Giải quyết vụ án mạng bằng Suy luận Bayes: Bài học từ phim Knives Out
Bài viết này sử dụng cốt truyện của bộ phim "Knives Out" để minh họa nguyên lý hoạt động của Suy luận Bayes (Bayesian Inference) - một khái niệm cốt lõi trong Khoa học Dữ liệu và Trí tuệ nhân tạo. Chúng ta sẽ cùng khám phá cách thám tử Benoit Blanc áp dụng tư duy xác suất để cập nhật các giả thuyết và tìm ra sự thật từ những mảnh ghép mâu thuẫn.

Giải quyết vụ án mạng bằng Suy luận Bayes: Bài học từ phim Knives Out
Tôi vẫn nhớ cảm giác khi xem bộ phim trinh thám kinh dị Knives Out (Bí ẩn Án mạng), người tôi nghiêng về phía màn hình như thể chính mình là người giải quyết vụ án. Khi đội của thám tử Blanc thẩm vấn từng người trong gia đình Thrombey, tôi cũng tự gạch tên những nghi phạm trong đầu, chỉ để đưa họ trở lại danh sách sau một vài tình tiết bất ngờ. Ngày đó, tôi chưa nhận ra rằng câu chuyện trinh thám kinh điển này thực chất đang khiến tôi thực hiện các phép tính trong đầu.
Mặc dù nghe có vẻ hơi xa vời, nhưng tôi tin rằng phong cách điều tra của Benoit Blanc phản chiếu rất rõ Suy luận Bayes (Bayesian Inference). Những ai nhớ các cuộc thẩm vấn trong phim sẽ nhanh chóng nhận ra rằng Benoit Blanc không hề chủ động hỏi. Ông ngồi cạnh cây đàn piano, để đội ngũ của mình (Trung úy Elliot và Sĩ quan Wagner) đặt câu hỏi. Vậy tại sao tôi lại nói phong cách của Blanc liên quan đến Suy luận Bayes? Chính Blanc đã đề cập đến điều này trong phim:
"Tôi quan sát sự thật mà không có định kiến của đầu óc hay trái tim." — Benoit Blanc, Knives Out.
Đây chính là bản chất của Suy luận Bayes, nơi kết luận của bạn không được dẫn dắt bởi trực giác mà bởi bằng chứng. Hãy cùng giải quyết vụ án mạng này sử dụng Suy luận Bayes.
Trước khi bắt đầu, hãy lưu ý rằng các giá trị xác suất được gán và cập nhật trong bài viết này không được tính toán bằng công thức Bayes chính xác, vì các giá trị khả năng (likelihood) rất khó gán cho bằng chứng hành vi như sự lảng tránh hay nói dối. Thay vào đó, chúng ta sử dụng các ước tính có cơ sở như một công cụ giảng dạy về tư duy dữ liệu.
Thiết lập bối cảnh — Xây dựng niềm tin ban đầu
Thám tử Blanc được thuê ẩn danh để điều tra khả năng Harlan Thrombey bị sát hại. Khi đội của ông bắt đầu thẩm vấn, Blanc lặng lẽ quan sát các nghi phạm tiềm năng từ phía sau. Khi cuộc thẩm vấn đi chệch hướng, ông điều chỉnh lại bằng cách gõ một phím đàn piano.
Ông quan sát thấy rằng mỗi tương tác đều bị vấy bẩn bởi những lời nói dối và mâu thuẫn. Điều ông làm đúng là không loại bỏ một câu chuyện nào vì cho là vô căn cứ trong khi nắm giữ một câu chuyện khác dựa trên cảm tính. Ông hiểu rằng những lời kể gây hiểu lầm có thể chứa đựng những mảnh ghép của sự thật. Ông đánh giá cẩn thận từng tương tác, gán trọng số cho từng quan sát, sau đó kết hợp chúng để đưa ra kết luận. Ông bắt đầu từ sự không chắc chắn nhưng dần dần xây dựng nên sự thật có khả năng cao nhất, gạt bỏ những định kiến cá nhân sang một bên.
Blanc bắt đầu bằng cách liệt kê các nguyên nhân có thể của cái chết. Trong thế giới Bayes, điều này được gọi là Mô hình Tiên nghiệm (Prior Model). Mô hình tiên nghiệm là tập hợp các giả định chúng ta nắm giữ trước khi có bất kỳ bằng chứng nào. Trong trường hợp này, mô hình tiên nghiệm là các giả thuyết ban đầu về cái chết của Thrombey trước khi cuộc điều tra bắt đầu.
Các giả thuyết ban đầu về vụ án
Đánh giá tính đầy đủ của niềm tin ban đầu
Hãy đánh giá các niềm tin ban đầu để xem liệu chúng ta đã bỏ sót khả năng nào khác hay không. Liệu chúng ta đã bỏ qua khả năng đây là một vụ hãm hại ai đó không? Nếu có, nó có nên được đưa vào làm giả thuyết thứ sáu không?
Đây là nơi quy tắc quan trọng nhất (Nguyên lý MECE) để xây dựng giả thuyết trong Suy luận Bayes phát huy tác dụng. Mỗi giả thuyết được xây dựng như một phần của Suy luận Bayes nên là Loại trừ lẫn nhau (Mutually Exclusive) và Bao quát đầy đủ (Collectively Exhaustive).
Hãy xem lại giả thuyết tiềm năng thứ sáu, "Cố gắng hãm hại ai đó". Mặc dù giả thuyết được chọn nên trả lời cho nguyên nhân gây ra cái chết, nhưng giả thuyết tiềm năng này nói nhiều hơn về động cơ đằng sau cái chết, miễn là nó được chứng minh là một vụ giết người. Do đó, nó vi phạm quy tắc loại trừ lẫn nhau của nguyên lý MECE và do đó không thể là một giả thuyết trực tiếp.
Gán xác suất (Xác suất Tiên nghiệm)
Hãy giữ nguyên các giả thuyết chúng ta đã xây dựng trước đó, vì chúng xem xét tất cả các nguyên nhân gây tử vong có thể (bao quát đầy đủ). Bước logic tiếp theo là gán xác suất cho niềm tin ban đầu của chúng ta. Điều này có nghĩa là chúng ta bắt đầu với một phỏng đoán có căn cứ về khả năng mỗi giả thuyết gây ra cái chết của Harlan Thrombey. Vì chúng ta gán xác suất trước khi có bất kỳ bằng chứng hoặc dữ liệu trực tiếp nào, chúng ta gọi đây là xác suất tiên nghiệm (prior probability).
Xác suất tiên nghiệm với phân phối bằng nhau
Một câu hỏi tự nhiên nảy sinh trong đầu là liệu mỗi giả thuyết có cùng xác suất xảy ra không. Câu trả lời là không, không phải lúc nào cũng vậy. Một hiểu lầm phổ biến trong suy luận Bayes là chúng ta phải gán xác suất bằng nhau cho tất cả các giả thuyết. Trong trường hợp không có bằng chứng trước, chúng ta giả định rằng thám tử Blanc gán xác suất bằng nhau cho mỗi giả thuyết. Nhưng điều đó không phải lúc nào cũng đúng.
Chúng ta cũng có thể giả định các xác suất không đồng đều (không bằng nhau) nếu có kiến thức trước cho thấy một giả thuyết có khả năng xảy ra hơn các giả thuyết khác. Thống kê tội phạm chung cũng có thể hữu ích để ước tính xác suất tiên nghiệm. Ví dụ, theo dữ liệu giết người của FBI [2], trong hầu hết các vụ giết người, nạn nhân biết kẻ giết mình. Các vụ giết người bởi người ngoài thường đòi hỏi động cơ liên quan đến trộm cắp hoặc một loại trả thù nào đó. Do đó, H4 (thành viên gia đình) nhận được trọng số lớn hơn, vì các thành viên gia đình có quyền tiếp cận nạn nhân nhiều hơn. Hơn nữa, trong trường hợp của Harlan Thrombey, giả thuyết rằng một thành viên gia đình gây ra cái chết của anh ta có trọng số lớn hơn vì các thành viên gia đình có thể có động cơ từ việc thừa kế tài sản và gia sản của anh ta. Các xác suất tiên nghiệm lý tưởng trong kịch bản của chúng ta sẽ là một phân phối không đồng đều.
Cập nhật xác suất dựa trên bằng chứng
Hãy cố gắng nhớ lại cảnh Marta bị thẩm vấn. Marta có một bệnh lý khiến cô nôn mỗi khi nói dối. Nhưng vì Marta ban đầu nghĩ rằng mình đã gây ra cái chết của Thrombey do accidentally đổi nhầm thuốc, cô xử lý tình huống bằng cách đưa ra những câu trả lời không đầy đủ và nửa sự thật.
Điểm twist ở đây là thám tử Blanc thực sự đã biết về tình trạng của cô. Những câu trả lời nửa vời của Marta có làm tăng sự nghi ngờ và do đó làm thay đổi các trọng số không? Một khả năng là Marta có động cơ giết ông Harlan (hỗ trợ lý thuyết người ngoài — H5). Một khả năng khác là Marta, với tư cách là y tá, có thể đã mắc một lỗi chết người khiến ông Thrombey phải trả giá (H2). Hàm Khả năng Bayes (Bayesian Likelihood Function) rất hữu ích trong những tình huống mơ hồ như vậy. Hàm Khả năng Bayes đo lường mức độ mỗi giả thuyết giải thích bằng chứng quan sát được. Thái độ của Marta không đủ để phân biệt giữa H2 và H5. Vì vậy, xác suất sẽ chỉ thay đổi nhẹ, không phải thay đổi mạnh. Xác suất của H2 và H5 sẽ tăng nhẹ, và của H1 và H3 sẽ giảm.
Một điểm quan trọng cần lưu ý về xác suất. Ngay khi chúng ta nhận được một dạng bằng chứng (nhỏ hoặc lớn) và bắt đầu cập nhật các trọng số, chúng ta gọi nó là xác suất hậu nghiệm (posterior probability). Dựa trên điều trên, chúng ta gán lại các xác suất như hình minh họa.
Từ hình ảnh, rõ ràng là các trọng số đã dịch chuyển nhẹ về phía H2 nhưng chưa có sự dịch chuyển đáng kể nào.
Những mâu thuẫn đơn giản nhưng trực tiếp — Vàng Bayes
Có một mâu thuẫn nổi bật về việc ai đứng ngay cạnh Harlan Thrombey trong bữa tiệc sinh nhật của ông. Con gái của Harlan, Linda, nói rằng cô ấy đứng cạnh Harlan, cùng với chồng và con trai mình. Tuy nhiên, Walt nói rằng ông và gia đình mình đứng cạnh Harlan. Mặc dù mâu thuẫn này có thể không chỉ ra một cá nhân cụ thể, nó làm tăng sự nghi ngờ về độ tin cậy chung của họ. Điều này làm tăng trọng số xung quanh H4 (thành viên gia đình).
Dưới đây là các xác suất đã cập nhật.
Mâu thuẫn trong câu chuyện của gia đình
Sự chuyển hướng của Walt về phía Ransom
Trung úy Elliot hỏi Walt tại sao Harlan lại gọi ông ra riêng nói chuyện và tại sao Walt có vẻ bị khiển trách sau đó. Walt do dự một phút rồi chuyển hướng lập luận sang Ransom. Ông đề cập rằng Harlan đã có một cuộc tranh luận với Ransom. Điều này cho thấy Walt đang tích cực che giấu cuộc trò chuyện của mình với Harlan. Hãy gán lại các xác suất dựa trên các mảnh bằng chứng này.
Mâu thuẫn giữa Mẹ và Con gái
Khi đội của Blanc hỏi tại sao Joni đến sớm, cô ấy nói rằng cô ấy muốn gặp Harlan về vấn đề chuyển tiền học phí cho con gái mình. Nhưng con gái của Joni, Meg, nói rằng ông ngoại Harlan chưa bao giờ bỏ lỡ việc chuyển tiền học phí cho cô. Mâu thuẫn này làm tăng đáng kể xác suất của H4.
Cảnh đọc di chúc — Tinh chỉnh giả thuyết của bạn
Cho đến nay, các trọng số cao nhất là cho H4, hỗ trợ lý thuyết về việc bị giết bởi một thành viên gia đình. Nhưng khi chúng ta thấy rằng tất cả tài sản đã được trao cho y tá và người chăm sóc, Marta, toàn bộ sự nghi ngờ chuyển sang cô ấy. Các trọng số tăng gấp ba cho H5 sau sự thay đổi kịch tính này. Gia đình nghi ngờ cô thao túng Harlan để đổi di chúc sang tên mình.
Đây là nơi một khái niệm quan trọng gọi là "Tinh chỉnh Giả thuyết (Hypothesis Refinement)" xuất hiện. Suy luận Bayes không hạn chế bạn bám vào tập hợp các giả thuyết ban đầu. Thay vào đó, nó cho phép bạn tinh chỉnh một giả thuyết và phân nhánh nó ra khi bạn có nhiều bằng chứng hơn. Trong trường hợp này, H5 (Bị giết bởi người ngoài) là một thuật ngữ chung rộng hơn. Bây giờ, chúng ta có thể phân nhánh thành một giả thuyết phụ chi tiết hơn.
Đột nhiên, gia đình từng yêu quý Marta coi cô là nghi phạm chính. Tuy nhiên, Blanc vẫn không thuyết phục rằng Marta có động cơ, vì báo cáo độc dược cho thấy Harlan không chết do quá liều morphine. Không giống như các thành viên gia đình, Blanc không phản ứng dựa trên trực giác mà dựa trên bằng chứng. Khi ông theo dấu vết bằng chứng, nó chỉ ông theo một hướng khác, về phía Ransom.
Cao trào — Bộ chuyển dịch xác suất tối thượng
Trong quá trình điều tra, hầu hết mọi thành viên trong gia đình (bao gồm cả nhân viên) đều nói về một cuộc đổ vỡ giữa Ransom Drysdale và ông ngoại Harlan, khiến Ransom bỏ ra khỏi bữa tiệc sớm hơn dự kiến. Ngoài ra, việc Ransom vắng mặt vào ngày sau khi Harlan chết đóng vai trò là bằng chứng thêm. Tuy nhiên, động cơ vẫn chưa rõ ràng cho đến khi Ransom đến vào ngày di chúc được đọc. Jacob, một cháu trai khác của Harlan, đề cập rằng anh ấy nghe lén được Ransom nói "Di chúc" và "Tôi cảnh báo bạn" với ông ngoại trước khi bỏ đi. Khi đối mặt với gia đình, Ransom thừa nhận rằng anh ấy đã biết mình bị loại khỏi di chúc. Thám tử Blanc, người đang quan sát tất cả những điều này, nhận ra rằng đây có thể là động cơ giết Harlan của Ransom. Dựa trên bằng chứng này, chúng ta cập nhật các giả thuyết của mình. Vì H4 (Bị giết bởi thành viên gia đình) là một thuật ngữ chung rộng hơn, chúng ta phân nhánh thành một giả thuyết phụ chi tiết hơn.
Xác suất chuyển dịch sang Ransom
Hãy chú ý cách khả năng Marta là kẻ giết người giảm mạnh dựa trên bằng chứng mới rằng báo cáo độc dược không cho thấy quá liều morphine, và thực tế là Ransom tức giận vì không được đưa vào di chúc. Xác suất hậu nghiệm thay đổi khi và khi bằng chứng vững chắc đến. Đây chính là điều khiến Bayes trở nên trực quan đến vậy. Dựa trên Xác suất Có Điều kiện, nó đặt ra câu hỏi trung thực nhất: "Cho tất cả những gì tôi biết cho đến nay, câu trả lời nào có khả năng nhất?".
Trong biểu đồ trên, hãy chú ý cách xác suất của Marta thỉnh thoảng giảm vọt, trong khi xác suất của Ransom tăng vọt về cuối dựa trên bằng chứng mới.
Kết luận — Thất bại trong việc hội tụ về H3?
Như chúng ta đã thấy, Knives Out là một ví dụ tuyệt vời để minh họa lý luận dưới sự không chắc chắn, về cơ bản là tiền đề cơ bản của Suy luận Bayes. Ban đầu, khả năng bị giết bởi thành viên gia đình tăng lên vì có mâu thuẫn trong mọi cuộc trò chuyện. Nhưng khi bằng chứng mới về Marta xuất hiện, sự nghi ngờ chuyển sang cô ấy. Tuy nhiên, sau khi Ransom đến và những tiết lộ sau đó về cuộc cãi vã với Harlan, các xác suất hội tụ về anh ta.
Thực tế là Harlan thực sự đã tự tử để bảo vệ Marta, vì cả hai đều tin rằng cô đã cho ông một liều morphine chết người. Vậy, Suy luận Bayes có thất bại không, vì nó không hội tụ về H3 (Chết do tự tử)? Đôi khi, sự thật có thể nhiều lớp, như trong trường hợp này, nơi Ransom đã đổi thuốc có chủ ý và mang theo thuốc giải độc với ý định duy nhất là gây cái chết cho Harlan. Do đó, mặc dù Ransom không trực tiếp giết Harlan, anh ta đã lên kế hoạch cho cái chết của ông. Cách tiếp cận Lý luận Bayes đã đi sâu hơn nguyên nhân trực tiếp của cái chết của Harlan, là tự tử. Khi được xử lý với một tâm trí trung lập, Suy luận Bayes có thể hiệu quả dẫn bạn đến các lớp bị chôn vùi dưới sự thật bề mặt.
Bài viết liên quan

Công nghệ
Microsoft giới thiệu Surface Pro 12 và Surface Laptop 8: Sức mạnh chip Intel, giá thành gây sốc
19 tháng 5, 2026

Công nghệ
CEO Palantir: 10% thế giới "ghét chúng tôi một cách chuyên nghiệp"
05 tháng 5, 2026

Công nghệ
OpenAI tặng ưu đãi Codex đặc biệt cho 8.000 developer sau khi tiệc GPT-5.5 cháy vé
05 tháng 5, 2026
