Ví dụ thực tế về lý thuyết trò chơi

Nhắc đến Lý thuyết trò chơi [Game theory] chắc mọi người sẽ nghĩ ngay đến bài toán kinh điển là "Thế lưỡng nan của người tù". Nhưng đó chỉ là một ví dụ rất cơ bản, thực tế khi tìm hiểu kỹ hơn về lý thuyết trò chơi thì sẽ thấy nó được chia thành nhiều loại, những chiến lược được áp dụng cũng khác nhau, và tất nhiên là rất thú vị. Ở đây mình chỉ đi sơ lược qua để có cái nhìn chung nhất, kèm theo một ví dụ thú vị khi vận dụng lý thuyết này vào tình yêu, còn nếu muốn tìm hiểu kỹ hơn một chút thì sẽ phải dành nhiều thời gian hơn ở bài viết sau ạ :p

Lý thuyết trò chơi là một nhánh của Toán học ứng dụng, nghiên cứu các tình huống chiến thuật trong đó các đối thủ lựa chọn các hành động khác nhau để cố gắng làm tối đa kết quả nhận được. Ban đầu được phát triển như là một công cụ để nghiên cứu hành vi kinh tế học, ngày nay Lý thuyết trò chơi được sử dụng trong nhiều ngành khoa học, từ sinh học tới triết học, quân sự, chính trị, và cả khoa học máy tính. Người được xem là cha đẻ của lý thuyết trò chơi là nhà toán học John von Neumann và nhà kinh tế học Oskar Morgenstern. Đây là hai đồng tác giả của cuốn sách có tựa đề "Theory of Games and Economic Behaviour" [Lý thuyết trò chơi và các hành vi kinh tế học] được xuất bản năm 1944. Còn John Nash là người có công phát triển lý thuyết trò chơi [nổi tiếng với "Cân bằng Nash"].

HAI GIẢ ĐỊNH CĂN BẢN

Lý thuyết trò chơi theo đuổi hai giả định căn bản. Thứ nhất, nó giả định mỗi cá nhân hay các nhóm cá nhân là một người tham gia trong một cuộc chơi và mục tiêu của họ là làm thế nào để giành lợi ích [có thể là chiến thắng hay giảm sự thiệt hại]. Thứ hai, nó xem mỗi hành động của con người được dẫn dắt dựa trên nguyên tắc lý tính theo ý nghĩa là trước mỗi quyết định, cá nhân đều cố gắng tính toán xem lợi ích/thiệt hại của bản thân mình khi đưa ra quyết định như thế nào.

CÁC LOẠI TRÒ CHƠI

Phân loại các loại trò chơi thường được dựa vào ba yếu tố là [i] số lượng người chơi, [ii] chiến lược mà các người chơi lựa chọn,  [iii] cơ chế quyết định kết quả của cuộc chơi. Dựa trên ba điểm trên có ba loại trò chơi chính: a] Trò chơi hai người có tổng bằng không, b] Trò chơi hai người với tổng khác không, c] Trò người nhiều người với tổng khác không. Trong khi trò chơi có tổng bằng không hàm ý rằng lợi ích của người này đồng nghĩa với thiệt hại của người khác, thì loại trò chơi với tổng khác không nhấn mạnh đến khả năng cùng thắng giữa các đối thủ trong một cuộc chơi, lợi ích của người này không nhất thiết là thiệt hại của người khác, mà ngược lại: mọi người tham gia cuộc chơi đều có thể giành được lợi ích tương đối cho bản thân.

CÁC LOẠI CHIẾN LƯỢC

Trong quá trình người chơi tham gia cuộc chơi, chúng ta có thể phân ra hai loại chiến lược: chiến lược hoàn hảo và chiến lược thông minh. Chiến lược hoàn hảo là chiến lược mà sẽ đem lại lợi ích cao nhất cho người tham gia cuộc chơi, không phụ thuộc vào hành động phản ứng của đối phương. Nói đơn giản là cho dù đối thủ có làm gì đi nữa, thì mình vẫn quyết định như vậy. Ngược lại, chiến lược thông minh hướng tới mục tiêu giảm thiểu mức độ rủi ro cho người tham gia cuộc chơi. Nói đơn giản là chiến lược này giúp người chơi chọn đường đi nào tới đích an toàn với rủi ro thấp nhất.

ÁP DỤNG VÀO BÀI TOÁN TÌNH YÊU

Có hay không nên tỏ tình? [Đoạn này copy tôn trọng tác giả :p]

"Có một chàng trai, thích một cô gái, vào ngày Valentine, anh ta quyết định tỏ tình với cô gái ấy, nhưng lại không biết liệu cô gái sẽ chấp nhận hay từ chối. Vậy thì có nên tỏ tình không?

Giả sử như cô gái chấp nhận, cả hai sẽ tràn trề hạnh phúc, biết rằng tình yêu không thể đong đếm, nhưng mình sẽ lượng hóa sự hạnh phúc - tức lợi ích [pay off] của mỗi bên là [10, 10].

Giả sử chàng tỏ tình nhưng nàng từ chối, đau khổ biết bao nhiêu, mình lượng hóa là [-10,0], tức ích lợi của chàng trai là -10, cô gái thì là 0

Tiếp theo, biết đâu cô gái có thể chấp nhận tình cảm của chàng, nhưng mà chàng lại sợ, quyết định không tỏ tình, thì chúng ta yêu nhau mà không đến được với nhau rồi, cả hai đều đau khổ, payoff là [-5,-5].

Trường hợp cuối cùng, là cô gái không chấp nhận lời tỏ tình và chàng trai cũng không tỏ tình, thì khi này lợi ích của hai người là [0,0].

Cuộc chơi sẽ đạt được đến 2 trạng thái cân bằng:

Thứ nhất, nếu chàng đoán nàng chấp nhận, lựa chọn của chàng là tỏ tình [10,10]

Thứ hai, nếu chàng đoán nàng không chấp nhận, chàng sẽ im lặng, như vậy là [0,0]

Vậy cuối cùng thì tỏ hay không tỏ, lựa chọn của chàng rõ ràng là trong điều kiện không chắc chắn. Như vậy thì chúng ta phải tính được kỳ vọng của chàng.

Xác suất của việc tỏ tình thành công là p, và ngược lại là 1-p.

Giá trị kỳ vọng của tỏ tình: 10p- 10[1-p]= 20p-10

Giá trị kỳ vọng của việc không tỏ tình: -5p

Như vậy trong trường hợp này, thì chàng trai sẽ quyết định tỏ tình khi nào?

20p-10>= -5p

25p>= 10

p>=0.4=40%

Trong bài toán của chúng ta, xác suất để chàng tỏ tình không phải là 50/50 đâu các bạn, mà chỉ cần lớn hơn hoặc bằng 40%, có lẽ vì trong ma trận lợi ích, việc cô gái chấp nhận mang đến quá nhiều hạnh phúc cho chàng, nên không cần là 5/5, chàng sẵn sàng tỏ tình khi xác suất thất bại cao hơn.

Nhưng nói thế chứ mà 4/6 cũng khó đoán lắm. Làm sao tránh được thất bại và biết được xác suất nàng đồng ý hay không.  Vì đã là xác suất thì cái gì cũng xảy ra. Xác suất càng cao, cơ hội càng rộng mở. Vậy để tránh rủi ro, các chàng nên làm gì. Trong dân gian hay gọi bật đèn xanh đó bạn. Còn trong kinh tế, nó được gọi là: Thủ thuật đánh tín hiệu. 

Để dò phản ứng của đối thủ, xem có thích nhiều hay ích, chàng trai nên gửi tín hiệu. Như vậy cuộc chơi của chúng ta sẽ được chia nhỏ thành một game mới, gồm nhiều bước [gọi là periods game]. Chàng có thể nhẹ nhàng nhắn tin từ mức độ bạn bè bình thường, tần số thấp đến mức độ hỏi han và mật độ nhiều hơn một tí. Nếu thử dẫn nàng đi ăn kem, sinh tố hay uống café với những người bạn. Cuộc chơi sẽ chia nhỏ thành nhiều bước như vậy và đến lúc mời nàng đi chơi riêng, nhắn tin bằng những lời có cánh. Và bằng cách đó, chàng đã kiểm được phản ứng của nàng và biết được xác suất để mình có nên tỏ tình hay không.

Còn các nàng, nếu mà thích các chàng rồi, hãy cũng nhẹ nhàng phản ứng cho các chàng biết nhé. Vì việc đó giúp cho cái "lý thuyết lựa chọn trong điều kiện không chắc chắn" trở nên dễ dàng hơn nhiều, tranh việc hai bên đều đau khổ vì mối tình câm hay làm tổn thương nhau khi kỳ vọng của chàng quá lớn.

Nãy giờ mình đơn giản hóa vấn đề nên mình bỏ qua một giả thiết cực kỳ quan trọng của cuộc chơi. Đó là rational - con người duy lý. Không có giả thuyết này, không có game theory. Tức khi bước vào cuộc chơi, lựa chọn chiến lược nào phải dựa trên nguyên tắc: phải dựa trên vấn đề giá trị hay ích lợi [pay off]. Điều này có thể sẽ không được tuân thủ trong tình yêu, khi mà nhịp đập con tim đa số làm cho các bạn tự hỏi: lý trí là cái chi chi? Bạn có thể không lựa chọn cho mình chiến lược trội, hay đánh giá mức "pay off" [ lợi ích âm có nghĩa là tổn thất] không đúng đắn, điều này do đó sẽ ảnh hưởng đến giá trị kỳ vọng và mức "P" nào là có thể để tiến hành "tỉnh tò".

Thêm nữa, mô hình này đã được đơn giản hóa rất nhiều. Trong lý thuyết kinh tế, để nhận diện hành vi đối thủ tốt hơn, mình sẽ phải xác định lợi ích gắn liền với tính cách của bạn và đối thủ: Vì ở đây, lựa chọn trong điều kiện là không chắc chắn, nên sẽ rủi ro, như vậy sẽ có người sợ rủi ro nhiều và có người ít sợ rủi ro, có người trung dung. Khi đó, nhất thiết phải thêm hệ số chiết khấu cho mức độ sợ rủi ro của từng người khi ra quyết định.

Đây là một game đơn giản, và mình cố làm nó đơn giản. Mình thấy yêu lý thuyết này vì nó phân tích hành vi của các đối tượng một cách hay ho, dù trong hành vi kinh tế hay cuộc sống thường ngày."

Cuối cùng, chúc mọi người một Valentine vui vẻ ạ :]]]

Tham khảo:

Wikipedia

//nghiencuuquocte.org/2015/11/14/ly-thuyet-tro-choi-game-theory/

Học viện Do Thái

Một cái nhìn tổng quan

Lý thuyết trò chơi là một lý thuyết về tương tác xã hội, cố gắng giải thích sự tương tác của mọi người với nhau. Như tên của lý thuyết cho thấy, lý thuyết trò chơi thấy sự tương tác của con người như thế: một trò chơi. John Nash, nhà toán học người đã được đặc trưng trong bộ phim A Beautiful Mind là một trong những nhà phát minh của lý thuyết trò chơi cùng với nhà toán học John von Neumann.

Lý thuyết trò chơi ban đầu là một lý thuyết kinh tế và toán học dự đoán rằng tương tác của con người có đặc điểm của một trò chơi, bao gồm chiến lược, người chiến thắng và kẻ thua cuộc, phần thưởng và hình phạt, lợi nhuận và chi phí.

Ban đầu nó được phát triển để hiểu nhiều hành vi kinh tế khác nhau, bao gồm hành vi của các công ty, thị trường và người tiêu dùng. Việc sử dụng lý thuyết trò chơi đã mở rộng trong các ngành khoa học xã hội và đã được áp dụng cho các hành vi chính trị, xã hội học và tâm lý.

Lý thuyết trò chơi lần đầu tiên được sử dụng để mô tả và mô hình hóa cách cư xử của con người. Một số học giả tin rằng họ thực sự có thể dự đoán con người thực sự sẽ cư xử như thế nào khi đối mặt với những tình huống tương tự như trò chơi đang được nghiên cứu. Quan điểm cụ thể của lý thuyết trò chơi này đã bị chỉ trích vì các giả định của các nhà lý thuyết trò chơi thường bị vi phạm. Ví dụ, họ giả định rằng người chơi luôn hành động theo cách để trực tiếp tối đa hóa chiến thắng của họ, khi trong thực tế điều này không phải lúc nào cũng đúng. Hành vi từ thiện và từ thiện sẽ không phù hợp với mô hình này.

Ví dụ về lý thuyết trò chơi

Chúng ta có thể sử dụng sự tương tác của việc yêu cầu một người nào đó cho một ngày như là một ví dụ đơn giản về lý thuyết trò chơi và cách có các khía cạnh giống như trò chơi có liên quan.

Nếu bạn yêu cầu ai đó hẹn hò, có thể bạn sẽ có một số chiến lược để "thắng" [có người khác đồng ý đi chơi với bạn] và "được thưởng" [có thời gian tốt] với chi phí tối thiểu "Cho bạn [bạn không muốn chi tiêu một số tiền lớn vào ngày hoặc không muốn có một tương tác khó chịu vào ngày].

Các yếu tố của trò chơi

Có ba yếu tố chính của trò chơi:

  • Những người chơi.
  • Các chiến lược của mỗi người chơi.
  • Hậu quả [payoffs] cho mỗi người chơi cho mọi hồ sơ có thể có của các lựa chọn chiến lược của tất cả người chơi.

Các loại trò chơi

Có một số loại trò chơi khác nhau được nghiên cứu sử dụng lý thuyết trò chơi:

  • Trò chơi không tổng hợp : Sở thích của người chơi xung đột trực tiếp với nhau. Ví dụ, trong bóng đá, một đội thắng và đội kia thua. Nếu chiến thắng bằng +1 và thua bằng -1, tổng là bằng không.
  • Trò chơi tổng số khác không : Quyền lợi của người chơi không phải lúc nào cũng xung đột trực tiếp, để có cơ hội cho cả hai đều đạt được. Ví dụ, khi cả hai người chơi chọn “không thú nhận” trong tình trạng khó xử của tù nhân [xem bên dưới].
  • Trò chơi di chuyển đồng thời : Người chơi chọn hành động đồng thời. Ví dụ, trong tình trạng khó xử của tù nhân [xem bên dưới], mỗi người chơi phải dự đoán đối thủ của họ đang làm gì vào lúc đó, nhận ra rằng đối phương đang làm như vậy.
  • Các trò chơi di chuyển tuần tự : Người chơi chọn hành động của họ theo một chuỗi cụ thể. Ví dụ, trong cờ vua hoặc trong các tình huống thương lượng / thương lượng, người chơi phải nhìn về phía trước để biết nên chọn hành động nào ngay bây giờ.
  • Trò chơi một lần: Trò chơi của trò chơi chỉ xảy ra một lần. Ở đây, các cầu thủ có thể không biết nhiều về nhau. Ví dụ, lật một người phục vụ trong kỳ nghỉ của bạn.
  • Trò chơi lặp lại : Trò chơi của trò chơi được lặp lại với cùng người chơi.

Tù nhân của tù nhân

Tình trạng khó xử của tù nhân là một trong những trò chơi phổ biến nhất được nghiên cứu trong lý thuyết trò chơi đã được miêu tả trong vô số các bộ phim và chương trình truyền hình tội phạm. Sự tiến thoái lưỡng nan của tù nhân cho thấy tại sao hai cá nhân có thể không đồng ý, ngay cả khi có vẻ như là tốt nhất để đồng ý. Trong trường hợp này, hai đối tác trong tội phạm được chia thành các phòng riêng biệt tại sở cảnh sát và đưa ra một thỏa thuận tương tự. Nếu một người làm chứng chống lại người bạn đời của anh ta và người bạn đời vẫn im lặng, người phản bội sẽ tự do và người bạn đời nhận được câu đầy đủ [ví dụ: mười năm]. Nếu cả hai đều im lặng, cả hai đều là những câu trong một thời gian ngắn trong tù [ví dụ: một năm] hoặc cho một khoản phí nhỏ. Nếu mỗi người chứng thực với nhau, mỗi người nhận được một câu vừa phải [ví dụ: ba năm].

Mỗi tù nhân phải chọn phản bội hoặc giữ im lặng, và quyết định của mỗi tù nhân được giữ lại từ người kia.

Sự tiến thoái lưỡng nan của tù nhân cũng có thể được áp dụng cho nhiều tình huống xã hội khác, từ khoa học chính trị đến luật pháp đến tâm lý để quảng cáo. Lấy ví dụ, vấn đề phụ nữ mặc trang điểm. Mỗi ngày trên khắp nước Mỹ, vài triệu giờ phụ nữ được dành cho một hoạt động có lợi ích đáng ngờ cho xã hội. Trang điểm đi sẽ miễn phí từ mười lăm đến ba mươi phút cho mỗi người phụ nữ mỗi buổi sáng. Tuy nhiên, nếu không ai mặc trang điểm, sẽ có sự cám dỗ lớn đối với bất kỳ một phụ nữ nào để đạt được lợi thế hơn những người khác bằng cách phá vỡ tiêu chuẩn và sử dụng mascara, đỏ mặt và kem che khuyết điểm để che giấu những khiếm khuyết và tăng cường vẻ đẹp tự nhiên của cô. Một khi một khối lượng quan trọng mặc trang điểm, mặt tiền trung bình của vẻ đẹp nữ là nhân tạo lớn hơn. Không trang điểm có nghĩa là đã nói lên sự tăng cường nhân tạo cho vẻ đẹp. Vẻ đẹp của bạn liên quan đến những gì được coi là trung bình sẽ giảm. Hầu hết phụ nữ do đó mặc trang điểm và những gì chúng tôi kết thúc với là một tình huống mà không phải là lý tưởng cho toàn bộ hoặc cho các cá nhân, nhưng được dựa trên sự lựa chọn hợp lý của từng cá nhân.

Giả định trò chơi Theorists Make

  • Các phần thưởng được biết và cố định.
  • Tất cả người chơi cư xử hợp lý.
  • Các quy tắc của trò chơi là kiến ​​thức phổ biến.

Tài liệu tham khảo

Duffy, J. [2010] Ghi chú bài giảng: Các yếu tố của một trò chơi. //www.pitt.edu/~jduffy/econ1200/Lect01_Slides.pdf

Andersen, ML và Taylor, HF [2009]. Xã hội học: Các yếu tố cần thiết. Belmont, CA: Thomson Wadsworth.

Video liên quan

Chủ Đề