Tiểu luận toán rời rạc (P2) PDF

Title Tiểu luận toán rời rạc (P2)
Course Toán rời rạc
Institution Trường Đại học Bách khoa Hà Nội
Pages 88
File Size 3.5 MB
File Type PDF
Total Downloads 297
Total Views 426

Summary

Báo cáo Toán rời rạc (P2)Lý thuyết trò chơi thực sự là gì?Lý thuyết trò chơi như chúng ta biết ngày nay ra đời là do sở thích chơi poker của một người. Nhưng không phải một người đàn ông bình thường mà chúng ta sẽ bắt gặp hằng ngày trên đường phố đâu. Ông là một nhà toán học, vật lý học và khoa học ...


Description

Báo cáo Toán rời rạc (P2) Lý thuyết trò chơi thực sự là gì? Lý thuyết trò chơi như chúng ta biết ngày nay ra đời là do sở thích chơi poker của một người. Nhưng không phải một người đàn ông bình thường mà chúng ta sẽ bắt gặp hằng ngày trên đường phố đâu. Ông là một nhà toán học, vật lý học và khoa học máy tính có tên là John von Neumann. Mục tiêu của ông đương nhiên là khác so với những người chơi poker thông thường muốn chơi giỏi hơn. Qua một bài báo của Forbes, ông ấy quan tâm tới poker vì ông coi nó như một con đường để phát triển toán học vào trong cuộc sống. Ông muốn có một lý thuyết chung có thể được áp dụng cho ngoại giao, tình yêu, sự tiến hóa của vạn vật hay chiến lược kinh doanh. Lý thuyết này được ông gọi là lý thuyết trò chơi. Thông qua sự hợp tác với nhà kinh tế học Oskar Morgenstern trong cuốn sách có tên là Lý thuyết về trò chơi và hành vi kinh tế vào năm 1944, ông đã tiến được gần hơn tới mục tiêu của mình. Trong cuốn sách này, hai người họ đã khẳng định rằng bất kì tình hình kinh tế có thể được định nghĩa là kết quả của một trò chơi giữa hai hoặc nhiều người chơi Trò chơi theo lý thuyết trò chơi là gì? Giáo sử kinh tế Yale Ben Polak lưu ý rằng một trò chơi có 3 thành phần cơ bản: người chơi, chiến thuật và phần thưởng có thể có của trò chơi. Tuy nhiên, không phải lúc nào người chơi cũng có kiến thức hoàn hảo về những yếu tố này của một trò chơi Chiến lược là những hành động mà người chơi thực hiện trong một trò chơi. Chiến lược là trung tâm của lý thuyết trò chơi Forbes mô tả lý thuyết được trình bày trong Lý thuyết về trò chơi và hành vi kinh tế là "mô hình toán học về tương tác chiến lược giữa các đối thủ hợp lý, trong đó hành động của mỗi bên sẽ phụ thuộc vào những gì bên kia sẽ làm". Khái niệm về sự phụ thuộc lẫn nhau trong chiến lược- hành động của một người chơi ảnh hưởng đến hành động của những người chơi khác - là một khía cạnh quan trọng trong phiên bản lý thuyết trờ chơi của von Neumann vẫn còn phù hợp cho đến ngày nay

Phần thưởng, được mô tả là "kết quả của chiến lược được người chơi áp dụng". Phần thưởng có thể là một loạt các thứ tùy thuộc vào trò chơi. Đó có thể là lợi nhuận, một hiệp ước hòa bình, hoặc mua một chiếc xe hơi. Một phiên bản lý thuyết trò chơi của Von Neumann là nó tập trung vào việc tìm ra các chiến lược tối ưu cho một loại trò chơi được gọi là trò chơi có tổng bằng không. Trong trò chơi có tổng bằng không, một người chơi thua thì người chơi khác được lợi. Ở đây có một lưu ý là người chơi không thể tăng hoặc giảm tài nguyên có sẵn. Các nhà phê bình đã lưu ý rằng cuộc sống không đơn giản như trò chơi có tổng bằng không. Có nhiều kịch bản trò chơi phức tạp hơn trong thế giới thực. Lý thuyết trò chơi đã phát triển để phân tích nhiều loại trò chơi hơn như trò chơi tổ hợp và trò chơi tích phân, tuy nhiên chúng ta chỉ có thời gian để xét một trò chơi thôi.

Một ví dụ kinh đển về một trò chơi thường được nghiên cứu trong lý thuyết trò chơi được gọi là "Song đề tù nhân" (The Prisoner's Dilemma) Các phiên bản khác nhau của trò chơi này có sẵn trên Internet. Một trong số đó có giả thiết như sau:"Có hai tù nhân, Đăng và Huy, họ vừa bị bắt vì cướp ngân hàng, tuy nhiên cảnh sát không có đủ bằng chứng để kết tội họ, nhưng biết rằng họ đã phạm tội. Những cách sát đưa Đăng và Huy vào các phòng thẩm vấn riêng biệt và đưa ra cho 2 tên này các lựa chọn: Nếu cả hai đều thú nhận thì cả hai sẽ bị tuyên án 10 năm tù; Nếu một tên thú tội và tên kia không thú tôi, tên thú nhận sẽ được tự do và tên còn lại sẽ phải ngồi tù 20 năm. Nếu cả hai không thú nhận thì cả hai sẽ phải nhận 5 năm tù cho một tội danh khác mà cả hai bị truy nã. Có thể nhận thấy "Song đề tù nhân" chứa đựng những yếu tô cơ bản của một trò chơi được đề cập đến trong "Lý thuyết trò chơi": 1. Hai người chơi là Đăng và Huy 2. Chiến lược có sẵn là thú tội hoặc không thú tội 3. Phần thưởng của trò chơi bao gồm từ không phải vào tù cho đến thụ án 5, 10 hoặc 20 năm tù. Và để so sánh các kết quả một cách dễ dàng hơn thì chúng sẽ được đưa vào một ma trận:

Các chiến lược của Đăng được liệt kê theo hàng hoặc trục x, phần thưởng của anh ấy được liệt kê trước. Phần thưởng của Huy được liệt kê sau và các chiến lược sẽ được nằm trong cột hoặc trên trục y.

Ma trận này được gọi là "dạng chuẩn tắc" trong lý thuyết trò chơi. Các chuyển động diễn ra đồng thời, có nghĩa là không người chơi nào biết được quyết định của người kia và các quyết định được đưa ra cùng một lúc (như trong ví dụ này thì cả hai tù nhân đều ở trong các phòng riêng biệt và sẽ không được đưa ra ngoài cho đến khi cả hai đã đưa ra quyết định của mình. Một giải pháp phổ biến cho các trò chơi đồng thời được gọi là "chiến lược thống trị". Được định nghĩa là "chiến lược mang lại lợi nhuận tốt nhất cho dù người chơi khác chọn gì. Đăng không biết liệu răng Huy có thú nhận hay không. Khi đó hắn sẽ xem xét các lựa chọn của mình. Với những lựa chọn đã được nêu ở trên thì đương nhiên chiến lược tốt nhất cho Huy là thú nhận bởi vì nó dẫn đến việc được phần thưởng tốt nhất bất kể là điều đó sẽ khiến anh ta được tự do hoặc sẽ phải ngồi tù nhưng sẽ ít hơn so với việc anh ta không thú nhận. Và tất nhiên là Đăng cũng ở trong hoàn cảnh tương tự và có những lựa chọn giống với Huy. Kết quả là, chiến lược tốt nhất cho Đăng cũng là thú nhận vì nó dẫn đến mức thưởng tốt nhất mà Huy sẽ nhận được. Trạng thái cân bằng chiến lược thống trị đạt được khi mỗi người chơi chọn chiến lược thống trị của riêng họ. → Vậy tại sao chiến lược cả hai đều không thú tội không phải là lựa chọn tốt nhất? Mặc dù phương án này sẽ giúp cả hai người ít thời gian ngồi tù hơn so với khi họ thú nhận, nhưng nó chỉ hiệu quả nếu cả hai người họ biết chắc chắn rằng

người kia sẽ không thú nhận. Và chúng ta không biết rằng liệu Đăng và Huy có thể làm việc cùng nhau với mức độ hợp tác đó hay không được Ngoài ra, cả hai khó có thể chọn chiến lược không thú nhận vì nó có hình phạt lớn hơn nếu họ thú nhận. Việc thú nhận cũng giúp mỗi người trong số họ có khả năng không phải ngồi tù, thậm chí là dưới 5 năm tù. The Prisoner's Dilemma là một ví dụ điển hình cho thấy lý thuyết trò chơi có thể trở thành vấn đề của tính hợp lý. Đây cũng là một trong những vấn đề gây tranh cãi nhất trong lý thuyết trò chơi. Thật vậy, hầu hết tất cả các lý thuyết đều dựa trên giả định rằng các tác nhân là những người chơi hợp lý, những người cố gắng tối đa hóa các phần thưởng của họ, nhưng các nghiên cứu chứng minh rằng người chơi không phải lúc nào cũng hoạt động theo lý trí và đôi khi kết luận của phân tích hợp lý không phù hợp với thực tế. Như chúng ta có thể thấy từ trò chơi này, chiến lược hợp lý nhất sẽ mang lại cho cả hai người chơi ít thời gian tù hơn không phải là lựa chọn tốt nhất trong khi mà lựa chọn khiến hai người chơi phải ở trong tù lâu hơn mới là lựa chọn như vậy. Song đề tù nhân cũng phản ánh cách các nhà nghiên cứu lý thuyết trò chơi khác có thể khắc phục một số vấn đề trong phiên bản lý thuyết trò chơi của Von Neumann. Một trong số họ là nhà toán học John Nash. Ông đã tìm ra cách để xác định chiến lược tối ưu trong bất kỳ trò chơi hữu hạn nào. Đó chính là "điểm cân bằng Nash" - một giải pháp cụ thể cho các trò chơi, một giải pháp được đánh giá bởi thực tế là mỗi người chơi đang tạo ra điều tốt nhất mà họ có thể có, dựa trên các chiến lược đang được sử dụng bởi tất cả các người chơi khác. Khi đạt được trạng thái cân bằng Nash trong một trò chơi, không ai trong số người chơi muốn thay đổi chiến lược khác bởi vì làm như vậy sẽ dẫn đến kết quả tồi tệ hơn chiến lược hiện tại. Trong Song đề tù nhân, cân bằng Nash là chiến lược cả hai người chơi thú nhận. Không có lựa chọn nào tốt hơn cho một trong hai người chơi để thay đổi nữa. Cũng từ ví dụ này, chúng ta có thể thấy một khía cạnh thú vị khác của cân bằng Nash. → Nhà toán học Iztok Hozo chỉ ra rằng "bất kì điểm cân bằng chiến lược thống trị nào cũng là điểm cân bằng Nash". Nguyên nhân là do "cân bằng Nash là sự mở rộng của các khái niệm về cân bằng chiến lược thống trị. Tuy nhiên ông cũng

lưu ý rằng cân bằng Nash có thể được sử dụng để giải quyết các trò chơi không có chiến lược thống trị". Cân bằng Nash đã chỉ ra rằng, tối đa hóa lợi ích cho từng cá nhân chưa chắc đã là tối đa hóa lợi ích cho một đám đông Nash nhận được nhiều lời khen ngợi cho cân bằng Nash và các công trình khác của ông trong Lý thuyết trò chơi - nhưng không phải từ John von Neumann. Von Neumann đã ghen tị, đã bác bỏ kết quả của Nash thời trẻ, nói là là "tầm thường" - quá đơn giản về mặt toán học. Và tất nhiên là nhiều người khác không đồng tình với đánh giá của Von Neumann về công việc của Nash. Nash sau đó chia sẻ Giải tưởng niệm Nobel về Khoa học Kinh tế vào năm 1994 cho công trình nghiên cứu lý thuyết trò chơi của họ. Và sau sự ra đi của Nash vào năm 2015, một trang web học thuật đã tóm gọn tất cả thành tựu của Nash như sau:"Đóng góp cơ bản nhất của Nash cho lý thuyết trò chơi là mở ra lĩnh vực này cho nhiều ứng dụng hơn trong nghiên cứu [...] Nếu không có sự đột phá của ông ấy, phần lớn những gì tiếp theo trong lý thuyết trò chơi có thể đã không thực hiện được". Kể từ giờ trở đi chúng ta sẽ gọi bằng cách là Người chơi 1 và Người chơi 2 hoặc là "anh" với người chơi 1 và "cô" với người chơi 2 Trò chơi hợp tác và trò chơi bất hợp tác Một trò chơi sẽ được gọi là trò chơi hợp tác khi người chơi được phép xây dựng một đội/nhóm/liên minh với một lời cam kết ví dụ như hợp đồng. Một trò chơi là bất hợp tác nếu người chơi không thể thành lập đội nhóm và tất cả các yêu cầu đều là bắt buộc tự thân vận động. Các trò chơi bất hợp tác thường được phân tích thông qua khuôn khổ của lý thuyết trò chơi bất hợp tác. Lý thuyết trò chơi hợp tác tập trung vào việc dự đoán các liên minh sẽ hình thành tế nào, hành động của người tham gia trong một nhóm và kết quả phần thưởng chung của nhóm. Đối lập với lý thuyết trò chơi bất hợp tác tập trung vào dự đoán hành động của từng các nhân, phần thưởng và phân tích Cân bằng Nash. Sự tập trung vào các lợi ích các nhân sẽ dẫn tới một hiện tượng được biết tới là Bi kịch của tài nguyên dùng chung, khi đó những tài nguyên được sử dụng khai thác ở mức độ triệt để. Việc thiếu hụt một giao kèo dẫn tới việc tài nguyên dùng chung thường bị hỏng nhanh, hao hụt nhanh bởi vì bị sử dụng quá nhiều và không có biện pháp cần thiết để ngăn các cá nhân sử dụng vì mục đích riêng.

Lý thuyết trò chơi hợp tác cung cấp một phương pháp tiếp cận ở mức độ cao khi nó mô tả những cấu trúc, chiến lược và phần thưởng của liên minh, trong khi lý thuyết trò chơi bất hợp tác cũng nhìn vào cách các thủ tục thương lượng sẽ ảnh hưởng đến việc phân phối phần thưởng với mỗi liên minh. Vì lý thuyết trò chơi bất hợp tác phổ biến hơn, lý thuyết trò chơi hợp tác có thể phân tích qua các cách tiếp cận của lý thuyết trò chơi bất hợp tác (điều ngược lại thì không có) cung cấp đủ các giả định để đưa ra các chiến lược khả thi có sẵn cho người chơi. Dù rằng có thể mong muốn chỉ sử dụng một lý thuyết duy nhất, nhưng trong nhiều trường hợp thì lượng thông tin không đủ để lập mô hình chính xác các thủ tục chính thức trong quá trình xây dựng chiến lược hoặc là mô hình kết quả quá phức tạo để cung cấp một chiến lược thực tế trong thế giới thực. Trong những trường hợp như vậy thì lý thuyết trò chơi hợp tác cung cấp một cách tiếp cận đơn giản cho phép phân tích trò chơi nói chung mà không phải đưa ra các giả định nào về việc thương lượng. Vậy thì sự khác biệt giữa lý thuyết trò chơi hợp tác và lý thuyết trò chơi bất hợp tác là gì? Cả hai đều là những cách tiếp cận và có những vẫn đề khi lựa chọn phương pháp tiếp cận. Chúng ta có thể xây dựng các mô hình tương tác chiến lược bằng lý thuyết trò chơi hợp tác hoặc lý thuyết trò chơi bất hợp tác, cả hai đều có lẽ sẽ hoạt động, chúng có những lợi thế cũng như những nhược được nhưng trong một số trường hợp thì phù hợp với cách tiếp cận bằng lý thuyết trò chơi hợp tác và những trường hợp khác thì phù hợp với lý thuyết trò chơi bất hợp tác hoặc là dựa vào câu hỏi đang cần giải quyết, chúng ta sẽ thấy thích thú với phương pháp này hơn so với phương pháp khác.

Lấy một ví dụ như sau: Có 3 đứa trẻ và mỗi đứa trẻ có một số tiền như sau: Huy có 6 nghìn đồng, Long có 4 nghìn đồng và Dương có 3 nghìn đồng. Những đứa trẻ này không quan tâm tới số tiền mà chúng có mà chỉ quan muốn mua kem. Có 3 loại kem là loại 500g có giá 7 nghìn đồng, loại 750g có giá 9 nghìn đồng và loại 1000g có giá 11 nghìn đồng. Chúng ta thấy rằng không một đứa trẻ (người chơi) nào có thể mua kem một mình và do đó chúng phải góp chung tiền (tài nguyên) và giờ chúng sẽ phải quyết định là sẽ chia ra như thế nào tức là mỗi người sẽ nhận được bao nhiêu? Phân tích vấn đề này bằng cách tiếp cận của lý thuyết trò chơi hợp tác và cũng như lý thuyết trò chơi bất hợp tác. Hai lý thuyết này có những điểm khác nhau cơ

bản như sau:

→ Các thỏa thuận có thể không được đề cập trong môi trường chiến lược. Những đứa trẻ này là những người bạn và chúng có thể dễ dàng viết ra một hợp đồng ràng buộc giữa chúng ví dụ như:"Nếu bạn không làm giống thế này tớ sẽ không nói chuyện với bạn nữa" và một số cách khác nữa. Thỏa thuận ràng buộc là thỏa thuận mà khi có một người vi phạm thì sẽ có hình phạt về tiền tệ. Thỏa thuận giữa những đứa trẻ có thể không có những hình phạt về tiền tệ nhưng sẽ có những tác động về cảm xúc và tâm lý. Nếu chúng ta phân tích một môi trường chiến lược mà những người tham gia trò chơi đã biết người khác từ trước, những người có quá khứ và có thể có tương lai với nhau thì lý thuyết trò chơi hợp tác sẽ có nhiều lợi ích, nhưng dĩ nhiên chúng ta có thể phân tích chiến lược bằng cách tiếp cận của lý thuyết trò chơi bất hợp tác và có những thỏa thuận tiềm năng được đưa ra với những người khác. → Trong lý thuyết trò chơi hợp tác thì cách tiếp cận đó là một cuộc thi hoặc một trò chơi giữa các liên minh. Còn trong cách tiếp cận của lý thuyết trò chơi bất hợp tác thì chúng ta không nhìn vào các nhóm người chơi mà nhìn vào từng cá nhân đơn lẻ, và bởi vì môi trường chiến lược mà những người chơi này không được phép và cũng không có cách nào để tham gia một liên minh (bởi họ không biết những người chơi khác). → Sự khác biệt lớn nhất giữa hai lý thuyết trò chơi này là lý thuyết trò chơi hợp tác đó là lý thuyết trò chơi hợp tác đưa môi trường chiến lược hoặc trò chơi vào một "hộp đen". Tức là những người chơi này tham gia một trò chơi và đây là môi trường chiến lược. Bởi vì quyết định của một người không đủ để định đoạt phần thưởng của riêng anh ta mà những người còn lại mới có thể có ảnh hưởng. Với việc xây dựng một mô hình thì chúng ta không đưa ra các dự đoán về chiến lược, về thời gian,... Bởi vì chúng ta làm sao mà biết được??? Quay lại với ví dụ trên thì hãy trả lời câu hỏi là bạn sẽ thực sự chơi trò chơi này như thế nào. Có lẽ chúng ta không thường phải ở trong tình huống này với bạn bè của mình, chúng ta không có một cách căn chỉnh đúng mực như trong những

trò chơi có thời gian cố định. Gần như chắc chắn tất cả ba đứa trẻ sẽ cùng nhau góp tiền và hãy quên việc hình thành một liên minh thế nào thay vào đó tất cả đều muốn cùng nhau góp tiền và như vậy là họ có thể mua cây kem 1000g. Đến đây chúng ta có câu hỏi là làm thế nào để chia cây kem đó? Chia đều hay là người góp nhiều tiền hơn sẽ được chia phần nhiều hơn? Phần nhiều nhất nhiều đến mức nào? Tức là họ sẽ phân xử và đàm phán như thế nào, liệu họ có viết số lên những tờ giấy rồi bốc chúng ngẫu nhiên,... Vậy thì quy luật của trò chơi mà họ sẽ chơi là gì? Chúng ta không thể biết, nhưng chúng ta có thể mô hình hóa nó, phụ thuộc vào câu hỏi mà chúng ta cần giải quyết. Nếu như chúng ta không quan tâm tới các chi tiết cụ thể của trò chơi và chỉ quan tâm là kết cục nên là như thế nào. Sau cùng khi họ cùng đi tới của hàng, mua kem và chia nó ra thì đâu là kết quả tối ưu. Chúng ta không cần quan tâm chuyện gì xảy ra trong "hộp đen", chỉ cần nhìn vào đầu ra của nó nên lý thuyết trò chơi hợp tác có nhiều ý nghĩa hơn. Nhưng đôi khi thì lý thuyết trò chơi bất hợp tác có mục tiêu là mở cái hộp này, khi muốn biết điều gì xảy ra trong cái hộp, chiến lược, hành động,... và vì lý do đó nên phải mở chiếc hộp và khám phá điều đang xảy ra bên trong. Điều này vẫn phụ thuộc vào loại câu hỏi bạn đang giải quyết. Nếu như chúng ta muốn phân tích cách các công ty cạnh tranh với nhau cũng như là các công ty thay đổi giá cả của họ như thế nào hoặc họ điều chỉnh số lượng của họ thế nào hoặc số lượng của họ thay đổi thế nào phụ thuộc vào những công ty khác... Chiến lược, thời gian trò chơi đều là những vấn đề khi đó chúng ta cần giải quyết những vấn đề cụ thể của môi trường chiến lược, chúng ta không chỉ nhìn vào đầu ra. Trong trường hợp này thì cách tiếp cận bằng lý thuyết trò chơi bất hợp tác sẽ có nhiều ý nghĩa hơn. Lý thuyết trò chơi hợp tác là tương đối và những điều kiện là lỏng lẻo, nên lý thuyết trò chơi hợp tác có tính quy chuẩn hơn khi so sánh với lý thuyết trò chơi bất hợp tác. Vì thế, lý thuyết trò chơi bất hợp tác minh bạch hơn như là người chơi sẽ chơi thế nào, nên chơi thế nào. Tuy vậy lý thuyết trò chơi hợp tác không quan tâm nhiều đến các chi tiết của trò chơi, nó sao cũng được và dù họ chơi như thế nào thì kết cục vẫn sẽ nên là như thế. Vậy tóm lại khi nào thì nên dùng lý thuyết trò chơi hợp tác và khi nào thì nên dùng lý thuyết trò chơi bất hợp tác. Chúng ta có thể mô hình hóa một không gian chiến lược bằng một trong hai cách tiếp cận. Rõ ràng là nó phụ thuộc vào loại câu hỏi mà chúng ta đang tìm câu trả lời, và trong những không gian thì lý thuyết trò chơi hợp tác phù hợp; ví dụ như hãy suy nghĩ là bạn biết các tình huống thương thuyết và bạn nhớ là bạn chưa từng trao đổi với nhiều người bán hoặc là

nhiều người mua. Những sự mô tả chiến lược, hành động hay là thời gian là những sự cốt yếu và chúng ta có thể nói chúng ta không quan tâm điều gì xảy ra bên trong cái hộp và tôi chỉ muốn biết kết cục. Có những lúc chúng ta muốn trả lời câu hỏi là đâu là các đề nghị tốt nhất và ai sẽ là người làm các đề nghị đó, nếu đó là chính bản thân mình thì nó sẽ có tác động tích cực hay tiêu cực hoặc nếu như chúng ta muốn nhượng bộ thì tần số nhượng bộ nên là bao nhiều thì lý thuyết trò chơi bất hợp tác sẽ có nhiều tác dụng hơn. Nó không hề rõ ràng trong nhiều trường hợp thì không có một sự khác biệt rõ ràng. Nhưng với những gì đã nêu ở trên thì có lẽ đã đủ những gì cơ bản nhất để chúng ta phân biệt hai cách tiếp cận này

Strict Dominance Chiến lược thống trị Cốt lõi của lý thuyết trò chơi là việc nghiên cứu các chiến thuật phụ thuộc lẫn nhau - tức là một tình huống mà hành động của một cá nhân sẽ tác động tới cá nhân còn lại và ngược lại. Chiến lược phụ thuộc lẫn nhau là rất phức tạp, khi mà người tham gia cần lường trước, hành động và phản ứng. ... Song đề tù nhân là bài toán lâu đời và là mô hình được nghiên cứu nhiều nhất trong lý thuyết trò chơi, và cách giải quyết bài táon cũng là đơn giản.... Strict Dominance: Thông qua bài toán Song đề tù nhân, chúng ta thấy được một ví dụ của thống trị nghiêm ngặt. Ta nói chiến lược a thống trị nghiêm ngặt chiến lược b cho người chơi x nếu như chiến lược x cung cấp một phần thưởng tốt hơn cho người chơi này so với chiến lược b bất kể là người chơi còn lại làm gì. Như trong ví dụ trên thì nếu như người chơi 1 lựa chọn "khai" thì anh ta sẽ nhận được kết quả tốt hơn so với im lặng bất kể là người chơi 2 có làm gì. Không hề bất ngờ là người chơi thường không bao giờ lựa chọn chiến lược bị áp đảo - theo như định nghĩa là một lựa chọn tốt hơn luôn luôn xuất hiện bất kể là người chơi còn lại làm gì. Ý nghĩa của con số và vai trò của lý thuyết trò chơi Mặc dù có một số lượng lớn các nhánh của lý thuyết trò chơi tập trung nghiên cứu cách dự đoán ích lợi, chúng ta thường coi như phần thưởng của mỗi người chơi là sự xếp hạng từ đầu ra mà anh/cô ta thích thú nhất cho tới ít thích thú nhất.

Trong Song đề tù nhân, ta giả định là người chơi muốn thời gian ở tù của mình là nhỏ nhất. Lý thuyết trò chơi không bắt buộc người chơi phải có những sự ưu tiên này, tương tự với các nhà phê bình thường yêu cầu. Thay vào đó, lý thuyết trò chơi phân tích điều gì nên xảy ra theo xu hướng mong muốn của người chơi. Vì vậy nếu như người chơi muốn thời gian tù của mình là nhỏ nhất thì chúng ta có thể sử dụng những số âm của tháng nếu như phải vào tù như là phần thưởng. Những con số này tương ứng với các kết quả mà họ sẽ nhận được từ ưu tiên nhất là kết quả có giá trị 0, kết quả ít mong muốn nhất là kết quả có giá tr...


Similar Free PDFs