την οικονομία

Ισορροπία Nash. Θεωρία παιγνίων για τους οικονομολόγους (John Nash)

Πίνακας περιεχομένων:

Ισορροπία Nash. Θεωρία παιγνίων για τους οικονομολόγους (John Nash)
Ισορροπία Nash. Θεωρία παιγνίων για τους οικονομολόγους (John Nash)

Βίντεο: John Nash / Τζον Νας - Θεωρία παιγνίων (Και αν όλοι πάμε για την ξανθιά;) 2024, Ιούλιος

Βίντεο: John Nash / Τζον Νας - Θεωρία παιγνίων (Και αν όλοι πάμε για την ξανθιά;) 2024, Ιούλιος
Anonim

Στη δεκαετία του 1930, ο John von Neumann και ο Oscar Morgenstern έγιναν οι ιδρυτές ενός νέου ενδιαφέροντος χώρου των μαθηματικών, το οποίο ονομάστηκε "θεωρία των παιχνιδιών". Στη δεκαετία του 1950, ο νέος μαθηματικός John Nash έγινε ενδιαφέρον για αυτόν τον τομέα. Η θεωρία της ισορροπίας έγινε το αντικείμενο της διατριβής του, την οποία έγραψε όταν ήταν 21 ετών. Έτσι δημιουργήθηκε μια νέα στρατηγική για τα παιχνίδια Nash Equilibrium, η οποία κέρδισε το βραβείο Νόμπελ πολλά χρόνια αργότερα, το 1994.

Image

Το μεγάλο χάσμα ανάμεσα στη συγγραφή μιας διατριβής και την καθολική αποδοχή ήταν μια δοκιμασία για τον μαθηματικό. Το Genius χωρίς αναγνώριση είχε ως αποτέλεσμα σοβαρές ψυχικές παραβιάσεις, αλλά ο John Nash κατάφερε να λύσει αυτό το πρόβλημα χάρη στο εξαιρετικό λογικό του μυαλό. Η θεωρία του για την "ισορροπία Nash" απονεμήθηκε το βραβείο Νόμπελ και η προσαρμογή του στην ταινία "Όμορφο μυαλό".

Θεωρία παιχνιδιών Εν συντομία

Δεδομένου ότι η θεωρία της ισορροπίας Nash εξηγεί τη συμπεριφορά των ανθρώπων από την άποψη της αλληλεπίδρασης, αξίζει να εξεταστούν οι βασικές έννοιες της θεωρίας των παιχνιδιών.

Η θεωρία των παιχνιδιών μελετά τη συμπεριφορά των συμμετεχόντων (πράκτορες) υπό συνθήκες αλληλεπίδρασης μεταξύ τους ανάλογα με τον τύπο του παιχνιδιού, όταν το αποτέλεσμα εξαρτάται από την απόφαση και τη συμπεριφορά πολλών ανθρώπων. Ο συμμετέχων λαμβάνει αποφάσεις, καθοδηγούμενος από τις προβλέψεις του σχετικά με τη συμπεριφορά των άλλων, η οποία ονομάζεται στρατηγική παιχνιδιού.

Υπάρχει επίσης μια κυρίαρχη στρατηγική στην οποία ο συμμετέχων παίρνει το βέλτιστο αποτέλεσμα για οποιαδήποτε συμπεριφορά άλλων συμμετεχόντων. Αυτή είναι η καλύτερη στρατηγική win-win του παίκτη.

Το δίλημμα του φυλακισμένου και η επιστημονική ανακάλυψη

Το δίλημμα του κρατούμενου είναι μια υπόθεση με παιχνίδι όταν οι συμμετέχοντες αναγκάζονται να κάνουν λογικές αποφάσεις, επιτυγχάνοντας έναν κοινό στόχο στο πλαίσιο μιας σύγκρουσης εναλλακτικών λύσεων. Το ερώτημα είναι ποια από αυτές τις επιλογές θα επιλέξει, αναγνωρίζοντας το προσωπικό και κοινό συμφέρον του, καθώς και την αδυναμία να πάρει και τα δύο. Οι παίκτες φαίνεται να περικλείονται σε σκληρές συνθήκες παιχνιδιού, γεγονός που μερικές φορές τους κάνει να σκέφτονται πολύ παραγωγικά.

Image

Αυτό το δίλημμα διερευνήθηκε από τον Αμερικανό μαθηματικό John Nash. Η ισορροπία που έφερε έξω έγινε επαναστατική του είδους της. Ιδιαίτερα έντονη, αυτή η νέα σκέψη επηρέασε τη γνώμη των οικονομολόγων για το πώς οι παράγοντες της αγοράς κάνουν επιλογές, λαμβάνοντας υπόψη τα συμφέροντα των άλλων, με στενή αλληλεπίδραση και διασταύρωση των συμφερόντων.

Είναι καλύτερα να μελετήσουμε τη θεωρία των παιχνιδιών με συγκεκριμένα παραδείγματα, καθώς αυτή η ίδια η μαθηματική πειθαρχία δεν είναι ξηρή θεωρητική.

Παράδειγμα δίλημμα για τους φυλακισμένους

Για παράδειγμα, δύο άτομα που λήστεψαν, έπεσαν στα χέρια της αστυνομίας και διερευνούνται σε ξεχωριστά κελιά. Ταυτόχρονα, οι αστυνομικοί προσφέρουν σε κάθε συμμετέχοντα ευνοϊκές συνθήκες υπό τις οποίες θα απελευθερωθεί εάν καταθέσει κατά του συντρόφου του. Κάθε ένας από τους εγκληματίες έχει τις ακόλουθες στρατηγικές που θα εξετάσει:

  1. Και οι δύο ταυτόχρονα μαρτυρούν και λαμβάνουν 2, 5 χρόνια στη φυλακή.

  2. Και οι δύο είναι σιωπηλοί ταυτόχρονα και λαμβάνουν 1 χρόνο το καθένα, δεδομένου ότι σε αυτή την περίπτωση η αποδεικτική βάση της ενοχής τους θα είναι μικρή.

  3. Κάποιος δίνει στοιχεία και παίρνει ελευθερία, ενώ ο άλλος είναι σιωπηλός και παίρνει 5 χρόνια στη φυλακή.

Είναι προφανές ότι η έκβαση της υπόθεσης εξαρτάται από την απόφαση και των δύο συμμετεχόντων, αλλά δεν μπορούν να καταλήξουν σε συμφωνία επειδή βρίσκονται σε διαφορετικά κελιά. Η σύγκρουση των προσωπικών τους συμφερόντων στον αγώνα για κοινό συμφέρον είναι επίσης εμφανής. Κάθε κρατούμενος έχει δύο επιλογές δράσης και 4 επιλογές για τα αποτελέσματα.

Επαγωγική αλυσίδα

Έτσι, ο εγκληματίας Α εξετάζει τις ακόλουθες επιλογές:

  1. Είμαι σιωπηλός και ο σύντροφός μου είναι σιωπηλός - και οι δύο θα λάβουν 1 χρόνο στη φυλακή.

  2. Δίνω το σύντροφό μου και μου δίνει - και οι δύο έχουμε 2.5 χρόνια στη φυλακή.

  3. Είμαι σιωπηλός και ο σύντροφός μου με παραδίδει - θα λάβω 5 χρόνια στη φυλακή και θα είναι ελεύθερος.

  4. Μου μίσθω συνεργάτη μου, και είναι σιωπηλός - έχω την ελευθερία, και είναι 5 χρόνια στη φυλακή.

Δίνουμε ένα πλέγμα πιθανών λύσεων και αποτελεσμάτων για λόγους σαφήνειας.

Ο πίνακας των πιθανών αποτελεσμάτων του διλήμματος του φυλακισμένου.

Image

Το ερώτημα είναι τι θα επιλέξει ο κάθε συμμετέχων;

"Σιωπή, δεν μπορείτε να μιλήσετε" ή "Σιωπή δεν μπορείτε να μιλήσετε"

Για να κατανοήσετε την επιλογή του συμμετέχοντα, πρέπει να περάσετε από την αλυσίδα των σκέψεών του. Μετά από τη συλλογιστική του εγκληματία Α: αν είμαι σιωπηλός και σιωπά τον σύντροφό μου, θα έχουμε έναν ελάχιστο όρο (1 έτος), αλλά δεν μπορώ να μάθω πώς θα συμπεριφερθεί. Εάν μαρτυρεί εναντίον μου, τότε είναι επίσης καλύτερο για μένα να καταθέσω, διαφορετικά μπορώ να καθίσω για 5 χρόνια. Θα προτιμούσα να κάθονται 2, 5 χρόνια από 5 χρόνια. Αν δεν λέει τίποτα, τότε πρέπει να καταθέσω, γιατί με αυτόν τον τρόπο θα αποκτήσω ελευθερία. Το μέλος Β υποστηρίζει επίσης με τον ίδιο τρόπο.

Image

Είναι εύκολο να καταλάβουμε ότι η κυρίαρχη στρατηγική για κάθε εγκληματία είναι να καταθέσει. Το βέλτιστο σημείο αυτού του παιχνιδιού εμφανίζεται όταν και οι δύο εγκληματίες δίνουν στοιχεία και λαμβάνουν το "βραβείο" τους - 2, 5 χρόνια στη φυλακή. Η θεωρία των παιχνιδιών του Nash την καλεί σε ισορροπία.

Βέλτιστη βέλτιστη λύση Nash

Η επανάσταση της άποψης Nashev είναι ότι μια τέτοια ισορροπία δεν είναι βέλτιστη εάν εξετάσουμε τον συγκεκριμένο συμμετέχοντα και το προσωπικό του ενδιαφέρον. Μετά από όλα, η καλύτερη επιλογή είναι να παραμείνετε σιωπηλοί και ελεύθεροι.

Η ισορροπία Nash είναι ένα σημείο επαφής, όπου κάθε συμμετέχων επιλέγει μια επιλογή που είναι βέλτιστη γι 'αυτόν μόνο εάν οι άλλοι συμμετέχοντες επιλέξουν μια συγκεκριμένη στρατηγική.

Λαμβάνοντας υπόψη την επιλογή όταν και οι δύο εγκληματίες σιωπούν και λαμβάνουν μόνο 1 χρόνο το καθένα, μπορούμε να την ονομάσουμε Pareto-optimal επιλογή. Ωστόσο, είναι δυνατή μόνο εάν οι εγκληματίες θα μπορούσαν να συμφωνήσουν εκ των προτέρων. Αλλά ακόμη και αυτό δεν θα εγγυηθεί αυτό το αποτέλεσμα, αφού ο πειρασμός να αποφύγουμε από την πειθώ και να αποφύγουμε την τιμωρία είναι μεγάλος. Η έλλειψη πλήρους εμπιστοσύνης στον άλλον και ο κίνδυνος να είναι ηλικίας 5 ετών υποχρεώνει κάποιον να επιλέξει την επιλογή με αναγνώριση. Για να ληφθεί υπόψη το γεγονός ότι οι συμμετέχοντες θα τηρήσουν την επιλογή με σιωπή, ενεργώντας από κοινού, είναι απλά παράλογο. Ένα τέτοιο συμπέρασμα μπορεί να γίνει αν μελετήσουμε την ισορροπία Nash. Παραδείγματα αποδεικνύουν μόνο αυτό.

Εγωιστική ή ορθολογική

Η θεωρία της ισορροπίας Nash έδωσε εκπληκτικά συμπεράσματα, αντικρούοντας τις αρχές που υπήρχαν πριν. Για παράδειγμα, ο Adam Smith θεωρούσε τη συμπεριφορά του καθενός από τους συμμετέχοντες ως απολύτως εγωιστική, γεγονός που έφερε το σύστημα σε ισορροπία. Αυτή η θεωρία ονομάστηκε "αόρατο χέρι της αγοράς".

Image

Ο John Nash είδε ότι εάν όλοι οι συμμετέχοντες ενεργούν για την επιδίωξη των δικών τους συμφερόντων, τότε αυτό ποτέ δεν θα οδηγήσει σε ένα βέλτιστο αποτέλεσμα της ομάδας. Θεωρώντας ότι η ορθολογική σκέψη είναι εγγενής σε κάθε συμμετέχοντα, η επιλογή που προσφέρει η στρατηγική ισορροπίας Nash είναι πιο πιθανή.

Αμιγώς αρσενικό πείραμα

Ένα ζωντανό παράδειγμα είναι το παιχνίδι "ξανθιά παράδοξο", το οποίο, αν και φαίνεται ακατάλληλο, είναι μια ζωντανή απεικόνιση που δείχνει πώς λειτουργεί η θεωρία των παιχνιδιών Nash.

Σε αυτό το παιχνίδι πρέπει να φανταστείτε ότι η εταιρεία των ελεύθερων παιδιών ήρθε στο μπαρ. Στη συνέχεια είναι μια εταιρεία κοριτσιών, μία από τις οποίες είναι προτιμότερη από τις άλλες, λένε ξανθιά. Πώς συμπεριφέρονται τα παιδιά για να πάρουν την καλύτερη φίλη για τον εαυτό τους;

Image

Έτσι, η συλλογιστική των παιδιών: αν ο καθένας αρχίσει να εξοικειώνεται με την ξανθιά, τότε πιθανότατα δεν θα φτάσει σε κανέναν, τότε οι φίλοι της δεν θα θέλουν να συναντηθούν. Κανείς δεν θέλει να είναι ο δεύτερος εφεδρικός. Αλλά αν οι τύποι επιλέγουν να αποφύγουν την ξανθιά, τότε η πιθανότητα για καθένα από τα παιδιά να βρουν μια καλή φίλη ανάμεσα στα κορίτσια είναι υψηλή.

Η κατάσταση της ισορροπίας Nash δεν είναι βέλτιστη για τους τύπους, επειδή, επιδιώκοντας μόνο τα εγωιστικά τους συμφέροντα, ο καθένας θα επέλεγε μια ξανθιά. Είναι προφανές ότι η επιδίωξη μόνο εγωιστικών συμφερόντων θα ισοδυναμεί με την κατάρρευση των συμφερόντων του ομίλου. Η ισορροπία Nash θα σημαίνει ότι κάθε άτομο ενεργεί για τα προσωπικά του συμφέροντα, τα οποία έρχονται σε επαφή με τα συμφέροντα ολόκληρης της ομάδας. Αυτή δεν είναι μια βέλτιστη επιλογή για όλους προσωπικά, αλλά βέλτιστη για όλους, με βάση τη συνολική στρατηγική επιτυχίας.

Ολόκληρη η ζωή μας είναι ένα παιχνίδι

Η λήψη αποφάσεων σε πραγματικές συνθήκες είναι πολύ παρόμοια με ένα παιχνίδι όταν περιμένετε μια ορισμένη ορθολογική συμπεριφορά από άλλους συμμετέχοντες. Στις επιχειρήσεις, στην εργασία, σε μια ομάδα, σε μια εταιρεία, ακόμα και σε σχέσεις με το αντίθετο φύλο. Από μεγάλες συναλλαγές σε καταστάσεις απλής ζωής, όλα υπακούουν σε ένα νόμο ή άλλο.

Image

Φυσικά, οι θεωρούμενες καταστάσεις παιχνιδιού με τους εγκληματίες και το μπαρ είναι απλώς εξαιρετικές εικόνες που καταδεικνύουν την ισορροπία του Nash. Παραδείγματα τέτοιων διλημμάτων εμφανίζονται πολύ συχνά στην πραγματική αγορά και αυτό ισχύει ιδιαίτερα σε περιπτώσεις όπου δύο μονοπωλείς ελέγχουν την αγορά.

Μικτές στρατηγικές

Συχνά δεν εμπλέκονται σε ένα, αλλά σε πολλά παιχνίδια ταυτόχρονα. Επιλέγοντας μία από τις επιλογές για ένα παιχνίδι, καθοδηγούμενη από μια ορθολογική στρατηγική, αλλά παίρνετε σε ένα άλλο παιχνίδι. Μετά από πολλές ορθολογικές αποφάσεις, μπορεί να διαπιστώσετε ότι το αποτέλεσμά σας δεν σας ταιριάζει. Τι να κάνετε;

Εξετάστε δύο τύπους στρατηγικής:

  • Μια καθαρή στρατηγική είναι η συμπεριφορά ενός συμμετέχοντα που προέρχεται από τη σκέψη για την πιθανή συμπεριφορά άλλων συμμετεχόντων.

  • Μια μικτή στρατηγική ή μια τυχαία στρατηγική είναι η εναλλαγή των καθαρών στρατηγικών τυχαία ή η επιλογή μιας καθαρής στρατηγικής με μια ορισμένη πιθανότητα. Αυτή η στρατηγική ονομάζεται επίσης τυχαία.

Image

Λαμβάνοντας υπόψη αυτή τη συμπεριφορά, έχουμε μια νέα ματιά στην ισορροπία Nash. Αν νωρίτερα ειπώθηκε ότι ο παίκτης επιλέγει μία στρατηγική μία φορά, τότε μπορεί να φανταστεί και άλλη συμπεριφορά. Μπορούμε να παραδεχτούμε ότι οι παίκτες επιλέγουν τυχαία μια στρατηγική με κάποια πιθανότητα. Παιχνίδια στα οποία η ισορροπία Nash δεν μπορεί να βρεθεί σε καθαρές στρατηγικές τους έχουν πάντοτε σε μικτές.

Η ισορροπία Nash σε μικτές στρατηγικές ονομάζεται μικτή ισορροπία. Αυτή είναι μια τέτοια ισορροπία, όπου κάθε συμμετέχων επιλέγει τη βέλτιστη συχνότητα για την επιλογή των στρατηγικών του, υπό τον όρο ότι οι άλλοι συμμετέχοντες επιλέγουν τις στρατηγικές τους με μια δεδομένη συχνότητα.