Vérifié contenu

La théorie des jeux

Sujets connexes: Mathématiques

À propos de ce écoles sélection Wikipedia

SOS Enfants, un organisme de bienfaisance de l'éducation , a organisé cette sélection. Une bonne façon d'aider d'autres enfants est de parrainer un enfant

La théorie des jeux est une étude de stratégique la prise de décision. Plus formellement, ce est «l'étude des des modèles mathématiques de conflit et de coopération entre les décideurs rationnels intelligents. "Une alternative terme suggéré" comme un nom plus descriptif pour la discipline "est interactive théorie de la décision. La théorie des jeux est principalement utilisé dans l'économie, la science politique et la psychologie, ainsi que la logique et de la biologie. Le premier sujet abordé jeux à somme nulle, les pertes nettes des gains de telle sorte qu'une personne exactement égales de l'autre participant (s). Aujourd'hui, cependant, la théorie des jeux se applique à un large éventail de rapports de classe, et a développé dans un terme parapluie pour le côté logique de la science, d'inclure les deux-humains non humains et, comme les ordinateurs. Usages classiques comprennent un sens de l'équilibre dans de nombreux jeux, où chaque personne a trouvé ou développés une tactique qui ne peuvent pas mieux avec succès ses résultats, compte tenu de l'autre approche.

La théorie des jeux moderne a commencé avec l'idée sur l'existence d'équilibres en stratégies mixtes en deux personnes jeux à somme nulle et sa preuve par John von Neumann . Preuve de l'origine de Von Neumann utilisée Point fixe le théorème de Brouwer sur applications continues en ensembles convexes compacts, qui est devenue une méthode standard dans la théorie des jeux et de l'économie mathématique. Son document a été suivi par son livre 1944 Théorie des Jeux et le comportement économique, avec Oskar Morgenstern, qui considérait les jeux coopératifs de plusieurs joueurs. La deuxième édition de ce livre a fourni une théorie axiomatique de l'utilité espérée, qui a permis aux statisticiens et les économistes mathématiques pour traiter la prise de décision en situation d'incertitude.

Cette théorie a été largement développée dans les années 1950 par de nombreux spécialistes. La théorie des jeux a plus tard été explicitement appliqué à la biologie dans les années 1970, bien que des développements similaires remontent au moins aussi loin que les années 1930. La théorie des jeux a été largement reconnu comme un outil important dans de nombreux domaines. Huit jeu théoriciens ont remporté le Prix commémoratif Nobel en sciences économiques, et John Maynard Smith a reçu le Prix Crafoord pour son application de la théorie des jeux à la biologie.

Représentation de jeux

Les jeux étudiés dans la théorie des jeux sont des objets mathématiques bien définis. Un jeu se compose d'un ensemble de joueurs, un ensemble de mouvements (ou stratégies) disponibles pour les joueurs, et une spécification des gains pour chaque combinaison de stratégies. La plupart des jeux coopératifs sont présentés sous la forme de fonction caractéristique, tandis que l'étendue et les formes normales sont utilisées pour définir des jeux non coopératifs.

Forme extensive

Une forme extensive jeu

La forme extensive peut être utilisé pour officialiser jeux avec un séquencement de temps de mouvements. Jeux ici sont joués sur arbres (comme sur la photo à gauche). Ici, chaque sommet (ou nœud) représente un point de choix pour un joueur. Le joueur est spécifié par un numéro indiqué par le sommet. Les lignes sur le sommet représentent une action possible pour ce joueur. Les gains sont indiquées au bas de l'arbre. La forme extensive peut être considéré comme un multi-joueurs généralisation d'un arbre de décision. (Fudenberg & Tirole 1991, p. 67)

Dans le jeu illustré à la gauche, il ya deux joueurs. Joueur 1 se déplace d'abord et choisit F ou U. Joueur 2 voit le coup de l 'Joueur 1 puis choisit A ou R. Supposons que le joueur 1 choisit U et alors le joueur 2 choisit A, alors le joueur 1 obtient 8 et Joueur 2 obtient deux.

La forme extensive peut également capturer des jeux simultanée-déplacer et les jeux à information imparfaite. Pour le représenter, soit une ligne pointillée relie différents sommets pour les représenter comme faisant partie de la même information set (ce est à dire, les joueurs ne savent pas à quel point ils sont), ou une ligne fermée est dessiné autour d'eux. (Voir l'exemple dans la section de l'information imparfaite .)

Forme normale

Joueur 2
choisit Gauche
Joueur 2
choisit droit
Joueur 1
choisit Up
4, 3 -1, -1
Joueur 1
choisit de Down
0, 0 3, 4
Forme ou gain normal matrice d'un deux-joueur, jeu à 2 stratégie

Le (forme ou stratégique) normale jeu est généralement représenté par une matrice qui montre les joueurs, les stratégies, et de pay-offs (voir l'exemple à la droite). Plus généralement, il peut être représenté par une fonction qui associe un gain pour chaque joueur avec toutes les combinaisons possibles d'actions. Dans l'exemple d'accompagnement, il ya deux joueurs; on choisit la ligne et l'autre choisit la colonne. Chaque joueur dispose de deux stratégies, qui sont spécifiées par le nombre de lignes et le nombre de colonnes. Les gains sont fournis à l'intérieur. Le premier nombre est la récompense reçue par le joueur de première ligne (du joueur 1 dans notre exemple); le second est la récompense pour le joueur de la colonne (du joueur 2 dans notre exemple). Supposons que le joueur 1 joue le haut et que le joueur 2 joue gauche. Ensuite le joueur 1 obtient un paiement de 4, et le joueur 2 obtient trois.

Quand un jeu est présenté sous forme normale, il est présumé que chaque joueur agit simultanément ou, au moins, sans connaître les actions de l'autre. Si les joueurs ont des informations sur les choix des autres joueurs, le jeu est généralement présentée sous forme extensive.

Chaque jeu vaste-forme a une normale-forme équivalente jeu, cependant la transformation sous forme normale peut entraîner une explosion combinatoire de la taille de la représentation, ce qui rend impossible de calcul. (Leyton-Brown & Shoham 2008, p. 35)

Formulaire de fonction caractéristique

Dans les jeux qui possèdent utilitaire amovible récompenses séparées ne sont pas donnés; plutôt, la fonction caractéristique décide le gain de chaque unité. L'idée est que l'unité qui est «vide», pour ainsi dire, ne reçoit pas de récompense à tous.

L'origine de cette forme se trouve dans John von Neumann et le livre d'Oskar Morgenstern; quand on regarde ces cas, ils deviné que quand un syndicat \ Mathbf {C} apparaît, il travaille contre la fraction \ Left (\ frac {\ mathbf {N}} {\ mathbf {C}} \ right) comme si deux personnes jouaient à un jeu normal. La récompense équilibré de C est une fonction de base. Bien qu'il existe des exemples différents qui aident à déterminer les montants de coalition de jeux normaux, semble pas tout ce qui dans leur forme de fonction peut être dérivé de tel.

Formellement, une fonction caractéristique est considérée comme: (N, v), où N représente le groupe de personnes et v: 2 ^ N \ à \ mathbf {R} est un utilitaire normal.

Ces fonctions caractéristiques ont élargi pour décrire les jeux où il ne existe aucun utilitaire amovible.

Partition forme de fonction

Le formulaire de fonction caractéristique ignore la possible externalités de la formation de la coalition. Dans la fonction de partition former le gain d'une coalition dépend non seulement de ses membres, mais aussi sur la façon dont le reste des joueurs sont partagé (Thrall et Lucas 1963).

Général et usages appliqués

Comme une méthode de mathématiques appliquées , la théorie des jeux a été utilisée pour étudier un large éventail de comportements humains et animaux. Il a été initialement développé en économie pour comprendre une grande collection de comportements économiques, y compris les comportements des entreprises, les marchés et les consommateurs. L'utilisation de la théorie des jeux dans les sciences sociales a augmenté, et la théorie des jeux a été appliquée à des comportements politiques, sociologiques et psychologiques.

Analyse la théorie des jeux a d'abord été utilisée pour étudier le comportement des animaux Ronald Fisher dans les années 1930 (bien que même Charles Darwin fait quelques déclarations de la théorie des jeux informels). Ce travail est antérieure à la dénomination «théorie des jeux», mais elle partage de nombreuses caractéristiques importantes avec ce domaine. Les développements dans l'économie ont ensuite été appliquées à la biologie en grande partie par John Maynard Smith dans son livre Evolution et la théorie des jeux.

En plus d'être utilisé pour décrire, prédire et expliquer le comportement, la théorie des jeux a également été utilisé pour développer des théories de comportement éthique ou normative et à prescrire un tel comportement. En l'économie et la philosophie, les chercheurs ont appliqué la théorie des jeux pour aider à la compréhension du comportement bon ou bon. La théorie des jeux arguments de ce type peuvent être trouvés aussi loin que Platon .

Description et modélisation

A trois étapes jeu de mille-pattes

La première utilisation connue est de décrire et modèle comment les populations humaines se comportent. Certains érudits pensent que par trouver les équilibres de jeux qu'ils peuvent prédire comment les populations humaines réelles se comportent lorsqu'ils sont confrontés à des situations analogues au jeu à l'étude. Ce point de vue particulier de la théorie des jeux a été critiquée récemment. Premièrement, il est critiqué parce que les hypothèses formulées par les théoriciens des jeux sont souvent violés. Les théoriciens des jeux peuvent prendre les joueurs agissent toujours de façon à maximiser directement leurs victoires (la modèle de Homo economicus), mais dans la pratique, le comportement humain se écarte souvent de ce modèle. Explications de ce phénomène sont nombreuses; irrationalité, de nouveaux modèles de délibération, ou même des motifs différents (comme celle de l'altruisme ). Les théoriciens des jeux répondent en comparant leurs hypothèses à ceux utilisés en physique. Ainsi, alors que leurs hypothèses ne tiennent pas toujours, ils peuvent traiter la théorie des jeux comme un scientifique raisonnable apparenté idéal pour les modèles utilisés par physiciens. Toutefois, dans le jeu de mille-pattes, deviner 2/3 du jeu moyenne, et le jeu du dictateur, les gens ne jouent pas régulièrement équilibres de Nash. Ces expériences ont démontré que les individus ne jouent pas stratégies d'équilibre. Il ya un débat en cours sur l'importance de ces expériences.

Par ailleurs, certains auteurs affirment que les équilibres de Nash ne fournissent pas de prévisions pour les populations humaines, mais plutôt fournir une explication pour pourquoi les populations qui jouent équilibres de Nash restent dans cet état. Cependant, la question de la façon dont les populations atteignent ces points reste ouvert.

Certains théoriciens de jeu se sont tournés vers la théorie des jeux évolutive afin de résoudre ces questions. Ces modèles supposent soit pas de rationalité ou rationalité limitée de la part des joueurs. Malgré son nom, la théorie des jeux évolutionniste ne présume pas nécessairement la sélection naturelle au sens biologique. La théorie des jeux évolutionniste comprend deux modèles biologiques ainsi que l'évolution culturelle et aussi de l'apprentissage individuel (par exemple, dynamique de jeu fictifs).

Analyse prescriptive ou normative

Coopérer Défaut
Coopérer -1, -1 -10, 0
Défaut 0, -10 -5, -5
Le dilemme du prisonnier

D'autre part, certains spécialistes voient pas la théorie de jeu un outil prédictif pour le comportement des êtres humains, mais comme une suggestion de la façon dont les gens doivent se comporter. Depuis une stratégie, correspondant à un équilibre de Nash d'un jeu constitue son meilleure réponse aux actions des autres joueurs - pour autant qu'elles soient (même) l'équilibre de Nash -, jouant une stratégie qui fait partie d'un équilibre de Nash semble approprié. Cependant, la rationalité d'une telle décision a été prouvé que pour les cas spéciaux. Cette utilisation normative de la théorie des jeux a également été critiquée. Premièrement, dans certains cas, il convient de jouer une stratégie de non-équilibre si l'on se attend à d'autres de jouer des stratégies non-équilibre ainsi. Pour un exemple, voir deviner 2/3 de la moyenne.

Deuxièmement, le dilemme du prisonnier présente une autre contre-potentiel. Dans le dilemme du prisonnier, chaque joueur poursuivant son propre intérêt conduit les deux joueurs d'être pire que se ils ne avaient poursuivi leurs propres intérêts.

Économie et affaires

La théorie des jeux est une méthode importante utilisée dans économie mathématique et les entreprises pour modélisation des comportements concurrents d'interagir agents. Les applications incluent un large éventail de phénomènes et des approches économiques, tels que ventes aux enchères, négociation, fusions et acquisitions prix, répartition équitable, duopoles, oligopoles, formation de réseaux sociaux, l'économie de calcul à base d'agents, équilibre général, conception du mécanisme, et systèmes de vote, et à travers ces zones aussi vastes que économie expérimentale, l'économie comportementale , économie de l'information, organisation industrielle et l'économie politique .

Cette recherche se concentre habituellement sur des ensembles particuliers de stratégies connues comme équilibres dans les jeux. Ces «concepts de solutions" sont généralement basées sur ce qui est requis par les normes de la rationalité. Dans les jeux non-coopératifs, le plus célèbre d'entre eux est l' équilibre de Nash . Un ensemble de stratégies est un équilibre de Nash si chacun représente une meilleure réponse aux autres stratégies. Donc, si tous les joueurs jouent les stratégies dans un équilibre de Nash, ils ne ont aucune incitation unilatérale de se écarter, car leur stratégie est le mieux qu'ils peuvent faire compte tenu de ce que font les autres.

Les gains du jeu sont généralement prises pour représenter la utilité des joueurs individuels. Souvent dans des situations de modélisation les gains représentent de l'argent, ce qui correspond sans doute à l'utilité d'un individu. Cette hypothèse, cependant, peut être défectueux.

Un document prototype sur la théorie des jeux en économie commence par présenter un jeu qui est une abstraction d'une situation économique particulière. Un ou plusieurs concepts de solution sont choisis, et l'auteur montre les jeux de stratégie dans le jeu présenté équilibres sont du type approprié. Naturellement on peut se demander à quoi sert cette information devrait être mis. Les économistes et professeurs d'affaires suggèrent deux principales utilisations (ci-dessus): descriptif et prescriptive.

Science politique

L'application de la théorie des jeux à la science politique se concentre dans les zones de chevauchement de partage équitable, l'économie politique , choix publics, négociation de guerre, la théorie politique positif, et théorie du choix social. Dans chacun de ces domaines, les chercheurs ont élaboré des modèles de la théorie des jeux dans lesquels les joueurs sont souvent les électeurs, états, groupes d'intérêts spéciaux, et des politiciens.

Pour les premiers exemples de la théorie des jeux appliquée à la science politique, voir le travail de Anthony Downs. Dans son livre Une théorie économique de la démocratie (Downs 1957), il applique la Hotelling modèle de localisation des entreprises dans le processus politique. Dans le modèle de Downs, les candidats politiques se engagent à des idéologies sur un espace politique unidimensionnelle. Downs premières montre comment les candidats politiques vont converger à l'idéologie préféré par l'électeur médian si les électeurs soient pleinement informés, mais fait valoir que les électeurs choisissent de rester ignorants rationnelle qui permet de divergence du candidat.

Une explication de la théorie des jeux pour paix démocratique est que le débat public et ouvert dans les démocraties envoyer des informations claires et fiables sur leurs intentions à d'autres Etats. En revanche, il est difficile de connaître les intentions des dirigeants non démocratiques, ce concessions effet auront, et si promesses seront tenues. Ainsi il y aura la méfiance et la réticence à faire des concessions si au moins une des parties à un différend est un non-démocratie (Levy & Razin 2003).

Biologie

Faucon Colombe
Faucon 20, 20 80, 40
Colombe 40, 80 60, 60
Le jeu faucon-colombe

Les paiements pour les jeux en biologie , contrairement à ceux en économie, sont souvent interprétées comme correspondant à fitness. En outre, l'accent a été mis sur moins équilibres qui correspondent à une notion de rationalité et plus sur ceux qui seraient entretenus par l'évolution des forces. L'équilibre le plus connu en biologie est connue comme la stratégie évolutionnaire stable (ou SST), et a été introduit en (Smith & Prix 1973). Bien que sa motivation initiale ne comportait aucune des exigences mentales de l' équilibre de Nash , chaque ESS est un équilibre de Nash.

En biologie, théorie des jeux a été utilisée pour comprendre de nombreux phénomènes différents. Il a été d'abord utilisé pour expliquer l'évolution (et de la stabilité) de la approximative de 1: 1 rapports sexuels. (Fisher 1930) a suggéré que les 1: rapports de masculinité 1 sont le résultat de forces évolutives qui agissent sur les personnes qui pourraient être considérées comme essayer de maximiser le nombre de leurs petits-enfants.

En outre, les biologistes ont utilisé la théorie des jeux de l'évolution et l'ESS pour expliquer l'émergence de communication animale (Harper & Maynard Smith, 2003). L'analyse de jeux de signalisation et d'autres jeux de communication a permis de mieux comprendre l'évolution de la communication chez les animaux. Par exemple, le mobbing comportement de nombreuses espèces, dont un grand nombre d'animaux de proie attaque un prédateur plus grand, semble être un exemple d'organisation émergente spontanée. Les fourmis ont également été montré pour présenter un comportement de feed-forward se apparente à la mode, voir Economie papillon.

Les biologistes ont utilisé le jeu de poulet pour analyser le comportement des combats et de la territorialité.

Maynard Smith, dans la préface de l'évolution et la théorie des jeux, écrit: «paradoxalement, il se est avéré que la théorie des jeux est plus facilement appliqué à la biologie que de le domaine du comportement économique pour laquelle il a été conçu à l'origine". La théorie des jeux évolutionniste a été utilisée pour expliquer de nombreux phénomènes apparemment incongrues dans la nature.

Un tel phénomène est appelé altruisme biologique. Ce est une situation dans laquelle l'organisme semble agir d'une manière qui bénéficie d'autres organismes et est préjudiciable à lui-même. Ce est distinct des notions traditionnelles de l'altruisme parce que ces actions ne sont pas conscients, mais semblent être adaptations évolutives pour augmenter la condition physique générale. Des exemples peuvent être trouvés dans les espèces allant de chauves-souris vampires qui régurgitent sang qu'ils ont obtenu de la chasse de nuit et lui donnent aux membres du groupe qui ne ont pas pour se nourrir, pour les abeilles ouvrières qui se occupent de la reine pendant toute leur vie et ne jamais se accouplent, à singes vervets qui avertissent les membres du groupe de l'approche d'un prédateur, même si elle met en danger les chances de survie de cette personne. Toutes ces actions augmenter la condition physique générale d'un groupe, mais se produisent à un coût pour l'individu.

La théorie des jeux évolutionniste explique cet altruisme avec l'idée de la sélection de parentèle. Altruistes discrimination entre les personnes qu'ils aident et parents de faveur. La règle de Hamilton explique le raisonnement derrière cette évolution sélection avec l'équation c

Informatique et logique

La théorie des jeux est venu à jouer un rôle plus important dans la logique et la science informatique . Plusieurs théories logiques aient une base la sémantique des jeux. En outre, les informaticiens ont utilisé des jeux pour modéliser calculs interactifs. En outre, la théorie des jeux fournit une base théorique pour le domaine de la systèmes multi-agents.

Séparément, la théorie des jeux a joué un rôle dans algorithmes ligne. En particulier, la problème k-serveur, qui a dans le passé été appelé jeux avec les frais de déménagement et jeux demande-réponse (Ben David, Borodine et Karp et al., 1994). Le principe de Yao est une technique de la théorie des jeux pour prouver des bornes inférieures sur le complexité de calcul randomisé algorithmes, et surtout des algorithmes en ligne.

L'émergence de l'Internet a motivé le développement d'algorithmes pour trouver les équilibres dans les jeux, des marchés, des ventes aux enchères de calcul, systèmes peer-to-peer, et les marchés de sécurité et d'information. La théorie des jeux algorithmique et en son sein conception du mécanisme de calcul algorithmique combiner conception et l'analyse de l'algorithme systèmes complexes avec la théorie économique.

Philosophie

Cerf Lièvre
Cerf 3, 3 0, 2
Lièvre 2, 0 2, 2
Stag chasse

La théorie des jeux a été mis à plusieurs usages dans la philosophie . Répondant à deux articles par WVO Quine (1960, 1967), Lewis (1969) a utilisé la théorie des jeux pour développer un compte philosophique de convention. Ce faisant, il a fourni la première analyse des connaissances communes et employé dans l'analyse de jeu dans jeux de coordination. En outre, il a d'abord suggéré que l'on peut comprendre ce qui signifie en termes de jeux de signalisation. Cette suggestion a été plus tard poursuivi par plusieurs philosophes depuis Lewis (Skyrms (1996), Grim, Kokalis et Alai-Tafti et al. (2004)). Après Lewis (1969) la théorie des jeux compte des conventions, Edna Ullmann-Margalit (1977) et Verres (2006) ont développé des théories de les normes sociales qui les définissent comme des équilibres de Nash qui résultent de la transformation d'un jeu mixte mobile dans un jeu de coordination.

La théorie des jeux a également contesté philosophes à penser en termes de interactive épistémologie: ce que cela signifie pour un collectif d'avoir des croyances ou des connaissances communes, et quelles sont les conséquences de cette connaissance pour les résultats sociaux résultant des interactions entre agents. Les philosophes qui ont travaillé dans ce domaine comprennent Bicchieri (1989, 1993), Skyrms (1990), et Stalnaker (1999).

Dans l'éthique , certains auteurs ont tenté de poursuivre le projet, commencé par Thomas Hobbes , de la morale découlant de l'intérêt. Depuis les jeux comme le dilemme du prisonnier présenter un conflit apparent entre la morale et l'intérêt, en expliquant pourquoi la coopération est requise par l'intérêt personnel est une composante importante de ce projet. Cette stratégie générale est un composant de la générale vue contrat social en philosophie politique (pour des exemples, voir Gauthier (1986) et Kavka (1986).

D'autres auteurs ont tenté d'utiliser la théorie des jeux évolutionniste pour expliquer l'émergence d'attitudes humaines sur la moralité et les comportements des animaux correspondantes. Ces auteurs se penchent sur plusieurs jeux, y compris le dilemme du prisonnier, chasse au cerf, et la Nash jeu de négociation en fournissant une explication de l'émergence d'attitudes sur la moralité (voir, par exemple, Skyrms (1996, 2004) et Sober et Wilson (1999)).

Certaines hypothèses utilisées dans certaines parties de la théorie des jeux ont été contestées dans la philosophie; par exemple, l'égoïsme psychologique indique que la rationalité se réduit à l'auto-intérêt une réclamation débattue parmi les philosophes. (Voir L'égoïsme psychologique # de critiques)

Types de jeux

Coopérative ou non coopérative

Un jeu est coopératif si les joueurs sont capables de former des engagements contraignants. Par exemple, le système juridique les oblige à respecter leurs promesses. Dans les jeux non coopératifs ce ne est pas possible.

Souvent, il est supposé que la communication entre les joueurs est autorisé dans des jeux coopératifs, mais pas dans ceux non coopératifs. Cependant, cette classification sur deux critères binaires a été remise en question, et parfois rejeté (Harsanyi 1974).

Parmi les deux types de jeux, jeux non coopératifs sont capables de modéliser des situations dans les moindres détails, produisant des résultats précis. Jeux coopératifs se concentrent sur le jeu en général. Des efforts considérables ont été déployés pour relier les deux approches. Le soi-disant Nash-programme a déjà mis en place un grand nombre de solutions concertées équilibres non coopératifs.

Jeux hybrides contiennent des éléments coopératifs et non coopératifs. Par exemple, les coalitions de joueurs sont formés dans un jeu coopératif, mais ce jeu de façon non-coopérative.

Symétrique et asymétrique

E Fa
E 1, 2 0, 0
Fa 0, 0 1, 2
Un jeu asymétrique

Un jeu symétrique est un jeu où les gains pour jouer une stratégie particulière ne dépendent que sur les autres stratégies employées, non pas sur qui est de les jouer. Si l'identité des joueurs peuvent être modifiés sans changer le gain aux stratégies, puis un jeu est symétrique. Beaucoup des couramment étudiées 2 × 2 jeux sont symétriques. Les représentations standard de poulet, la dilemme du prisonnier, et de la chasse au cerf sont tous les jeux symétriques. Certains chercheurs envisageraient certains jeux asymétriques comme exemples de ces jeux ainsi. Toutefois, les gains les plus courantes pour chacun de ces jeux sont symétriques.

Le plus souvent asymétriques jeux étudiés sont des jeux où il ne sont pas des ensembles de stratégies identiques pour les deux joueurs. Par exemple, le jeu de l'ultimatum et de même la jeu du dictateur ont des stratégies différentes pour chaque joueur. Il est possible, cependant, pour un jeu d'avoir des stratégies identiques pour les deux joueurs, mais être asymétrique. Par exemple, le jeu sur la photo à droite est asymétrique malgré des ensembles de stratégies identiques pour les deux joueurs.

À somme nulle et non à somme nulle

Un B
Un -1, 1 3, -3
B 0, 0 -2, 2
Un jeu à somme nulle

Jeux à somme nulle sont un cas particulier de jeux à somme constante, dans lequel les choix par les joueurs ne peut ni augmenter ni diminuer les ressources disponibles. Dans les jeux à somme nulle l'avantage total à tous les joueurs dans le jeu, pour chaque combinaison de stratégies, ajoute toujours à zéro (plus informelle, un joueur bénéficie seulement aux dépens égale des autres). Poker illustre un jeu à somme nulle (en ignorant la possibilité de la coupe de la maison), parce que l'on gagne exactement le montant ses adversaires perdent. Autres jeux à somme nulle comprennent correspondant centimes et la plupart des jeux de société classiques y compris Go et d'échecs .

Beaucoup de jeux étudiés par les théoriciens des jeux (y compris l'infâme dilemme du prisonnier) sont des jeux non à somme nulle, parce que la résultat net a des résultats supérieurs ou inférieurs à zéro. Officieusement, dans les jeux non à somme nulle, un gain par un joueur ne correspond pas nécessairement à une perte par un autre.

Jeux à somme constante correspondent à des activités comme le vol et le jeu, mais pas à la situation économique fondamentale dans laquelle il ya un potentiel gains tirés du commerce. Il est possible de transformer ne importe quel jeu dans un (éventuellement asymétrique) jeu à somme nulle en ajoutant un joueur fictif supplémentaire (souvent appelé le «Conseil»), dont les pertes de compenser les gains nets des joueurs.

Simultanée et séquentielle

Jeux simultanés sont des jeux où les deux joueurs se déplacent simultanément, ou se ils ne se déplacent pas en même temps, les joueurs ultérieures ne sont pas conscients des actions des joueurs précédents (ce qui les rend efficace simultanée). Jeux séquentiels (ou dynamiques) jeux sont des jeux où les joueurs plus tard ont une certaine connaissance sur les actions antérieures. Ce ne doit pas être information parfaite sur chaque action de joueurs antérieures; il pourrait être très peu de connaissances. Par exemple, un joueur peut savoir que un joueur plus tôt n'a pas effectué une action particulière, alors qu'il ne sait pas lequel des autres actions disponibles le premier joueur réellement effectué.

La différence entre les jeux séquentiels simultanés et est capturée dans les différentes représentations décrites ci-dessus. Souvent, forme normale est utilisée pour représenter des parties simultanées, et forme extensive est utilisée pour représenter séquentielles. La transformation du vaste sous forme normale est une façon, ce qui signifie que plusieurs vastes jeux de forme correspondent à la même forme normale. Par conséquent, notions d'équilibre pour les jeux simultanés sont insuffisantes pour raisonner sur les jeux séquentiels; voir la perfection en sous-jeux.

En bref, les différences entre séquentiel et jeux simultanés sont les suivantes:

Séquentiel Simultané
Normalement désigné par: Arbres de décision Matrices Payoff
La connaissance préalable du déménagement de l'adversaire: Oui Aucun
Temps Axe: Oui Aucun
Aussi connu comme: Jeu vaste Jeu stratégique

Information parfaite et d'information imparfaite

Un jeu d'information imparfaite (la ligne pointillée représente l'ignorance de la part du joueur 2, formellement appelé ensemble d'informations)

Un important sous-ensemble de jeux séquentiels se compose de jeux de information parfaite. Un jeu est l'une des informations parfait si tous les joueurs connaissent les mouvements précédemment par tous les autres joueurs. Ainsi, seuls les jeux séquentiels peuvent être des jeux de l'information parfaite parce que les joueurs dans les jeux simultanés ne connaissent pas les actions des autres joueurs. La plupart des jeux étudiés dans la théorie des jeux sont des jeux imparfaite-information. Des exemples intéressants de jeux parfaite-information comprennent le jeu de l'ultimatum et jeu de mille-pattes. Jeux de loisirs de parfaits jeux d'information comprennent les échecs , aller et mancala . Beaucoup de jeux de cartes sont des jeux de l'information imparfaite, par exemple poker ou Bridge.

Information parfaite est souvent confondue avec des informations complètes, qui est un concept similaire. Une information complète nécessite que chaque joueur de connaître les stratégies et les paiements disponibles pour les autres joueurs, mais pas nécessairement les actions prises. Jeux d'informations incomplètes peuvent être réduits, cependant, aux jeux de l'information imparfaite en introduisant " se déplace par nature "(Leyton-Brown & Shoham 2008, p. 60).

Jeux combinatoires

Jeux où la difficulté de trouver une stratégie optimale provient de la multiplicité des coups possibles sont appelés jeux combinatoires. Les exemples incluent les échecs et viennent. Jeux qui impliquent une information imparfaite ou incomplète peuvent également avoir un fort caractère combinatoire, par exemple backgammon . Il n'y a aucune théorie unifiée des éléments d'adressage dans les jeux combinatoires. Il ya, cependant, des outils mathématiques qui peuvent résoudre des problèmes particuliers et répondre aux questions générales.

Jeux de l'information parfaite ont été étudiés dans la théorie des jeux combinatoires, qui a développé de nouvelles représentations, par exemple numéros surréaliste, ainsi que combinatoire et algébrique (et parfois non-constructives) méthodes de preuve résoudre les jeux de certains types, y compris les jeux "bouclées" qui peuvent résulter en une infinité de longues séquences de mouvements. Ces méthodes se adressent jeux avec la complexité combinatoire supérieur à ceux habituellement pris en compte dans la théorie traditionnelle (ou «économique») jeu. Un jeu typique qui a été résolu de cette façon est hex. Un domaine d'étude connexe, puisant théorie de la complexité de calcul, est la complexité du jeu, qui est concerné par l'estimation de la difficulté de calcul de trouver des stratégies optimales.

Research in l'intelligence artificielle a abordé deux jeux parfaits et imparfaits (ou incomplètes) l'information qui ont des structures combinatoires très complexes (comme les échecs, go, backgammon ou) pour lesquels aucune des stratégies optimales prouvables ont été trouvés. Les solutions pratiques impliquent heuristiques de calcul, comme élagage alpha-bêta ou l'utilisation de réseaux de neurones artificiels formés par apprentissage par renforcement, ce qui rend les jeux plus docile dans la pratique de l'informatique.

Infiniment longs jeux

Jeux, comme étudié par les économistes et les joueurs du monde réel, sont généralement terminé en un nombre fini de mouvements. Mathématiciens purs ne sont pas ainsi restreints, et mis théoriciens en particulier les jeux de l'étude qui durent une infinité de mouvements, avec le gagnant (ou autre gain) non connus qu'après tous ces mouvements sont terminés.

L'attention est généralement pas tellement sur ce qui est la meilleure façon de jouer un tel jeu, mais simplement de savoir si l'un ou l'autre joueur a une stratégie gagnante. (Il peut être prouvé, en utilisant le axiome du choix, qu'il ya des jeux-même avec une information parfaite, et où les seuls résultats sont «gagner» ou «perdre» -pour laquelle ni joueur a une stratégie gagnante.) L'existence de ces stratégies, pour les jeux conçus intelligemment, a conséquences importantes la théorie des ensembles descriptive.

Jeux discrets et continus

Une grande partie de la théorie des jeux est toutefois préoccupé avec des jeux finis discrets, qui ont un nombre fini de joueurs, des mouvements, des événements, résultats, etc. Beaucoup de concepts peuvent être prorogés,. Jeux en continu permettent aux joueurs de choisir une stratégie d'un jeu de stratégie continue. Par exemple, Concurrence à la Cournot est généralement modélisé avec les stratégies des joueurs étant les quantités non négatifs, y compris les quantités fractionnaires.

jeux différentielles

Jeux différentiels comme le continu poursuite et évasion jeu sont des jeux continus où l'évolution des variables d'état des joueurs est régi par des équations différentielles . Le problème de trouver une stratégie optimale dans un jeu différentiel est étroitement liée à la théorie du contrôle optimal. En particulier, il existe deux types de stratégies: les stratégies en boucle ouverte sont trouvés en utilisant le Pontryagin principe du maximum tandis que les stratégies en boucle fermée sont trouvés en utilisant Méthode de programmation dynamique de Bellman.

Un cas particulier de jeux différentiels sont les jeux disposant d'un horizon de temps aléatoire. Dans ces jeux, le temps terminal est une variable aléatoire avec une donnée distribution de probabilité fonction. Par conséquent, les joueurs de maximiser la espérance mathématique de la fonction de coût. Il a été montré que le problème d'optimisation modifié peut être reformulé comme un jeu différentiel actualisés sur un intervalle de temps infini.

Beaucoup-joueur et les jeux de la population

Jeux avec un arbitraire, mais finie, nombre de joueurs sont souvent appelés jeux n-personne (Luce & Raiffa 1957). La théorie des jeux évolutionniste considère jeux impliquant une population de décideurs, où la fréquence avec laquelle une décision particulière est faite peut changer avec le temps en réponse aux décisions prises par tous les individus de la population. En biologie, ce est destiné à modéliser (biologique) évolution , où les organismes génétiquement programmés passent le long de certaines de leurs émissions de stratégie pour leur progéniture.En économie, la même théorie est destiné à capturer les changements de population parce que les gens jouent le jeu de fois dans leur vie, et consciemment (et peut-être rationnellement) les stratégies de commutation (Webb, 2007).

Résultats stochastiques (et par rapport aux autres domaines)

Problèmes de décision individuelles avec les résultats stochastiques sont parfois considérés comme des «jeux d'un joueur". Ces situations ne sont pas considérés jeu théorique par certains auteurs. Ils peuvent être modélisées en utilisant des outils similaires au sein des disciplines connexes de la théorie de la décision, la recherche opérationnelle et les domaines de l'intelligence artificielle, en particulier la planification AI (l'incertitude) et système multi-agents. Bien que ces domaines peuvent avoir différents facteurs de motivation, les mathématiques impliquées sont sensiblement les mêmes, par exemple en utilisant des processus de décision de Markov (MDP).

Résultats stochastiques peuvent également être modélisés en termes de théorie de jeu en ajoutant un joueur agissant au hasard qui fait "se déplace de chance», aussi connu comme " mouvements de la nature »(Osborne & Rubinstein, 1994). Ce joueur est généralement pas considéré comme un troisième joueur dans ce qui est autrement un jeu à deux joueurs, mais sert simplement à fournir un coup de dés où requis par le jeu.

Pour certains problèmes, différentes approches de modélisation stochastiques résultats peuvent conduire à des solutions différentes. Par exemple, la différence d'approche entre les CMD et la solution minimax est que ce dernier considère le pire des cas sur un ensemble de mouvements contradictoires, plutôt que le raisonnement dans l'attente de ces mouvements donnés une distribution de probabilité fixe. L'approche minimax peut être avantageux où les modèles stochastiques d'incertitude ne sont pas disponibles, mais peut également être surestime événements extrêmement improbables (mais coûteux), se balançant de façon spectaculaire la stratégie dans de tels scénarios, si on suppose que l'adversaire peut forcer un tel événement se produise. (Voir théorie du cygne noir pour plus de discussion sur ce genre de question de modélisation, particulièrement en ce qui a trait à prédire et limiter les pertes dans la banque d'investissement.)

Modèles généraux qui incluent tous les éléments de résultats stochastiques, adversaires, et observabilité partielle ou bruyant (de coups par d'autres joueurs) ont également été étudiés. La " règle d'or "est considéré comme partiellement observable jeu stochastique (de POSG), mais quelques problèmes sont réalistes calcul est possible dans la représentation POSG.

Metagames

Ce sont des jeux dont le jeu est le développement des règles pour un autre jeu, la cible ou l'objet jeu. Metagames cherchent à maximiser la valeur d'utilité de l'ensemble de règles développées. La théorie de Metagames est liée à la théorie de la conception du mécanisme.

Le terme analyse metagame est également utilisé pour faire référence à une approche pratique développé par Nigel Howard (Howard, 1971) dans lequel une situation est encadrée comme un jeu stratégique dans lequel les parties prenantes tentent de réaliser leurs objectifs par le biais des options à leur disposition. Les développements ultérieurs ont conduit à la formulation de l'analyse de la confrontation.

Histoire

Les premières discussions d'exemples de jeux à deux eu lieu bien avant l'avènement de la théorie des jeux modernes, mathématique. La discussion a d'abord connu de la théorie des jeux a eu lieu dans une lettre écrite par James Waldegrave en 1713. Dans cette lettre, Waldegrave fournit une minimax solution de stratégie mixte à une version de deux personnes du jeu de carte le Son. James Madison a fait ce que nous reconnaissons maintenant que une analyse de la théorie des jeux des façons états peut être devrait se comporter sous différents systèmes d'imposition. Dans son 1838 Recherches sur les Principes mathématiques de la théorie des richesses ( Recherches sur les principes mathématiques de la théorie des richesses ), Antoine Augustin Cournot considéré comme un duopole et présente une solution qui est une version restreinte de l' équilibre de Nash .

Le mathématicien danois Zeuthen prouvé que le modèle mathématique a une stratégie gagnante en utilisant théorème de point fixe de Brouwer. Dans ses 1938 livres Applications aux Jeux de Hasard et notes antérieures, Émile Borel prouvé un théorème minimax pour deux personnes jeux de matrice à somme nulle que lorsque la matrice de pay-off était symétrique. Borel a conjecturé que la non-existence d'équilibres en stratégies mixtes dans deux personnes jeux à somme nulle aurait lieu, une conjecture qui a été prouvé faux.

La théorie des jeux n'a pas vraiment exister comme un champ unique jusqu'à ce que John von Neumann a publié un document en preuve originale de 1928. Von Neumann utilisée point fixe le théorème de Brouwer sur applications continues en ensembles convexes compacts, qui est devenue une méthode standard dans la théorie des jeux et de l'économie mathématique. Son document a été suivi par son livre 1944 Théorie des Jeux et le comportement économique . La deuxième édition de ce livre a fourni une théorie axiomatique de l'utilité, qui réincarne vieille théorie de Daniel Bernoulli d'utilité (de l'argent) en tant que discipline indépendante. Les travaux de Von Neumann en théorie des jeux a culminé dans ce livre 1944. Ce travail de base contient la méthode pour trouver des solutions mutuellement cohérentes pour deux personnes jeux à somme nulle. Au cours de la période suivante, les travaux sur la théorie des jeux est principalement axé sur la théorie des jeux coopératifs, qui analyse les stratégies optimales pour des groupes d'individus, en supposant qu'ils peuvent appliquer les accords entre eux sur les stratégies appropriées.

En 1950, la première discussion mathématique du dilemme du prisonnier est apparu, et une expérience a été menée par les mathématiciens notables Merrill M. Flood et Melvin Dresher, dans le cadre de l' enquêtes de RAND corporation dans la théorie des jeux. Rand a poursuivi les études en raison d'applications possibles au global la stratégie nucléaire. autour de ce même temps, John Nash ont développé un critère de cohérence mutuelle des stratégies des acteurs, connus comme l'équilibre de Nash, applicable à une plus grande variété de jeux que le critère proposé par von Neumann et Morgenstern. Cet équilibre est suffisamment général pour permettre l'analyse de jeux non-coopératifs en plus de ceux de coopération.

La théorie des jeux a connu un regain d'activité dans les années 1950, période durant laquelle les concepts de l' âme, la forme extensive jeu, jeu fictif, jeux répétés, et la valeur de Shapley ont été développés. En outre, les premières applications de la théorie des jeux à la philosophie et la science politique ont eu lieu pendant cette période.

En 1965, Reinhard Selten a présenté son concept de solution de sous-jeu parfait équilibre, qui a encore affiné l'équilibre de Nash (plus tard, il serait introduire tremblante perfection de main aussi bien). En 1967, John Harsanyi a développé les concepts d' une information complète et jeux bayésiens. Nash, Selten et Harsanyi devenus lauréats du prix Nobel d'économie en 1994 pour ses contributions à la théorie de jeu économique.

Dans les années 1970, la théorie des jeux a été largement appliquée dans la biologie , en grande partie en raison du travail de John Maynard Smith et sa stratégie évolutivement stable . En outre, les concepts de l'équilibre corrélé, la perfection de la main tremblante, et la connaissance commune ont été présentés et analysés.

En 2005, les théoriciens de jeu Thomas Schelling et Robert Aumann suivies Nash, Selten et Harsanyi comme lauréats du prix Nobel. Schelling a travaillé sur des modèles dynamiques, les premiers exemples de la théorie des jeux évolutionniste. Aumann plus contribué à l'école d'équilibre, l'introduction d'un grossissement d'équilibre, l'équilibre corrélé, et de développer un vaste analyse formelle de l'hypothèse de la connaissance commune et de ses conséquences.

En 2007, Leonid Hurwicz, avec Eric Maskin et Roger Myerson, a reçu le prix Nobel d'économie "pour avoir jeté les bases de la théorie de la conception du mécanisme. " Les contributions de Myerson comprennent la notion de juste équilibre, et un texte d'études supérieures importante: la théorie des jeux, Analyse des conflits (Myerson 1997). Hurwicz introduit et formalisé le concept de compatibilité des incitations.

La culture populaire

L'histoire de la vie du jeu théoricien et mathématicienJohn Nash a été transformé en un biopic, A Beautiful Mindmettant en vedetteRussell Crowe, basé sur le livre deSylvia Nasar.

"Jeux-théorie» et «théorie des jeux» sont mentionnés dans le roman de science fiction militaire Starship Troopers par Robert A. Heinlein. Dans le film du même nom 1997, le caractère Carl Jenkins se réfère à sa mission, le renseignement militaire, comme des «jeux et la théorie."

L'un des principaux gameplay de décision mécanique du jeu vidéo évasion Zero: Dernière récompense de la vertu est fondée sur la théorie des jeux. Certains des personnages référence, même le dilemme du prisonnier.

Le film Dr. Strangelove satire jeu idées théoriques à propos de la théorie de la dissuasion. Par exemple, la dissuasion nucléaire dépend de la menace de représailles catastrophique si une attaque nucléaire est détectée. Un théoricien des jeux pourrait faire valoir que ces menaces peuvent manquer d'être crédible , dans le sens où ils peuvent conduire à sous-jeu des équilibres imparfaits. Le film prend cette idée un peu plus loin, avec les Russes commettre irrévocablement à une réponse nucléaire catastrophique sans faire le public de la menace.

Récupéré à partir de " http://en.wikipedia.org/w/index.php?title=Game_theory&oldid=549389746 "