La théorie de l’utilité espérée
L’incertitude est une caractéristique majeure de la réalité économique. Les économistes ont donc cherché des moyens de l’intégrer dans leurs modèles. L’un de ces moyens est la théorie de l’utilité espérée, selon laquelle, confronté à un choix dont les effets sont incertains, l’agent économique visera à maximiser l’espérance mathématique de l’utilité du gain[1]. Cette théorie joue encore un rôle dans beaucoup de modèles contemporains. Voyons un bref survol historique de son développement, extrait de mon ouvrage en ligne « Ombres et lumières de l’économie politique ».
[1] Dans des conditions normales, caractérisées par l’aversion pour le risque, l’utilité de l’espérance mathématique de gains incertains est supérueure à l’espérance mathématique des utilités de ces mêmes gains.
Le « paradoxe de Saint-Pétersbourg »
En 1713, le mathématicien suisse Nicolas Bernoulli expose le problème paradoxal suivant : proposons un jeu de pile ou face non truqué. On procède au nombre de jets nécessaires jusqu’à ce que face apparaisse une première fois. Le gain du joueur vaut 2n ducats où n est le nombre de jets nécessaires. Combien serions-nous prêts à payer pour participer à ce jeu ? Le paradoxe vient de ce que l’espérance mathématique de gain vaut l’infini, alors que personne ne paierait cher pour y participer. C’est son cousin Daniel qui avança une explication en 1738. En fait, l’espérance mathématique du gain n’intervient pas dans le choix ; c’est l’espérance mathématique de l’utilité du gain. Or celle-ci augmente moins que le gain. Ce disant, Nicolas Bernoulli est le premier précurseur de la théorie de l’utilité marginale décroissante.
von Neumann et Morgenstern
Dans l’ouvrage « Theory of Games and Economic Behavior », la théorie de l’utilité espérée ne fait l’objet que d’une quinzaine de pages qui sont une simple introduction aux développements qui suivent. Pourtant, ces pages eurent rapidement un retentissement considérable.
Les auteurs s’intéressent au système de préférence d’un individu, comme l’ont fait leurs prédécesseurs parétiens lorsqu’ils ont conçu les courbes d’indifférence. Simplement, ils élargissent les préférences à des situations comportant des alternatives stochastiques. Par exemple, le choix entre une possibilité A certaine et un événement qui sera soit B à une probabilité α, soit C à une probabilité (1-α). Les évènements B et C doivent être mutuellement exclusifs. Est sous-jacente à ce système de préférence, une notion que les auteurs appellent « utilité » avec toutes les précautions d’usage. Dans l’exemple ci-dessus, si l’agent préfère la perspective A (d’utilité a) à la perspective [B ou C] (d’utilité b), cette préférence peut être notée a > b[1]. Ceci ne signifie pas encore qu’il y a moyen de quantifier a et b, mais c’est justement la possibilité de cette quantification que les auteurs veulent démontrer.
Le point de départ du raisonnement est ce double élément :
a > b (9.5-A)
α.a + (1-α).b (9.5-B)
Ces deux expressions signifient respectivement la possibilité de hiérarchiser des utilités et la possibilité de les combiner avec des probabilités. Ce sont les seules véritables hypothèses du modèle.
Le but est de prouver qu’à chaque utilité a, b…, on peut associer un nombre réel ρ qui est la valeur d’une fonction v(a), v(b)… qui respecte la double condition (9.6) :
si a > b, alors v(a) > v(b) (9.6-A)[2]
v(α.a + (1-α).b) = α.v(a) + (1-α).v(b) (9.6-B)
Préalablement, les auteurs démontrent que si, pour un système de préférences, plusieurs fonctions respectent cette double condition, elles sont nécessairement liées entre elles par le fait qu’elles sont mutuellement des transformations linéaires. Autrement dit : pour ρ, ρ’ respectant (9.6), on a ρ’ = k.ρ + l . Les auteurs considèrent qu’il s’agit là d’une relation suffisamment restrictive pour que les fonctions v(.) restent significatives[3] ; on en trouve régulièrement de semblables en physique, par exemple pour les températures.
Pour assurer les relations (9.6), il faut postuler certaines propriétés du système de préférences. Autrement dit, il faut établir une base axiomatique. « A choice of axioms is not a purely objective task (…) The axioms should not be too numerous, the system is to be as simple and transparent as possible, and each axiom should have an immediate intuitive meaning by which its appropriateness may be judged directly”[4].
Les axiomes choisis constituent évidemment le cœur de la démonstration.
- Le système de préférences est complètement ordonné. Pour tout couple d’utilités a et b, on aura toujours entre elles a > b, a = b ou a < b.
- Les préférences sont transitives : si a > b et b > c, on aura nécessairement a > c.
- a > b implique a > α.a+(1-α).b, ce qui est justifié par le caractère mutuellement exclusif des événements
- a > b > c implique l’existence d’un α tel que α.a + (1-α)c > b. « This is a plausible continuity assumption »[5].
- α.a + (1-α).b = (1-α).b + α.a
- α.[β.a + (1 - β).b] + (1 – α).b = γ.a + (1 - γ)b, où γ = α.β. Une application d’alternatives stochastiques successives (ici 2 étapes : α et β) peut toujours correspondre à une application unique (ici : γ = α.β)
L’équation (9.6-B) signifie que la fonction d’utilité d’une perspective stochastique prend comme valeur l’espérance mathématique des utilités des événements possibles pondérées par leur probabilité. Une caractéristique de cette fonction est donc que la valeur qu’elle prend n’est pas influencée positivement ou négativement par l’attitude de l’individu face au risque. Les auteurs s’interrogent si on pourrait les accuser de construire un système visant à occulter l’attitude face au risque mais ils ne trouvent d’indice d’une telle culpabilité dans aucun de leurs axiomes.
Terminons avec quelques mises au point. D’abord, les auteurs estiment que leur modèle se marie mal avec les probabilités subjectives ; ils le trouvent mieux assorti aux probabilités formées à partir des fréquences constatées sur le long terme. Cette affirmation est toutefois peu étayée. Ils rappellent également cette évidence que leur fonction d’utilité ne peut servir à des comparaisons ou des additions interpersonnelles. Enfin, ils reconnaissent que « we cannot avoid the assumption that all subjects of the economy under consideration are completely informed about the physical characteristics of the situation in which they operate and are able to perform all statistical, mathematical etc., operations which this knowledge makes possible »[6]. Mais pensent-ils, leur théorie des jeux basée sur cette hypothèse explique valablement certains comportements qu’on attribuerait prima facie à l’information imparfaite ; cette dernière interprétation ne serait donc pas nécessairement la plus adéquate.
A la fin des années quarante et au début des années cinquante, beaucoup d’auteurs s’emparèrent de la théorie de l’utilité espérée pour la critiquer, pour la défendre, pour la réinterpréter ou l’exposer avec d’autres formules mathématiques. Un colloque fut même tenu à Paris.
Parmi les auteurs qui réexposèrent cette théorie, Samuelson est l’un des partisans de ce qu’on a appelé l’axiome d’indépendance.
Dans son article « Probability, Utility and the Independence Axiom », Samuelson commence par définir :
-
- Une situation de probabilité de revenu simple : c’est une loterie qui rapporte des lots X1, X2…Xn, respectivement avec des probabilités mutuellement exclusives x1, x2…xn (dont la somme vaut évidemment 1).
- Une situation de probabilité de revenu composée : c’est un ticket de loterie dont les lots sont euxmêmes la participation à d’autres loteries. Par exemple :[(X1, X2 ; ½, ½),(X1, X3 ; ¼ ; ¾) ;⅔,⅓)] offre à deux chances sur trois le gain X1 ou le gain X2 à une chance sur deux ou à une chance sur trois le gain X1 à une chance sur quatre ou le gain X3 à trois chances sur quatre.
- Une situation de probabilité de revenu associée à une situation composée est la situation simple qu’on obtient en prenant tous les lots de toutes les loteries et en calculant leur probabilité en multipliant la probabilité de la loterie par celle du lot dans la loterie et en additionnant les probabilités ainsi obtenues dans toutes les loteries ou le lot est présent. Dans l’exemple cidessus, la probabilité de X1 est (2/3 x 1/2) + (1/3 x 1/4), celle de X2 est (2/3 x 1/2) et celle de X3 est (1/3 x 3/4).
Pour spécifier un comportement rationnel face au risque, Samuelson estime pouvoir se satisfaire de ces deux axiomes :
- Axiom I of Complete Ordering : All situations can be completely ordered and in terms of their associated prizes alone. (This ordering may be further assumed to be continuous in the probabilities x1, x2…).
- Axiom II (Strong Independence) : If lottery ticket (A)1 is (as good or) better than (B)1, and lottery ticket (A)2 is (as good or) better than (B)2, then an even chance of getting (A)1 or (A)2 is (as good or) better than an even chance of getting (B)1 or (B)2[7].
Comme nous l’avons vu aux titres III et IV, les relations de complémentarité et de substituabilité entre les biens affectent l’utilité du groupe de biens. Selon Samuelson, le principe d’indépendance, tout-à-fait illégitime en situation de certitude, devient raisonnable dans le cas stochastique et même indispensable à la construction de ce qu’il appelle « the Bernoulli-Savage theory of maximisation of expected utility ». Vu que, d’une part (A)1 et (B)1 sont mutuellement exclusifs et que, d’autre part (A)2 et (B)2 le sont aussi, on ne voit pas pourquoi le choix entre (A)1 et (B)1 pourrait être contaminé par celui entre (A)2 et (B)2.
Samuelson avait déjà démontré lors du colloque de Paris que ces deux axiomes sont nécessaire pour définir le comportement qui maximise la « Bernoulli expected cardinal-utility magnitude » : x1.u(X1) +…+ xn.u(Xn).
Dans leur article « The Expected-Utility Hypothesis and the Measurability of Utility » (1952), Friedman et Savage défendent ladite hypothèse voulant que dans des “choices involving risk (…) individual choose in such circumstances as if they were seeking to maximize the expected value of some quantity”. Ils proposent de fonder ce principe sur un trio d’axiomes :
- Le premier axiome correspond aux axiomes 1 et 2 de von Neumann et Morgenstern.
- Si α.a + (1 – α)c ≤ b, " 0 ≤ α < 1, alors a ≤ b.
- " 0 < α <1, α.a + (1 – α)c ≤ α.b + (1 – α)c n’est vrai que si a ≤ b
Les auteurs expliquent le sens de cet axiome avec l’exemple suivant. Si un médecin hésite entre plusieurs maladies pour établir son diagnostic, mais que le repos est le meilleur remède pour chacun d’eux, il peut prescrire ce remède, même sans diagnostic exact. En fait, il s’agit d’une forme d’axiome d’indépendance, puisqu’en combinant respectivement une perspective a et une perspective b avec une perspective c, on ne modifie pas la préférence entre elles.
Maurice Allais est en désaccord avec la théorie de Bernoulli elle-même et avec ses différentes déclinaisons que nous venons d’examiner. Il l’a combattue dans plusieurs articles, dont « Le Comportement de l’Homme Rationnel devant le Risque : Critique des Postulats et Axiomes de l’Ecole Américaine » (1953).
Il commence par exposer les quatre éléments psychologiques essentiels pour analyser les comportements face au risque :
- Elément I : la déformation psychologique des valeurs monétaires et la courbure de la satisfaction absolue. Cet élément concorde avec le principe bernoullien mettant en avant la valeur psychologique des gains qui augmente moins que ceux-ci.
- Elément II : la déformation psychologique des probabilités objectives. Certains croient en leur bonne étoile alors que d’autres s’estiment poursuivis par la malchance. Seules importent les probabilités subjectives.
- Elément III : la pondération suivant les probabilités des valeurs psychologiques et la considération des espérances mathématiques de la distribution des probabilités des valeurs monétaires.
- Elément IV : la prise en considération de la forme des distributions de probabilités des valeurs psychologiques et en particulier de leur dispersion. Ce facteur a trait au plaisir ou au déplaisir procuré par le jeu en tant que tel. L’agent réticent au risque préférera les densités de probabilité à faible variance. Allais insiste tout particulièrement sur ce facteur qui a tendance à être négligé.
Une des difficultés est que les éléments I et IV sont conceptuellement distincts, mais pratiquement indissociables. C’est à la possibilité de grandes pertes et de grands gains que beaucoup d’agents sont particulièrement sensibles. Pour celui qui désire à tout prix une grosse somme, le jeu est parfois le seul moyen rationnel de se la procurer. Les éléments I à III ne rendent pas compte de cette réalité. « On ne saurait ainsi négliger la dispersion des valeurs psychologiques même dans une première approximation. C’est même à notre avis l’élément spécifique de la psychologie du risque »[8]. Allais insiste également sur le fait que l’existence d’émotions positives ou négatives face au risque n’est en rien un signe d’irrationalité.
Allais formalise sa théorie par l’équation (9.7) :
s(V) = f(g1,…,gn,p1,…,pn) (9.7)
La fonction s(.) indique l’utilité d’une perspective ou d’un gain et V est une perspective aléatoire comportant des gains gi selon des probabilités pi. Allais propose également une deuxième équation dont la signification est identique mais qui convient mieux pour des variables continues. Considérons la variable γ qui correspond à la satisfaction des gains possibles. On a γ = s(g). Sa fonction de densité de probabilité est Φ(γ). On a alors :
s(V) = h(Φ(γ)) (9.8)
Par contre, l’équation qui exprime la théorie de l’école américaine est :
B(V) = ∑i pi. B(gi) (9.9)
B(.) est l’indicateur d’utilité de von Neumann et Morgenstern, correspondant à la fonction v(.) de l’équation (9.6). D’après Allais, pour ces auteurs, B(.) et s(.) coïncident, abstraction faite des transformations linéaires de v(.). Par contre, il estime ambigüe la position de Friedman, Savage et Samuelson. Leur version de la fonction B(.) semble être un amalgame des éléments I et IV. D’après Allais, sous la plume de von Neumann et Morgenstern, la formule (9.9) décrit le comportement de l’homme moyen, alors pour les autres, elle est le modèle du comportement rationnel.
Allais s’emploie à réfuter la formule (9.9). D’abord du point de vue théorique, en partant d’une définition abstraite de la rationalité. Selon lui, les seules implications de la rationalité sont au nombre de trois :
-
- un champ de choix ordonné
- le recours aux probabilités objectives
- ce qu’il appelle l’axiome de préférence absolue disant que si pour toutes les éventualités, le gain de V1 domine celui de V2, il faut préférer V1 à V2.
Allais démontre mathématiquement (dans un autre article) qu’il est impossible de déduire l’équation (9.9) de ces trois postulats. Il démontre également que l’équation (9.9) est plus restrictive que l’équation (9.8). En fait, le formule bernoullienne est trop restrictive par rapport aux seules implications de la rationalité, ce qui est une forme d’irrationalité.
Un comportement très courant chez les entrepreneurs consiste à opérer un arbitrage entre le gain probable d’une opération et le risque de subir une grande perte. Ils ont alors un indicateur d’indifférence du type S = f(M,q) où M est le gain probable et q la probabilité de cette perte. Pour conserver un niveau de satisfaction donné, il paraît rationnel que M doit augmenter beaucoup plus rapidement que q. Mais cette croissance plus que proportionnelle de M n’est pas compatible avec le caractère linéaire de la formule bernoullienne.
Allais s’attache également à réfuter l’axiome d’indépendance, notamment dans sa version de Samuelson, qu’il résume par l’équation :
Si P1 < P2, alors : α.P1 + (1-α).P3 < α.P2 + (1-α).P3 (9.10)
Il écrit : « Ce point de vue est en réalité inacceptable, car il suppose le premier tirage correspondant aux probabilités [α ;(1-α)] comme neutre, alors qu’il ne l’est pas, et il se place ‘ex post’ alors qu’il faut se placer ‘ex ante’ »[9]. Allais imagine une situation où P2 et P3 sont des gains certains alors que P1 est un gain probable. Mêlé à P3, P2 perd le statut de gain certain qui faisait son attrait ; il a donc plus à perdre que P1 de la combinaison avec P3. Voici un exemple chiffré :
P2 donne100 millions certains, P1 donne 500 millions à 98/100 ou rien à 2/100. Les personnes prudentes mais néanmoins rationnelles préféreront P2 à P1. Introduisons maintenant la perspective P3 qui est la certitude d’un franc que l’on mêle à P1 et P2 avec une probabilité 1‑α = 99/100. Ceux qui préféraient P2 à P1 pourraient maintenant opter pour 500 millions à 0,98/100 plutôt que 100 millions à 1/100. L’axiome de Samuelson est mis en échec.
L’erreur a une double cause :
-
- Si on se place ex post comme Samuelson, on élimine inconsciemment l’essence du risque que constitue la forme de la distribution.
- « Notre psychologie est telle que nous préférons plus de sécurité au voisinage de la certitude qu’au voisinage de grands risques… »[10].
Remarque : Pour limiter la taille de l’article, j’ai éliminé la contribution de Friedman et Savage ainsi que celle de Markowitz, mais elles sont analysées dans le chapitre « L’incertitude ».
[1] Attention : a et b ne sont pas des gains mais des perspectives offertes à l’individu, appréciées sous l’angle de l’avantage qu’elles procurent. Les auteurs ne font jamais intervenir directement les gains dans leur modèle : la comparaison porte toujours sur les perspectives elles-mêmes.
[2] Le signe « > » a une signification différente dans a >b (simple préférence) et dans v(a) >v(b) (supériorité numérique).
[3] Sans l’intervention des probabilités α et 1-α, toute transformation monotone eût été acceptable.
[4] Von Neumann & Morgenstern [377] p. 25
[5] Von Neumann & Morgenstern [377] p. 27
[6] Von Neumann & Morgenstern [377] p. 30
[7] Samuelson [314] p. 672. D’autres auteurs comme Marschak ou Savage ont également donné leur définition de l’axiome d’indépendance. Il y a des nuances entre ces définitions, mais elles vont évidemment dans le même sens.
[8] Allais [7] p. 512. On ne peut s’empêcher de dresser un parallèle avec la controverse du capital (chap. 5.3). Dans les deux cas, la théorie néoclassique tire des conclusions de la seule espérance mathématique d’une variable (la durée du processus de production ou l’utilité du gain). Dans les deux cas, elle est contestée par l’affirmation que la forme de la distribution (de l’application des facteurs primaires dans le temps ou la densité de probabilité des gains) importe également.
[9] Allais [7] p. 520
[10] Allais [7] p. 539
1 réactions à cet article
Ajouter une réaction
Pour réagir, identifiez-vous avec votre login / mot de passe, en haut à droite de cette page
Si vous n'avez pas de login / mot de passe, vous devez vous inscrire ici.
FAIRE UN DON