Avant d’aborder les niveaux de probabilité, il est essentiel de clarifier la définition des événements et les règles de résolution. Une fois ces règles établies, la question naturelle qui se pose est : les prix du marché sont-ils fiables ? Beaucoup répondent intuitivement : « La dernière fois, il a eu raison, donc il est forcément juste », ou « La dernière fois, il s’est trompé, donc les marchés de prédiction ne marchent pas. » Ces deux réactions sont trop simplistes. Les marchés de prédiction ne livrent pas une réponse binaire du type « ça va arriver ou pas », mais un ensemble d’estimations probabilistes. Juger s’ils « ont eu raison » exige donc un langage probabiliste.
En réalité, un marché peut très bien « tomber juste » sur le résultat tout en étant très déséquilibré d’un point de vue probabiliste. À l’inverse, il peut « se tromper souvent sur la direction » tout en reflétant honnêtement l’incertitude. Évaluer uniquement par les gains et les pertes, c’est passer à côté de l’aspect le plus précieux – et le plus mal compris – des marchés de prédiction : la calibration.
Pour juger de la qualité d’un marché, il faut se demander : qu’est-ce que la calibration, et quand peut-on vraiment considérer que le marché « a eu raison » ?
Précision répond à : le verdict final correspond-il au résultat observé ?
Calibration répond à : lorsque le marché annonce 70 %, environ 70 % des événements concernés se réalisent-ils effectivement ?
Prenons un exemple simple. Imaginons 100 occurrences d’un même type d’événement, et le marché cote systématiquement 90 %. Si 90 se produisent et 10 non, la cote de 90 % est raisonnable du point de vue de la calibration. Si, en revanche, le marché cote constamment 51 % pour les 100 cas, et que 51 se réalisent tandis que 49 non, la précision « semble bonne », mais le marché n’offre quasiment aucun pouvoir de discrimination probabiliste – il se contente de pencher toujours légèrement du même côté.
Inversement, une cote honnête de 60 % qui finit par échouer ne signifie pas que « le marché a menti » : 60 % implique intrinsèquement 40 % de chances que l’événement ne se produise pas. Assimiler « cela n’est pas arrivé » à « échec du marché » revient à évaluer un outil probabiliste avec une logique déterministe.
Les lecteurs doivent ici mettre à jour leur lecture probabiliste de la leçon 1 : interpréter les marchés de prédiction ne consiste pas seulement à savoir « quel camp est favori », mais aussi à vérifier si ce biais reflète honnêtement la fréquence historique.
Une méthode courante pour évaluer la calibration consiste à tracer une courbe de calibration : regrouper les prédictions historiques par intervalles de probabilité (par exemple 50–60 %, 60–70 %, 70–80 %) puis calculer le taux d’occurrence réel dans chaque intervalle. Idéalement, la courbe devrait se rapprocher de la diagonale – les événements cotés à 70 % devraient se réaliser environ 70 % du temps sur le long terme.
On observe trois écarts fréquents :
Excès de confiance : le marché cote 80 %, mais le taux réel est bien inférieur. Les sujets très médiatisés et les marchés à narration unique en sont souvent victimes.
Excès de prudence : le marché cote 55 %, mais le taux réel dépasse 55 %. Ce phénomène peut survenir lorsque l’information se diffuse lentement ou que les participants sont réservés.
Effectifs insuffisants : trop peu de cas historiques dans un intervalle de probabilité rendent les statistiques instables. Cela concerne surtout les événements rares et les marchés émergents.
Ainsi, la calibration n’est pas une étiquette binaire « juste/faux », mais une propriété de long terme qui nécessite un nombre suffisant d’échantillons et des observations par intervalle. Cette leçon n’a pas pour but de fournir un coefficient de calibration précis pour une plateforme – cela demanderait des données professionnelles et une méthodologie rigoureuse – mais seulement d’établir un cadre d’évaluation : ne jugez pas la calibration sur un ou deux marchés brûlants.
Le score de Brier est une métrique courante pour évaluer la qualité des prédictions probabilistes. Pour des événements binaires, on calcule l’erreur de chaque prédiction par rapport au résultat ; plus le score est bas, plus les estimations sont proches de la réalité (une prédiction parfaite obtient 0, une erreur totale approche 1 ; la formule exacte dépend du calcul utilisé).
L’intérêt du score de Brier est de pénaliser les « erreurs d’excès de confiance ». Coté à 99 % et échouer donne une pénalité plus lourde que coté à 60 % et échouer – cela correspond à la pensée probabiliste : la première revendique une certitude bien plus grande, donc l’erreur coûte plus cher.
Les utilisateurs ordinaires n’ont pas besoin de calculer le score de Brier à la main, mais doivent en comprendre la signification :
Si deux marchés ont une précision similaire, celui dont le score de Brier est le plus bas exprime généralement les probabilités de façon plus honnête ;
Si un marché pousse souvent les probabilités vers les extrêmes (0 ou 1), il peut sembler « décisif » à court terme, mais sa calibration à long terme est souvent moins bonne ;
Pour évaluer la qualité d’un marché, regardez à la fois « a‑t‑il eu raison ? » et « les probabilités étaient‑elles raisonnablement cotées ? »
Pour un même événement, les cotations à différents moments transportent des informations différentes. Une cote de 40 % une semaine avant un match peut refléter l’alignement, les blessures et le calendrier – des facteurs à moyen terme ; une cote de 65 % une heure avant peut intégrer la composition de départ, la météo et les actualités de dernière minute. Ce sont toutes deux des probabilités, mais elles répondent à des questions légèrement différentes : les cotations précoces sont des estimations, les plus tardives se rapprochent du consensus final.
En lisant les marchés de prédiction, notez l’horodatage. Parler du « marché toujours haussier » sans tenir compte du moment peut fausser l’appréciation de l’efficacité de l’information. Cela vaut aussi pour les grands événements macro : un contrat lié à la Fed une semaine avant le NFP et une minute avant la publication des données sont régis par des facteurs de volatilité différents – ils ne sont pas interchangeables.
Les probabilités affichées sur les interfaces de Gate Prediction Market sont des instantanés à un instant T. Si vous utilisez Gate for AI Agent pour extraire des contextes macro (prix du BTC, indice dollar, anticipations de taux), leur objectif est d’expliquer « pourquoi les probabilités ont changé », et non de substituer directement les mouvements du prix de l'actif aux prix des contrats Yes. Une hausse du BTC ne signifie pas automatiquement que les cotes d’approbation d’un événement crypto doivent augmenter – il peut y avoir un lien, mais il doit être défini et vérifié séparément.
Les marchés de différents domaines varient fortement par la structure des participants, les sources d’information et la liquidité. La calibration ne peut donc pas être généralisée.
Marchés politiques et électoraux : riches en informations et très couverts par les médias, mais les récits polarisés peuvent entraîner des phases d’excès de confiance. Les analyses post-électorales discutent souvent des « écarts des 90 % pré-électoraux par rapport au résultat » – un problème typique de calibration.
Marchés sportifs : règles plus claires, longue historique de données, certains événements fréquents se calibrent bien ; mais les blessures soudaines ou les décisions arbitrales controversées créent encore des perturbations à court terme.
Marchés crypto et industriels : seuils de FDV, progrès d'approbation, annonces de partenariats reposent davantage sur des définitions textuelles (voir leçon 2). Des participants spéculatifs guidés par les récits peuvent prédominer, les marchés sont souvent peu profonds avec des sauts de cotes, et la volatilité de la calibration y est généralement plus élevée.
En conséquence, les affirmations générales comme « les marchés de prédiction sont précis » ou « ils ne le sont pas » n’ont pas de sens. Posez plutôt la question : pour quels types d’événements, sur quelles périodes et dans quelles conditions de liquidité la calibration est‑elle atteinte ?
Gate for AI Agent, ou les outils d’IA généraux, peuvent entreprendre des tâches de recherche dans le cadre de cette leçon : organiser les taux de base historiques pour certains événements, compiler les cotations passées et les résultats de règlement, aider aux statistiques groupées ou tracer des courbes de calibration. Cela accélère l’organisation et permet de formuler des hypothèses à tester.
En revanche, ces outils ne peuvent pas : affirmer « ce marché a toujours été précis » sans avoir lu les règles originales ; regrouper quelques cas en lois générales ; ou produire directement « il faut acheter Yes ». Toute figure générée par l’IA doit renvoyer aux données originales. Si l’échantillon est insuffisant, elle doit clairement indiquer « données insuffisantes pour évaluer la calibration » plutôt que de donner une fausse précision. Les agents s’arrêtent à la recherche. La décision de se fier aux probabilités d’un marché doit être prise par des humains, en fonction des règles, de la liquidité et de sources indépendantes.
La question centrale de cette leçon est : qu’est-ce que la calibration, et quand peut-on dire que le marché « a eu raison » ? Dans les marchés de prédiction, « avoir raison » comporte deux dimensions : le résultat s’est‑il réalisé, et les estimations de probabilité étaient‑elles raisonnables ? La précision ne couvre que le premier point ; la calibration examine la cohérence à long terme des estimations. Des indicateurs comme le score de Brier nous rappellent que coter à 90 % et échouer constitue une erreur probabiliste plus grave que coter à 60 % et échouer.
Nous voyons également que le temps, le thème et la liquidité influencent fortement la calibration. On ne peut pas se baser sur les gains ou pertes d’un seul marché brûlant pour conclure sur l’ensemble des marchés de prédiction. Gate Prediction Market fournit des instantanés du consensus actuel ; les données macro de Gate for AI Agent offrent une comparaison contextuelle, mais ne sauraient remplacer la lecture des probabilités des contrats d’événements eux-mêmes.
La prochaine leçon abordera une autre dimension clé de la fiabilité : même avec une bonne calibration à long terme, des cotations individuelles peuvent être faussées par la liquidité, les spreads et la manipulation. La liquidité et l’efficacité informationnelle sont des étapes indispensables pour lire correctement les marchés de prédiction.