Antes de adentrarnos en los niveles de probabilidad, conviene dejar claras las definiciones de los eventos y las reglas de liquidación. Una vez aclaradas las reglas, surge la siguiente pregunta natural: ¿son fiables los precios del mercado? Mucha gente responde por intuición: «La última vez acertó, así que será preciso», o «La última vez falló, luego los mercados de predicción no funcionan». Ambos razonamientos son demasiado simplistas. Los mercados de predicción no dan una conclusión binaria de «sí o no», sino un conjunto de estimaciones de probabilidad; valorar si «acertaron» exige un lenguaje probabilístico.
De hecho, un mercado puede acertar el resultado con frecuencia y, sin embargo, estar muy descalibrado desde el punto de vista probabilístico; o puede «fallar la dirección» a menudo, pero reflejar honestamente la incertidumbre. Juzgar solo por aciertos o fallos pasa por alto el aspecto más valioso (y más incomprendido) de los mercados de predicción: la calibración.
Para evaluar la calidad del mercado, debemos preguntarnos: ¿qué es la calibración y cuándo podemos afirmar que el mercado realmente «acertó»?
Exactitud responde: ¿Coincide el veredicto final con el resultado?
Calibración responde: Cuando el mercado dice 70 %, ¿ocurre aproximadamente el 70 % de esos eventos?
Un ejemplo sencillo ilustra la diferencia. Supongamos que hay 100 instancias de un mismo evento y el mercado siempre cotiza al 90 %. Si ocurren 90 y no ocurren 10, la cotización del 90 % es razonable desde la óptica de la calibración. Si, en cambio, el mercado siempre cotiza al 51 % en los 100 eventos, y exactamente 51 ocurren mientras 49 no, la exactitud «sigue viéndose bien», pero el mercado ofrece casi nula capacidad de discriminación probabilística, simplemente se mantiene siempre ligeramente de un lado.
Por el contrario, una cotización honesta del 60 % que finalmente falla no significa que «el mercado mintiera»; el 60 % implica de por sí un 40 % de probabilidad de que no ocurra. Equiparar «no ocurrió» con «fracaso del mercado» es evaluar una herramienta probabilística con mentalidad determinista.
Para los lectores, la lectura probabilística de la Lección 1 necesita actualizarse aquí: leer los mercados de predicción no va solo de «qué lado se favorece», sino también de si ese sesgo refleja honestamente la frecuencia histórica.
Una forma habitual de evaluar la calibración es trazar una curva de calibración: agrupar las predicciones históricas por intervalos de probabilidad (p. ej., 50–60 %, 60–70 %, 70–80 %), y luego calcular la tasa de ocurrencia real en cada intervalo. Lo ideal es que la curva se aproxime a la diagonal: los eventos cotizados al 70 % deberían ocurrir aproximadamente el 70 % de las veces a largo plazo.
Se observan tres desviaciones típicas:
Sobreconfianza: El mercado cotiza al 80 %, pero la ocurrencia real está muy por debajo. Los temas candentes y los mercados de una sola narrativa suelen mostrar esto.
Exceso de cautela: El mercado cotiza al 55 %, pero la ocurrencia real supera ese porcentaje. Puede darse cuando la información se difunde lentamente o los participantes son cautelosos.
Muestras insuficientes: Muy pocos casos históricos en un intervalo de probabilidad hacen que las estadísticas sean inestables. Los eventos de cola larga y los mercados de temas nuevos suelen presentar esto.
Por tanto, la calibración no es una etiqueta única de «correcto/incorrecto», sino una propiedad a largo plazo que requiere suficientes muestras y observación por intervalos. Esta lección no pretende ofrecer un coeficiente de calibración preciso para ninguna plataforma —eso requiere datos profesionales y metodología— sino establecer un marco de evaluación: no juzgues la calibración basándote en uno o dos mercados puntuales.
La puntuación Brier es una métrica habitual para evaluar la calidad de las predicciones probabilísticas. Para eventos binarios, se calcula el error de cada predicción contra el resultado; cuanto menor es la puntuación, más cerca están las estimaciones de probabilidad de la realidad (una predicción perfecta obtiene 0, una totalmente errónea se acerca a 1; el cálculo exacto depende de la fórmula).
El valor de la puntuación Brier está en penalizar los «errores por sobreconfianza». Cotizar al 99 % y fallar tiene una penalización mayor que cotizar al 60 % y fallar; esto es coherente con el pensamiento probabilístico: el primero afirma una certeza mucho mayor, por lo que los errores cuestan más.
Los usuarios habituales no necesitan calcular la puntuación Brier a mano, pero deben entender su significado:
Si dos mercados tienen una exactitud similar, el que tenga una puntuación Brier más baja suele expresar la probabilidad de forma más honesta.
Si un mercado empuja a menudo las probabilidades hacia los extremos (0 o 1), puede parecer «decisivo» a corto plazo, pero la calibración a largo plazo tiende a ser peor.
Para evaluar la calidad del mercado, considera tanto «si acertó» como «si las probabilidades se cotizaron de forma razonable».
Para el mismo evento, las cotizaciones en distintos momentos contienen información diferente. Cotizar al 40 % una semana antes de un partido puede reflejar la alineación, las lesiones, el calendario (factores a medio plazo); cotizar al 65 % una hora antes puede incorporar el once titular, el clima, noticias en tiempo real. Ambas son «probabilidades», pero responden a preguntas ligeramente distintas: las cotizaciones tempranas son estimaciones; las tardías se acercan al consenso final.
Al leer los mercados de predicción, presta atención a la marca de tiempo. Decir «el mercado siempre ha sido alcista» sin considerar el momento puede malinterpretar la eficiencia de la información. Lo mismo se aplica a los grandes eventos macro: un contrato relacionado con la Fed una semana antes del NFP frente a uno un minuto antes de la publicación de datos están impulsados por factores de volatilidad diferentes, no intercambiables.
Las probabilidades que se muestran en las interfaces del Mercado de Predicción de Gate son instantáneas en ese momento; si usas las capacidades de primer nivel del Agente IA de Gate para obtener contextos macro (como el precio de BTC, el índice del dólar, las expectativas de tipos), su propósito es explicar «por qué cambiaron las probabilidades», no sustituir directamente los movimientos del precio del activo por los precios de los contratos de evento «Sí». Un repunte de BTC no significa automáticamente que las probabilidades de aprobación de un evento cripto deban subir —pueden estar relacionados, pero deben definirse y verificarse por separado.
Los distintos mercados temáticos varían enormemente en estructura de participantes, fuentes de información y liquidez; el rendimiento de la calibración no puede generalizarse.
Mercados políticos y electorales: Ricos en información y muy cubiertos por los medios, pero las narrativas polarizadas pueden generar fases de sobreconfianza; las revisiones poselectorales suelen discutir «el 90 % preelectoral que se desvió del resultado», un problema de calibración.
Mercados deportivos: Las reglas son más claras, hay un largo historial de datos; algunos eventos principales se calibran bien, pero las lesiones repentinas o las controversias arbitrales siguen causando perturbaciones a corto plazo.
Mercados de cripto y eventos del sector: Los umbrales de la FDV, el progreso de las aprobaciones, los lanzamientos de asociaciones dependen más de definiciones textuales (véase la Lección 2); los participantes especulativos y guiados por narrativas pueden dominar, los mercados poco profundos y las cotizaciones erráticas son comunes, y la volatilidad de la calibración tiende a ser mayor.
Por lo tanto, afirmaciones generales como «los mercados de predicción son precisos» o «los mercados de predicción no son precisos» carecen de sentido. En su lugar, pregúntate: ¿para qué tipos de eventos, en qué plazos y bajo qué condiciones de liquidez se logra la calibración?
El Agente IA de Gate o las herramientas generales de IA pueden asumir tareas de investigación en esta lección, como organizar tasas base históricas para ciertos eventos, recopilar cotizaciones pasadas del mercado y resultados de liquidación, ayudar en estadísticas agrupadas o esbozar curvas de calibración. Estas tareas aceleran la organización y ayudan a formar hipótesis que luego se ponen a prueba.
Las tareas que no pueden asumir incluyen: afirmar «este mercado siempre ha sido preciso» sin leer las reglas originales; empaquetar unos pocos casos como leyes generales; o producir directamente «deberías comprar Sí». Cualquier cifra generada por IA debe remitirse a los datos originales; si el tamaño de la muestra es insuficiente, debe indicar claramente «no hay suficiente para evaluar la calibración», en lugar de ofrecer una falsa precisión. Los agentes se detienen en la investigación; la decisión de confiar en las probabilidades de un mercado debe ser juzgada por humanos basándose en las reglas, la liquidez y las fuentes independientes.
La pregunta central de esta lección es: ¿qué es la calibración y cuándo podemos decir que el mercado «acertó»? La respuesta es que en los mercados de predicción, «acertar» tiene dos capas: si el resultado ocurrió y si las estimaciones de probabilidad fueron razonables. La exactitud solo considera la primera; la calibración examina la consistencia a largo plazo de las estimaciones. Indicadores como la puntuación Brier nos recuerdan: cotizar al 90 % y fallar es una distorsión probabilística más grave que cotizar al 60 % y fallar.
También vemos que el tiempo, el tema y la liquidez afectan significativamente el rendimiento de la calibración; no se pueden usar los aciertos o fallos de un único mercado para concluir sobre todos los mercados de predicción. El Mercado de Predicción de Gate ofrece instantáneas de consenso actual; los datos macro del Agente IA de Gate proporcionan comparaciones de contexto, pero no pueden sustituir la lectura de la probabilidad del contrato del evento en sí.
La próxima lección abordará otra dimensión que determina la fiabilidad: incluso si la calibración es buena a largo plazo, las cotizaciones individuales pueden estar sesgadas por liquidez, spreads y manipulación: la liquidez y la eficiencia informativa son pasos esenciales al leer los mercados de predicción.