¿Qué significa 5 Sigma?

T.E.L: 4 min.

Los experimentos de física de partículas se miden en función de la probabilidad. Algunos conceptos básicos para comprenderlo.

Recientemente se divulgaron los resultados parciales de dos experimentos de física vinculados a mesones b y muones. En esos y muchos otros casos, las conclusiones se realizan en función de un valor de Sigma. Si es igual o mayor a 5, ¡Eureka!; si es menor, se guarda el cotillón para más adelante.

Los científicos usan el valor p para sondear la probabilidad de sus hipótesis. En un experimento que compara un fenómeno A con un fenómeno B, los investigadores construyen dos hipótesis:

1-Que A y B NO están correlacionados, que se conoce como hipótesis nula y es la hipótesis más conservadora;

2-Que A y B SÍ están correlacionados, que se conoce como hipótesis de investigación.

Los investigadores luego asumen la hipótesis nula (que también se menciona como H0) y calculan la probabilidad de obtener datos tan o más extremos de lo observado, dado que no hay relación entre A y B. Este cálculo del valor p puede estar basado en diferentes pruebas estadísticas. Si el valor p es bajo (por ejemplo 0,01) significa que hay solo una pequeña chance (1 por ciento en ese caso) de que los datos sean azarosos sin correlación. Usualmente hay un límite pre-establecido en cada campo de estudio para rechazar la hipótesis nula y afirmar que A y B están correlacionados. Valores como p=0,05 y p=0,01 son muy comunes en diferentes disciplinas científicas.

La física de altas energías (también llamada física de partículas) requiere un valor mucho menor para anunciar evidencia de descubrimientos. El límite corresponde a un valor p=0,003 para "evidencia de una partícula" y el estándar para un "descubrimiento" es p=0,0000003. A esto último se le llama 5 Sigmas.

La razón para ese estándar tan exigente son las fluctuaciones estadísticas. ¿Qué es eso?

Pongamos un ejemplo:

Digamos que tiraremos una moneda 100 veces. Para reducir el error humano, montamos una máquina que tirará la moneda. Esperamos que luego de 100 tiradas, cerca de 50 sean Cara y otras tantas, Sello. Cara y Sello son los dos lados de la moneda.

Si en vez de esos valores, obtenemos 66/100 caras, ¿cómo se explica?

I-Error instrumental: En vez de poner a una persona a tirar monedas millones de veces, pusimos una máquina. Pero la máquina puede estar mal hecha o mal calibrada. En las grandes colaboraciones de física, esto es poco probable, ya que se reúne mucha gente que se divide el trabajo y le dedican años a diseñar, construir y calibrar las partes. Además, realizan los experimentos en tandas o "runs" y entre cada una revisan y recalibran de ser necesario.

II-Fluctuaciones aleatorias: Hay menos de 1% de que al lanzar una moneda ordinaria 100 veces caerá 66 caras. Pero si mil personas tiran monedas idénticas 100 veces cada una, se vuelve probable que algunos obtendrán 66 caras.

III. Si se pueden descartar las explicaciones I y II, entonces, quizás hay "algo" desconocido que interactúa con nuestra moneda o nuestros muones.

Para descartar la opción II, se repiten los experimentos, ya que si es una fluctuación aleatoria, aparecerá a veces, no siempre. Si se repite, entonces ya no será aleatorio y no será una mera fluctuación.

¿POR QUÉ SIGMA?

Es una letra del alfabeto Griego usada para representar la desviación estándar, que mide la distribución de datos alrededor de la media. Es como el "ancho" de la distribución. Una muestra con una desviación alta está más expandida, tiene mayor variabilidad; mientras una muestra con baja desviación se agrupa en forma más concentrada cerca de la media. Por ejemplo, si hacemos un gráfico de la altura de los perros de diferentes razas, habrá mayor variabilidad y la desviación estándar será mayor, es decir los valores que se alejan de la media. Si la media entre todas las razas es 50 cmts, habrá chihuahuas de 20 y gran danés de 80, por decir algo. En cambio, si se tomara solo una raza, la amplitud de la muestra será menor.

LA CAMPANA

La curva de campana o campana de Gauss es lo que en estadística se llama "Distribución normal", concepto desarrollado por De Moivre y Laplace.

En una curva perfecta, 68% de los datos están dentro de una desviación estándar de la media, 95% dentro de dos y así.

En los gráficos se usan las letras μ (mu) para la media y σ (sigma) para la desviación.

ERRORES

Hay dos tipos de errores comunes en la divulgación de los resultados en el periodismo:

1) Hemos dicho que el valor p para 5 Sigmas es p=0,0000003. Esto es una probabilidad, no un porcentaje. Para transformar probabilidad a porcentaje hay que multiplicar por 100. Por tanto, p=0,0000003 es igual que 0,00003%.

2) +/-5 Sigmas es igual a 1 en 1,7 millones. Sin embargo, en varias publicaciones se dice que 5 Sigmas es igual a 1 en 3,5 millones. Esto es así porque la distribución normal es simétrica, hacia un lado y hacia otro. De allí el +/- 5 Sigmas. Si se calcula en ambos lados obtenemos la primera frecuencia, y si se mira solo hacia un lado, la segunda.

5 Sigmas es entonces un valor estándar usado en física de partículas para considerar un descubrimiento. Por eso, cuando se anuncia un "potencial" hallazgo, debemos ser cautos, ya que también existen los falsos positivos.

Los científicos necesitan ser optimistas, ya que nada ni nadie garantiza que luego de años de trabajo, lograrán hacer un descubrimiento. Pero, frente a un posible hallazgo, deben ser pesimistas: quizás no sea lo que parece. Sin embargo, a veces la emoción les gana a los investigadores. Por eso conviene que los precavidos seamos nosotros. Si el descubrimiento es real, los resultados se repetirán en otros experimentos.

ALERTA PROBABLE

Hay que tener en cuenta que no es lo mismo obtener una probabilidad, dada una hipótesis cierta, que la probabilidad de que una hipótesis sea cierta, dado un resultado.

Por ejemplo: supongamos que todos pensamos que todas las aves vuelan, ya que tienen alas. Entonces elaboramos una hipótesis de que hay aves que no vuelan. Luego calculamos la probabilidad de observar aves que no vuelen y habrá una probabilidad, ya que habrá aves lastimadas. Y diremos que descubrimos algo, pero será un falso positivo. Hasta que otros observen pingüinos o avestruces.

Los valores de p no miden la probabilidad de que la hipótesis nula sea cierta, sino si coinciden o no con lo esperado.

Si hay algo que es difícil de entender es la probabilidad. Probablemente.☉

Fuentes y enlaces relacionados

5 Sigma What's That?, By Evelyn Lamb

https://blogs.scientificamerican.com/observations/five-sigmawhats-that/

Regla 68-95-99.7

https://es.wikipedia.org/wiki/Regla_68-95-99.7

Valor p

https://es.wikipedia.org/wiki/Valor_p

Sobre las imágenes

De https://commons.wikimedia.org/wiki/User:Chen-Pan_Liao - File:P-value_in_statistical_significance_testing.svg, CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=102618293

De Ainali - Trabajo propio, CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=3141713

Páginas

1/5/21 - DJ: