Por Juan Vázquez 

La paradoja de Simpson, también llamada efecto Yule-Simpson, es un efecto que ocurre cuando la asociación entre dos variables categóricas es cualitativamente diferente de la asociación entre las mismas dos variables. En palabras más sencillas: podemos obtener resultados diferentes a partir de la misma fuente de datos.

En general, las estadísticas son persuasivas, tanto así que las personas, organizaciones y países enteros basan algunas de sus decisiones más importantes en ellas. Sin embargo, cada conjunto estadístico puede ocultar algo capaz de poner de cabeza los resultados por completo. Esto, usualmente, sucede cuando los datos que utilizamos contienen un factor oculto o simplemente una condición. Veamos el ejemplo que utilizó Mark Liddell para Ted-Ed y así aclarar la situación:

              

    Hospital A             Hospital B

Imaginemos que tenemos que elegir entre dos hospitales (A y B) para la cirugía de nuestro abuelo. De los últimos 1,000 pacientes que recibió cada hospital, 900 sobrevivieron en el hospital A y 800 en el hospital B. Si dejáramos la conclusión hasta aquí, ¿cuál sería la mejor opción? Obviamente el hospital A; sin embargo, todo cambia si observamos los datos con una perspectiva un poco más amplia.

Sumando al ejemplo, ahora consideraremos que no todos los pacientes llegan al hospital en el mismo estado de salud, entonces, ahora dividiremos a los 1,000 pacientes que llegaron a cada hospital en dos grupos: aquellos que llegaron en un buen estado de salud y aquellos que llegaron en un mal estado de salud. El hospital A sólo tuvo a 100 pacientes en un mal estado de salud de los cuales 30 sobrevivieron, mientras que el hospital B tuvo 400 pacientes en mal estado de salud, de los cuales sobrevivieron 210. Lo que nos demuestra que el hospital B es la mejor opción ya que tiene un promedio de 52.5% de probabilidades que pacientes en mal estado de salud sobrevivan. Pero, ¿qué pasa con los pacientes en buen estado de salud? Sorpresivamente también es más probable que sobrevivan en el hospital B con una probabilidad de sobrevivir del 98%.


Con esto podemos apreciar que algunas veces lo que nos muestra una estadística no es necesariamente verdadero o falso y que siempre debemos considerar posibles condiciones ocultas o datos que no se nos estén mostrando en cada resultado.

¡No lo olviden! La próxima vez que ocho de cada diez Gatos prefieran Güiskas (sí, con “G”), pregúntense en qué condiciones fueron obtenidos esos datos y si puede haber algún factor que indique que podamos obtener un resultado totalmente distinto y si este fue usado sólo para convencernos “con pruebas”.

Referencia: https://ed.ted.com/lessons/how-statistics-can-be-misleading-mark-liddell

Facebook
Twitter
LinkedIn
Telegram
WhatsApp
Email
0 0 votes
Article Rating
Subscribe
Notify of
guest
0 Comments
Inline Feedbacks
View all comments
0
Would love your thoughts, please comment.x
()
x