sábado, 29 de mayo de 2021

Variables de Confusión: Qué es la paradoja de Berkson, o sesgo de encuentro, y el riesgo atribuido al COVID

 Vamos a ver un caso muy especial que está asociado a las variables de confusión. La denominada Paradoja de Berkson, también denominada Sesgo de encuentro, sesgo de colisión, o falacia de Berkson. En inglés se denomina Collider Bias. 

La importancia de la paradoja de Berkson se encuentra en la interpretación de los estudios de bioestadística, de los estudios de biomedicina y de medicina. 

En el año 1946, un estadístico de la clínica de Mayo, en USA, hizo una observación que dejó un poco perpleja a la comunidad científica. Analizando los datos epidemiológicos del Hospital, se dió cuenta que la relación estadística entre las enfermedades puede ser engañosa si se la estudia solamente en pacientes de los hospitales. Qué significa esto?, que los datos de un hospital o una internación nos piede mostrar asociación entre dos condiciones, cuando en realidad no existe, o alternativamente, puede aparecer una asociación ficticia, o bien una asociación en sentido inverso. 

Pero, ¿Qué es lo que encontró Berkson específicamente?. Berkson estudió la diabetes y la inflamación de la vesícula, o colecistitis. Se sabe que la diabetes es un factor de riesgo para la inflamación, y naturalmente tendrían que estar correlacionadas positivamente, pero analizando los datos del hospital, Berkson encontró un correlación negativa entre las enfermedades. Inmediatamente Berkson publicó los resultados, sosteniendo que era una asociación espúrea o sesgada, por ser estudiada únicamente en personal hospitalario, aunque tardaría mucho tiempo hasta que la comunidad científica comience a tomarse en serio sus observaciones.

Para entender mejor esto, veamos un ejemplo que surgió unos años después. En 1979, el dr. Sackett encontró que el 7.5% de la población general tenía enfermedades de los huesos, y que este porcentaje no estaba relacionado para nada con la presencia de una enfermedad respiratoria. Pero si observaba en la población hospitalaria, es decir, en pacientes itnernados con enfermedad respiratoria, el porcentaje de personas con enfermedades en los huesos se disparaba al 25%. Si en la ciudad no habia alguna relación entre los huesos y las enfermedades respiratorios, porqué las personas internadas con enfermedades respiratorias tenían un gran número de problemas en los huesos. Sackett denominó a este sesgo, el sesgo de Berkson, o el sesgo de la tasas de admisión.

La cuestión se encuentra en que hay tres variables, la primera es una enfermedad, en este caso la enfermedad respiratoria, la segunda variable es la segunda enfermedad, la enfermedad de los huesos. Pero ambas variables influyen sobre la tercer variable, la denominada collider, o colisión, es la hospitalización. La probabilidad de encontrar a una persona que posea una enfermedad de huesos y una enfermedad respiratoria aumentan en la población hospitalaria, porque la muestra no es representativa. Ambas variables influyen en la hospitalización, y  por ende, en que muestra coy a tomar para analizar, es un sesgo de selección.

Otro caso interesante es el de los tests COVID en Gran Bretaña. Sabemos que en la población general , las personas de mayorpía de edad poseen una correlación entre el peso y la edad. A mayor edad, mayor peso. Es una de las asociaciones más consistentes en la medicina. Sin embargo, si tomamos solamente la población que que se ha realizado el test COVID, y analizamos la relación entre la edad y el peso entre los testeados, encontramos que la edad está inversamente correlacionado al peso. Es decir, a mayor edad, menor peso. ¿Como puede ser esto?, es otro caso de la paradoja de Berkson. 

Esto es porque en un momento los tests eran realizados primariamente a las personas de mayor riesgo, y quienes eran las personas de más riesgo, aquellas que eran jóvenes pero tenían alto peso, y personas mayores, que no eran necesariamente obesas. Si tomo esta subpoblación, la correlación entre la edad y el peso era inversa, al contrario que la población general.

Esto puede verse en el gráfico, donde la raya roja es la relación positiva que se obtiene entre la edad y el peso, mientras que la raya azul es la relación engativa que se observa entre las personas que obtuvieron el test.

En general, si dos factores influencian la manera en que son seleccionados en una muestra, se dice que esos factores "colisionan sobre la selección". En el casos del ejemplo de la enfermedad respiratoria y la del hueso, ambos factores influian directamente en la hospitalización. En el caso de la edad y del peso, las dos variables influían en si se tomaba el test o no se tomaba el test.

En el gráfico vemos una representación del fenómeno, las flechas indican las relaciones causales y la relación entre las variables puede ser alterada si ambas influyen en la selección de la muestra. Se pueden generar asociaciones que no existían anteriormente, como las enfermedades del hueso y respiratoria. O invertir relaciones existentes, como el peso y la edad; o exagerar algunas otras.

Veamos un tercer ejemplo. Un trabajo interesante, publicado por Herbert, Griffith y colaboradores en el año 2020, ilustra como esta paradoja puede explicar algunos resultados aparentemente sorprendentes que se observaron en la pandemia. 

Un trabajo epidemiológico que llamó mucho la atención a comienzos del año pasado fue a partir de unos datos que sostenían que el tabaco era un factor protector contra el COVID. La reacción inicial ante esta sugerencia fue tomada con mucho escepticismo. El Tabaco es muy malo para el sistema respiratorio, ¿como puede ser que sea beneficioso para el virus? . Pero los datos que emergían de los paises donde el virus pegó primero parecían avalar esta hipótesis: la proporción de fumadores entre los pacientes hospitalizados por COVID era una proporción mucho más baja que la proporción de fumadores de la población general. En China, el 8% de los pacientes hospitalizados por COVID eran fumadores, mientras que en la población general ese porcentaje llegaba a un 25%. En Italia, está diferencia era también notoria, el 8% de los hospitalizados fumaban, mientras que el 19% de la población general lo hacía. Era un resultado raro, ¿podría ser que el tabaco protegía a las personas de las hospitalizaciones por COVID, o estaba siendo otro caso de la paradoja de Berkson?

La explicación es la siguiente. Para que una persona sea hospitalizada, debe tener un grado serio de COVID. Por otro lado, el tabaco ocasiona un gran número de enfermedades colaterales, como cardíacas, cáncer, arteriosclerosis, etc, que pueden devenir en hospitalizaciones. Por tanto, una persona que está hospitalizada, tendrá un grado muy severo de COVID, o no será hospitalizada, pero entre los pacientes que no tengan COVID, habrá una mayor proporción de internados por causas relacionadas al tabaco, es decir, habrá una mayor proporcion de fumandores en internados no COVID. Dicho de otra manera, Los test COVID en los internados mostrarán menor tasa de infección entre fumadores que en no fumadores, porque los fumadores también están internados por enfermedades relacionadas al cigarrillo, y no necesariamente COVID. mostrando un sesgo de selección.

Por esta razón es tan importante el proceso de selección. El hecho de pertencer a un cierto grupo de riesgo poseer ciertos síntomas aumenta la chance de ser seleccioado para un test y colisionan en la selección. Es por eso que el proceso de selección debe ser representativo. Es importante donde la inferencia causal es el foco del trabajo.


No hay comentarios:

Publicar un comentario

¿Es la edad del calendario igua a nuestra edad biológica?

Se dice que el tiempo que se desperdicia no se recupera más y que el reloj es un enemigo imbatible. Durante décadas, el avance de la ciencia...