viernes, 28 de agosto de 2020

Es confiable la PCR?


Voy a hacer este video porque últimamente se están diciendo muchísimas cosas por Internet respecto al virus y a la situación que estamos viviendo. De lo que voy a hablar específicamente, es sobre algo que conozco porque tengo experiencia. Que es la efectividad de la PCR en el área de diagnóstico. 

Como vimos en los videos pasados, la eficacia de una técnica, cuando hablamos estrictamente de la técnica, está dada por los parámetros denominados especificidad y sensibilidad. Para una descripción detallada sobre lo que es la especificidad y sensibilidad en el diagnóstico los invito a ver mi video pasado. 

Recapitulando, la probabilidad que el test detecte el virus en las personas infectadas se denomina sensibilidad, es una propiedad de la técnica. La especificidad, en contraparte, es la capacidad de la técnica de no detectar el virus en las personas sin infección.

Estos dos parámetros, sensibilidad y especificidad, son características propias de una técnica, pero no no nos hablan de la población de donde se toman las muestras, nos hablan de las características operativas del diagnóstico.

 Por ejemplo, una especificidad del 95% nos indica que del total de ensayos que se hacen a las personas sanas, va a salir correctamente negativo en el 95% de ellos, mientras que será un falso positivo en el 5%. 

Entonces, si uno va a hacerse un test y el test sale positivo, ¿Cómo se si es un falso positivo o un verdadero positivo?, ¿Cuál es la probabilidad que haya sido un error?. Un amala interpretación de este parámetro sería que, si tengo una especificidad del 95%, tengo una chance del 5% de tener un falso positivo. No, no es así, esto es una mala interpretación. La chance de ser un falso positivo es mucho menor, básicamente porque tenemos que considerar la cantidad de personas infectadas en la población y la sensibilidad de la técnica. 

Lo que queremos averiguar es la capacidad predictiva de la técnica, para eso tenemos que considerar el porcentaje de infectados en la población.. 

El valor que realmente estamos buscando es cuál es la probabilidad de poseer el virus si me salió positivo la técnica. O dicho de otra manera, me salió positiva la técnica, que probabilidad tengo de tener el virus. 

¿Porqué es importante saber la cantidad de virus circulante?,  porque cuanto menos virus tengo en la población, también disminuye la chance de informar un falso negativo, porque simplemente, no hay casi, virus, en el caso que no haya ningun virus circulando, entonces la posibilidad de informar un falso negativo es cero, porque no hay virus. En el caso contrario, si hay mucho virus circulando, la probabilidad de informar un falso positivo disminuye también, si, por ejemplo, toda la pobllación está infectada, la probabilidad de infectar un falso positivo es cero también. Entonces, el porcentaje de virus circulante influyen en la capacidad predictiva de la técnica. ¿Pero cómo sabemos con qué porcentaje de virus tenemos si no hemos realizado algún test?.  En realidad, no lo sabemos, lo podemos intuir, calcular por otros métodos.

Calculemos la capacidad predictiva de la PCR del virus con el teorema de Bayes

P(+|V) , es la sensiblidad de la técnica, que son los test positivos en las personas infectadas

P(V), es el porcentaje del virus circulante, cuyo valor podemos estimar

P(+), es el porcentaje de los test positivos que tiene la población, que es un dato empírico, sabemos cuantos no dieron positivo. Ahora, este valor, en realidad es la suma de los falsos positivos (+|-V) . P(-V) más los verdaderos positivos. 

Nos da la fórmula

P(V|+) = P (+|V) . P(V) / P(+)

Donde P(V|+)  srepresentan el porcentaje o probabilidad de los tests positivos que realmente tienen el virus.  Y que es el cociente entre la cantidad de ensayos positivos que me detectaron correctamente el virus, dividido todos los ensayos positivos.

Ahora, vamos a calcular la capacidad predictiva de la técnica en cuestión. Según lo reportado por los primeros estudios, la sensibilidad de la PCR están en 80%% aproximadamente, como son diferentes las técnicas algunas son 85%, otras 95%. 

Esto nos dice que la técnica tiene un 20% de falsos negativos, pero como vamos a ver a continuación, la sensibilidad no influye tanto en la eficacia de la técnica. Aparte, los negativos se realizan dos veces, disminuyendo esta probabilidad. Los parámetros que más afectan la eficacia de la técnica son la especificidad y la circulación del patógeno o virus. En general, la técnica de PCR es una técnica exquisitamente específica, porque se fundamenta en la complementariedad del ADN. Dicho de otra manera, puede ser que a veces en cantidades muy pequeñas  del virus no lo detecta, pero cuando lo detecta no se equivoca. La especificidad es del 99%, es decir, un 1% de falsos positivos. Ahora, digamos que la circulación del patógeno en la población está en un 40%.  Calculamos según la forma y nos da un 98% de calor predictivo positivo. Es decir, podemos asegurar que la tenemos un 98% de certeza que el test positivo me indica que tengo el virus. Pero, si la circulación del virus es más baja este porcentaje también lo hace, y si sube la circulación del virus también lo hace la chance de ser informado correctamente. Pero sobre todo siempre se encuentra por arriba del 90%.



0.8 * 0.4 / (0.8 * 0.4 + 0.01 * 0.6)

 0.08/ 0.08 + 0.0196

0.0996

80%

De acuerdo a estos datos, y considerando una sensibilidad del 77% y una prevalencia de 

0.81%

Si aumentamos la sensibilidad de la técnica a 0.85, el valor predictivo positivo se va a 0.89

La capacidad predictiva del test de PCR es muy buena, pero fundamentalmente en un aspecto, La técnica de PCR es una técnica altamente específica, es decir, disminuye grandemente los falsos positivos. Lo que generalmente se regula es su sensibilidad. Dicho de otra manera, es más probable que salga un falso negativo que un falso positivo, y está bien que sea así. De todas maneras, en la práctica, los resultados se repiten, lo que aumenta la eficacia de detección.

P (+|V) sensibilidad

P (-|V) falso negativo 

P (-|(-V)) especificidad

P(+| (-V)) falso positivo


jueves, 7 de mayo de 2020

Qué es y qué no es confusión en estadística



Por ejemplo, si estamos probando los efectos del ejercicio físico respecto a la longevidad de las personas jubiladas o retiradas, entonces tomamos un grupo de pacientes que caminan mucho y lo comparamos con otro que no caminan y los seguimos en un período de cinco años. En este caso, el ejercicio físico es X y longevidad es Y. ¿Qué esperaríamos en este ejemplo?. Esperamos que el grupo que realiza más actividad física sean más longevos que aquellos que lo hacen pobremente.
Ahora, si la edad promedio de los grupos es diferente al comenzar el estudio, podemos arribar a un resultado erróneo. Si, por dar un ejemplo hipotético, el grupo que realiza poca actividad física son en promedio más jóvenes que aquellos que caminan más, se registrarán más fallecimientos en el grupo que camina más, pero estas se deberán a las diferencias de edad de ambos grupos y no a los efectos del ejercicio físico. En ese caso, la Edad es el factor de confusión.

Ahora, uno se puede realizar otra pregunta, ¿pueden haber otros factores que no hayamos tenido en cuenta que modifiquen aún más los resultados?. ¿cuál era la dieta de los grupos?, ¿tenían enfermedades subyacentes?

Este es un ejemplo real, que proviene de un  trabajo realizado en Honolulu. En este trabajo se seguían a 8000 hombres jubilados desde el año 1965 hasta 1977. Los investigadores querían saber si un mayor ejercicio físico prolongaba la vida en hombres jubilados. Ellos encontraron que los que caminaban menos de una milla por día tenían una tasa de mortalidad dos veces mayor que los que caminaban más de una milla por día.
Los investigadores pensaron en todo esto, así que midieron la edad, dieta, cigarrillo, peso, enfermedades preexistentes. Y efectivamente encontraron una diferencia en el promedio de edad entre los grupos. Así que realizaron lo que se conoce como ajuste del factor de confusión o controlar por el factor de confusión. Él único requisito que se debe tener es medir la variable ateriormente. Ellos tenían la edad y muchas otras medidas de las personas. Lo que hicieron fue diviri a los grupos de pacientes y al grupo control en intervalos de edad, y medimos el efecto que tiene la dieta en pacientes y controles de cada intervalo por separado. Después promediamos los efectos, considerando o ponderando cuánto porcentaje de personas había en cada intérvalo de edad. Este procedimiento se denomina "ajuste de Z" o "controlar Z".

Luego de ajustar los resultados, encontraron que el 43% de los poco caminadores habían muerto,en comparación con el fallecimiento de solamente el 21% de los caminadores intensos.

¿Porqué es a veces muy difícil detectar la confusión en un estudio? 
La razón de tal dificultad se basa en dos premisas, primero es la diferencia entre lo que queremos calcular (la relación causal entre dos variables, X e Y, como vimos) y como diseñamos el estudio para detectarlo.
Hay dos conceptos fundamentales en la confusión: la incomparabilidad de los grupos, como vimos, y la búsqueda de la tercer variable o de confusión.
Cuando decimos que vamos a comparar dos tratamientos, por ejemplo, una vacuna y un placebo, los grupos a quienes probamos deben ser iguales en las variables más importantes. Pero... que son las variables más importantes para ese tratamiento? Cómo se que la edad es importante para los caminadores de Honolulu?, pensamos que el sentido común nos dará la respuesta, pero las cosas siempre son más complicadas de lo que parecen.
El problema de la definir la variable de confusión también es problemático. Es una variable que tenga una causa común con X o Y, o es simplementa una variable que esté correlacionada con X o Y.
Entonces tenemos dos grupos de definiciones:
Proce

Cómo funciona la edición genética de Cripsr?


Hola, vamos a ver cómo funciona la edición genética por CRISPr. En este primer video veremos la función natural, en la continuación como es utilizado para ingeniería genética.

El sistema fue descubierto en las bacterias a comienzos del siglo por al menos tres investigadores de manera independiente. Se trata de un sistema de inmunidad adquirida o adaptativa en bacterias. Dicho de otro modo, es una manera en que las bacterias se defienden de los virus, denominados también bacteriófagos, y tienen memoria de una infección anterior para evitar que el mismo virus vuelva a atacarlos, por eso es denominada inmunidad adaptativa.
La verdad que esto fue una gran revolución en el campo de la microbiología porque hasta el momento solo se sabía que los organismos superiores presentaban ese tipo de inmunidad. Es más, cuando los primeros autores enviaron sus resultados a revistas notorias como Nature o Science, fueron rechazados porque simplemente no creían que eso fuera posible.

El mecanismo básico se divide en tres etapas, en la primera etapa, denominada adquisición, el virus entra a la bacteria y libera su ADN o ARN, el sistema cripsr reconoce el ADN del virus y mediante las proteínas Cas1 y Cas2, lo corta y lo agrega a su genoma para después reconocer un nuevo ataque. ¿cómo lo hace?, Cripsr es toda una familia que tiene numerosas variantes, pero en general comparten Cas1 y Cas2, que reconoce una secuencia que comparten los fagos que se denomina protoespaciador, estas proteínas los reconocen y cortan en lugares adyacentes, la función de cortar el ADN se denomina función nucleasa y ribonucleasa, cortan el ADN del virus, y pegan el ADN del virus en el genoma de la bacteria, por decirlo de alguna manera, en el locus de CRIPSR. Como ven  acá, el locus CRIPr está formado por los genes CAS, seguido de una secuencia lider, y secuencias repetidas denominadas repetidos Crispr y espaciadores, el ADN del virus es copiado en los espaciadores.

El locus CRIPSR dentro de la bacteria tiene la siguiente disposición, esto es un modelo, porque puede variar de acuerdo a las especies. los genes CAS, una secuencia lider seguido por repetidos crispr y los espaciadores con la secuencia del virus. Dentro del lider se encuetra el promotor de transcripción, que es donde se inicia el pasaje de ADN a ARN, todos el arreglo es transcripto como una sola cadena que luego es procesada. Como es procesada deriva en tres tipos, I, II y III. La manera en que cortan difieren en los tres sistemas, utilizando genes cas6 o ARNasaIII. Independientemente como fueron procesados el ARN que proviene del espaciador será utilizado como guía para reconocer el ADN foráneo.

En la útima etapa los ARNcrispr se unen a las proteínas CAS para formar complejos riboproteicos que reconocen al ADN del fago y lo cortan. Estos complejos circulan dentro de la bacteria en busca de ADN de virus y reconocen el proto espaciador para cortarlo. Los tres tipos difieren en la composición. Uno de los sistemas, el denominado tipo II, tiene mucho interés, porque el ARN de Crispr se acompleja con Cas9, que está formado por dos endonucleasas que inactivan el blanco. Modificaciones de este sistema se utiliza para inactivar genes en ingeniería genética.



¿Es la edad del calendario igua a nuestra edad biológica?

Se dice que el tiempo que se desperdicia no se recupera más y que el reloj es un enemigo imbatible. Durante décadas, el avance de la ciencia...