lunes, 27 de agosto de 2018

Teorema de Bayes II: Cuál es la idea detrás del Teorema y que significa


Bayes quería demostrar que se podía calcular la probabilidad de un evento (la causa) a través de un efecto. Nuestro cerebro está entrenado para calcular la probabilidad de un efecto, por ejemplo, si no me abrigo, se que voy a tener chance de tomar un resfrío. Pero nuestro cerebro no está entrenado para calcular la "probabilidad inversa". Es decir, si tengo un resfrío, ¿cuál es la chance de no haber usado la campera?

Si un niño lanza una piedra a la ventana, es probable que el vidrio se rompa, pero si veo la ventana rota, ¿qué tan probable es que haya sido por el lanzamiento de una piedra?


Pero esta probabilidad, Bayes la llamaba "probabilidad de un suceso anterior", es fundamentalmente importante. Luego se denominó "probabilidad inversa" y en día es más conocida como "probabilidad posterior o a posteriori". Tal probabilidad es simple, pero fue difícil descubrirla porque es contraria a nuestra intuición. Lo que hizo Bayes fue darle una demostración formal.

¿Porqué la probabilidad inversa o a posteriori es contra intuitiva y porqué es importante conocerla?, porque nuestro cerebro razona desde la causa al efecto, no del efecto a la causa. 

En los ejemplos anteriores la falta de abrigo causó el resfrío, y no al revés; en el ejemplo de la piedra y la ventana, es el lanzamiento de la piedra lo que causó la rotura. Es el sentido de las cosas lo que nos desorienta y es porqué estos conceptos básicos tardaron mucho tiempo en conocerse.


Veamos un ejemplo:

Digamos que una panadería está por abrir sus puertas y desean hacer un estudio de mercado. Su producto principal  son las medialunas, y quieren averiguar que porporción de los clientes que compran sus medialunas, también toman te.
Entonces consultan a una gran confitería, que vende te y café con medialunas.  El personal de la confitería consulta a sus registros, y también a sus recuerdos, y les dicen, que el 40% de los clientes piden te, y que el 70% de las personas que piden te, también piden medialunas. 
(Diapo árbol)
Para hacer esto una regla general, llamemos a P(T) a la probabilidad general que un cliente pida te, y por consiguiente, P(-T) a que no lo pida; y P(M) a la probabilidad general que un cliente quiera medialunas y P (-M) a que no lo haga. La probabilidad que un cliente pida medialunas, dado que ha pedido te, se denota de la siguiente manera, que se denomina probabilidad condicional. 

¿Cómo calculamos la cantidad de clientes que han pedido te y medialunas?. Se puede hacer de una manera relativamente fácil. Multiplicamos la chance que tienen las personas de pedir medialunas luego de haber pedido te, por la probabilidad que una persona tiene de pedir te. 






¿Cuál es la probabilidad de que una persona que entra a una cafetería pida una taza de te?. Digamos que el 70% pidió una taza de te y que la mitad de los que pidieron te también pidieron medialunas


Ahora, ¿que fracción de los clientes pidieron te y medialunas a la vez?. Es una operación simple. La mitad del 70% es 35%. 



Si sabemos que un cliente pidió una taza de te P(T), entonces, la probabilidad  P(M|T) denota la probabilidad que tiene un cliente de pedir medialunas, dado que ya sabemos que eligió una taza de te. Esta probabilidad se denomina probabilidad directa. Pero la pregunta que tiene interés aquí es: si veo una persona comiendo medialuna, ¿cuál es la posibilildad que haya tomado te?. Esto es lo contra intuitivo y es la pregunta que más nos interesa. 


La probabilidad que un cliente pida te es P(T) 
la probabilidad que un cliente pida medialunas es P(M)
P(M|T) es la probabilidad que tiene un cliente pida medialunas, dado que ya sabemos que eligió una taza de te.

Ahora, la pregunta de investigación puede ser, 
P(T|M) denota la probabilidad de que un cliente haya pedido te, dado que se sabe que está comiendo medialunas.


P(T y M) = P(T|M) . P(M) 

P(M y T) = P(M|T) . P(T)


Como ya demostramos más arriba que dan el mismo resultado, se los puede unir.
                               
                                P(T|M) . P(M)  =  P(M|T) . P(T)

Esta es la "regla de Bayes", aunque es simple, ofrece una solución al problema de la probabilidad inversa.

Con estos datos, un problema simple de Bayes sería: En una cafetería el 2/3 de los clientes piden té, P(T); la mitad de ellos piden medialunas, P(M|T), y también sabiendo la probabilidad de ordenar medialunas, podemos calcular la probabilidad que tiene un individuo de pedir te, dado que pidió medialunas.

Esta es el rol más importante  de la regla de Bayes;

Podemos estimar la probabilidad directamente en una dirección, en el cual nuestro  juicio es más confiable, y utilizarlo para derivar la probabilidad condicional en la otra dirección, donde nuestro juicio es menos confiable..

Una aplicación muy importante de la regla de Bayes es la actualización en una creencia o hipótesis particular.  Una buena parte de nuestra confianza se basa en la frecuencia de eventos pasados. Si un cliente entra a la confitería, basados en información previa, que probablemente querrá té o café, o que si pide te, probablemente querrá medialunas. La regla de Bayes le dá valores numéricos a ese proceso de razonamiento.




jueves, 23 de agosto de 2018

Qué es el Teorema de Bayes I: El Ministro Bayes y la aplicación en la vida real.



En la historia de la ciencia hay muchas personas que son muy reconocidas o recordadas y que hicieron grandes hallazgos. Pero también hay otros grandes que realizaron grandes aportes pero por alguna razón, no son tan recordados.

Un caso muy particular es el sacerdote Bayes, un ministro presbiteriano y fanático de la matemática de origen inglés. Desarrolló los principios de lo que sería reconocido como el Teorema de Bayes. Para ver la importancia de su descubrimiento basta con ver las aplicaciones que se derivan de ella: re-codificación de señales de celulares, búsqueda inteligente de Spam, discernimiento de los diagnósticos médicos, descubrimiento de víctimas de accidentes a través de análisis de ADN, mejora en la señal de los celulares, etc.

Pero, ¿qué es el teorema de Bayes?.

Para entender a fondo cuál es la esencia del teorema, no basta únicamente con ver las fórmulas que se enseñan en los cursos, sino en entender cuales son sus implicancias.

Un poco de historia.

Bayes fue un hijo de sacerdotes y nació en Hertfordshire, Inglaterra en el año 1701. Venía de una prominente familia  "no conformista", es decir, protestantes que no estaban conformes con la Iglesia de Inglaterra. En 1719, estudió en la Universidad de Edinburgh donde tomó lógica y teología, en Escocia, y donde habría aprendido mucho de matemática, pero no ingresó en universidades más prestigiosas ubicadas en Inglaterra como Cambridge u Oxford por su disidencia con la Iglesia de Inglaterra. 
En 1724 volvió a la capilla de su padre y luego se mudó a Tunbridge Wells, en 1734, donde ejerció como ministro hasta su muerte en 1761.
Resultado de imagen para THOMAS BAYES



En su vida publicó dos libros: uno sobre teología, y otro sobre lógica de cálculo matemático. Este último le valió su ingreso como miembro de la Real Sociedad en 1742, el círculo de mayor importancia científica en el Reino Unido.

Se interesó en probabilidad y chances más tardíamente, aunque no se sabe bien que fue lo que lo inspiró a volcarse a esta área. Su trabajo más prominente, del cual derivaría el teorema de Bayes, no fue publicado en vida, sino que fue encontrado por su amigo, el reverendo Richard Price, después de la muerte. Doscientos cincuenta años después sus principios revolucionarían la ciencia de varias maneras.



¿Qué aplicaciones tiene el teorema de Bayes?

La idea básica del teorema de Bayes es que podemos podemos cometer menos errores con más datos. Utilizamos algo que se denomina "probabilidad inversa", que es la idea previa que tenemos de un suceso. Esto es lo realmente novedoso. Por ejemplo, podemos pensar que la posibilidad que nos asciendan es de un 50%, pero a medida que va pasando el tiempo, tomamos en consideración lo que nos dice nuestro jefe, y afinamos nuestra predicción a una probabilidad más acertada, lo que se denomina actualizar la probabilidad, después podemos ir agregando más información, como el desempeño, y vamos afinando nuestra predicción,  permitiéndonos estimar valores más precisos. 

El hecho de usar un valor anterior, ya sea por información previa, o por intuición, es la receta del éxito del teorema, pero también fue el motivo de mucha discusión en el siglo pasado. Dos conceptos básicos son la probabilidad previa, y la posterior, que antiguamente era denominada probabilidad inversa.

Otro ejemplo: Supongamos que nos encontramos hospedados en un hotel y queremos calcular cuál es la probabilidad de que la próxima persona que entre al hotel sea un individuo de estatura mayor que 1,75 metros. Sabemos que la media poblacional del país es 1,75, entonces podemos asumir que la chance del próximo huésped será de 1/2. 
Ahora, nos enteramos que se hará un encuentro de basquetbolistas en el hotel, y la mayoría de los huéspedes serán jugadores. Con esta nueva información la probabilidad ya no puede ser de 1/2, sino que probablemente sea mucho mayor. Esta práctica de actualizar las probabilidades con nueva información es la inferencia bayesiana.


Las aplicaciones más precisas son:

-Redes Funcionales de genes.
Se trata de modelos matemáticos que predicen como se interrelacionan los miles de componentes dentro de las células, las interacciones posibles pueden llegar a ser un número increíblemente alto. A partir de los modelos se pueden hacer predicciones.

-Medicina
La inferencia bayesiana es muy importante en los diagnósticos y predicción de enfermedades. Es un área importante porque permite calcular si es conveniente o no realizar estudios a toda la población o solo a un grupo de gente.

-Biomonitoreo.
Para la medición de indicadores químicos en el cuerpo. Estos sirven para alertarnos sobre enfermedades. El biomonitoreo se refiere al seguimiento de múltiples marcadores a través del tiempo.

-Clasificación de documentos

-Búsqueda de información en base de datos. De manera similar a Google, encontrar la información que uno desea en una base de datos es todo un arte que debe ser mejorado periódicamente.

-Búsqueda semántica. Se refiere a entender el contexto de una oración al realizar una búsqueda, es un proceso que necesita mejorarse continuamente

-Procesamiento de imágenes. En el proceso de codificación y descodificación de las imágenes

-Código Turbo. Utilizado por la telefonía móvil, los términos 3G y 4G son en realidad redes bayesianas.


Si conoces alguna aplicación adicional agrega en los comentarios

¿Es la edad del calendario igua a nuestra edad biológica?

Se dice que el tiempo que se desperdicia no se recupera más y que el reloj es un enemigo imbatible. Durante décadas, el avance de la ciencia...