Bayes quería demostrar que se podía calcular la probabilidad de un evento (la causa) a través de un efecto. Nuestro cerebro está entrenado para calcular la probabilidad de un efecto, por ejemplo, si no me abrigo, se que voy a tener chance de tomar un resfrío. Pero nuestro cerebro no está entrenado para calcular la "probabilidad inversa". Es decir, si tengo un resfrío, ¿cuál es la chance de no haber usado la campera?
Si un niño lanza una piedra a la ventana, es probable que el vidrio se rompa, pero si veo la ventana rota, ¿qué tan probable es que haya sido por el lanzamiento de una piedra?
Pero esta probabilidad, Bayes la llamaba "probabilidad de un suceso anterior", es fundamentalmente importante. Luego se denominó "probabilidad inversa" y en día es más conocida como "probabilidad posterior o a posteriori". Tal probabilidad es simple, pero fue difícil descubrirla porque es contraria a nuestra intuición. Lo que hizo Bayes fue darle una demostración formal.
Si un niño lanza una piedra a la ventana, es probable que el vidrio se rompa, pero si veo la ventana rota, ¿qué tan probable es que haya sido por el lanzamiento de una piedra?
Pero esta probabilidad, Bayes la llamaba "probabilidad de un suceso anterior", es fundamentalmente importante. Luego se denominó "probabilidad inversa" y en día es más conocida como "probabilidad posterior o a posteriori". Tal probabilidad es simple, pero fue difícil descubrirla porque es contraria a nuestra intuición. Lo que hizo Bayes fue darle una demostración formal.
¿Porqué la probabilidad inversa o a posteriori es contra intuitiva y porqué es importante conocerla?, porque nuestro cerebro razona desde la causa al efecto, no del efecto a la causa.
En los ejemplos anteriores la falta de abrigo causó el resfrío, y no al revés; en el ejemplo de la piedra y la ventana, es el lanzamiento de la piedra lo que causó la rotura. Es el sentido de las cosas lo que nos desorienta y es porqué estos conceptos básicos tardaron mucho tiempo en conocerse.
En los ejemplos anteriores la falta de abrigo causó el resfrío, y no al revés; en el ejemplo de la piedra y la ventana, es el lanzamiento de la piedra lo que causó la rotura. Es el sentido de las cosas lo que nos desorienta y es porqué estos conceptos básicos tardaron mucho tiempo en conocerse.
Veamos un ejemplo:
Digamos que una panadería está por abrir sus puertas y desean hacer un estudio de mercado. Su producto principal son las medialunas, y quieren averiguar que porporción de los clientes que compran sus medialunas, también toman te.
Entonces consultan a una gran confitería, que vende te y café con medialunas. El personal de la confitería consulta a sus registros, y también a sus recuerdos, y les dicen, que el 40% de los clientes piden te, y que el 70% de las personas que piden te, también piden medialunas.
(Diapo árbol)
Para hacer esto una regla general, llamemos a P(T) a la probabilidad general que un cliente pida te, y por consiguiente, P(-T) a que no lo pida; y P(M) a la probabilidad general que un cliente quiera medialunas y P (-M) a que no lo haga. La probabilidad que un cliente pida medialunas, dado que ha pedido te, se denota de la siguiente manera, que se denomina probabilidad condicional.
¿Cómo calculamos la cantidad de clientes que han pedido te y medialunas?. Se puede hacer de una manera relativamente fácil. Multiplicamos la chance que tienen las personas de pedir medialunas luego de haber pedido te, por la probabilidad que una persona tiene de pedir te.
¿Cuál es la probabilidad de que una persona que entra a una cafetería pida una taza de te?. Digamos que el 70% pidió una taza de te y que la mitad de los que pidieron te también pidieron medialunas
Entonces consultan a una gran confitería, que vende te y café con medialunas. El personal de la confitería consulta a sus registros, y también a sus recuerdos, y les dicen, que el 40% de los clientes piden te, y que el 70% de las personas que piden te, también piden medialunas.
(Diapo árbol)
Para hacer esto una regla general, llamemos a P(T) a la probabilidad general que un cliente pida te, y por consiguiente, P(-T) a que no lo pida; y P(M) a la probabilidad general que un cliente quiera medialunas y P (-M) a que no lo haga. La probabilidad que un cliente pida medialunas, dado que ha pedido te, se denota de la siguiente manera, que se denomina probabilidad condicional.
¿Cómo calculamos la cantidad de clientes que han pedido te y medialunas?. Se puede hacer de una manera relativamente fácil. Multiplicamos la chance que tienen las personas de pedir medialunas luego de haber pedido te, por la probabilidad que una persona tiene de pedir te.
¿Cuál es la probabilidad de que una persona que entra a una cafetería pida una taza de te?. Digamos que el 70% pidió una taza de te y que la mitad de los que pidieron te también pidieron medialunas
Ahora, ¿que fracción de los clientes pidieron te y medialunas a la vez?. Es una operación simple. La mitad del 70% es 35%.
Si sabemos que un cliente pidió una taza de te P(T), entonces, la probabilidad P(M|T) denota la probabilidad que tiene un cliente de pedir medialunas, dado que ya sabemos que eligió una taza de te. Esta probabilidad se denomina probabilidad directa. Pero la pregunta que tiene interés aquí es: si veo una persona comiendo medialuna, ¿cuál es la posibilildad que haya tomado te?. Esto es lo contra intuitivo y es la pregunta que más nos interesa.
La probabilidad que un cliente pida te es P(T)
la probabilidad que un cliente pida medialunas es P(M)
la probabilidad que un cliente pida medialunas es P(M)
P(M|T) es la probabilidad que tiene un cliente pida medialunas, dado que ya sabemos que eligió una taza de te.
Ahora, la pregunta de investigación puede ser,
P(T|M) denota la probabilidad de que un cliente haya pedido te, dado que se sabe que está comiendo medialunas.
Ahora, la pregunta de investigación puede ser,
P(T|M) denota la probabilidad de que un cliente haya pedido te, dado que se sabe que está comiendo medialunas.
P(T y M) = P(T|M) . P(M)
P(M y T) = P(M|T) . P(T)
Como ya demostramos más arriba que dan el mismo resultado, se los puede unir.
P(T|M) . P(M) = P(M|T) . P(T)
P(T|M) . P(M) = P(M|T) . P(T)
Esta es la "regla de Bayes", aunque es simple, ofrece una solución al problema de la probabilidad inversa.
Con estos datos, un problema simple de Bayes sería: En una cafetería el 2/3 de los clientes piden té, P(T); la mitad de ellos piden medialunas, P(M|T), y también sabiendo la probabilidad de ordenar medialunas, podemos calcular la probabilidad que tiene un individuo de pedir te, dado que pidió medialunas.
Esta es el rol más importante de la regla de Bayes;
Podemos estimar la probabilidad directamente en una dirección, en el cual nuestro juicio es más confiable, y utilizarlo para derivar la probabilidad condicional en la otra dirección, donde nuestro juicio es menos confiable..
Una aplicación muy importante de la regla de Bayes es la actualización en una creencia o hipótesis particular. Una buena parte de nuestra confianza se basa en la frecuencia de eventos pasados. Si un cliente entra a la confitería, basados en información previa, que probablemente querrá té o café, o que si pide te, probablemente querrá medialunas. La regla de Bayes le dá valores numéricos a ese proceso de razonamiento.