Un calasificador nos permite encontrar la pertenenciencia de un vector de datos a una clase, ya se que esta clase esté definida por un humano. En este caso veremos un clasificador donde un humano establece las clases a priori y está basado en tablas de frencuencias. 

El clasificador bayesiano ingénuo está basado en el teorema de bayes con el supuesto de que existe independencia entre los predictores. 

Ahora bien, queremos calcular a que clase c pertenece un conjunto de datos x.  Como sabemos con el algoritmo de bayes podemos obtener esta probabilidad posterior de la siguiente manera:

 

\[ P(c|x)=\frac{P(x|c)P(c)}{Px} \]

  1. P(c|x) es la probabilidad posterior que deseamos caluclar. Esta nos indica que la probabilidad de que se tenga una clase c dados los datos en x.
  2. P(c) es la probabilidad posterior de la clase. Qué tan probable que se obtenga una clase c.
  3. P(x|c) es la esperanza, que es la probabilida de los datos dada una cierta clase.
  4. P(x) es la probabilidad a priori de los datos o predictor. 

Los datos 2,3 y 4 es posible obtenerlos de una tabla de frencuencias. También se asume que el efecto del predictor x dada una clase c es indepndiente de los valores del predictor. Esta condición es llamada la independencia condicional de clases. 

La tabla de probabilidad puede ser calculada construyendo una tabla de frenciencias para cada atributo con respecto a su objetivo. Con estas tablas de frecuencias se construyen tablas de probabilidad que se utilizarán para calcular la probabilidad de Bayes ingenuo . La clase con la probabilidad posterior más alta es a la cuál se le asigna el vector de datos .

 

Share This