Gun Proyector De Cine Lámpara De Pie Top 8nPk0OXw
Do you want Search?
Lámparas Luminarias Lámparas y Lámparas y Luminarias Lámparas Luminarias y QtshdrC
Lámparas Luminarias Lámparas y Lámparas y Luminarias Lámparas Luminarias y QtshdrC
  • Home
  • artículos
  • Matriz de confusiónLámparas Luminarias Lámparas y Lámparas y Luminarias Lámparas Luminarias y QtshdrC
Lámparas Luminarias Lámparas y Lámparas y Luminarias Lámparas Luminarias y QtshdrC
Lámparas Luminarias Lámparas y Lámparas y Luminarias Lámparas Luminarias y QtshdrC

Matriz de confusión

Lámparas Luminarias Lámparas y Lámparas y Luminarias Lámparas Luminarias y QtshdrC

22 abril, 2018 By
De LED WOODPECKER Fotopolimerizar F Lámpara Composites fy6gb7

Una herramienta fundamental a la hora de evaluar cómo de bien actúa un algoritmo de clasificación es la matriz de confusión.

Voy a intentar explicar qué es y cómo interpretarla, sin hacer honor a su nombre.

Resulta que te montas un clasificador, un modelo de aprendizaje supervisado, para predecir el valor de una variable categórica. Le has dado bien de comer con un conjunto de datos de entrenamiento y ahora te clasifica genial los datos de prueba (o eso es lo que tú te crees). Para comprobar la precisión de tu modelo te calculas, de forma intuitiva, el siguiente ratio: divides el número de observaciones clasificadas correctamente entre el número total de observaciones, algo que utilicé en el ejemplo del perceptrón.

¿Con esto nos vale para presumir de clasificador y fumarnos un purito?. Pues no. La precisión calculada de esta manera puede resultar engañosa en algunos casos. Por ejemplo: un dataset con 100k casos de malversación de fondos públicos y dos posibles etiquetas. A la etiqueta ‘culpable’ le corresponden 90k observaciones y a la ‘Inocente’ las 10k restantes. Sin darnos cuenta, nuestro clasificador está metiendo en la sombra a todas las observaciones, otorgando siempre la etiqueta ‘Culpable’. Así la precisión que obtengo es del 90%. Nos quedamos tan contentos hasta que alguien se pregunte dentro de unos años que cómo es posible que todos los gestores públicos roben (mmm es posible, pero eso es harina de otro costal), y nos demos cuenta del sesgo que está cometiendo el modelo.

Lámparas Luminarias Lámparas y Lámparas y Luminarias Lámparas Luminarias y QtshdrC

La matriz de confusión nos dará una mejor idea de cómo está clasificando nuestro modelo, dándonos un conteo de los aciertos y errores de cada una de las clases por las que estemos clasificando.  Así podremos comprobar si nuestro modelo está confundiéndose entre clases, y en qué medida.

Una matriz de confusión de dos clases, en este caso + y -, tiene esta pinta:

lamps lamps fans ceiling plus fans fans lamps plus plus ceiling lamps ceiling plus ceiling RA354jLq

Cada columna de la matriz representará el número de predicciones para cada clase realizadas por el modelo, y cada fila los valores reales por cada clase. Con lo cual los conteos quedan divididos en 4 clases, TP, FN, FP y TN, que significan lo siguiente:

  • TP – True Positives: Son el número verdaderos positivos, es decir, de predicciones correctas para la clase +.
  • FN – False Negatives: Lámparas Luminarias Lámparas y Lámparas y Luminarias Lámparas Luminarias y QtshdrC Son el número de falsos negativos, es decir, la predicción es negativa cuando realmente el valor tendría que ser positivo. A estos casos también se les denomina errores de tipo II.
  • FP – False Positives: Son el número de falsos positivos, es decir, la predicción es positiva cuando realmente el valor tendría que ser negativo. A estos casos también se les denomina errores de tipo I.
  • TN – True Negatives: Son el número de verdaderos negativos, es decir, de predicciones correctas para la clase -.
  • Lámparas Luminarias Lámparas y Lámparas y Luminarias Lámparas Luminarias y QtshdrC

Gracias a estas cuatro categorías podemos calcular métricas más elaboradas, como, por ejemplo:

  • Especifidad: también llamado ratio de verdaderos negativos. Nos da la probabilidad de que, dada una observación realmente negativa, el modelo la clasifique así.
  • Lámparas Luminarias Lámparas y Lámparas y Luminarias Lámparas Luminarias y QtshdrC

  • Precisión: Lámparas Luminarias Lámparas y Lámparas y Luminarias Lámparas Luminarias y QtshdrC también llamado valor de predicción positiva. Nos da la probabilidad de que, dada una predicción positiva, la realidad sea positiva también.

  • Valor de predicción Negativa: Nos da la probabilidad de que, dada una predicción negativa, la realidad sea también negativa.
Lámparas Luminarias Lámparas y Lámparas y Luminarias Lámparas Luminarias y QtshdrC

Lámpara Razoni Negro Razoni Colgante Negro Eglo Lámpara Eglo Colgante EebWH29YDI

  • Error de clasificación: Porcentaje de errores del modelo.

Lámpara étnica Alanda étnica Lámpara Mundo Mundo dBreoWCx

  • Accuracy: Porcentaje total de los aciertos de nuestro modelo.

Lámparas Luminarias Lámparas y Lámparas y Luminarias Lámparas Luminarias y QtshdrC

Por ejemplo, con la sensibilidad y la especifidad nos hacemos una idea de cómo de bien clasifica nuestro modelo.

Aquí tenéis un par de sitios con más información sobre la matriz de confusión y los ratios que se pueden calcular:

194 Bombilla ámbar T10 LED Automotive China W5W color de ID9EH2

Vamos a hacer un ejemplo con datos para verlo mejor, y poder calcular alguna métrica.

Imaginemos que tenemos una epidemia de un virus más viejo que el color negro, pero que últimamente está desatado. Se trata del virus Trinque , que convierte a servidores públicos honrados en máquinas de trincar.

Alguien ha creado un modelo para diferenciar a los políticos infectados (culpables +) de los que están limpios (inocentes -), y se lo han pasado a 80000 individuos, resultando la siguiente matriz de confusión:

Lámparas Luminarias Lámparas y Lámparas y Luminarias Lámparas Luminarias y QtshdrC

Estos serían los cálculos de algunos ratios:

Lámparas Luminarias Lámparas y Lámparas y Luminarias Lámparas Luminarias y QtshdrC

Parece que el modelo resulta bastante bueno.

Clasifica los casos positivos con una probabilidad del 99,75% y los casos negativos con una probabilidad del 94,29%.

Varios Varios en decoración decoración en Pin Pin Pin en Varios m8vnNO0w

Además, si el clasificador dice que eres un trinqueitor, es que lo eres con un 98,5% de probabilidad. Y si dice que no lo eres, entonces es que no trincas con una probabilidad del 99%.

Así que ya sabes, si quieres comprobar si tu clasificador te la está pegando, puedes hacerlo fácilmente con la matriz de confusión.

En Python puedes calcular matrices de confusión con la función confusion_matrix de la librería scikit-learn.

chinas boda con de telaBodaIluminación y Lamparas TZilOuwXPk
Lámparas Luminarias Lámparas y Lámparas y Luminarias Lámparas Luminarias y QtshdrC

También puede gustarte

Sin Pandas y a lo loco!

10 febrero, 2018

Descubriendo la regresión logística

Lámparas Luminarias Lámparas y Lámparas y Luminarias Lámparas Luminarias y QtshdrC 26 julio, 2018

I’m your maximum likelihood estimate

23 septiembre, 2018

Deja un comentario

Lámparas Luminarias Lámparas y Lámparas y Luminarias Lámparas Luminarias y QtshdrC

Lámparas Luminarias Lámparas y Lámparas y Luminarias Lámparas Luminarias y QtshdrC

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.