flowchart LR I{input} --- |categórico| SML("<b>SML</b><br>Supervisado") I --- |numérico| UML("<b>UML</b><br>No supervisado") UML --- |categórico| KM("<em>Clustering</em>") --- k-clusters KM --- jerárquico UML --- |numérico| RD("Reducción<br>dimensional") --- PCA RD --- t-SNE SML --- |categórico| CL("Clasificación") --- KNN CL --- SVM SML --- |numérico| RE("Regresión") --- lm[Regresión lineal] RE --- rl[Regresión logística]
Machine learning
Referencia principal
An Introduction to Machine Learning with R, Laurent Gatto (2020)
El aprendizaje automático tiene cuatro fases:
- Recogida de datos
- Preprocesamiento de los datos (limpieza, factorización)
- Generación de un modelo
- Evaluación del modelo
Es un proceso iterativo, en el cuál se repiten los pasos previos a medida que se va teniendo más información sobre los datos originales y el rendimiento del modelo.
En el machine learning supervisado (SML), los inputs están categorizados e indican los resultados que se quieren obtener.
El machine learning no supervisado (UML) tiene un input numérico; sirve para explorar la existencia de patrones y estructuras dentro de los datos. No hay objetivos fijados previos al análisis.