Machine learning

Referencia principal

El aprendizaje automático tiene cuatro fases:

  1. Recogida de datos
  2. Preprocesamiento de los datos (limpieza, factorización)
  3. Generación de un modelo
  4. Evaluación del modelo

Es un proceso iterativo, en el cuál se repiten los pasos previos a medida que se va teniendo más información sobre los datos originales y el rendimiento del modelo.

En el machine learning supervisado (SML), los inputs están categorizados e indican los resultados que se quieren obtener.

El machine learning no supervisado (UML) tiene un input numérico; sirve para explorar la existencia de patrones y estructuras dentro de los datos. No hay objetivos fijados previos al análisis.

flowchart LR
  I{input} --- |categórico| SML("<b>SML</b><br>Supervisado")
  I --- |numérico| UML("<b>UML</b><br>No supervisado")
  UML --- |categórico| KM("<em>Clustering</em>") --- k-clusters
  KM --- jerárquico
  UML --- |numérico| RD("Reducción<br>dimensional") --- PCA
  RD --- t-SNE  
  SML --- |categórico| CL("Clasificación") --- KNN
  CL --- SVM
  SML --- |numérico| RE("Regresión") --- lm[Regresión lineal]
  RE --- rl[Regresión logística]