MACHINE LEARNING - APRENDIZAJE NO SUPERVISADO - Just Learn

DESTACADO

viernes, 25 de septiembre de 2020

MACHINE LEARNING - APRENDIZAJE NO SUPERVISADO

 El aprendizaje no supervisado es aquél que no requiere de ningún etiquetado previo de las instancias. Se basa en los datos tal y como los recibe y su objetivo es determinar relaciones de similitud, diferencia o asociación.

Aprendizaje no supervisado (Unsupervised Learning)

 Los modelos que se catalogan bajo este epígrafe son:

  •  Clusters Estos modelos buscan aquellas instancias que son similares entre sí y distintas de las demás para formar agrupaciones de los datos llamadas clusters. Dichos modelos nos permitirán predecir a qué cluster corresponde un nuevo elemento. Veremos algún ejemplo de clustering aplicado al sector inmobiliario, para segmentar la oferta de pisos y ver qué productos son similares, y al comercio, creando agrupaciones de tipos de cervezas según los gustos de nuestros clientes. 
  • Detectores de anomalías Estos modelos buscan aquellas instancias que son distintas de la tónica general del resto de datos. El ejemplo que veremos de este tipo de modelos es su aplicación al fraude en el sector de los préstamos bancarios, pero también podrían usarse para limpiar aquellas instancias de un dataset que contienen datos erróneos o muy sesgados (outliers). 
  • Buscadores de asociaciones Estos modelos buscan las relaciones existentes entre diversos valores de los campos proporcionados. Las relaciones, o reglas de asociación (association rules) son de la forma: cuando este campo tiene este valor entonces, en general, aquel campo tiene aquel valor. El ejemplo típico de este tipo de modelos es el análisis de la cesta de la compra, donde se descubren los productos que se adquieren a la vez más a menudo de lo que sería de esperar si se compraran al azar. 

En general, un problema de Machine Learning necesitará aplicar combinaciones de varios tipos de modelos y refinar el proceso hasta llegar a los resultados deseados. Quizás debamos aplicar un detector de anomalías a nuestros datos para limpiar el dataset de aquellas instancias que contengan datos erróneos antes de usarlo para construir un modelo de clasificación. También podemos querer aplicar primero un clustering sobre los datos y crear modelos distintos para cada cluster para que estén más adaptados a los grupos existentes en nuestro datos. Así pues, el proceso hasta llegar a la solución del problema conllevará en general el uso de más de un tipo de modelo. 






Post Bottom Ad

Responsive Ads Here

Pages