MACHINE LEARNING - INTRODUCCIÓN - Just Learn

DESTACADO

martes, 21 de julio de 2020

MACHINE LEARNING - INTRODUCCIÓN

MODULO I : INTRODUCCIÓN AL MACHINE LEARNING

  • ¿QUÉ ES EL MACHINE LEARNING?
El aprendizaje automático o Machine Learning se engloba dentro de las disciplinas de la Inteligencia Artificial. Es un método científico que nos permite usar los ordenadores y otros dispositivos con capacidad computacional para que aprendan a extraer los patrones y relaciones que hay en nuestros datos por sí solos. Esos patrones se pueden usar luego para predecir comportamientos y en la toma de decisiones. Hasta la llegada del Machine Learning, la automatización del análisis en la toma de decisiones requería siempre de un experto humano capaz de descubrir algunas reglas más o menos ajustadas. El experto, basándose en los datos, intentaba descubrir cuáles eran los distintos patrones que nos permitían resolver el problema. Formulaba un conjunto de reglas más o menos exactas y dichas reglas eran específicamente programadas por ingenieros de software.

El conjunto resultaba en un modelo más o menos próximo a la realidad, que se usaba para estimar lo que iba a ocurrir en un nuevo caso o en el futuro y en eso se basaba la toma de decisiones. Este sistema de toma de decisiones presenta varios problemas:

    • Escasez de expertos: A menudo nos puede ser difícil encontrar expertos formados en el domínio de nuestro problema. 

    • Desarrollo automatizado: Una vez los expertos han detectado las reglas, éstas deben ser automatizadas e integradas en nuestros sistemas para poder aplicarlas a grandes volúmenes de datos automáticamente. Dicho trabajo involucra a ingenieros de software, que deben entender y programar dichas reglas. En ocasiones, la transmisión de información entre el experto y el ingeniero de software da lugar a errores y requiere un tiempo considerable de implementación. 

    • Renovación de los modelos: La producción de una solución de este tipo acostumbra a ser lenta y costosa, y los modelos son difíciles de adaptar cuando los datos evolucionan y sus reglas cambian. 

    • Escalabilidad: El volumen y la complejidad de los problemas que podemos solucionar con este método es limitado.

A medida que el volumen y la complejidad de los datos han ido creciendo, se ha hecho absolutamente necesario el uso del Machine Learning. Incluso en ficheros con pocos datos, cuando el número de propiedades que se manejan empieza a crecer nos es difícil detectar los posibles patrones que los relacionan. En la siguiente figura vemos uno de los ejemplos canónicos que se utilizan para describir cómo hacer aprendizaje automático. El fichero describe algunas propiedades de un tipo de flores, el iris, y el objetivo del problema es predecir la especie a la que pertenece cada ejemplar según sus características. Como se puede ver, a pesar de que el número de campos no es muy elevado, a simple vista es muy difícil detectar las reglas que determinan dicha clasificación.

Estructura de datos correspondiente a un ejemplo canónico de aprendizaje automatizado. Cada fila corresponde a un ejemplar de iris y sus las columnas contienen las medidas de sépalo y pétalo y la especie a la que pertenece el ejemplar. Existen reglas muy claras que nos permiten catalogar dichas flores en su especie a partir de sus medidas, pero para los humanos es difícil detectar dichas relaciones, aún cuando el número de propiedades involucradas no es muy alto, como en este caso.

Cuando la complejidad aumenta, los ordenadores superan en capacidad de análisis a los expertos humanos y evitan la necesidad de programar explícitamente soluciones a medida. De esta forma, hemos pasado de la toma de decisiones dirigida por expertos a la toma de decisiones dirigida por datos. Los ingredientes imprescindibles para cualquier solución de Machine Learning son dos: los datos y los modelos de Machine Learning.


Post Bottom Ad

Responsive Ads Here

Pages