Machine Learning

De Departamento de Informatica
Saltar a: navegación, buscar

Machine Learning (en español, aprendizaje de máquina o aprendizaje automático) es una subrama de la Inteligencia Artificial (IA), y como su nombre lo indica, esta tecnología trata de darle a la máquina la capacidad de aprender. El aprendizaje automático se basa algoritmos que aprenden y realizan predicciones. Tales algoritmos operan mediante la construcción de un modelo basados en conjuntos de datos de entrenamiento.

Contenido

Contexto organizacional

El aprendizaje de máquina nace en la búsqueda de lograr la ya conocida Inteligencia Artificial. En sus inicios, diversos investigadores intentaron resolver la problemática a través del aprendizaje de máquina con variados métodos simbólicos, a lo que actualmente se le conoce con el nombre de 'redes neuronales'.

Hoy en día, muchas organizaciones utilizan el aprendizaje de máquina para mejorar las decisiones de negocio, aumentar la productividad, detectar enfermedades e inclusive para el pronóstico del tiempo. La tecnología Machine Learning puede ser utilizada en cualquier organización que requiera de un aprendizaje automático, es decir, empresas que no solo necesiten herramientas para entender los datos que se tienen actualmente, sino que también requieran una herramienta preparada para los datos que se tendrán.

Actualmente el aprendizaje de máquina ha jugado un rol fundamental en áreas tales como la bioinformática, la inteligencia de negocios, la recuperación de información en la web y el desarrollo de vehículos autónomos.

¿Cuando se puede usar Machine Learning?

  • Cuando el objetivo es la predicción automatizada.
  • Cuando existen datos históricos disponibles.
  • Cuando existen "números mágicos" en sistemas actuales, es decir, el valor que se quiere predecir ya debe estar registrado anteriormente.

¿Cuando no se puede usar Machine Learning?

  • Cuando la predicción es una pequeña parte de la experiencia.
  • Cuando no hay datos históricos disponibles.
  • Cuando existen muchas reglas de negocios gobiernan la experiencia.
  • Cuando las predicciones no tienen un patrón predecible.

Interacción de componentes del Machine Learning

Personas

El papel que desempeñan las personas en el aprendizaje de máquina depende del tipo de sistema a implementar, que básicamente se pueden clasificar en aprendizaje supervisado y el aprendizaje no supervisado.

El aprendizaje supervisado se caracteriza por tener la información que especifica qué los conjuntos de datos son satisfactorios para el propósito de aprendizaje; Un ejemplo podría ser un software que reconoce si una imagen dada es o no la imagen de un rostro: para el aprendizaje del programa habría que proporcionar diferentes imágenes, especificando en el proceso si es o no un rostro.

En el aprendizaje sin supervisión, el programa no tiene datos para definir qué información es satisfactoria o no. El objetivo principal de estos programas a menudo encontrar patrones para separar y clasificar los datos en diferentes grupos de acuerdo a sus atributos. El software de aprendizaje no supervisado no sería capaz de decirnos si una imagen dada es una cara o no, pero podría, por ejemplo, clasificar las imágenes entre los que contienen rostros humanos, los animales o los que no las contienen. La información obtenida por un algoritmo de aprendizaje no supervisado debe entonces ser interpretado por una persona para dar utilidad.

Resumiendo, un sistema de aprendizaje no supervisado se basa en un aprendizaje automático que trata de eliminar cualquier necesidad de la intuición o el conocimiento de los procesos de análisis de datos humanos, mientras que el aprendizaje bajo supervisión trata de establecer un marco de colaboración entre el experto y el ordenador. Sin embargo, la intuición humana no puede ser reemplazada en su totalidad, ya que el diseñador del sistema debe especificar la forma de representación de los métodos de manipulación de datos y caracterización de ellos.

Procesos

Cuando se implementa el aprendizaje de máquina, se busca mejorar, acelerar y automatizar los procesos. Estos procesos son muy variados pero siempre están relacionados con la proporción de ayuda a la gestión.

Datos

Un factor primordial para implementar el Machine learning, es la existencia de una fuente de datos o información, a través del cual el software implementado identifica patrones complejos en millones de estos datos. De esta manera la máquina "aprende", es decir, el algoritmo que revisa los datos, es capaz identificar y predecir comportamientos del sistema.

Aplicaciones del Machine Learning

  • Motor de búsqueda
  • Minería de datos
  • Big Data
  • Detección de fraudes con el uso de tarjetas de crédito
  • Análisis del mercado de valores
  • Diagnóstico médico
  • Clasificación de secuencias de ADN
  • Reconocimiento del habla
  • Robótica

Ventajas desventajas o riesgos

Ventajas

  • Mejora la gestión organizacional.
  • Facilita la toma de decisiones.
  • Acelera los procesos.
  • Automatiza procesos.

Desventajas o riesgos

Existe posibilidad de riesgos si la implementación del Machine Learning involucra que la máquina tome decisiones importantes de manera automática y no supervisada, por ende éste es un problema más bien humano. También puede ocurrir que si la máquina realiza predicciones erróneas por mala implementación del ingeniero, será difícil de detectar y decisiones importantes pueden basarse en estos malos pronósticos.

Funcionamiento

El gradiente descendente (o gradiente de descenso rápido) y la regresión lineal son métodos de "predicción", éstos dos métodos son los más conocidos para determinar el comportamiento de los datos, estos pueden actuar por separado, sin embargo tienen mayor eficacia cuando ambos se implementan.

En general los algoritmos de Machine Learning, consta de 3 piezas fundamentales, estas son que siempre tienen datos de entrada X, de salida Y, y el método (función entre los datos) utilizado para analizar los datos. Puesto que Machine Learning funciona a partir de los datos X e Y, entonces se requiere obtener la mejor función entre los datos, el cual se obtiene a través de un algoritmo de aprendizaje, y su principal herramienta para este objetivo es el uso de la regresión lineal cuando los datos de salida son "números reales", como 1.2, 3.1415, 2.768, etc. Sin embargo, la técnica no es sólo es utilizada en los estudios de máquinas de aprendizaje, sino que también en las principales materias que se imparten en estadística, econometría o de las ciencias sociales y políticas. La idea básicamente es ajustar los datos experimentales a una curva, no solo se limita a una recta y en el peor de los casos puede ser una curva más elaborado, por ejemplo, polinomios.

Algunos Ejemplos

En la creciente demanda de máquinas que posean aprendizaje automático, por las facilidades, ventajas e información que esta proporciona (entre muchas otras), es que actualmente se tienen miles de sistemas que la implementan, entre las cuales se encuentra la aplicación de fotos de Google, que aplica las etiquetas automáticas a las imágenes en álbumes de fotos digitales, o departamentos de policía en todo Estados Unidos que implementan herramientas de evaluación de riesgos, el cual es un software que analiza grandes conjuntos de datos de crímenes históricos que se utilizan para pronosticar dónde están los puntos donde la criminalidad es más probable que surja; entonces la policía es dirigida a esas áreas. A continuación se muestra en dos ejemplos el cómo actúa Machine learning.

  • Minería de datos (data mining): Machine Learning básicamente participa en el proceso llamado también "minería de datos" fase en la cual se encarga básicamente del modelamiento propiamente tal, en donde se aplican los métodos inteligentes con el objetivo de extraer patrones previamente desconocidos, válidos, nuevos, potencialmente útiles y comprensibles, permitiendo analizar enormes bases de datos, tanto a lo ancho como a lo largo.
  • Motor de búsqueda: Primero se debe mencionar que esta tecnología es un software diseñado para buscar información en la Web. Las búsquedas se hacen con palabras clave o con árboles jerárquicos por temas; el resultado de la búsqueda es un listado de direcciones web en los que se mencionan temas relacionados con las palabras clave buscadas. En palabras simple, es un sistema informático que busca archivos almacenados en servidores web, pero no sólo buscan páginas web, hay otros que buscan en noticias, servicios como Gopher, FTP, etc. Las búsquedas se hacen con palabras clave o con árboles jerárquicos por temas; el resultado de la búsqueda «Página de resultados del buscador» es un listado de direcciones web en los que se mencionan temas relacionados con las palabras clave buscadas. Los motores de búsqueda más usados son Google, Bing, y Yahoo entre otros.

Referencias

Bibliografía

  • Alpaydin, E. 2004 Introduction to Machine Learning (Adaptive Computation and Machine Learning). The MIT Press.
  • Shawe-Taylor, J. and Cristianini, N. 2004 Kernel Methods for Pattern Analysis. Cambridge University Press.
  • 6.867 Machine Learning, Fall 2002, MIT OpenCourseWare.
  • Mitchell, T. M. 1997 Machine Learning. 1st. McGraw-Hill Higher Education.
  • NATARAJAN, B. K. Machine Learning, a theoretical approach, Morgan Kaufmann Publishers Inc., 1991


Autor

  • Giovanni Eduardo Aravena Morales - San Joaquín
Herramientas personales
Espacios de nombres
Variantes
Acciones
Navegación
Herramientas