Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
APRENDIZAJE AUTOMÁTICO (MACHINE LEARNING) Definición Escenarios en los que sería beneficioso que las máquinas aprendan: • Falta de experiencia humana en un dominio (Ejm: Simulación de navegación en territorios desconocidos). • Los escenarios y comportamientos sean cambiantes con el tiempo (Ejm: Disponibilidad de infraestructura en una organización) • Las personas pueden tener suficiente experiencia en el dominio, pero es muy difícil explicar o traducir formalmente esta experiencia en tareas computacionales (Reconocimiento de voz y escenas, Traducciones, etc.). • Abordar problemas específicos de un dominio a escala con enormes volúmenes de datos y con demasiadas condiciones y restricciones complejas. La idea central es hacer que las máquinas resuelvan tareas que se pueden definir fácilmente de forma intuitiva pero muy difíciles de definirlas manera formal. Definición Aprendizaje. Incrementar el Conocimiento adquirido, Realizar Tareas con mayor Eficiencia o Corrección, o llevar a cabo Nuevas Tareas. Adquisición de Conocimiento. Actividad de Informarse de algún Hecho o Situación, o de obtener Información que origina una Reestructuración de Conocimiento disponible. Capacidad de Memorizar. Basado en Conservar el conocimiento con el fin de poder utilizarlo en el futuro. Requiere que se Establezcan Mecanismos en la Memoria de los sistemas para Almacenar Nuevos Elementos en el contexto adecuado. Definición Debido al reciente gran desarrollo tecnológico y disminución de precios en Hw, ahora podemos crear, almacenar y enviar más datos que nunca en la historia. Estos datos alimentan los modelos de aprendizaje automático y es el principal impulsor del auge de esta ciencia en los últimos años. El aprendizaje automático es un subcampo de la IA y puede definirse: "El aprendizaje automático es la ciencia de hacer que las computadoras aprendan y actúen como lo hacen los humanos, y mejoren su aprendizaje con el tiempo de manera autónoma, al proporcionarles datos e información en forma de observaciones e interacciones del mundo real". - Dan Fagella El aprendizaje automático ofrece una forma eficiente de capturar conocimiento en datos para mejorar gradualmente el rendimiento de los modelos predictivos y tomar decisiones basadas en datos. Se ha convertido en una tecnología omnipresente y disfrutamos de sus beneficios en: predicción de ventas, determinación del riesgo crediticio, automóviles autónomos, reconocimiento de imagen y voz, etc. Definición formal de Aprendizaje Automático Se dice que un programa de computadora aprende de la experiencia E con respecto a algunas clases de tareas T y la medida de rendimiento P, si su desempeño en las tareas T, medido por P, mejora con la experiencia E. Los principales dominios o campos asociados con Machine Learning incluyen lo siguiente: • Inteligencia artificial • Procesamiento natural del lenguaje • Minería de datos • Matemáticas • Estadística • Ciencias de la Computación • Aprendizaje profundo • Ciencia de los datos Definición formal de Aprendizaje Automático Tipos de Aprendizaje Automático Los métodos de Machine Learning se pueden clasificar de varias formas bajo diferentes escenarios, basados en las características de los datos y sus categorías, como se ve en las figuras siguientes: ALGORITMOS DE APRENDIZAJE AUTOMÁTICO CLÁSICO Métodos basados en la cantidad de supervisión humana en el proceso de aprendizaje: a. Aprendizaje supervisado b. Aprendizaje no supervisado c. Aprendizaje por refuerzo Aprendizaje Supervisado Los métodos de Aprendizaje Supervisados incluyen algoritmos de aprendizaje que toman muestras de datos (Datos de Entrenamiento) y salidas asociadas (Categorías o Respuestas) con cada muestra de datos durante el proceso de entrenamiento de dicho modelo Objetivo: Aprender (mapear) asociaciones entre las muestras de datos de entrada y sus salidas correspondientes, basadas en múltiples instancias de datos de entrenamiento. Este conocimiento aprendido se puede usar en el futuro para predecir una salida, con cualquier nueva muestra de datos de entrada X que previamente no se conocía o que no se había visto durante el proceso de capacitación modelo. Aprendizaje Supervisado Estos métodos se denominan supervisados porque el modelo aprende en muestras de datos donde las respuestas / etiquetas de salida ya se conocen de antemano en la fase de entrenamiento (un “supervisor” o “maestro” proporciona esos datos con salidas asociadas): Aprendizaje Supervisado Los métodos de aprendizaje supervisado son principalmente de dos clases, según el tipo de tareas de ML que pretendan resolver: 1) clasificación : cuando buscamos predecir una categoría 2) regresión: cuando buscamos predecir un valor numérico APRENDIZAJE SUPERVISADO- CLASIFICACIÓN PARA PREDECIR CATEGORÍAS En la clasificación el objetivo es predecir las etiquetas de clases categóricas de las nuevas observaciones, basada en observaciones pasadas. Estas etiquetas de clase son valores discretos que pueden entenderse como pertenencia a grupos definidos. Divide objetos basados en uno de los atributos conocidos de antemano. Se utilizan por ejemplo para: – Clasificar los mensajes de spam en el correo electrónico – Búsqueda de documentos similares. – Reconocimiento de caracteres y números manuscritos. (OCR) – Detección de riesgo crediticio. Los Algoritmos supervisados mas usados son: Naive Bayes, Árbol de decisiones, Regresión logística, el vecino mas cercano, la máquina de vectores de soporte y redes neuronales. CLASIFICACIÓN PARA PREDECIR CATEGORÍAS Un ejemplo de clasificación binaria: hay 2 clases, círculos y cruces, y 2 características, X1 y X2. El modelo puede encontrar la relación entre las características de cada punto de datos y su clase, y establecer una línea límite entre ellos, de modo que cuando se le proporcionan datos nuevos, puede estimar la clase a la que pertenece, dadas sus características. En este caso, el nuevo punto de datos cae en el subespacio circular y, por lo tanto, el modelo predecirá que su clase será un círculo. CLASIFICACIÓN PARA PREDECIR CATEGORÍAS APRENDIZAJE SUPERVISADO- ANÁLISIS DE REGRESIÓN • Un segundo tipo de aprendizaje supervisado es la predicción de resultados continuos, que también se denomina Análisis de Regresión. • En el Análisis de Regresión, dada una serie de variables predictoras (explicativas) y una variable de respuesta continua, se requiere encontrar una relación entre esas variables que nos permita predecir un resultado. • Los modelos de regresión utilizan atributos o características de datos de entrada y sus correspondientes valores de salida numérica continua (también llamados respuesta), para aprender relaciones y/o asociaciones específicas entre las entradas y sus salidas correspondientes. • Con este conocimiento, se puede predecir respuestas para observaciones nuevas no conocidas, proceso que es similar a la clasificación, pero con salidas numéricas continuas. APRENDIZAJE SUPERVISADO- ANÁLISIS DE REGRESIÓN Ejemplo de regresión lineal: dados X e Y, ajustamos una línea recta que minimiza la distancia entre los puntos de muestra y la línea ajustada. Luego se usa la intersección y la pendiente aprendida, de la línea ajustada, para predecir el resultado de nuevos datos. APRENDIZAJE NO SUPERVISADO El Aprendizaje No Supervisado está relacionado con tratar de extraer información valiosa de los datos, en lugar de tratar de predecir algún resultado a partir de la información de E/S de los mismos. Objetivo: Intenta aprender estructuras latentes inherentes, patrones y/o relaciones a partir de datos sin ayuda o supervisión. Hay más incertidumbre en los resultados del aprendizaje no supervisado que en los supervisados, sin embargo en los No supervisados se puede obtener mucha información que anteriormente no estaba disponible. Los métodos de Aprendizaje No Supervisados se pueden categorizaren las siguientes amplias áreas de tareas del ML: • Agrupación (clustering) • Reducción de dimensionalidad • Detección de anomalías. • Asociación. APRENDIZAJE NO SUPERVISADO: AGRUPACIÓN (CLUSTERING) Los métodos de agrupación son métodos de aprendizaje automático que intentan encontrar patrones de similitud y relaciones entre muestras de un conjunto de datos, y luego agrupan estas muestras en varios grupos, de modo que cada cluster o grupo de muestras de observaciones tiene cierta similitud, según los atributos o características de los datos (sin ninguna clasificación previa, supervisión o conocimiento sobre los atributos de dichas observaciones). APRENDIZAJE NO SUPERVISADO: REDUCCIÓN DE DIMENSIONALIDAD Se reduce el número de variables de características o atributos (dimensiones) para cada muestra de datos, al extraer o seleccionar un conjunto de características principales o representativas. Se trata de encontrar correlaciones entre las características, lo que significaría que hay información redundante, ya que algunas características podrían explicarse parcialmente con las otras. Elimina el ruido de los datos y comprime los datos en un subespacio más pequeño, conservando la información relevante. Los principales algoritmos para reducir dimensionalidad son: los vecinos más cercanos, el análisis de componentes principales (PCA) y el análisis discriminante. APRENDIZAJE POR REFUERZO El aprendizaje por refuerzo trata de aprender de la experiencia y no de un conjunto de ejemplos (como en el supervisado y no supervisado). Características del aprendizaje por refuerzo: • Está dirigido por objetivos. Este objetivo se expresa por una recompensa que devuelve el entorno al realizar una acción sobre él. No se conoce cual es la salida adecuada para el sistema. Tan solo que el efecto que debe producir esta salida sobre el entorno sea tal que se maximice la recompensa recibida a largo plazo. • El comportamiento del entorno es, en general, desconocido y puede ser estocástico, es decir, que la evolución del entorno y la recompensa generada pueden obedecer a una cierta función de probabilidad. APRENDIZAJE POR REFUERZO Características del aprendizaje por refuerzo: • La recompensa puede tener un cierto retardo. Es decir, la bondad de una acción tomada por el sistema puede que no se refleje hasta un cierto número de evaluaciones posteriores. • Dado que el comportamiento del entorno es desconocido, el aprendizaje por refuerzo conlleva una fuerte carga de ensayo y error. • Uno de los problemas asociados es el balance exploración-explotación. • Se trata de evaluar si es mejor explorar el entorno para mejorar el conocimiento del problema (a costa de empeorar a corto plazo la recompensa obtenida) o explotar el conocimiento acumulado (intentando maximizar la recompensa). • Es importante señalar las diferencias respecto al aprendizaje por analogía. El aprendizaje por analogía también está basado en la experiencia, pero se limita a almacenar experiencias pasadas y buscar correspondencias. GRACIAS
Compartir