Logo Studenta

APRENDIZAJE AUTOMÁTICO

¡Este material tiene más páginas!

Vista previa del material en texto

APRENDIZAJE AUTOMÁTICO
(MACHINE LEARNING)
Definición
Escenarios en los que sería beneficioso que las máquinas aprendan:
• Falta de experiencia humana en un dominio (Ejm: Simulación de 
navegación en territorios desconocidos).
• Los escenarios y comportamientos sean cambiantes con el tiempo (Ejm: 
Disponibilidad de infraestructura en una organización)
• Las personas pueden tener suficiente experiencia en el dominio, pero es 
muy difícil explicar o traducir formalmente esta experiencia en tareas 
computacionales (Reconocimiento de voz y escenas, Traducciones, etc.).
• Abordar problemas específicos de un dominio a escala con enormes 
volúmenes de datos y con demasiadas condiciones y restricciones 
complejas.
La idea central es hacer que las máquinas resuelvan tareas que se 
pueden definir fácilmente de forma intuitiva pero muy difíciles de 
definirlas manera formal.
Definición
Aprendizaje. Incrementar el Conocimiento adquirido, Realizar Tareas con 
mayor Eficiencia o Corrección, o llevar a cabo Nuevas Tareas.
Adquisición de Conocimiento. Actividad de Informarse de algún Hecho 
o Situación, o de obtener Información que origina una Reestructuración de 
Conocimiento disponible.
Capacidad de Memorizar. Basado en Conservar el conocimiento con el 
fin de poder utilizarlo en el futuro.
Requiere que se Establezcan Mecanismos en la Memoria de los sistemas 
para Almacenar Nuevos Elementos en el contexto adecuado.
Definición
Debido al reciente gran desarrollo tecnológico y disminución de precios en 
Hw, ahora podemos crear, almacenar y enviar más datos que nunca en la 
historia. Estos datos alimentan los modelos de aprendizaje automático y es 
el principal impulsor del auge de esta ciencia en los últimos años.
El aprendizaje automático es un subcampo de la IA y puede definirse:
"El aprendizaje automático es la ciencia de hacer que las computadoras 
aprendan y actúen como lo hacen los humanos, y mejoren su aprendizaje 
con el tiempo de manera autónoma, al proporcionarles datos e información 
en forma de observaciones e interacciones del mundo real". - Dan Fagella
El aprendizaje automático ofrece una forma eficiente de capturar 
conocimiento en datos para mejorar gradualmente el rendimiento de los 
modelos predictivos y tomar decisiones basadas en datos. Se ha convertido 
en una tecnología omnipresente y disfrutamos de sus beneficios en: 
predicción de ventas, determinación del riesgo crediticio, automóviles 
autónomos, reconocimiento de imagen y voz, etc. 
Definición formal de Aprendizaje Automático
Se dice que un programa de computadora aprende de la experiencia E 
con respecto a algunas clases de tareas T y la medida de rendimiento P, si 
su desempeño en las tareas T, medido por P, mejora con la experiencia E.
Los principales dominios o campos asociados con Machine Learning
incluyen lo siguiente:
• Inteligencia artificial
• Procesamiento natural del lenguaje
• Minería de datos
• Matemáticas
• Estadística
• Ciencias de la Computación
• Aprendizaje profundo
• Ciencia de los datos
Definición formal de Aprendizaje Automático
Tipos de Aprendizaje Automático
Los métodos de Machine Learning se pueden clasificar de varias 
formas bajo diferentes escenarios, basados en las características de 
los datos y sus categorías, como se ve en las figuras siguientes:
ALGORITMOS DE APRENDIZAJE AUTOMÁTICO CLÁSICO
Métodos basados en la cantidad de supervisión humana en 
el proceso de aprendizaje:
a. Aprendizaje supervisado
b. Aprendizaje no supervisado
c. Aprendizaje por refuerzo
Aprendizaje Supervisado
Los métodos de Aprendizaje Supervisados incluyen algoritmos de 
aprendizaje que toman muestras de datos (Datos de Entrenamiento) y 
salidas asociadas (Categorías o Respuestas) con cada muestra de datos 
durante el proceso de entrenamiento de dicho modelo 
Objetivo:
Aprender (mapear) asociaciones entre las muestras de datos de entrada y 
sus salidas correspondientes, basadas en múltiples instancias de datos de 
entrenamiento.
Este conocimiento aprendido se puede usar en el futuro para predecir una 
salida, con cualquier nueva muestra de datos de entrada X que 
previamente no se conocía o que no se había visto durante el proceso de 
capacitación modelo.
Aprendizaje Supervisado
Estos métodos se denominan supervisados porque el modelo aprende en 
muestras de datos donde las respuestas / etiquetas de salida ya se 
conocen de antemano en la fase de entrenamiento (un “supervisor” o 
“maestro” proporciona esos datos con salidas asociadas):
Aprendizaje Supervisado
Los métodos de aprendizaje supervisado son principalmente de dos 
clases, según el tipo de tareas de ML que pretendan resolver:
1) clasificación : cuando buscamos predecir una categoría
2) regresión: cuando buscamos predecir un valor numérico
APRENDIZAJE SUPERVISADO- CLASIFICACIÓN PARA PREDECIR CATEGORÍAS
En la clasificación el objetivo es predecir las etiquetas de clases categóricas de 
las nuevas observaciones, basada en observaciones pasadas.
Estas etiquetas de clase son valores discretos que pueden entenderse como 
pertenencia a grupos definidos.
Divide objetos basados ​​en uno de los atributos conocidos de antemano.
Se utilizan por ejemplo para:
– Clasificar los mensajes de spam en el correo electrónico
– Búsqueda de documentos similares.
– Reconocimiento de caracteres y números manuscritos. (OCR)
– Detección de riesgo crediticio.
Los Algoritmos supervisados mas usados son: Naive Bayes, Árbol de
decisiones, Regresión logística, el vecino mas cercano, la máquina de vectores
de soporte y redes neuronales.
CLASIFICACIÓN PARA PREDECIR CATEGORÍAS
Un ejemplo de clasificación binaria: hay 2 clases, círculos y cruces, y 2 
características, X1 y X2. El modelo puede encontrar la relación entre las 
características de cada punto de datos y su clase, y establecer una línea 
límite entre ellos, de modo que cuando se le proporcionan datos nuevos, 
puede estimar la clase a la que pertenece, dadas sus características. 
En este caso, el nuevo punto de datos
cae en el subespacio circular y, por lo 
tanto, el modelo predecirá que su clase
será un círculo.
CLASIFICACIÓN PARA PREDECIR CATEGORÍAS
APRENDIZAJE SUPERVISADO- ANÁLISIS DE REGRESIÓN
• Un segundo tipo de aprendizaje supervisado es la predicción de resultados 
continuos, que también se denomina Análisis de Regresión.
• En el Análisis de Regresión, dada una serie de variables predictoras
(explicativas) y una variable de respuesta continua, se requiere encontrar una 
relación entre esas variables que nos permita predecir un resultado.
• Los modelos de regresión utilizan atributos o características de datos de 
entrada y sus correspondientes valores de salida numérica continua (también 
llamados respuesta), para aprender relaciones y/o asociaciones específicas 
entre las entradas y sus salidas correspondientes.
• Con este conocimiento, se puede predecir respuestas para observaciones 
nuevas no conocidas, proceso que es similar a la clasificación, pero con 
salidas numéricas continuas.
APRENDIZAJE SUPERVISADO- ANÁLISIS DE REGRESIÓN
Ejemplo de regresión lineal: dados X e Y, ajustamos una línea recta que minimiza la
distancia entre los puntos de muestra y la línea ajustada. Luego se usa la intersección y
la pendiente aprendida, de la línea ajustada, para predecir el resultado de nuevos datos.
APRENDIZAJE NO SUPERVISADO
El Aprendizaje No Supervisado está relacionado con tratar de extraer 
información valiosa de los datos, en lugar de tratar de predecir algún 
resultado a partir de la información de E/S de los mismos.
Objetivo: Intenta aprender estructuras latentes inherentes, patrones y/o 
relaciones a partir de datos sin ayuda o supervisión.
Hay más incertidumbre en los resultados del aprendizaje no supervisado 
que en los supervisados, sin embargo en los No supervisados se puede 
obtener mucha información que anteriormente no estaba disponible.
Los métodos de Aprendizaje No Supervisados se pueden categorizaren 
las siguientes amplias áreas de tareas del ML:
• Agrupación (clustering)
• Reducción de dimensionalidad
• Detección de anomalías.
• Asociación.
APRENDIZAJE NO SUPERVISADO: AGRUPACIÓN (CLUSTERING)
Los métodos de agrupación son métodos de aprendizaje automático que 
intentan encontrar patrones de similitud y relaciones entre muestras de un 
conjunto de datos, y luego agrupan estas muestras en varios grupos, de 
modo que cada cluster o grupo de muestras de observaciones tiene cierta 
similitud, según los atributos o características de los datos (sin ninguna 
clasificación previa, supervisión o conocimiento sobre los atributos de 
dichas observaciones).
APRENDIZAJE NO SUPERVISADO: REDUCCIÓN DE DIMENSIONALIDAD
Se reduce el número de variables de características o atributos (dimensiones) para 
cada muestra de datos, al extraer o seleccionar un conjunto de características 
principales o representativas.
Se trata de encontrar correlaciones entre las características, lo que significaría que 
hay información redundante, ya que algunas características podrían explicarse 
parcialmente con las otras. Elimina el ruido de los datos y comprime los datos en 
un subespacio más pequeño, conservando la información relevante.
Los principales algoritmos para
reducir dimensionalidad son: 
los vecinos más cercanos, 
el análisis de componentes 
principales (PCA) y 
el análisis discriminante.
APRENDIZAJE POR REFUERZO
El aprendizaje por refuerzo trata de aprender de la experiencia y no de 
un conjunto de ejemplos (como en el supervisado y no supervisado).
Características del aprendizaje por refuerzo:
• Está dirigido por objetivos. Este objetivo se expresa por una 
recompensa que devuelve el entorno al realizar una acción sobre él. 
No se conoce cual es la salida adecuada para el sistema. Tan solo 
que el efecto que debe producir esta salida sobre el entorno sea tal 
que se maximice la recompensa recibida a largo plazo.
• El comportamiento del entorno es, en general, desconocido y puede 
ser estocástico, es decir, que la evolución del entorno y la recompensa 
generada pueden obedecer a una cierta función de probabilidad.
APRENDIZAJE POR REFUERZO
Características del aprendizaje por refuerzo:
• La recompensa puede tener un cierto retardo. Es decir, la bondad de una 
acción tomada por el sistema puede que no se refleje hasta un cierto número 
de evaluaciones posteriores.
• Dado que el comportamiento del entorno es desconocido, el aprendizaje por 
refuerzo conlleva una fuerte carga de ensayo y error.
• Uno de los problemas asociados es el balance exploración-explotación.
• Se trata de evaluar si es mejor explorar el entorno para mejorar el 
conocimiento del problema (a costa de empeorar a corto plazo la recompensa 
obtenida) o explotar el conocimiento acumulado (intentando maximizar la 
recompensa).
• Es importante señalar las diferencias respecto al aprendizaje por analogía. El 
aprendizaje por analogía también está basado en la experiencia, pero se 
limita a almacenar experiencias pasadas y buscar correspondencias.
GRACIAS

Continuar navegando