Logo Studenta

Clase 40 - Algoritmos de Clasificación III

¡Este material tiene más páginas!

Vista previa del material en texto

ALGORITMOS DE CLASIFICACIÓN III
 Clase 40. DATA SCIENCE
Obligatoria siempre
Profundizar en el Aprendizaje Supervisado . 
Aplicar el algoritmo de SVM.
Aplicar los modelos de Regresión.
OBJETIVOS DE LA CLASE
Obligatoria siempre. Es lo que queremos alcanzar una vez finalizada la clase. Recordá que se enuncian en principio con el verbo delante (por ejemplo: “Comprender…”, “Analizar…”, “conocer…”, etc).
MAPA DE CONCEPTOS
MAPA DE CONCEPTOS CLASE 40
APRENDIZAJE SUPERVISADO
MODELOS DE REGRESIÓN
SVM
HYPERTURNING
Se puede usar para comenzar o finalizar la clase, según sea más conveniente. La información de este slide es de relleno. 
Recurso: Mapa de conceptos
Muestra rápidamente los contenidos de la clase y cómo se relacionan. Ayuda a los estudiantes a evitar “perderse” durante la clase, al avanzar en un sentido lineal una diapositiva tras otra. El ejemplo pertenece a la primera clase del curso UX/UI.
Sugerencia: 
-También se pueden mostrar con un menor énfasis o colores apagados, aquellos contenidos de clases anteriores y que se vinculen con la actual. 
-Resaltar con color los temas que se abordan en la clase.
Clase 39
Algoritmos de Clasificación II
CRONOGRAMA DEL CURSO
KNN, RANDOM FOREST, REGRESIÓN LOGÍSTICA
ALGORITMO DE CLASIFICACIÓN
Clase 40
Algoritmos de Clasificación III
SVM, REGRESIÓN E HYPERTURNING
Clase 41
Algoritmos de Agrupación I
INVESTIGACIÓN SOBRE CLUSTERING
KMEDIANS, FUZZYKMEANS, KMEANS Y HDBSCAN
CLUSTERING
Recurso: Cronograma del curso
- Se muestra al inicio de cada clase 
- Tiene un aspecto similar a un calendario.
- Resume rápidamente: título de la clase, número y contenidos que abarca
- Guía rápida tanto para docentes, como para estudiantes.
- Para mayor ubicación en el curso, también muestra en un tamaño más pequeño lo sucedido la clase anterior y la siguiente.
-Ubicar en el interior de cada clase aquellas cuestiones destacadas con las cuales se encontrará el alumno y con su respectivo nombre: desafíos, entregables de proyecto, actividades colaborativas o ejemplos en vivo.
PREGUNTA
¿Conoces el algoritmo SVM?
¿De qué se trata? 
¡ESCRIBELO EN EL CHAT!
“Para pensar”.
¿Como crear encuestas de zoom? Disponible en este video.
El docente generará una encuesta de zoom para que los estudiantes respondan. Esto es una actividad de comprobación.
Sugerimos:
Utilizarlo antes del break para que los estudiantes puedan votar en la encuesta antes de ir al mismo.
Al regresar, mostrar los resultados a los estudiantes.
Si hay buena respuesta de este recurso, se recomienda utilizarlo de forma orgánica en más instancias de la clase.
MÁQUINAS DE SOPORTE VECTORIAL (SVM)
¿De qué se trata?
SVM por sus siglas en inglés (Support Vector Machines), es un algoritmo que se puede usar tanto para regresión como para problemas de clasificación.
SVM en Acción
Vamos a suponer que los puntos azules corresponden a la clase «azul» y los puntos rojos a la clase «rojo».
Ahora vamos a intentar dibujar una línea que separe los puntos azules de los rojos. 
De esta forma, cuando haya un punto nuevo, intentaremos poder determinar qué color va a tener, dependiendo del lado de la línea en el que se encuentre.
A continuación veremos algunos ejemplos de formas equivocadas de clasificar.
En la siguiente figura, podemos decir que lo que esté a la izquierda de la línea, es azul y lo que esté a la derecha, es rojo. 
Sin embargo, el punto nuevo abajo a la izquierda es clasificado como azul aunque en realidad debería clasificarse como rojo.
Clasificaciones erróneas con SVM
Podemos decir que cualquier punto que esté por arriba de la línea establecida será azul y cualquier otro punto que esté por debajo de la línea será rojo. 
Sin embargo, el nuevo punto a la derecha, ha sido incorrectamente clasificado como azul, cuando debería ser rojo.
Clasificaciones erróneas con SVM
Clasificación óptima con SVM
La línea que mejor distingue las zonas de los puntos azules de la zona de los puntos rojos es la que maximiza el margen entre ambos.
 SVM es una técnica de machine learning que encuentra la mejor separación posible entre clases. 
Resulta importante mencionar, que normalmente los problemas de aprendizaje automático tienen muchas dimensiones, por lo tanto en vez de encontrar la línea óptima, el SVM encuentra el hiperplano que maximiza el margen de separación entre clases.
MODELOS DE REGRESIÓN
PREGUNTA
¿Cuándo aplicábamos un modelo de Regresión?
¿Cuál era la diferencia entre una Regresión Lineal y Múltiple? 
¡ESCRIBELO EN EL CHAT!
“Para pensar”.
¿Como crear encuestas de zoom? Disponible en este video.
El docente generará una encuesta de zoom para que los estudiantes respondan. Esto es una actividad de comprobación.
Sugerimos:
Utilizarlo antes del break para que los estudiantes puedan votar en la encuesta antes de ir al mismo.
Al regresar, mostrar los resultados a los estudiantes.
Si hay buena respuesta de este recurso, se recomienda utilizarlo de forma orgánica en más instancias de la clase.
Aplicar un ajuste por el método de mínimos cuadrados.
1
2
3
Modelo de regresión lineal
Hacer verificaciones para chequear que el modelo sea válido y bueno.
Además de tener una recta de ajuste, la denominaremos recta de regresión, porque cumple con las condiciones 🎉.
¿Qué hacer para aplicarlo?
Usar para slides de texto con gráfico de etapas/pasos.
Se la llama simple cuando solo hay una variable independiente y múltiple cuando hay más de una. 
Dependiendo del contexto, a la variable modelada se le conoce como dependiente o variable respuesta, y a las variables independientes como regresores, predictores o features.
Regresión lineal simple vs múltiple 
Usar para slides de texto con gráfico de etapas/pasos.
HYPERTURNING
Muchas veces encontrar cuál es el mejor parámetro para nuestro modelo, suele ser complejo. Es por eso que necesitamos realizar lo que se conoce como “optimización de hiperparámetros”.
Hypertuning de Parámetros
👉
Usar para slides de texto con gráfico de etapas/pasos.
Dentro de este contexto, resulta importante entender que la optimización de hiper-parámetros, se realiza normalmente mediante la utilización de un proceso de búsqueda cuyo objetivo consiste en encontrar la mejor selección de valores para un conjunto finito de hiper-parámetros con el objetivo de generar el mejor modelo posible.
Hypertuning de Parámetros
Usar para slides de texto con gráfico de etapas/pasos.
De los diversos algoritmos vistos y estudiados en clase, podemos usar: 
Algoritmos de Regresión
¿Existen más algoritmos de Regresión? ¡Claro! Más info disponible en el Material ampliado de la clase. 🤓
Random Forest.
Knn.
Árbol de Decisión.
SVM.
Usar para slides de texto con gráfico de etapas/pasos.
☕ 
BREAK
¡5/10 MINUTOS Y VOLVEMOS!
Obligatoria siempre. A la hora del Break, entre 5 y 10 minutos. Considerar ubicar este espacio en un momento adecuado de la clase. Al volver, mostrar los resultados de la pregunta del anterior slide y generar un breve intercambio.
EJEMPLO EN VIVO
Utilizaremos la carpeta de Notebooks con los archivos CoderHouse.ipynb para practicar SVM, Regresión y Hypertuning. 
“Ejemplo en vivo”
El docente realizará una tarea compartiendo la pantalla en vivo. Se centrará en los pasos y los aspectos a tener en cuenta.
¿QUIERES SABER MÁS? TE DEJAMOS MATERIAL AMPLIADO DE LA CLASE
Portada de Material Ampliado
Algoritmos de Regresión | scikit-learn.org
Disponible en nuestro repositorio.
Usar para que los estudiantes puedan explorar en sus casas los recursos vistos en clase: libros, artículos, herramientas, websites, videos (ajenos a Coder)
Enviar el contenido a integrar a contenidos@coderhouse.com para que lo podamos incluir en el Repositorio.
¿PREGUNTAS?
¡MUCHAS GRACIAS!
Resumen de lo visto en clase hoy: 
- Aprendizaje Supervisado.
- Ejemplo de algoritmos de Regresión.
Obligatoria siempre. En caso de cerrar con el “mapa de conceptos” se puede dejar solo “muchas gracias”. Completar el resumen con palabrasclaves de lo visto.
OPINA Y VALORA ESTA CLASE
#DEMOCRATIZANDOLAEDUCACIÓN

Continuar navegando