Logo Studenta

Maquinas de Aprendizaje

¡Estudia con miles de materiales!

Vista previa del material en texto

10010608351, 10692628832, 10324237723, 1049612174
Máquinas de Aprendizaje: Una investigación acerca de los algoritmos en la educación
Salamanca C. Autor1, Lizarazo J. Autor2, Valderrama J. Autor3, Bautista
V. Autor4, miembro de la CUN
Resumen - En esta investigación se presenta una definición clara sobre las máquinas de aprendizaje y sus diferentes tipos, como lo son: el aprendizaje supervisado, el aprendizaje no supervisado y el aprendizaje por refuerzo. Cada uno de ellos con diferentes tipos de algoritmos y elementos que los hacen únicos en el aprendizaje de máquinas.
Junto a estas definiciones se encuentran los antecedentes sobre las máquinas de aprendizaje en la educación, que sirvieron como pilar en la investigación. Se analizaron proyectos de algunas universidades del mundo que implementaron las máquinas de aprendizaje en sus instituciones para predecir y tomar decisiones. De esta manera se generaron datos, tablas y gráficas que dieron herramientas para concluir de manera objetiva cuál es el mejor algoritmo para variables booleanas y el más utilizado en la educación. 
Índice de Términos - Algoritmos, aprendizaje automático, datos, educación, máquinas de aprendizaje, programas, tecnología y variables, aprendizaje supervisado, aprendizaje no supervisado.
I. Introducción
Las máquinas de aprendizaje son una técnica asociada a la detección automática de patrones relevantes dentro de un conjunto de datos [1]. Por ende, el objetivo es Identificar cuáles son las máquinas de aprendizaje que se utilizan para variables booleanas. Hoy en día nos encontramos rodeados de máquinas de aprendizaje, una tecnología que prácticamente requiere de un proceso, análisis y extracción computacional de información a partir de grandes cantidades de datos que facilitan la toma de decisiones [1]. Mediante los diferentes tipos de aprendizaje las máquinas pueden aprender de sí mismas sin ser explícitamente programadas por los humanos, analizando datos ya existentes y trabajados con anterioridad el modelo de aprendizaje automático forma patrones y los usa para aprender y hacer predicciones futuras. Las máquinas de aprendizaje son la salida más fácil para el desarrollo de procesos repetitivos y mecánicos, que han ayudado a la humanidad tanto en el mundo académico como en el empresarial, y constituyendo una fuerte palanca de transformación [2].
En el 2017 Tobar [3] explica que las máquinas de aprendizaje en la educación permiten que los estudiantes aprendan de una mejor manera, ya que el sistema analiza su rendimiento y personaliza el contenido con el objetivo de reforzar aspectos específicos de manera individual, orienta al estudiante hacia lo que debe reforzar. La recopilación de estos datos permite al docente identificar el contenido que el estudiante ha comprendido y el que debe fortalecer.
La finalidad de este proyecto es definir qué máquinas de aprendizaje son mejores para las variables booleanas que agilicen y faciliten la supervisión del progreso educativo de los alumnos prácticamente en tiempo real, permitiendo un elevado grado de autoformación para el alumnado que lo utilice, y así reciba ejercicios y tareas con una frecuencia a la medida de sus posibilidades y siempre buscando mejorar aquellos aspectos de su educación [4].
II. Marco Teórico
1. Máquinas de Aprendizaje
 
El aprendizaje automático es una rama en evolución de los algoritmos computacionales que están diseñados para emular la inteligencia humana aprendiendo del entorno circundante. Se les considera el caballo de batalla en la nueva era de los llamados big data. Las técnicas basadas en el aprendizaje automático se han aplicado con éxito en diversos campos que van desde el reconocimiento de datos, la visión por computadora, la ingeniería, las finanzas, el entretenimiento y la educación [5].
De acuerdo a Carleo et al. [6] El aprendizaje automático (ML) abarca una amplia gama de algoritmos y herramientas de modelado que se utilizan para una amplia gama de tareas. El aprendizaje automático se inspira en el trabajo de varias disciplinas: ciencias cognitivas, informática, estadística, complejidad computacional, teoría de la información, teoría del control, filosofía y biología, el aprendizaje automático se refiere a la capacidad de una máquina para mejorar su rendimiento en función de resultados anteriores también es un método científico que se usa en ordenadores y otros dispositivos con capacidad computacional para aprender o extraer patrones y relaciones que hay en los datos por sí solos. Esos patrones se pueden usar luego para predecir comportamientos y en la toma de decisiones [7].
 1.1. Aprendizaje Supervisado
Un algoritmo de aprendizaje supervisado analiza los datos de entrenamiento y produce una función inferida, que puede ser utilizada para mapear nuevos ejemplos. Un escenario óptimo permitirá que el algoritmo determine correctamente las etiquetas de clase para instancias invisibles. Esto requiere que el algoritmo de aprendizaje generalice de los datos de entrenamiento a situaciones invisibles de una manera "razonable" [8, p.71].
Se genera un modelo predictivo, basado en datos de entrada y salida, se caracteriza porque utiliza algoritmos que tienen un aprendizaje previo basado en etiquetas que el ser humano configura con anterioridad. Algunos ejemplos de este tipo de aprendizaje, se puede ver en la detección de correos spam, en la función de reconocimiento de voz o escritura en un celular y también en el reconocimiento de firmas [9], además el aprendizaje supervisado incluye la regresión y clasificación. 
	Fig. 1. Mapa modelo de aprendizaje supervisado
 1.1.1 Regresión
 
En el 2018, Zambrano [10] afirma que los algoritmos de regresión son el programa de aprendizaje automático que se ocupan de modelar la relación entre variables que se definen de forma iterativa utilizando una medida de error en las predicciones realizadas por el modelo. Es una regresión enmarcada en el grupo de los modelos lineales generalizados, las cuales utilizan una función logit y son útiles para modelar probabilidades referentes a un evento en función de otras variables, se basa en la probabilidad de ocurrencia de los posibles valores de la variable dependiente y utiliza para ello una regresión logística que acota los resultados en el intervalo 0 y 1, adicionalmente, está respaldada por su capacidad de pronosticación [10].
 1.1.2 Clasificación
La clasificación en el aprendizaje supervisado se da cuando los algoritmos realizan una clasificación de datos que producen como salida una etiqueta discreta dentro de un conjunto finito de etiquetas. A su vez, los modelos de clasificación pueden ser binarios si tenemos que predecir entre dos clases o puede ser multiclase, cuando se tiene que clasificar más de dos clases, toda esta información debe ser analizada con anterioridad. Los problemas más comunes son: reconocimiento de voz, detección de rostros, reconocimiento de escritura a mano, clasificación de documentos, etc. Puede ser un problema de clasificación binaria o un problema de varias clases. Hay muchos algoritmos para la clasificación en el aprendizaje automático. [11, p.76].
 1.1.3 Algoritmos más usados en el aprendizaje 
 supervisado
Cada grupo de aprendizaje supervisado posee diferentes tipos de algoritmos; los tipos de algoritmos de clasificación es aquel algoritmo [12] encuentra diferentes patrones y tiene por objetivo clasificar los elementos en diferentes grupos y los tipos de algoritmos de regresión tienen como resultado un número específico. Si las etiquetas suelen ser un valor numérico, mediante las variables de las características, se pueden obtener dígitos como datos resultantes [11].
A) Vecinos más cercanos - Clasificación
Vecinos más cercanos es uno de los algoritmos de clasificación más básicos y esenciales en Machine Learning. Se encuentra una aplicación intensa en el reconocimiento de patrones, la minería de datos y la detecciónde intrusos basado en instancias [13].
B) Máquinas de Vectores - Clasificación
De acuerdo a González [13] El algoritmo de vectores de soporte o Support Vector Machine es un clasificador discriminatorio definido formalmente por un hiperplano de separación. En otras palabras, dados los datos de entrenamiento etiquetados el algoritmo genera un hiperplano óptimo que clasifica los nuevos ejemplos en dos espacios dimensionales, este hiperplano es una línea que divide un plano en dos partes donde en cada clase se encuentra en cada lado.
C) Árboles de decisión - Clasificación 
Árbol de decisión o Decisión Tree Classification se utiliza principalmente en problemas de clasificación, aunque funciona para variables de entrada y salida categóricas como continuas. En esta técnica, dividimos la data en dos o más conjuntos homogéneos basados en el diferenciador más significativo en las variables de entrada. El árbol de decisión identifica la variable más significativa y su valor que proporciona los mejores conjuntos homogéneos de población. Todas las variables de entrada y todos los puntos de división posibles se evalúan y se elige la que tenga mejor resultado [13].
D) K-NN - Clasificación
Según el Lee en el 2018, nos indica que el algoritmo de clasificación no puede predecir valores fuera del rango de los datos mostrados, debido que el algoritmo K-NN es uno de los algoritmos de clasificación más simples y se utiliza para identificar los puntos de datos que se separan en varias clases para predecir la clasificación de un nuevo punto de muestra. K-NN es un algoritmo de aprendizaje perezoso no paramétrico. Clasifica nuevos casos en función de una medida de similitud; es decir, funciones de distancia [14].
E) Regresión lineal - Regresión
La regresión lineal es [15] una técnica paramétrica de machine learning. Con paramétrica se quiere decir que incluso antes de mirar a los datos, ya se conoce cuántos parámetros (o coeficientes) se necesitan. El aprendizaje consiste en encontrar cuáles son los mejores parámetros (coeficientes) para los datos que se tienen. Los mejores coeficientes serán los que minimicen alguna medida de error.
F) Árboles de decisión - Regresión
Los árboles de decisión son modelos no-paramétricos. Esto significa que no se sabe cuántos parámetros van a existir hasta que no se vean los datos y se construya el árbol. La regresión lineal, es un modelo paramétrico porque antes de ver los datos se puede decir con toda certeza cuántos parámetros se necesitarán [15].
G) Redes Neuronales - Regresión 
De acuerdo a Martinez [15] Son un modelo computacional evolucionado a partir de diversas aportaciones científicas que están registradas en la historia.1 Consiste en un conjunto de unidades, llamadas neuronas artificiales, conectadas entre sí para transmitir señales. La información de entrada atraviesa la red neuronal (donde se somete a diversas operaciones) produciendo unos valores de salida.
H) Polinomial - Regresión
La regresión polinomial es una forma de análisis de regresión en la que la relación entre la variable independiente X y la variable dependiente Y se modela como un polinomio de enésimo grado en X. La regresión polinomial se ajusta a una relación no lineal entre el valor de X y la media condicional correspondiente de Y, denotada E (y | x) [13].
 1.2 Aprendizaje no supervisado
Romero [11] explica que el aprendizaje no supervisado, como se puede adivinar, los datos de entrenamiento no están etiquetados, el sistema intenta como aprender sin un maestro. En esta situación, se está de una manera trabajando a ciegas, hace falta una variable respuesta que supervise el análisis, en este caso se busca entender las relaciones entre las variables o entre las observaciones. El objetivo será la extracción de información significativa, sin la referencia de variables de salida conocidas y mediante la exploración de la estructura de dichos datos sin etiqueta.
Este tipo de aprendizaje también tiene aplicaciones para reducir dimensionalidad o simplificar conjuntos de datos. En el caso de agrupar datos por afinidad, el algoritmo debe definir una métrica de similitud o distancia que le sirva para comparar los datos entre sí. Como ejemplo de aprendizaje no supervisado tenemos los algoritmos de agrupamiento o clustering, que podrían aplicarse para encontrar clientes con características similares a los que ofrecer determinados productos o destinar una campaña de marketing, descubrimiento de tópicos o detección de anomalías, entre otros [16].
Fig. 2. Mapa modelo de aprendizaje no supervisado
 1.2.1 Agrupamiento
 
La agrupación en clústeres es un concepto importante cuando se trata de aprendizaje no supervisado. Se trata principalmente de encontrar una estructura o patrón en una colección de datos sin categorizar. Los algoritmos de agrupación procesarán sus datos y encontrarán clústeres naturales (grupos) si existen en los datos. También puede modificar cuántos clústeres deben identificar sus algoritmos. Le permite ajustar la granularidad de estos grupos [17].
 1.2.2 Reducción de dimensiones 
La reducción de dimensionalidad, o reducción de dimensión, es la transformación de datos de un espacio de alta dimensión en un espacio de baja dimensión de modo que la representación de baja dimensión conserva algunas propiedades significativas de los datos originales, idealmente cerca de su dimensión intrínseca. Trabajar en espacios de gran dimensión puede ser indeseable por muchas razones; los datos brutos suelen ser escasos como consecuencia de la dimensionalidad, y el análisis de los datos suele ser difícil de resolver desde el punto de vista computacional. Es común en campos que se ocupan de un gran número de observaciones y / o un gran número de variables, como el procesamiento de señales, el reconocimiento de voz, la neuroinformática y la bioinformática [12]. 
 1.2.3 Algoritmos más usados en el aprendizaje
 no supervisado
A) K-Means - Agrupación
El agrupamiento de K-medias es un método de cuantificación de vectores, originalmente a partir del procesamiento de señales, que tiene como objetivo dividir N observaciones en K grupos en los que cada observación pertenece al grupo con la media más cercana, sirviendo como un prototipo del racimo. Esto da como resultado una partición del espacio de datos en celdas de Voronoi. La agrupación de K-reduce minimiza las varianzas dentro del grupo, pero no distancias euclidianas regulares, que sería el problema de Weber más difícil: la media optimiza los errores cuadrados, mientras que sólo la mediana geométrica minimiza las distancias euclidianas [12].
B) DBSCAN - Agrupación
La agrupación en clústeres basada en la densidad se refiere a métodos de aprendizaje no supervisados que identifican grupos / clústeres distintivos en los datos, basándose en la idea de que un clúster en el espacio de datos es una región contigua de alta densidad de puntos, separada de otros clústeres de este tipo por regiones contiguas de baja densidad de puntos. El agrupamiento espacial de aplicaciones con ruido basado en densidad es un algoritmo básico para el agrupamiento en clústeres basado en densidad. Puede descubrir grupos de diferentes formas y tamaños a partir de una gran cantidad de datos, que contienen ruido y valores atípicos [12].
C) Agglomerative - Agrupación
La agrupación es el amplio conjunto de técnicas para encontrar subgrupos o agrupaciones sobre la base de la caracterización de objetos dentro de un conjunto de datos, de modo que los objetos con grupos son similares pero diferentes del objeto de otros grupos. La directriz principal de la agrupación en clústeres es que los datos dentro de un clúster deben ser muy similares entre sí pero muy diferentes de los que están fuera de los clústeres. Existen diferentes tipos de técnicas de agrupamiento como métodos de particionamiento, métodos jerárquicos [12].
D) Análisis de Componentes Principales - Reducción de dimensionesLa reducción de la dimensionalidad es común en campos que se ocupan de un gran número de observaciones y / o un gran número de variables, como el procesamiento de señales, el reconocimiento de voz, la neuroinformática y la bioinformática. Los métodos se dividen comúnmente en enfoques lineales y no lineales. Los enfoques también se pueden dividir en la selección de características y la extracción de características. La reducción de dimensionalidad se puede utilizar para la reducción de ruido, visualización de datos, análisis de clústeres, o como un paso intermedio para facilitar otros análisis [12].
E) Análisis de Componentes independientes - Reducción de dimensiones
En el procesamiento de señales, el análisis de componentes independientes (ICA) es un método computacional para separar una señal multivariante en subcomponentes aditivos. Esto se hace asumiendo que los subcomponentes son señales no gaussianas y que son estadísticamente independientes entre sí. ICA es un caso especial de separación de fuente ciega. El análisis de componentes independientes intenta descomponer una señal multivariante en señales independientes no gaussianas. Como ejemplo, el sonido suele ser una señal que se compone de la adición numérica, en cada tiempo t, de señales de varias fuentes [12].
F) Análisis de discriminante lineal - Reducción de dimensiones 
El análisis discriminante lineal (LDA), el análisis discriminante normal o el análisis de función discriminante es una generalización de la discriminante lineal de Fisher, un método utilizado en estadísticas y otros campos, para encontrar una combinación lineal de características que caracterizan o separan dos o más clases de objetos o eventos. La combinación resultante puede ser utilizada como clasificador lineal, o, más comúnmente, para la reducción de dimensionalidad antes de la clasificación posterior [17]. 
 1.3 Aprendizaje por refuerzo
El aprendizaje por refuerzo es un método de aprendizaje automático que se basa en recompensar los comportamientos deseados y penalizar los no deseados. Aplicando este método, un agente es capaz de percibir e interpretar el entorno, ejecutar acciones y aprender a través de prueba y error. Es un aprendizaje que fija objetivos a largo plazo para obtener una recompensa general máxima y lograr una solución óptima [16]. 
Fig. 3. Mapa modelo de aprendizaje por refuerzo
 1.3.1 Elementos del aprendizaje por refuerzo 
El aprendizaje por refuerzo tiene dos componentes; El agente que se refiere al prototipo que se desea instruir para que pueda tomar decisiones con cierto grado de independencia y el ambiente que es el entorno en el cual el agente se desplaza e interactúa. Entre el agente y el ambiente se desarrollan una serie de asociaciones para llevar a cabo el aprendizaje por refuerzo [9]. Estas relaciones son:
A) Acción: Se refiere a las diferentes acciones posibles que un agente puede realizar [9].
B) Estado del Ambiente: Es el indicador que le brinda al agente la información sobre cómo están organizados los diferentes elementos del ambiente en ese determinado momento [9]. 
C) Recompensa o Castigo: Luego de que el agente toma una decisión, recibe una recompensa o castigo como consecuencia de ello. Esto servirá para aumentar o disminuir las probabilidades de que dicha acción pueda repetirse con mayor frecuencia [9]. 
 2. Máquinas de Aprendizaje en la educación
Caraballo [18] menciona que se debe hacer un esfuerzo adicional para repensar los medios, las formas y los atributos que son relevantes recabar para ganar en contenido, validez y confiabilidad de la data relevada. Una vez resuelto el problema de la captura y calidad de la información recabada, corresponde comprender esos datos.
Así mismo menciona que Como se trata de un fenómeno complejo, multidimensional y que deberá administrar cientos de atributos de cada perfil, constituirá un reto formular las preguntas adecuadas, y presentar las diferentes asociaciones o factores que determinan la variable dependiente, ergo el nivel de aprendizaje, de forma amigable y comprensible.
Para finalizar de acuerdo a Valdez [7] una forma de mejorar la capacidad de análisis y contribuir a formular mejores preguntas a la data, es recurrir al aprendizaje no supervisado. Es decir, definir una herramienta o algoritmo que permita a los sistemas informáticos determinar patrones, relaciones entre los datos y estructuras no evidentes ni consistentes con las hipótesis tradicionales formuladas a partir de la teoría.
III. Antecedentes 
En el área de la enseñanza y el aprendizaje, la literatura identifica la personalización de la experiencia educativa como el principal ámbito que debe ser fortalecido con las nuevas aplicaciones de IA. [19] Existen además otras contribuciones relacionadas con el apoyo a la colaboración y al diagnóstico de trastornos del aprendizaje, entre otros, que se están explorando en la actualidad .
Un primer ámbito de contribución de la IA a la educación quizás el más conocido y con más trayectoria comprende los sistemas de enseñanza adaptativos. Se trata de plataformas y sistemas de tutoría inteligente que ofrecen trayectorias personalizadas de aprendizaje basadas en los perfiles, respuestas e interacciones de los estudiantes.[20]Estas aplicaciones buscan acercar el tipo, dificultad, secuencia y ritmo de los materiales de aprendizaje, así como sus diálogos, preguntas y retroalimentación, a las necesidades individuales de los estudiantes, con costos considerablemente inferiores a los de los medios tradicionales. Existe una variedad de productos para diversas materias del currículum aunque con mayor frecuencia en matemáticas y ciencias que han sido adoptados por los sistemas escolares en los ámbitos local y nacional. 
[21]La incorporación en estos sistemas adaptativos de nuevos algoritmos de IA con reconocimiento de voz e imagen, y el manejo de grandes volúmenes de datos, están permitiendo personalizar aún más las trayectorias de aprendizaje de los estudiantes, organizándose con elementos de su personalidad, intereses, estilos de aprendizaje y estados de ánimo. [22]Con las nuevas aplicaciones se podrían identificar las fortalezas y debilidades de cada usuario, así como sus desafíos y motivaciones, con lo cual se generaría una trayectoria idónea que optimice el proceso de aprendizaje de cada estudiante e incluso ajuste los contenidos a formatos culturalmente apropiados.
En China se están desarrollando varias iniciativas innovadoras en este ámbito. Una de ellas es Master Lerner, un “súper profesor” en línea capaz de responder simultáneamente 500 millones de consultas de los estudiantes que están preparando el examen de ingreso a la universidad en ese país.[23] Otra es Hujiang, un sistema que dará retroalimentación en línea con base en el reconocimiento de las expresiones de los estudiantes a partir del análisis de su imagen de video y de su voz.
[24]Una variante de atención personalizada a los estudiantes explorada en los últimos años es la de los chatbots adaptativos. Se trata de sistemas de chat automatizados que dan respuesta en lenguaje natural a las consultas de los estudiantes sobre algún tema específico. En Argentina, por ejemplo, se llevó a cabo un experimento con este tipo de tecnología para la enseñanza de conceptos básicos ligados a las ciencias de la computación, el cual obtuvo una buena acogida por parte de los estudiantes. Otros estudios han confirmado que el uso frecuente de este tipo de herramienta de comunicación facilita la incorporación de los estudiantes a actividades educativas.
Por último, están surgiendo aplicaciones con las que se busca aprovechar las nuevas capacidades de la IA en materia de reconocimiento de patrones en conjuntos de datos muy complejos para realizar diagnósticos y otro tipo de contribuciones específicas.[25] Por ejemplo, la empresa sueca Iexplore desarrolló una aplicación para predecir la dislexia con base en el seguimiento del movimiento de los ojos de los niños. Se están diseñando otrasparecidas para identificar el autismo y el déficit de atención con el uso de robots sociales.
[24]El aprovechamiento de la mayor parte de las aplicaciones educativas desarrolladas a partir de las nuevas capacidades tecnológicas de la IA supone condiciones de acceso a dispositivos y conexión a internet que permitan un trabajo individual y personalizado con los recursos digitales. Esto implica que todos los alumnos dispongan de una computadora portátil o una tableta (propia o del centro educativo) para realizar las actividades pertinentes y que las escuelas dispongan de internet de alta velocidad para garantizar el trabajo fluido de cientos de alumnos simultáneamente. Si bien cabría suponer que en el mediano plazo es posible que estas condiciones se tornan habituales en los sistemas escolares de los países desarrollados, se requerirán de todas maneras inversiones importantes en infraestructura digital durante los próximos años, incluso en naciones avanzadas en esta materia como Estados Unidos.
El proyecto sobre la inteligencia artificial y los futuros del aprendizaje se apoya en la Recomendación sobre la Ética de la Inteligencia Artificial que se aprobará durante la 41ª Reunión de la Conferencia General de la UNESCO, y dará seguimiento a las recomendaciones que contiene el próximo informe mundial titulado “Reimagining our futures together: A new social contract for education” (Replantear juntos nuestros futuros: nuevo contrato social para la educación), que será publicado en noviembre de 2021.[25] El proyecto se pondrá en marcha en el marco del Consenso de Beijing sobre la Inteligencia Artificial en la Educación y la Estrategia de la UNESCO sobre la innovación tecnológica en la educación.
IV. Desarrollo
En la figura 4 se observa una tabla de comparación de algunas de las universidades del mundo, que han utilizado las máquinas de aprendizaje como una herramienta educativa para predecir futuras acciones de sus estudiantes, con el fin de mejorar su rendimiento académico o de predecir sus retiro o su futuro desempeño en la institución.
Fig. 4. Tabla Comparativa de Algoritmos
Universidad Autónoma de Chihuahua
En México es de gran importancia la educación de nivel superior ya que se necesitan profesionistas para alcanzar un mayor desarrollo, sin embargo no todos los estudiantes logran terminar su carrera. Se han realizado sistemas de predicción para pronosticar deserción o bajo rendimiento en los alumnos en general, pero no se identifican a los alumnos de nuevo ingreso con bajo rendimiento para otorgarles atención personalizada, y de esta manera ayudarles a terminar su carrera, es por eso que mediante la minería de datos se realizó un sistema de predicción basado en algoritmos de regresión que arrojan información sobre los estudiantes de nuevo ingreso de la Universidad Tecnológica de Chihuahua con mayor probabilidad de fracasar en su primer cuatrimestre [26]. 
Universidad Tecnológica Nacional
En Buenos Aires, Argentina Urteaga y Siri [27] demostraron que los estudiantes con mayores tasas de acceso a los materiales de un LMS obtenían mejores notas. Utilizaron datos obtenidos de un curso semipresencial, mediante un plugin de captura en Moodle y un modelo de regresión y concluyeron que el promedio de ingresos semanales al sistema y el de tareas completadas eran buenos predictores del desempeño general, también analizaron interacciones con árboles de decisión, Bayes ingenuo y k-nearest neighbors (k-NN) y observaron que los primeros tenían en su caso mayor poder predictivo del desempeño.Urteaga y Siri aplicaron 21 clasificadores a la actividad en Moodle de estudiantes de siete cursos para estudiar el rendimiento de distintas técnicas y concluyeron que no existe una mejor que el resto en todos los casos.
Politecnico Colombiano Jaime Isaza Cadavid
La deserción estudiantil es una realidad en el país y es un fenómeno complejo por ende fue necesaria la realización de un modelo predictivo que sirve como apoyo a las Universidades colombianas para el análisis de la deserción en estudiantes, principalmente, en programas de pregrado en modalidad virtual. Un modelo predictivo que puede ayudar a las organizaciones a generar ganancias y evitar pérdidas futuras, tomando datos históricos y con ellos arrojar resultados esperados para ser analizados y apoyar en las decisiones. Este modelo se desarrolla, tomando eventos históricos con distintas variables de tipo social, académico, personal, laboral, ingresos a las plataformas e-learning, etc. y posteriormente, a estas variables se le aplican algoritmos de regresión lógica. Se espera la predicción de probabilidades de deserción de cada estudiante, posteriormente, con esta información se puede alertar y aplicar medidas preventivas tempranas con la población estudiantil [28].
Escuela Superior Politécnica de Chimborazo
En el 2015,[29] Katherine demuestra que la minería de datos se orienta a la presentación prospectiva de información, y para ello, es necesario escoger un algoritmo apropiado que ofrezca los mejores resultados, según el tipo de datos: Árbol de Decisión y Regresión Logística, aplicados a los datos continuos y discretos generados por la función académica de una institución de educación superior. Se buscó determinar el algoritmo con el mejor desempeño a través del uso del método científico y técnicas de estadística descriptiva e inferencial, y los resultados presentan que: no existe una diferencia significativa en el uso de RAM de los algoritmos, el algoritmo de Árbol de Decisión tiene menor tiempo de respuesta, y mayor precisión que el de Regresión Logística, mientras que este último tiene un mejor uso de CPU, concluyendo que el algoritmo de Árbol de Decisión es el de mejor desempeño para el escenario planteado.
Institución de Educación Superior Chilena
Con este programa se busca vincular el mundo de la educación superior con la enseñanza media al promover que estudiantes de último año de educación secundaria realicen una serie de cursos y talleres con el propósito de que estén mejor preparados social y académicamente para su ingreso a la educación superior. Específicamente, se evaluó el efecto del programa en los resultados académicos de estudiantes que, habiendo participado de esta iniciativa durante 2016 mientras eran estudiantes secundarios, se matriculan en 2017 en la institución organizadora de esta práctica. Se utilizó la metodología cuasi-experimental Propensity Score Matching a través de los algoritmos vecino más cercano y regresión ajustada para comprar resultados académicos entre estudiantes beneficiarios del programa matriculados en la institución evaluada (Grupo Tratamiento) y estudiantes de los mismos programas de estudio de éstos que no participaron de la iniciativa evaluada (Grupo Control). Como medidas de resultados académicos se utilizaron el promedio general de notas y la proporción general de asistencia a clases de los estudiantes durante el primer semestre de 2017 y un indicador que estimaba si el estudiante continuó estudiando en la institución durante 2018. Los resultados indican que el programa tiene un impacto positivo y estadísticamente significativo tanto en los promedios de notas como en los niveles de asistencia de los estudiantes. Sin embargo, no se observan diferencias significativas en los niveles de retención al comparar beneficiarios y no beneficiarios de éste [30].
Universidad del Bio-Bio Concepción 
Actualmente, la detección de alumnos que puedan desertar un programa de estudios es un tema relevante para las universidades. La deserción se define de distintas formas, sin embargo, todos los estudios convergen en que para que un alumno deserte de un plan de estudios se deben combinar varias variables. Se presenta una comparación de indicadores de rendimiento del modelo de deserción actual de la Universidad del Bío-Bío, el cual está basado en la técnica de regresión logística y se compara con un nuevo modelo basado en árboles de decisión. El nuevo modelo se obtiene a través de metodologías de minería de datos y fue implementado a travésde la herramienta SAP Predictive Analytics. Para entrenar, validar y aplicar el modelo se utilizaron datos reales de las bases de datos de la UBB. La comparación demuestra que el modelo propuesto obtiene una exactitud del 86%, una precisión del 97% con un porcentaje de error del 14% en la predicción de la deserción estudiantil, muy superior al valor actual que entrega el modelo basado en regresión logística. Posteriormente, el modelo de predicción obtenido fue optimizado considerando otras variables logrando mejorar los indicadores de predicción. Las instituciones de educación superior deberían tomar en consideración las variables que más explican el fenómeno de la deserción estudiantil para mejorar la retención de sus estudiantes [31]. 
Fig. 5. Algoritmos utilizados en instituciones analizadas 
En la figura 5. Se describe la cantidad de algoritmos usados por las diferentes instituciones de educación superior, podemos evidenciar que el algoritmo que más se usó fue el de Regresión lógica que fue utilizado 6 veces por las instituciones, seguido de el algoritmo de Árbol de decisión que fue usado 3 veces por las instituciones y el algoritmo que menos fue utilizado por las instituciones fue el algoritmo de vecinos cercanos que solo se utilizo una vez.
Fig. 6. Porcentaje de Algoritmos
En la figura 6. Se describe el porcentaje de uso de los tres algoritmos, donde se evidencia que el 60 % de las universidades investigadas utilizan regresión lineal en sus modelos de aprendizaje.
Fig. 7. Finalidad de los Algoritmos
En la figura 7. Se encuentra la información respecto a la finalidad de los algoritmos de aprendizaje, dichas finalidades son: indicadores académicos, desempeño académico y deserción de estudiantes. Se observa que la finalidad con mayor uso tuvo una cantidad de 3 y fue deserción de estudiantes. 
V. Conclusión
Los medios de enseñanza siguen evolucionando a pasos agigantados, es por eso que hoy en día se habla de las máquinas de aprendizaje como una de las herramientas con mayor impacto en la educación. Estas permiten crear sistemas con el fin de analizar productividad y tomar decisiones de forma efectiva.
Luego de investigar y analizar algunas de las universidades e instituciones que usaron las máquinas de aprendizaje en la educación, se puede concluir que esta herramienta es utilizada para predecir futuras acciones de sus estudiantes como: la deserción, el desempeño o el ingreso de estudiantes a la institución (dependiendo de una población y ciertas calificaciones).
Los algoritmos de regresión lógica que utilizan variables booleanas, son los más utilizados para los modelos de educación por su eficacia y simplicidad, ya que tienen un tiempo de respuesta efectivo para el análisis de datos. Adicional a esto, no es necesario disponer de grandes recursos computacionales, ya que es un algoritmo que aprende de manera sencilla, tanto en entrenamiento como en ejecución. De igual forma, los resultados son altamente interpretables, siendo esta una de sus principales ventajas respecto a otros tipos de algoritmos. 
Referencias
[1] M. C. Alberto, (2019, septiembre). “Utilización del machine learning en la industria 4.0-Universidad Valladolid,” Máster en Ingeniería. [En línea] pp.27 -- 37. Disponible:https://core.ac.uk/download/pdf/228074134.pdf
[2] C. M. Javier, A. G. Manuel, R. G, Daniel (2018).“Machine learning, una pieza clave en la transformación de los negocios” Management Solution Making things happen, servicio profesional de consultoría. [En línea]. pp.6—17.Disponible:https://www.managementsolutions.com/sites/default/files/publicaciones/esp/machine-learning.pdf
[3] T. Eugenia ,(2017, Octubre).“5 Herramientas de Machine Learning en la educación,”Enseñanza, Recursos y Herramientas e-learning masters. [En linea].Disponible:http://elearningmasters.galileo.edu/2017/10/26/5-herramientas-de-machine-learning-en-la-educacion/
[4] D. C Enrique ,(2020, Noviembre).“Machine Learning: ¿El futuro de la educación?,” Aulaplaneta innovamos para una educación mejor. [En línea].Disponible:https://www.aulaplaneta.com/2020/10/29/recursos-tic/machine-learning-el-futuro-de-la-educacion/
[5] El Naqa I, Murphy MJ (2015, Octubre). “¿Qué es el aprendizaje automático?”. [En línea]. Disponible: https://doi.org/10.1007/978-3-319-
18305-3_1
[6] G. Carleo ,(2019, Diciembre).“Aprendizaje automático y ciencias físicas''. Disponible:https://journals.aps.org/rmp/abstract/10.1103/RevM
odPhys.91.045002.
[7] A. Valdez ,(2018, Mayo). “Introducción al aprendizaje de máquina”. [En línea]. Disponible: https://www.researchgate.net/publication/338518560
_INTRODUCCION_AL_MACHINE_LEARNING.
[8] M. Fuentes, W. Medina, (2021, Abril). “Diseño de un modelo predictivo-asistencial de pacientes infectados por covid-19, mediante un modelo supervisado de Machine Learning basado en criterios de derivación hospitalaria o ambulatoria ”. [En línea]. Disponible: http://repositorio.ug.edu.ec/handle/redug/52650
[9] F. Medina ,(2021, Abril). “¿Las máquinas aprenden?: Conoce los tipos de machine learning ''.[En línea]. Disponible: https://www.crehana.com/
ar/blog/desarrollo-web/tipos-de-machine-learning/
[10] J. Zambrano, (2018, marzo). ¿Aprendizaje supervisado o no supervisado? Conoce sus diferencias dentro del machine learning y la automatización inteligente. [En línea]. Disponible: https://medium.com/@juanzambrano/aprendizaje-supervisado-o-no-supervisado-39ccf1fd6e7b
[11] B. Romero ,(2020, Octubre).“Una introducción a los modelos Machine Learning''.[En línea]. Disponible: https://repositorioinstitucional.buap.m
x/handle/20.500.12371/10527
[12] M. Fuentes, W. Medina, (2021, Abril). “Diseño de un modelo predictivo-asistencial de pacientes infectados por covid-19, mediante un modelo supervisado de Machine Learning basado en criterios de derivación hospitalaria o ambulatoria ”. [En línea]. Disponible: http://repositorio.ug.edu.ec/handle/redug/52650
[13] D. Alba, J. Calle. (2020). Aplicación de técnicas de machine Learning Basado en información sísmica para Profundizar la probabilidad de Terremotos mediante el uso De regresión logística y Redes neuronales. [En línea]. Disponible: http://repositorio.ug.edu.ec/bitstream/redug/4886
2/1/B-CISC-PTG-1717%20Alba%20Vega%20Daniel%20Alejandro%20-%20Calle%20Jara%20Javier%20Fernando.pdf#page=48&zoom=100,148,805
[14] T. Lee. (2018). A machine learning (kNN) approach to predicting global seafloor total organic carbon. Global Biogeochemical Cycles, 1, 10.. [En línea]. Disponible: https://agupubs.onlinelibrary.wiley.com/doi/full/10.1
029/2018GB005992
[15] L. González. (2019). K Vecinos más Cercanos – Teoría. [En línea]. Disponible: https://aprendeia.com/k-vecinos-mas-cercanos-teoria-machi
ne-learning/
[16] P. de los Santos. (2017). “Tipos de aprendizaje en Machine Learning: Supervisado y no supervisado” [En línea]. Disponible: https://empresas.
blogthinkbig.com/que-algoritmo-elegir-en-ml-aprendizaje/
[17] N. Rodriguez. (2020). “Los métodos de aprendizaje automático supervisado en la clasificación textual según el grado de especialización” [En línea]. Disponible: https://www.researchgate.net/pu
blication/326403259_Los_metodos_de_aprendizaje_automatico_supervisado_en_la_clasificacion_textual_segun_el_grado_de_especializacion
[18] J. Martinez. (2020). ¿Clasificación o Regresión? [En línea]. Disponible: https://www.iartificial.net/clasificacion-o-regresion/
[19] E. Carballo, (2020, Febrero). “Educación y Machine Learning: La puerta de entrada a un nuevo paradigma ”. [En línea]. Disponible: http://www.educa.org.do/wp-content/uploads/2017/07/Nota-de-trabajo-EDUCA-No-35.pdf
[20] Montero Carlo, Breve Historia de la Inteligencia Artificial párrafo 4 [En línea]. Disponible en:  http://www.cs.us.es/~fsancho/?e=221
[21] J. Cardenas, El machine learning a través de los tiempos, y los aportes a la humanidad: [En línea]. Hoja 4 Disponible en:  https://repository.unilibre.edu.co/bitstream/handle/10901/17289/EL%20MACHINE%20LEARNING.pdf?sequence=1&isAllowed=y
[22] Anali Quintos, DESARROLLO DE LA INTELIGENCIA ARTIFICIAL A LO LARGODEL TIEMPO [En línea]. Parrafo 5, Disponible en:  https://forum.huawei.com/enterprise/es/desarrollo-de-la-inteligencia-artificial-a-lo-largo-del-tiempo/thread/736751-100757
[23] Banco Interamericano de Desarrollo (BID). 2016. Uruguay: Implementación de un sistema de monitoreo en analíticas de aprendizaje y tutorías virtuales (UR-T1143). Documento de Cooperación Técnica. 
[24] J. Cabero, (1996, Febrero) Nuevas Tecnologías, Comunicación Y Educación Universidad de Sevilla Edutec. núm. 1 [Revista Electrónica de Tecnología Educativa] disponible en www.uib.es/depart/dcweb/ revelec1.htlm [consultado enero 10, 2001].
[25] M. Erika, (2021, Marzo), “Inter American Development Bank Usos y efectos de la inteligencia artificial en educación”. [En línea]. https://redcl
ade.org/wp-content/uploads/BID-estudio-Erika6.pdf
[26] D. Jose, (2016, Diciembre), “Desarrollo de sistemas de predicción con regresión del desempeño académico de alumnos de nuevo ingreso en universidades tecnológicas”. [En línea].http://repositorio.uach.mx/122/1
/Tesis%20Jos%C3%A9%20Alfredo%20De%20La%20Cruz%20 Nava
.pdf
[27] U. Ignacio, S. Laura, (2020, Febrero), “Predicción temprana de deserción mediante aprendizaje automático en cursos profesionales en linea”. [En línea]. https://www.redalyc.org/journal/3314/331463171008/
html/
[28] M. Julio, (2020, Abril), “Propuesta de un modelo predictivo utilizando aprendizaje profundo para el análisis de deserción estudiantil en universidades colombianas virtuales”. Politecnico Colombiano Jaime Isaza Cadavid. [En línea]. Disponible:https://www.iudigital.edu.co/Revis
tadeInvestigacion/Articulos/Ver%20Art%C3%ADculo%206.pdf 
[29] G. Katherine, (2015, Septiembre), “Desempeño de algoritmos de minería en indicadores académicos: Árbol de decisión y regresión logística”. Escuela Superior Politécnica de Chimborazo [En línea]. Disponible: http://scielo.sld.cu/scielo.php?script=sci_arttext&pid=S2227
-18992015000400008
[30] V. Muggli, I. Juan, (2019), “Impacto de programa propedéutico en la progresión académica de estudiantes chilenos de educación superior”. Universidad Tecnológica de Panamá [En línea]. Disponible: https://ridd
a2.utp.ac.pa/handle/123456789/5619
[31] P. Alfredo, E. Elizabeth, C. Monica, V. Gilba (2018, Febrero), “Análisis comparativo de técnicas de predicción para determinar la deserción estudiantil: Regresión lógica vs Árboles de decisión”. Universidad de Bio-Bio Concepcion. [En línea]. Disponible: https://dsi.face.ubiobio.cl/
mcaniupan/pdfs/desercion_cam_ready.pdf

Continuar navegando