Logo Studenta

DeportesyDataMining

Esta es una vista previa del archivo. Inicie sesión para ver el archivo original

Deportes y Data Mining 
Por: Pedro Univaso 
Resumen 
El análisis de datos se está convirtiendo en un aspecto central de 
los deportes profesionales. Deportes como el tenis han 
comenzado a utilizar los datos como una nueva fuente de ingresos 
para servir a las empresas de pantalla y juegos de azar. Los datos 
fueron la materia prima para el análisis y aprendizaje automático y 
de la misma manera que se están convirtiendo en el más valioso 
activo en el mundo digital, se están convirtiendo en un aspecto 
importante del deporte. 
Las organizaciones deportivas tienen montañas de datos en bruto, 
y cada vez hay más disponibles. Esta información ahora se puede 
usar para generar valor en todos los aspectos de su organización, 
desde la venta de más boletos hasta la prevención de lesiones en 
los jugadores. El Data Mining permite a estas organizaciones 
aplicar inteligencia artificial y aprendizaje automático para 
potenciar las percepciones y las decisiones tanto dentro como 
fuera del campo. 
 
 
 
 
 
 
 
 
 
 
Algunas ventajas del Data Mining aplicado a los deportes [1] 
 
 
Fútbol: análisis de datos y deportes electrónicos 
Los datos en el fútbol se están extendiendo a todos los aspectos del 
negocio. A nivel de jugadores, se usa para tomar decisiones sobre 
entrenamiento, nutrición y lesiones; pero también para evaluar el 
rendimiento de los jugadores y su valor potencial en el mercado. 
Los datos de los jugadores también son una aportación a los deportes de 
fantasía, un negocio en crecimiento donde la gente creó sus propios 
equipos virtuales y el desempeño de los jugadores reales en el equipo 
virtual determinó el rendimiento del equipo. Los datos también están 
siendo relevantes para analizar equipos y los algoritmos de aprendizaje 
automático utilizaron la posición y la velocidad de cada jugador en el 
campo y la pelota varias veces por segundo para estimar las probabilidades 
de anotar y recomendar cambios en la posición de los jugadores para 
aumentar esta probabilidad. 
En el aspecto comercial, los datos sobre el comportamiento de los fanáticos también son 
valiosos, desde comportamiento antes, durante y después del juego, en base a las respuestas 
de los fanáticos que van al estadio e interactúan en las redes sociales a las tasas de conversión 
e impacto en el valor de los paquetes de patrocinio. 
De acuerdo al Dr. Antonio Dávila [2], profesor del IESE, el equipo de gestión de Boca también 
está evaluando los deportes electrónicos. Fue el de más rápido crecimiento de mercado en la 
industria del deporte. Originalmente, y aun siendo su corriente principal, los deportes 
electrónicos eran sobre juegos digitales como Dota2, League of Legends o Fortnite. Sin 
embargo, los deportes tradicionales han comenzado a crear sus propias versiones digitales. 
MotoGP, campeonato mundial de motociclismo ahora organizó un campeonato digital de 
motos. El juego digital FIFA de Electronic Arts fue un éxito de ventas con más de 260 millones 
vendidos, 24 millones solo en 2018. Algunos equipos profesionales habían creado sus propios 
equipos digitales para competir en las ligas electrónicas creadas recientemente con la 
expectativa de crear un nuevo flujo de ingresos. En 2018, Boca creó una unidad de negocios de 
deportes electrónicos y firmó un contrato exclusivo con Konami, la compañía de juegos con 
títulos que incluyen Pro Evolution Soccer. Ya en 2019, la asociación organizó torneos 
deportivos para los hinchas de Boca. 
Luis Carlos Molina, en su ponencia “Torturando los datos hasta que confiesen” [3], presenta el 
sistema inteligente para prevenir lesiones que utiliza el AC de Milán. Desde el 2014 el club usa 
redes neuronales para prevenir lesiones y optimizar el acondicionamiento de cada atleta. Esto 
ayudará a seleccionar el fichaje de un posible jugador o a alertar al médico del equipo de una 
posible lesión. El sistema, creado por Computer Associates International, es alimentado por 
datos de cada jugador, relacionados con su rendimiento, alimentación y respuesta a estímulos 
externos, que se obtienen y analizan cada quince días. El jugador lleva a cabo determinadas 
actividades que son monitoreadas por veinticuatro sensores conectados al cuerpo y que 
transmiten señales de radio que posteriormente son almacenadas en una base de datos. 
Actualmente el sistema dispone de 5.000 casos registrados que permiten predecir alguna 
posible lesión. Con ello, el club intenta ahorrar dinero evitando comprar jugadores que 
presenten una alta probabilidad de lesión, lo que haría incluso renegociar su contrato. Por otra 
parte, el sistema pretende encontrar las diferencias entre las lesiones de atletas de ambos 
sexos, así como saber si una determinada lesión se relaciona con el estilo de juego de un país 
concreto donde se practica el fútbol. 
 
Béisbol: no sólo estadísticas del juego 
La industria del deporte se ha enfrentado a una explosión en la amplitud y 
profundidad de los datos disponibles de las fuentes como Statcast, HITf/x, 
PITCHf/x, FIELDf/x, seguimiento de jugadores y tecnologías portátiles, por 
nombrar solo un pequeño subconjunto. Los propietarios y entrenadores 
tienen acceso a datos, desde promedios de bateo, velocidad de salida, 
distancia de HomeRun, historial de jugadores, condiciones climáticas, 
estadísticas de lanzamiento, desgloses de rendimiento, seguimiento de 
jugadores en tiempo real y más. Además, las organizaciones deportivas 
también tienen datos sobre los fanáticos, venta de entradas y empleados de 
la organización, todo lo cual es de una calidad mucho más alta que nunca 
debido a la capacidad de controlar los factores de incertidumbre y 
aleatoriedad. 
 
Big Data: ¿el nuevo esteroide del tenis? 
Así titula en su blog Raghav Radhakrishnan [4] la 
nueva visión del tenis profesional. Atrás 
quedaron los días en que los entrenadores solían 
sentarse y recopilar información durante un 
partido en vivo y luego buscaban patrones e 
ideas en los datos que podrían ayudarlos a tomar 
mejores decisiones para futuros partidos. Hoy en 
día, los entrenadores tienen los dos ingredientes 
básicos para el análisis deportivo: datos 
fácilmente disponibles recopilados de diversas 
fuentes y herramientas que pueden procesar y analizar grandes cantidades de datos. 
SlamTracker de IBM es una de esas herramientas que mejora las posibilidades de ganar de los 
jugadores al señalar tres acciones clave que se deben tomar. Este análisis se realiza en base a 
41 millones de puntos de datos recopilados de cada partido con datos de 8128 partidos, un 
cálculo simple nos da una enorme cifra de 333,248,000,000 puntos de datos en términos de 
porcentaje de servicio, puntos, velocidad de servicio, puntajes, ganador, duración , tipos de 
jugadores, superficie, etc. 
IBM recopila datos de múltiples maneras, comenzando por los árbitros que actualizan un PDA 
portátil llamado "Chump", que está conectado a la red de IBM, a los 48 analistas de tenis que 
se colocan alrededor de la cancha en varias posiciones para registrar y alimentar manualmente 
datos en la nube de IBM. Además de analizar estos datos, la herramienta también analiza el 
sentimiento de las personas en el estadio y en todo el mundo, utilizando técnicas de 
procesamiento de lenguaje en Facebook y Twitter. La herramienta luego crea un ranking de 
líderes sociales. 
Los datos también se comparten con los medios en tiempo real, usando pantallas táctiles que 
muestran todos los datos / estadísticas del partido junto con varias vistas, para ayudar a los 
periodistas a elaborar artículos. Esto no termina aquí. Va más allá al predecir el tráfico para el 
sitio web respectivo, como el "Abierto de Australia", basado en el conocimiento en las redes 
sociales, blogs, Twitter, etc. y luego el sistema aumenta la capacidad del sitio web si descubre 
que el tráfico aumentará. 
Similar al IBM SlamTracker, SAP en colaboración con la Asociación
de Tenis Femenino (WTA) 
desarrolló una herramienta que proporciona a las jugadoras y entrenadoras un análisis 
posterior al partido de las variaciones en la técnica y el rendimiento. 
 
La academia y el basquetbol 
Las opciones de los que toman decisiones en un 
equipo de basquet no se limitan a las estrategias 
que se adoptarán durante los juegos. Los más 
importantes están fuera del campo y se refieren a 
la composición del equipo y a los jugadores 
talentosos y productivos para adquirir en los que el 
equipo puede confiar para elevar su nivel de juego. 
En el trabajo presentado en la Conferencia 
Internacional de Inteligencia Computacional y sus Aplicaciones en 2018, los investigadores de 
la Escuela Nacional Superior en Informática de Argelia [5] propusieron utilizar tareas de 
minería de datos para mejorar la toma de decisiones de los responsables del equipo de 
manera de lograr resultados apropiados que conduzcan a la mejora del rendimiento de sus 
jugadores y su equipo. Tareas como clustering o agrupamiento, clasificación y regresión se 
proponen para detectar las debilidades de un equipo; cuáles son los mejores jugadores que 
pueden ayudar a superar estas debilidades; y hasta para predecir el rendimiento y los salarios 
de los jugadores. Para ello emplearon un conjunto de datos de la NBA. 
En el 2012 una alumna de la Universidad Tecnológica de Dublin [6] propone en su tesis de 
maestría el uso de diferentes herramientas de Data Mining para predecir el resultado de los 
partidos de 5 temporadas de la NBA, logrando una precisión del 70% con el clasificador 
SimpleLogistic. 
 
 
 
Tendencias en los deportes 
A pesar que el análisis de datos ha involucrado a casi todos los deportes, el uso de 
herramientas de Data Mining, que permitan predecir situaciones o extraer información oculta 
para los humanos, sólo está siendo empleada en pocas disciplinas. 
Shumaker, Solieman y Chen en su libro Sports Data Mining [7], editado en el 2010, analizan el 
campo de aplicación actual de las herramientas de Data Mining en 6 deportes: béisbol, 
basquetbol, cricket, fútbol americano, hockey y fútbol. Mientras que otros deportes donde 
comienzan a aparecer trabajos de investigación son en el bowling y en algunas especialidades 
olímpicas. 
El actual resurgimiento de las redes neuronales profundas y el multimedia Data Mining (audio, 
video, imágenes) permitirán incursionar en nuevas aplicaciones que seguirán incrementando el 
rendimiento de los atletas, de los equipos y de los negocios relacionados de las más diversas 
disciplinas deportivas. 
 
Referencias 
[1] Sports. En www.datarobot.com/solutions/sports/. Consultado el 28/12/2019. 
[2] Antonio Davila (2019). Club Atlético Boca Juniors: Adapting to the New World of Football. 
IESE Business School, Universidad de Navarra. 
[3] Luis Carlos Molina (2000). Torturando los datos hasta que confiesen. Departamento de 
Lenguajes y Sistemas Informáticos. 
[4] Raghav Radhakrishnan (2015). Big Data: the new steroid of tennis. En www.bigdata-
madesimple.com/big-data-a-new-steroid-in-tennis/. Consultado el 28/12/2019. 
[5] Hamdad, L., Benatchba, K., Belkham, F., & Cherairi, N. (2018, May). Basketball Analytics. 
Data Mining for Acquiring Performances. In IFIP International Conference on Computational 
Intelligence and Its Applications (pp. 13-24). Springer, Cham. 
[6] Cao, C. (2012). Sports data mining technology used in basketball outcome prediction. 
[7] Schumaker, R. P., Solieman, O. K., & Chen, H. (2010). Sports data mining (Vol. 26). Springer 
Science & Business Media.

Continuar navegando

Materiales relacionados

29 pag.
Juegos reducidos

SIN SIGLA

User badge image

Anderson Aguilar Peñuela

17 pag.
document - 2023-09-06T004624 916

SIN SIGLA

User badge image

alejandra demontes de oca

7 pag.