viernes, 18 de marzo de 2011

Data Mining y los Deportes

Como hoy es viernes y termina la semana laboral para algunos voy a relacionar el tema del día de hoy con los deportes.  Cuando empece a buscar algunos ejemplos de empresas que se encargan de prácticar DATA MINING, para poder entender las aplicaciones y las implicaciones de esta actividad, esta situación es lo que en el ámbito cotidiano se conoce por algunas personas como el manejo de las estadísticas.

Por ejemplo en la NBA utilizando el software de Data Mining llamado Advanced Scout de IBM al momento preparar un juego, un entrenador puede revisar rápidamente un sin número de Estadísticas: disparos, intentos de disparo, tapones, asistencias, faltas personales, etc... Pero Advanced Scout también puede detectar patrones en estas estadísticas que un entrenador no necesariamente puede saber. Así que durante un juego, un entrenador puede saber exactamente quien juega más eficaz, con que los jugadores se acompaña mejor y bajo qué circunstancias. Esto lo denominamos "atributo de enfoque" y se encuentra condicionado a rangos de atributos donde las distribuciones difieren de la norma.

Para entender mejor este concepto, podemos ver un análisis de los datos de un juego entre los Knicks de Nueva York y los Hornets de Charlotte que reveló que cuando " Glenn Rice, juega en la posición de escolta, su efectividad se incrementa a 6/5 (83%) en rebotes capturados y encestados. "

A través de minería de datos, Advanced Scout identificado un cierto jugador (Rice), jugando en una posición determinada (escolta), efectividad en tiro (83%), en un determinado tipo de tiro (rebotes capturados y encestados). Advanced Scout no sólo encuentra este patrón, sino que señala que es interesante, ya que difiere considerablemente de la media de porcentaje de tiro del 54% de los Charlotte Hornets en ese juego. Esta información hace que se puedan redifinir estrategias rápidamente.

Y esto se realizaba por el año 1998, nunca antes mejor dicho, el siglo pasado.

Muchos de nosotros cuando vemos un juego de cualquier deporte vemos que nos colocan datos que como los recibimos aisladamente, no nos generan valor agregado, ej. Velocidad de lanzamiento, Distancia en Tiro, etc. Es la combinación de múltiples de estos datos la que genera las predicciones.

Y por cierto soy fanatico de los Lakers y los Heats.

No hay comentarios: