A
continuación se describen varios ejemplos donde se ha visto involucrado el data
mining. Se han seleccionado de diversos dominios y con diversos objetivos para
observar su potencial. Respecto a los modelos inteligentes, se ha comprobado
que en ellos se utilizan principalmente árboles y reglas de decisión, reglas de
asociación, redes neuronales, redes bayesianas, conjuntos aproximados (rough
sets), algoritmos de agrupación (clustering), máquinas de soporte vectorial,
algoritmos genéticos y lógica difusa.
En
el gobierno
El FBI
analiza las bases de datos comerciales para detectar terroristas.
A
principios del mes de julio de 2002, el director del Federal Bureau of
Investigation (FBI), John Aschcroft, anunció que el Departamento de Justicia
comenzará a introducirse en la vasta cantidad de datos comerciales referentes a
los hábitos y preferencias de compra de los consumidores, con el fin de
descubrir potenciales terroristas antes de que ejecuten una acción. Algunos expertos
aseguran que, con esta información, el FBI unirá todas las bases de datos
probablemente mediante el número de la Seguridad Social y permitirá saber si
una persona fuma, qué talla y tipo de ropa usa, su registro de arrestos, su
salario, las revistas a las que está suscrito, su altura y peso, sus
contribuciones a la Iglesia, grupos políticos u organizaciones no
gubernamentales, sus enfermedades crónicas (como diabetes o asma), los libros
que lee, los productos de supermercado que compra, si tomó clases de vuelo o si
tiene cuentas de banco abiertas, entre otros. La inversión inicial rondo los
setenta millones de dólares estadounidenses para consolidar los almacenes de
datos, desarrollar redes de seguridad para compartir información e implementar
nuevo software analítico y de visualización.
En la empresa
Detección
de fraudes en las tarjetas de crédito.
En 2001,
las instituciones financieras a escala mundial perdieron más de 2.000 millones
de dólares estadounidenses en fraudes con tarjetas de crédito y débito. El
Falcon Fraud Manager es un sistema inteligente que examina transacciones,
propietarios de tarjetas y datos financieros para detectar y mitigar fraudes.
En un principio estaba pensado, en instituciones financieras de Norteamérica, para
detectar fraudes en tarjetas de crédito. Sin embargo, actualmente se le han
incorporado funcionalidades de análisis en las tarjetas comerciales, de
combustibles y de débito. El sistema Falcon ha permitido ahorrar más de
seiscientos millones de dólares estadounidenses cada año y protege
aproximadamente más de cuatrocientos cincuenta millones de pagos con tarjeta en
todo el mundo –aproximadamente el sesenta y cinco por ciento de todas las
transacciones con tarjeta de crédito.
Descubriendo
el porqué de la deserción de clientes de una compañía operadora de telefonía
móvil.
Este
estudio fue desarrollado en una operadora española que básicamente situó sus
objetivos en dos puntos: el análisis del perfil de los clientes que se dan de
baja y la predicción del comportamiento de sus nuevos clientes. Se analizaron
los diferentes históricos de clientes que habían abandonado la operadora
(12,6%) y de clientes que continuaban con su servicio (87,4%). También se
analizaron las variables personales de cada cliente (estado civil, edad, sexo,
nacionalidad, etc.). De igual forma se estudiaron, para cada cliente, la
morosidad, la frecuencia y el horario de uso del servicio, los descuentos y el
porcentaje de llamadas locales, interprovinciales, internacionales y gratuitas.
Al contrario de lo que se podría pensar, los clientes que abandonaban la
operadora generaban ganancias para la empresa; sin embargo, una de las
conclusiones más importantes radicó en el hecho de que los clientes que se
daban de baja recibían pocas promociones y registraban un mayor número de
incidencias respecto a la media. De esta forma se recomendó a la operadora
hacer un estudio sobre sus ofertas y analizar profundamente las incidencias
recibidas por esos clientes. Al descubrir el perfil que presentaban, la
operadora tuvo que diseñar un trato más personalizado para sus clientes
actuales con esas características. Para poder predecir el comportamiento de sus
nuevos clientes se diseñó un sistema de predicción basado en la cantidad de
datos que se podía obtener de los nuevos clientes comparados con el
comportamiento de clientes anteriores.
Prediciendo
el tamaño de las audiencias televisivas.
La British
Broadcasting Corporation (BBC) del Reino Unido emplea un sistema para predecir
el tamaño de las audiencias televisivas para un programa propuesto, así como el
tiempo óptimo de exhibición. El sistema utiliza redes
neuronales y árboles de decisión aplicados a datos históricos de la cadena para
determinar los criterios que participan según el programa que hay que
presentar. La versión final se desempeña tan bien como un experto humano con
la ventaja de que se adapta más fácilmente a los cambios porque es
constantemente reentrenada con datos actuales.
En
la universidad
Conociendo
si los recién graduados de una universidad llevan a cabo actividades
profesionales relacionadas con sus estudios.
Se hizo un
estudio sobre los recién graduados de la carrera de Ingeniería en Sistemas
Computacionales del Instituto Tecnológico de Chihuahua II, en Méjico. Se quería observar si estos se insertaban en actividades
profesionales relacionadas con sus estudios y, en caso negativo, se buscaba
saber el perfil que caracterizó a los ex-alumnos durante su estancia en la
universidad. El objetivo era saber si con los planes de estudio de la
universidad y el aprovechamiento del alumno se hacía una buena inserción
laboral o si existían otras variables que participaban en el proceso. Dentro de
la información considerada estaba el sexo, la edad, la escuela de procedencia,
el desempeño académico, la zona económica donde tenía su vivienda y la
actividad profesional, entre otras variables. Mediante la aplicación de
conjuntos aproximados se descubrió que existían cuatro variables que
determinaban la adecuada inserción laboral, que son citadas de acuerdo con su
importancia: zona económica donde habitaba el estudiante, colegio de donde
provenía, nota al ingresar y promedio final al salir de la carrera. A partir de
estos resultados, la universidad tendrá que hacer un estudio socioeconómico
sobre grupos de alumnos que pertenecían a las clases económicas bajas para dar
posibles soluciones, debido a que tres de las cuatro variables no dependían de
la universidad.
No hay comentarios:
Publicar un comentario