Cada vez se
genera más información y se hace más fácil el acceso masivo a la misma (existen
grandes cantidades de bases de datos on-line) Ej. Transacciones
Bancarias, Internet y la Web, Redes Sociales, Informaciones Científicas.
La
tecnología es barata y los sistemas de gestión de las bases de datos son
capaces de trabajar con cantidades masivas de datos (terabytres). Y estos
datos contienen información útil “Conocimiento”, sin embargo necesitamos
extraer información de datos para convertirla en conocimiento, y que
adicionalmente esta información tenga las siguientes características:
a. Rapidez
y Confiabilidad.
b.
Capacidad de Modelización y escalabilidad.
c.
Explicación e Interpretación de los resultados (Visualización).
Por ejemplo,
Walmart captura transacciones de 2900 tiendas en 6 países. Esta información se
acumula en una base de datos masiva de 7,5 terabytes. Walmart permite que
más de 3500 proveedores accedan a los datos relativos a sus productos para
realizar distintos análisis. Así pueden identificar clientes, patrones de
compras, compras cruzadas, etc. En el año 2009, Walmart Computers proceso
más de 16 millones de consultas complejas o combinadas.
Qué
diferencias hay entre información, datos y conocimiento, bueno se utilizan
indistintamente de manera informal y en algunas culturas reciben diferentes
matices, Información y Datos suelen referirse a información genérica carente de
propósito, aunque datos suele referir a evidencias. Mientras Conocimiento
es más subjetivo, depende de las intenciones de cuál sea el objetivo del
aprendizaje, debe ser inteligible para el que aprende o necesita del
aprendizaje.
Y que es el
aprendizaje, es el mejoramiento del conocimiento a partir de la experiencia, lo
cual va generando identificación de patrones, eliminación de redundancia lleva
a la comprensión de la información y culmina en lo que se define como
Inteligencia.

La unión de
estas dos variables que son el Aprendizaje Automático a través de la extracción
automática de conocimiento y las Bases de Datos con características de
asociación entre sus diferentes datos y sus algoritmos escalables derivo en lo
que hoy día se conoce como Minería de Datos o Data Mining.
No hay comentarios:
Publicar un comentario