Cada vez se
genera más información y se hace más fácil el acceso masivo a la misma (existen
grandes cantidades de bases de datos on-line) Ej. Transacciones
Bancarias, Internet y la Web, Redes Sociales, Informaciones Científicas.
La
tecnología es barata y los sistemas de gestión de las bases de datos son
capaces de trabajar con cantidades masivas de datos (terabytres). Y estos
datos contienen información útil “Conocimiento”, sin embargo necesitamos
extraer información de datos para convertirla en conocimiento, y que
adicionalmente esta información tenga las siguientes características:
a. Rapidez
y Confiabilidad.
b.
Capacidad de Modelización y escalabilidad.
c.
Explicación e Interpretación de los resultados (Visualización).
Por ejemplo,
Walmart captura transacciones de 2900 tiendas en 6 países. Esta información se
acumula en una base de datos masiva de 7,5 terabytes. Walmart permite que
más de 3500 proveedores accedan a los datos relativos a sus productos para
realizar distintos análisis. Así pueden identificar clientes, patrones de
compras, compras cruzadas, etc. En el año 2009, Walmart Computers proceso
más de 16 millones de consultas complejas o combinadas.
Qué
diferencias hay entre información, datos y conocimiento, bueno se utilizan
indistintamente de manera informal y en algunas culturas reciben diferentes
matices, Información y Datos suelen referirse a información genérica carente de
propósito, aunque datos suele referir a evidencias. Mientras Conocimiento
es más subjetivo, depende de las intenciones de cuál sea el objetivo del
aprendizaje, debe ser inteligible para el que aprende o necesita del
aprendizaje.
Y que es el
aprendizaje, es el mejoramiento del conocimiento a partir de la experiencia, lo
cual va generando identificación de patrones, eliminación de redundancia lleva
a la comprensión de la información y culmina en lo que se define como
Inteligencia.
Esta ha
sido la combinación necesaria mediante la cual se han fundamentado la
Estadística como base para la predicción de comportamientos, el reconocimiento
de Patrones y la Inteligencia Artificial, basada en la convergencia de
estadística aplicada con ingeniería de sistemas. Esto degenero en el
aprendizaje automático y las Redes Neuronales, basada en la aparición de modelos
flexibles.
La unión de
estas dos variables que son el Aprendizaje Automático a través de la extracción
automática de conocimiento y las Bases de Datos con características de
asociación entre sus diferentes datos y sus algoritmos escalables derivo en lo
que hoy día se conoce como Minería de Datos o Data Mining.
No hay comentarios:
Publicar un comentario