martes, 29 de mayo de 2012

El Mundo de la Informacion y sus problemas


Cada vez se genera más información y se hace más fácil el acceso masivo a la misma (existen grandes cantidades de bases de datos on-line) Ej.  Transacciones Bancarias, Internet y la Web, Redes Sociales, Informaciones Científicas.

La tecnología es barata y los sistemas de gestión de las bases de datos son capaces de trabajar con cantidades masivas de datos (terabytres).  Y estos datos contienen información útil “Conocimiento”, sin embargo necesitamos extraer información de datos para convertirla en conocimiento, y que adicionalmente esta información tenga las siguientes características:

a. Rapidez y Confiabilidad.
b. Capacidad de Modelización y escalabilidad.
c. Explicación e Interpretación de los resultados (Visualización).

Por ejemplo, Walmart captura transacciones de 2900 tiendas en 6 países. Esta información se acumula en una base de datos masiva de 7,5 terabytes.  Walmart permite que más de 3500 proveedores accedan a los datos relativos a sus productos para realizar distintos análisis. Así pueden identificar clientes, patrones de compras, compras cruzadas, etc.  En el año 2009, Walmart Computers proceso más de 16 millones de consultas complejas o combinadas.

Qué diferencias hay entre información, datos y conocimiento, bueno se utilizan indistintamente de manera informal y en algunas culturas reciben diferentes matices, Información y Datos suelen referirse a información genérica carente de propósito, aunque datos suele referir a evidencias.  Mientras Conocimiento es más subjetivo, depende de las intenciones de cuál sea el objetivo del aprendizaje, debe ser inteligible para el que aprende o necesita del aprendizaje.

Y que es el aprendizaje, es el mejoramiento del conocimiento a partir de la experiencia, lo cual va generando identificación de patrones, eliminación de redundancia lleva a la comprensión de la información y culmina en lo que se define como Inteligencia.

Esta ha sido la combinación necesaria mediante la cual se han fundamentado la Estadística como base para la predicción de comportamientos, el reconocimiento de Patrones y la Inteligencia Artificial, basada en la convergencia de estadística aplicada con ingeniería de sistemas.  Esto degenero en el aprendizaje automático y las Redes Neuronales, basada en la aparición de modelos flexibles.

La unión de estas dos variables que son el Aprendizaje Automático a través de la extracción automática de conocimiento y las Bases de Datos con características de asociación entre sus diferentes datos y sus algoritmos escalables derivo en lo que hoy día se conoce como Minería de Datos o Data Mining.

No hay comentarios: