Estudios
recientes indican que el ochenta por ciento de la información de una compañía
está almacenada en forma de documentos. Sin duda, este campo de estudio es muy
vasto, por lo que técnicas como la categorización de texto, el procesamiento de
lenguaje natural, la extracción y recuperación de la información o el
aprendizaje automático, entre otras, apoyan al text mining (minería de texto).
En ocasiones se confunde el text mining con la recuperación de la información
(Information Retrieval o IR) (Hearst, 1999). Ésta última consiste en la
recuperación automática de documentos relevantes mediante indexaciones de
textos, clasificación, categorización, etc. Generalmente se utilizan palabras
clave para encontrar una página relevante. En cambio, el text mining se refiere
a examinar una colección de documentos y descubrir información no contenida en
ningún documento individual de la colección; en otras palabras, trata de
obtener información sin haber partido de algo (Nasukawa y otros, 2001).
Una
aplicación muy popular del text mining es relatada en Hearst (1999). Don
Swanson intenta extraer información derivada de colecciones de texto. Teniendo
en cuenta que los expertos sólo pueden leer una pequeña parte de lo que se
publica en su campo, por lo general no se dan cuenta de los nuevos desarrollos
que se suceden en otros campos. Así, Swanson ha demostrado cómo cadenas de
implicaciones causales dentro de la literatura médica pueden conducir a hipótesis
para enfermedades poco frecuentes, algunas de las cuales han recibido pruebas
de soporte experimental. Investigando las causas de la migraña, dicho
investigador extrajo varias piezas de evidencia a partir de títulos de
artículos presentes en la literatura biomédica. Algunas de esas claves fueron:
El estrés
está asociado con la migraña.
El estrés
puede conducir a la pérdida de magnesio.
Los
bloqueadores de canales de calcio previenen algunas migrañas.
El magnesio
es un bloqueador natural del canal de calcio.
La
depresión cortical diseminada (DCD) está implicada en algunas migrañas.
Los niveles
altos de magnesio inhiben la DCD.
Los
pacientes con migraña tienen una alta agregación plaquetaria.
Estas
claves sugieren que la deficiencia de magnesio podría representar un papel en
algunos tipos de migraña, una hipótesis que no existía en la literatura y que
Swanson encontró mediante esas ligas. De acuerdo con Swanson (Swanson y otros,
1994), estudios posteriores han probado experimentalmente esta hipótesis
obtenida por text mining con buenos resultados.
No hay comentarios:
Publicar un comentario