Archivos de Autor: Juan Alfonso

UDIMA investiga en Informática Biomédica

La Medicina es un dominio en el que la Informática desempeña un papel cada vez más relevante. En el ámbito médico surgen infinidad de datos, en particular, relacionados con los pacientes atendidos, que puede ser interesante analizar en busca de conocimiento oculto. Dichos datos pueden abarcar desde los resultados de una analítica, hasta registros de un electroencefalograma, pasando por imágenes obtenidas con algún método de radiodiagnóstico.

Exploraciones como el electroencefalograma o el electrocardiograma generan series de tiempo iconográficas que no son sencillas de analizar. Dichas series contienen fragmentos de especial interés para los expertos, denominados eventos. La localización automática de esos eventos y su posterior análisis ha despertado el interés de varios investigadores de Udima que, en los últimos años, han propuesto un marco para la extracción de conocimiento en series temporales médicas que contienen eventos interesantes para los médicos. Entre dichos investigadores se encuentran el prof. Juan Alfonso Lara (cuya tesis doctoral supuso el comienzo de esta investigación) y el prof. David Lizcano.

Las investigaciones realizadas han dado sus frutos en forma de resultados, que muy pronto, bajo el título de «A General Framework for Time Series Data Mining based on Event Analysis«, verán la luz en forma de artículo científico publicado por la prestigiosa revista Journal of Biomedical Informatics. Se da la circunstancia de que esa revista está dirigida por Edward («Ted») H. Shortliffe, creador, a principios de la década de 1970, de MYCIN, uno de los primeros sistemas expertos desarrollados.

Los resultados obtenidos permitirán crear modelos de referencia de pacientes, que podrán ser integrados como parte de sistemas de apoyo a la decisión en medicina, especialmente en lo que se refiere al diagnóstico de patologías que tienen reflejo en las series temporales iconográficas analizadas.

Modelización conceptual de datos complejos con UML para la minería de datos

En entradas anteriores de este blog, se han abordado diferentes temas relacionados con “Data Mining”, que en castellano se traduce como “Minería de Datos”. Se trata de una disciplina informática que estudia grandes volúmenes de datos para extraer conocimiento útil a partir de ellos.

Data Mining ofrece grandes ventajas ya que puede ser aplicada casi a cualquier dominio de conocimiento. Sin embargo, cada vez son más los dominios en los que surgen datos con una estructura muy compleja y, por tanto, se necesitan nuevos enfoques a la hora de extraer conocimiento a partir de ellos. En dichos dominios, cada objeto a analizar puede no estar representado por una simple tabla de atributos, sino que la información relativa a dicho objeto puede llegar a estar compuesta por un conjunto muy amplio de datos relacionados entre sí, aumentando así la dificultad del análisis.

Antes de realizar ese análisis se hace cada vez más necesario modelizar los datos para tener una correcta comprensión, almacenamiento y posterior tratamiento de los mismos.

Para abordar este problema, investigadores de la UDIMA han propuesto una extensión de UML que permite representar un conjunto cualquiera de datos estructuralmente complejos organizados de forma jerárquica. La modelización conceptual facilita la comprensibilidad de los datos por parte del humano y es el punto de partida que permite automatizar otras tareas de análisis de datos como la comparación de individuos o la creación de modelos de referencia.

La propuesta descrita se ha aplicado sobre datos estructuralmente complejos procedentes del área de la estabilometría, una disciplina médica que estudia el equilibrio de los seres humanos. Los resultados de esta investigación han sido verdaderamente satisfactorios.

Esta investigación ha dado lugar a un artículo en el journal «Information and Software Technologies» (IST) de Elsevier, uno de los de mayor impacto en su área. El artículo, llevado a cabo por los profesores de Udima Juan Alfonso Lara, David Lizcano y María Aurora Martínez puede consultarse en este enlace.

Data Mining: Aplicaciones y Responsabilidad

El término «Data Mining», que en castellano se traduce como «Minería de Datos», hace referencia a una disciplina informática que estudia grandes volúmenes de datos para extraer conocimiento útil a partir de ellos. Data Mining ofrece grandes ventajas ya que puede ser aplicada casi a cualquier dominio de conocimiento.

Una de las aplicaciones más prometedoras de Data Mining es el análisis de datos sísmicos para poder predecir la ocurrencia de terremotos. Los sismógrafos recogen información sobre la actividad sísmica de cada región a lo largo del tiempo, dando lugar a series temporales. El análisis de dichas series con técnicas de Data Mining puede ayudar a prever la aparición de un seísmo, de la actividad previa a un seísmo o de las réplicas de éste. Efectivamente, en este sentido hay diferentes informaciones y propuestas como las que se muestran a continuación:

aepia.aic.uniovi.es/revista/index.php/aia/article/view/925/748

http://primamerica.blogspot.com.es/2007/12/sismologia-en-chile-y-data-mining.html

Hasta aquí, la entrada al blog se limita a una aportación técnica de interés. Sin embargo, el motivo de traer esta información ahora viene al caso porque en los últimos días siete científicos italianos han sido condenados por un juez a seis años de cárcel por no predecir el seísmo de L’Aquila, que se llevó por delante la vida de más de 300 personas (Enlace a la noticia). Con casi total certeza estos científicos utilizaban herramientas informáticas (probablemente de Data Mining) de predicción de seísmos que, claro está, no funcionaron, ya que los científicos calificaron como «mínimo» el riesgo de los posibles temblores que a la postre resultaron devastadores.

La tecnología juega un papel fundamental en nuestras vidas, pero a veces puede conducir a situaciones de confusión como la ocurrida en Italia. ¿Hasta qué punto nos debemos fiar de la tecnología y en particular del conocimiento extraído mediante técnicas de Data Mining? ¿Quién es responsable de las técnicas propuestas cuando éstas fallan? ¿Es responsabilidad de quien las usa o de quien las propone?

Kaggle: Haciendo que Data Mining se convierta en un deporte

La Mineria de Datos (Data Mining) comprende un conjunto de técnicas y algoritmos que persiguen la extracción de conocimiento útil a partir de grandes volúmenes de datos. Data Mining se emplea en una gran cantidad de dominios para lograr una mejor comprensión de éstos, para mejorar los procesos de las empresas, para gestionar la relación con los clientes, etc.

Normalmente, las compañías suelen acudir a equipos de ingenieros de Data Mining para que éstos les ayuden a resolver algún problema mediante el análisis de datos. Las compañías entregan datos a los ingenieros y éstos los analizan y generan unos resultados que se entregan a las compañías. Todo ello por una importante suma de dinero.

Esta visión del Data Mining parece estar evolucionando, en gran parte gracias a iniciativas como la propuesta por Kaggle, una plataforma online para realizar competiciones de Data Mining. La plataforma proporciona un repositorio para que las compañías publiquen sus datos. A partir de ahí, comienza un concurso abierto para que los expertos en Data Mining de todo el mundo descarguen esos datos y propongan soluciones a los problemas de la compañía en cuestión. La mejor solución se hace con un premio que puede rondar varios millones de dólares.

Gracias a este tipo de competiciones, se han resuelto problemas relacionados con el descubrimiento de nuevos entes en el universo, la predicción de la probabilidad de accidente de los asegurados de una compañía de seguros, etc. Además Kaggle constitutye un importante punto de encuentro entre los expertos en diferentes áreas.

La gran idea de Kaggle ha conseguido atraer a grandes inversores procedentes de compañías como PayPal o Google y ha hecho aumentar su valor en más de 11 millones de dólares en las últimas semanas.

Actualmente se encuentra abierto un concurso para analizar datos médicos con el objetivo de ayudar a reducir gastos innecesarios de billones de dólares en hospitalizaciones innecesarias. El premio, para quién esté pensando en participar, es de 3 millones de dólares.