En entradas anteriores de este blog, se han abordado diferentes temas relacionados con “Data Mining”, que en castellano se traduce como “Minería de Datos”. Se trata de una disciplina informática que estudia grandes volúmenes de datos para extraer conocimiento útil a partir de ellos.
Data Mining ofrece grandes ventajas ya que puede ser aplicada casi a cualquier dominio de conocimiento. Sin embargo, cada vez son más los dominios en los que surgen datos con una estructura muy compleja y, por tanto, se necesitan nuevos enfoques a la hora de extraer conocimiento a partir de ellos. En dichos dominios, cada objeto a analizar puede no estar representado por una simple tabla de atributos, sino que la información relativa a dicho objeto puede llegar a estar compuesta por un conjunto muy amplio de datos relacionados entre sí, aumentando así la dificultad del análisis.
Antes de realizar ese análisis se hace cada vez más necesario modelizar los datos para tener una correcta comprensión, almacenamiento y posterior tratamiento de los mismos.
Para abordar este problema, investigadores de la UDIMA han propuesto una extensión de UML que permite representar un conjunto cualquiera de datos estructuralmente complejos organizados de forma jerárquica. La modelización conceptual facilita la comprensibilidad de los datos por parte del humano y es el punto de partida que permite automatizar otras tareas de análisis de datos como la comparación de individuos o la creación de modelos de referencia.
La propuesta descrita se ha aplicado sobre datos estructuralmente complejos procedentes del área de la estabilometría, una disciplina médica que estudia el equilibrio de los seres humanos. Los resultados de esta investigación han sido verdaderamente satisfactorios.
Esta investigación ha dado lugar a un artículo en el journal «Information and Software Technologies» (IST) de Elsevier, uno de los de mayor impacto en su área. El artículo, llevado a cabo por los profesores de Udima Juan Alfonso Lara, David Lizcano y María Aurora Martínez puede consultarse en este enlace.