Archivos por Etiqueta: Data Mining

Data Mining: Aplicaciones y Responsabilidad

El término «Data Mining», que en castellano se traduce como «Minería de Datos», hace referencia a una disciplina informática que estudia grandes volúmenes de datos para extraer conocimiento útil a partir de ellos. Data Mining ofrece grandes ventajas ya que puede ser aplicada casi a cualquier dominio de conocimiento.

Una de las aplicaciones más prometedoras de Data Mining es el análisis de datos sísmicos para poder predecir la ocurrencia de terremotos. Los sismógrafos recogen información sobre la actividad sísmica de cada región a lo largo del tiempo, dando lugar a series temporales. El análisis de dichas series con técnicas de Data Mining puede ayudar a prever la aparición de un seísmo, de la actividad previa a un seísmo o de las réplicas de éste. Efectivamente, en este sentido hay diferentes informaciones y propuestas como las que se muestran a continuación:

aepia.aic.uniovi.es/revista/index.php/aia/article/view/925/748

http://primamerica.blogspot.com.es/2007/12/sismologia-en-chile-y-data-mining.html

Hasta aquí, la entrada al blog se limita a una aportación técnica de interés. Sin embargo, el motivo de traer esta información ahora viene al caso porque en los últimos días siete científicos italianos han sido condenados por un juez a seis años de cárcel por no predecir el seísmo de L’Aquila, que se llevó por delante la vida de más de 300 personas (Enlace a la noticia). Con casi total certeza estos científicos utilizaban herramientas informáticas (probablemente de Data Mining) de predicción de seísmos que, claro está, no funcionaron, ya que los científicos calificaron como «mínimo» el riesgo de los posibles temblores que a la postre resultaron devastadores.

La tecnología juega un papel fundamental en nuestras vidas, pero a veces puede conducir a situaciones de confusión como la ocurrida en Italia. ¿Hasta qué punto nos debemos fiar de la tecnología y en particular del conocimiento extraído mediante técnicas de Data Mining? ¿Quién es responsable de las técnicas propuestas cuando éstas fallan? ¿Es responsabilidad de quien las usa o de quien las propone?

Kaggle: Haciendo que Data Mining se convierta en un deporte

La Mineria de Datos (Data Mining) comprende un conjunto de técnicas y algoritmos que persiguen la extracción de conocimiento útil a partir de grandes volúmenes de datos. Data Mining se emplea en una gran cantidad de dominios para lograr una mejor comprensión de éstos, para mejorar los procesos de las empresas, para gestionar la relación con los clientes, etc.

Normalmente, las compañías suelen acudir a equipos de ingenieros de Data Mining para que éstos les ayuden a resolver algún problema mediante el análisis de datos. Las compañías entregan datos a los ingenieros y éstos los analizan y generan unos resultados que se entregan a las compañías. Todo ello por una importante suma de dinero.

Esta visión del Data Mining parece estar evolucionando, en gran parte gracias a iniciativas como la propuesta por Kaggle, una plataforma online para realizar competiciones de Data Mining. La plataforma proporciona un repositorio para que las compañías publiquen sus datos. A partir de ahí, comienza un concurso abierto para que los expertos en Data Mining de todo el mundo descarguen esos datos y propongan soluciones a los problemas de la compañía en cuestión. La mejor solución se hace con un premio que puede rondar varios millones de dólares.

Gracias a este tipo de competiciones, se han resuelto problemas relacionados con el descubrimiento de nuevos entes en el universo, la predicción de la probabilidad de accidente de los asegurados de una compañía de seguros, etc. Además Kaggle constitutye un importante punto de encuentro entre los expertos en diferentes áreas.

La gran idea de Kaggle ha conseguido atraer a grandes inversores procedentes de compañías como PayPal o Google y ha hecho aumentar su valor en más de 11 millones de dólares en las últimas semanas.

Actualmente se encuentra abierto un concurso para analizar datos médicos con el objetivo de ayudar a reducir gastos innecesarios de billones de dólares en hospitalizaciones innecesarias. El premio, para quién esté pensando en participar, es de 3 millones de dólares.