Datamining

¿Qué es Datamining?

El Datamining, también conocido como minería de datos o minado de datos en territorio español, es un conjunto de técnicas que se realizan para explorar bases de datos de tamaño considerable, indagar entre ficheros y archivos de programas o estadísticas de forma automática, o semimanual con la intención de encontrar algún tipo de patrón o información no disponible a simple vista para el usuario medio. La realización de esta serie de procesos es algo que suele implicar el uso de conocimientos de estadística o incluso la elaboración y aprovechamiento de algoritmos especializados en la búsqueda para encontrar la información deseada. En los últimos años, además, con el auge de la inteligencia artificial, la programación se ha especializado de tal manera que ya ha sido capaz de crear varias IA con la que realizar datamining en determinados sectores. Dar una definición general sobre este concepto es complicado, sobre todo a la hora de hablar de su puesta en marcha, ya que hay tantas variantes como casos posibles. Por lo general, sí que se pueden determinar cuatro fases concretas que se aplican en mayor o menor medida a la hora de hablar de minería de datos: determinar los objetivos, procesado previo de los datos, determinar el modelo a emplear, analizar resultados. A partir de esos cuatro puntos básicos, podemos encontrar miles de manifestaciones diferentes de datamining. Hay casos en los que se realiza de forma manual, cotejando y repasando ficheros uno por uno; mientras que en otros, sobre todo cuando se trabaja con grandes volúmenes de datos (veáse, Big Data), lo habitual es que se recurra a complejos algoritmos o incluso a las citadas IA.