Mineração de dados
Origem: Wikipédia, a enciclopédia livre.
Mineração de dados ou Data Mining é o processo de varrer grandes bases de dados a procura de padrões como regras de associação, sequências temporais, para classificação de ítens ou agrupamento (clustering). Esse é um tópico recente em Ciência da computação mas utiliza várias técnicas da Estatística, Recuperação de informação, Inteligência artificial e reconhecimento de padrões.
Mineração de dados é uma etapa de um processo conhecido como extração de conhecimento em bases de dados ou Knowledge-Discovery in Databases (KDD).
São exemplos de técnicas de mineração de dados: regras de associação, clustering, algoritmo genético, árvores de decisão e outras.
[editar] Ligações Externas
- Mineração de dados no Open Directory Project
- Programa de Mineração de Dados, Universidade da Florida Central
- Lista de pessoas em projetos de mineração de dados
- Diretório de Mineração de Dados
- Tutoriais e recursos em mineração de dados
- Tutoriais de Andrew Moore da Universidade de Carnegie Mellon
[editar] Software
- Enterprise Miner, ferramenta de data mining do SAS
- IlliMine Projeto de mineração de dados escrito em C++.
- InfoCodex Aplicação de mineração de dados com uma base de dados linguística.
- KDB2000 Uma ferramenta livre em C++ que integra acesso à bases de dados, pre-processamento, técnicas de transformação e um vasto escopo de algoritmos de mineração de dados.
- KXEN Ferramenta de mineração de dados comercial, utiliza conceitos do Profesor Vladimir Vapnik como Minimização de Risco Estruturada (Structured Risk Minimization ou SRM) e outros.
- KNIME Plataforma de mineração de dados aberta que implementa o paradigma de pipelining de dados. Baseada no
- LingPipe API em Java para mineração em textos distribuída com código-fonte.
- MDR Ferramenta livre em Java para detecção de interações entre atributos utilizando o método da multifactor dimensionality reduction (MDR).
- Orange Tookit livre em Python para mineração de dados e aprendizado de máquina.
- Pimiento Um ambiente para mineração em textos baseado em Java.
- Tanagra Software livre de mineração de dados e estatística.
- WEKA Software livre em java para mineração de dados.