Data Mining, Mineria de Datos,Rules,ReglasDescripción completa
Descripción: wy5r
Descripción completa
Descripción: Estrategias Mercadeo Mineria de datos
Mineria de Datos PresentacionDescripción completa
Libro de Mineria de datosDescripción completa
Libro de Mineria de datosDescripción completa
Minería de DatosDescripción completa
TareaDescripción completa
nmhgDescripción completa
mineria de datosDescripción completa
Descripción completa
lecturaFull description
lecturaDescripción completa
TÈCNICAS DE MINERIA DE DATOS
La Minería de Datos (DM) por las siglas en ingles Data Mining es el proceso de extraer conocimiento útil y comprensible, previamente desconocido, desde grandes cantidades de datos almacenados en distintos formatos. Las herramientas de Data Mining predicen futuras tendencias y comportamientos, permitiendo en los negocios la toma de decisiones. ASOCIACIONES
Las reglas de asociación se utilizan para descubrir hechos que ocurren en común dentro 1 de un determinado conjunto de datos. datos. Se han investigado ampliamente diversos métodos para aprendizaje de reglas de asociación que han resultado ser muy interesantes para descubrir relaciones entre variables en grandes conjuntos de datos. 2
Piatetsky-Shapir o describe el análisis y la presentación de reglas 'fuertes' descubiertas en bases de datos utilizando diferentes medidas de interés. Basado en el concepto de 3 al. presentaron un trabajo en el que indicaban las reglas de regla fuerte, Agrawal et al. asociación que descubrían las relaciones entre los datos recopilados a gran escala en los sistemas de terminales de punto de venta de unos supermercados. Por ejemplo, la siguiente regla:
TECNICAS
Redes neuronales.- Son un paradigma de aprendizaje y procesamiento automático inspirado en la forma en que funciona el sistema nervioso de los animales. Se trata de un sistema de interconexión de neuronas en una red que colabora para producir un estímulo de salida. Algunos ejemplos de red neuronal son: El Perceptrón. o El Perceptrón multicapa. o
o
Los Mapas Auto organizados, también conocidos como redes de Kohonen.
Regresión lineal .- Es la más utilizada para formar relaciones entre datos. Rápida y eficaz pero insuficiente en espacios multidimensionales donde puedan relacionarse más de 2 variables.
Árboles de decisión .- Un árbol de decisión es un modelo de predicción utilizado en el ámbito de la inteligencia artificial, dada una base de datos se construyen estos diagramas de construcciones lógicas, muy similares a los sistemas de predicción basados en reglas, que sirven para representar y categorizar una serie de condiciones que suceden de forma sucesiva, para la resolución de un problema. Ejemplos: Algoritmo ID3. o Algoritmo C4.5. o
Modelos estadísticos.- Es una expresión simbólica en forma de igualdad o ecuación que se emplea en todos los diseños experimentales y en la regresión para indicar los diferentes factores que modifican la variable de respuesta.
Agrupamiento o Clustering.- Es un procedimiento de agrupación de una serie de vectores según criterios habitualmente de distancia; se tratará de disponer los vectores de entrada de forma que estén más cercanos aquellos que tengan características comunes. Ejemplos: Algoritmo K-means. o Algoritmo K-medoids. o
Reglas de asociación.- Se utilizan para descubrir hechos que ocurren en común dentro de un determinado conjunto de datos.
Según el objetivo del análisis de los datos, los algoritmos utilizados se clasifican en supervisados y no supervisados (Weiss y Indurkhya, 1998):
Algoritmos supervisados (o predictivos): predicen un dato (o un conjunto de ellos) desconocido a priori, a partir de otros conocidos. Algoritmos no supervisados (o del descubrimiento del conocimiento): se descubren patrones y tendencias en los datos.
EJEMPLO: COMPORTAMIENTO EN INTERNET También es un área en boga el del análisis del comportamiento de los visitantes — sobre todo, cuando son clientes potenciales — en una página de Internet. O la utilización de la información —obtenida por medios más o menos legítimos — sobre ellos para ofrecerles propaganda adaptada específicamente a su perfil. O para, una vez que adquieren un determinado producto, saber inmediatamente qué otro ofrecerle teniendo en cuenta la información histórica disponible acerca de los clientes que han comprado el primero
Pronóstico: cálculo de las ventas y predicción de las cargas del servidor o del tiempo de inactividad del servidor. Agrupación: distribución de clientes o eventos en grupos de elementos relacionados, y análisis y predicción de afinidades.