Download as ppt, pdf, or txt
Download as ppt, pdf, or txt
You are on page 1of 35

http://www.erphowtos.

com/sap-business-
objects/40-sap-business-objects-40-
demos.html

SEMINARIO: S.I.
Ponencia: Data Warehouse

Carlos Martín García (cmartingarcia@telefonica.net)

Diego de la Cruz López (dcruzlopez@yahoo.com)


Índice
• Objetivos del Seminario

• Evolución de los sistemas y justificación de los DW

• ¿Qué es un Data Warehouse?

• Arquitectura conceptual de un Data Warehouse

• Modelado de Datos y Ejemplos de Extracción

• Herramientas de extracción de datos: Data Mining

• Documentación

• Conclusiones

Seminario - Data Warehouse


Página 2 de 35
Introducción: objetivos del seminario

• Entender el significado del Data Warehouse

• Poner un poco de orden en el significado de las siglas Data Warehouse, Data


mining y Business Inteligent

• Repasar las distintas alternativas que existen para abordar la construcción de


Data Warehouse

• Finalizar con los factores de éxito, los beneficios que aporta y los errores a
evitar

Poner claridad en unas siglas que vamos a oír


cada día mas, y el porqué de esta tendencia.

Seminario - Data Warehouse


Página 3 de 35
Índice
• Objetivos del Seminario

• Evolución de los sistemas y justificación de los DW

• ¿Qué es un Data Warehouse?

• Arquitectura conceptual de un Data Warehouse

• Modelado de Datos y Ejemplos de Extracción

• Herramientas de extracción de datos: Data Mining

• Documentación

• Conclusiones

Seminario - Data Warehouse


Página 4 de 35
Evolución de los sistemas y justificación de los DW

• Los SI de las compañías responden a sus necesidades prioritarias


– Hasta 1990 las compañías necesitaban automatizar sus proceso
 Se crean grandes sistemas transaccionales donde quedan recogidas todas las
operaciones
 Enfocados a procesos estáticos, conocidos y de complejidad media
 Sus datos: se modifican constantemente, están orientados al proceso y se
organizan intentando optimizar la eficiencia (Normalización elevada)
 El volumen de transacciones es elevado
 Ej. Sistema de ventas y facturación
– En los últimos años surgen nuevas necesidades / requerimientos diferentes a la
automatización de procesos como: Sistemas de apoyo a la gestión y a la dirección
 Se crean sistemas de apoyo a la toma de decisión
 Los procesos son a petición, dinámico, complejo (Ej. Un análisis)
 Sus datos: deben mantenerse, enriquecerse y completarse
 El volumen de transacciones es muy bajo
 Ej. Sistema de análisis de las ventas, crédito scoring
Seminario - Data Warehouse
Página 5 de 35
Evolución de los sistemas y justificación de los DW

• Comparando los sistemas transaccionales vs los sistemas de gestión por


algunas de sus características encontramos:

Sistemas Transaccionales Típicos Sistemas de Gestión y Dirección


E – Contratos – Análisis de mercado, de las
J – Pedidos, Facturación y
ventas
– Análisis de tendencias
E Ventas
– Evolución de los costes
M – Apuntes Contables VS – Segmentaciones
– Alertas
P – Movimientos y
– Credit Scoring
Transacciones bancarias
L – Compras y
– Cuadros de Mando Integral
O aprovisionamiento
– MIS o EIS
– Rentabilidad dinámica de
S – Peticiones periódicas clientes
– Propensiones...

Seminario - Data Warehouse


Página 6 de 35
Evolución de los sistemas y justificación de los DW

• (Cont.)
Sistemas Transaccionales Típicos Sistemas de Gestión y Dirección

E – Al Proceso, al núcleo del – Al Análisis, la consulta, al


negocio, que es estático conocimiento. Actividades sin
N caminos preestablecidos,
– Sus datos se modelan
F intentando optimizar VS
variantes
– Sus datos deben modelarse
O actualizaciones e optimizando su lectura y
insercciones por múltiples
Q usuarios. Datos Dinámicos
análisis. Los datos se
incrementan no se borran
U – Sus BD son muy penalizadas – Requieren consultas muy
E por consultas cruzadas,
complejas
pesadas, cruzadas,… exigen
una parametrización
especifica de la BD

Sistemas Transaccionales Típicos Sistemas de Gestión y Dirección


U
SUA – Operadores, personal de – Directivos, gestores,

RIO front - office, ingresados de VS trabajadores del conocimiento


datos,... y ANALISTAS

Seminario - Data Warehouse


Página 7 de 35
Evolución de los sistemas y justificación de los DW

• Hechos actuales que favorecen la aparición del DW


Sistemas Era de la
Transaccionales información
No pueden ser
Conducen a Diseñar e
interrumpidos, ni Implantar sistemas de apoyo a Tener mas información,
penalizados, enfocados antes,.. En formato
al proceso y la
la decisión compresible y utilizable
eficiencia. Extraer es una de las tácticas de
información de gestión los nuevos estrategas
tiene un coste elevado

DW
Usuarios Competición
Aparición de usuarios
que trabajan en la El DW permite ser
extracción de Mejora 4 ejes: rentabilidad, proactivo, decidir,
conclusiones a partir de anticipar en función
la información:
tiempo en desarrollo de de la información
trabajador del productos, innovación y disponible..
conocimiento, analistas
personalización a clientes.

Seminario - Data Warehouse


Página 8 de 35
Índice
• Objetivos del Seminario

• Evolución de los sistemas y justificación de los DW

• ¿Qué es un Data Warehouse?

• Arquitectura conceptual de un Data Warehouse

• Modelado de Datos y Ejemplos de Extracción

• Herramientas de extracción de datos: Data Mining

• Documentación

• Conclusiones

Seminario - Data Warehouse


Página 9 de 35
¿Qué es un Data Warehouse?

• Definición tradicional de Data Warehouse por Bill Inmon

El Data Warehouse es una colección de datos


orientados al tema, integrados, no volátiles e
historiados, organizados para el apoyo de un proceso
de ayuda a la decisión

• Atributos:
– Datos Orientados al tema: se estructuran por temas de interés para la empresa
 Los sistemas transaccionales organizan datos en función al proceso funcional
 Los Data Mart son “mini” Data Warehouse enfocados a un único tema
– Integrados: un dato tiene un significado único, independientemente del
departamento o punto de vista que lo consulte
 Ej. el estado de un cliente es lo mismo para marketing, facturación que dirección
 Esto obliga a la unificación del dato
– No volátiles e historiados: los datos no son actualizados por actualizaciones, por lo
que una consulta realizada tres meses después dará idéntico resultado
Seminario - Data Warehouse
Página 10 de 35
¿Qué es un Data Warehouse?

• Data Warehouse = mejorar o facilitar el proceso de toma de decisiones


empresariales
– Si tengo mejor información, que no datos, que mi competencia mis directivos
podrán tomar mejores decisiones.

• Se soporta en un conjunto de herramientas destinadas a potenciar el


almacenamiento, acceso y análisis de los datos
– Soportan o apoyan una variedad enorme de labores
 Dirección: información de gestión
 Marketing: segmentaciones, análisis de promociones, …
 Otros: “crédito scoring”, “círculos de calidad”, “innovación de producto”,...
Áreas
Propósito Modo Base
afectados
La abundancia de
Mejorar y A través de la mejora Marketing
datos no es
facilitar la toma en el acceso, información, hasta que Sistemas
de decisiones exploración y análisis se ordenan y se
empresariales de la información Dirección
proprocionan
corporativa y externa adecuadamente
Seminario - Data Warehouse
Página 11 de 35
Índice
• Objetivos del Seminario

• Evolución de los sistemas y justificación de los DW

• ¿Qué es un Data Warehouse?

• Arquitectura conceptual de un Data Warehouse

• Modelado de Datos y Ejemplos de Extracción

• Herramientas de extracción de datos: Data Mining

• Documentación

• Conclusiones

Seminario - Data Warehouse


Página 12 de 35
Arquitectura Conceptual de un Data Warehouse
• La visión global de los componentes de un DW:

FUENTES DE PROCESOS E. T. C ALMACEN DE DATOS SISTEMA EXPLOTACIÓN


DATOS HERR. USUARIO
E. T . C
EXTRACCIÓN
TRANSFORMACIÓN
CARGA DATA
Query &
SISTEMA Reporting
WAREHOUSE
TRANSAC-
DW
CIONAL
OLAP,
EIS,
BSC

OTRAS
FUENTES
EXTERNAS
METADATO Data Mining

Otras:
alarmas,
notificaciones

Seminario - Data Warehouse


Página 13 de 35
Arquitectura Conceptual de un Data Warehouse

• Construir un DW empieza por identificar las necesidades de información actuales y


previsibles, de los potenciales usuarios.

FUENTES DE DATOS ETC DW HERR. USUARIO


EXTRACCIÓN Query & Reporting
TRANSFORMACIÓN
BD TR. CALCULO DW OLAP, EIS
CMando
BD Ext. Metadato Data Mining

¿Qué información es necesaria para tomar las mejores decisiones de negocio?


Responder implica:
– Identificar dentro de las BD Corporativas (en general provenientes de los
Sistemas Transaccionales) los datos interesantes desde el punto de vista de
análisis de la información.
–Ej. BD de ventas, organización interna, estructura comercial, ...
– Identificar BD externas con las que podemos enriquecer la información de la
organización.
–Ej. Datos demográficos, resumen de datos macroecómicos,…
– Se tendrá que elegir entre distintas BD y no contemplar otras.
–Realizar esta tarea requiere conocer los objetivos estratégicos del DW. Ej. Mejor
seguimiento de ventas, de las promociones, gestión óptima de stock,..
Seminario - Data Warehouse
Página 14 de 35
Arquitectura Conceptual de un Data Warehouse

• Los procesos de extracción, transformación, enriquecimiento y carga de los datos


en el DW; permiten “copiar - mover” los datos de las fuentes de datos al DW
FUENTES DE DATOS ETC DW HERR. USUARIO
EXTRACCIÓN Query & Reporting
TRANSFORMACIÓN
BD TR. CALCULO DW OLAP, EIS
CMando
BD Ext. Metadato Data Mining

¿Cómo obtener la información, transformarla, enriquecerla y cargarla en el DW?


Responder a esta pregunta implica
– En el DW el dato debe ser único e integro, al provenir de varias fuentes no es fácil.
– En concreto implica:
– Identificar los pasos de los procesos y su periodicidad.
– Diseñar los algoritmos de transformación, desnormalización y agregación de los datos
– Unificar el significado de los datos y enriquecerlos con información externa
– Convertir los datos desde el diseño de la BD de las fuentes, al diseño del DW. Las
estructuras suelen diferir, a veces incluso en la forma de modelado de dato (Relacional
vs Multidimensional)
– Existen herramientas de extracción disponibles en el mercado que facilitan la tarea,
sino debes construir procesos a medida.
Seminario - Data Warehouse
Página 15 de 35
Arquitectura Conceptual de un Data Warehouse

• El Data Warehouse tiene dos elementos clave: el Almacén en sí (Base de Datos)


o DW y el Repositorio de Metadatos (diccionario - catálogo de datos)
FUENTES DE DATOS ETC DW HERR. USUARIO
EXTRACCIÓN Query & Reporting
TRANSFORMACIÓN
BD TR. CALCULO DW OLAP, EIS
CMando
BD Ext. Metadato Data Mining

¿Para el almacén qué modelado de datos es más conveniente y qué herramienta


se adapta mejor? Responder a esta pregunta implica
– El almacén de datos se materializa en una BD y sobre sus características giran
las decisiones en este punto.
– Hay que decidir entre un Modelo de Datos Relacional (E-R) vs un Modelo
Dimensional
– Hay que seleccionar el sistema gestor de BD que mejor se ajuste a la dimensión,
técnica de modelado de datos elegida, volumen, eficiencia,… para soportar el
almacén
– Hay que decidir si es único o esta dividido en DataMarts (BD orientadas al tema
concreto manejadas descentralizadamente) piezas menores del DW
Seminario - Data Warehouse
Página 16 de 35
Arquitectura Conceptual de un Data Warehouse

• Repositorio de metadatos: es el catálogo donde se recoge la información que


describe al dato (semántica, formato, significado, reglas de extracción y calculo, fuente,….)
FUENTES DE DATOS ETC DW HERR. USUARIO
EXTRACCIÓN Query & Reporting
TRANSFORMACIÓN
BD TR. CALCULO DW OLAP, EIS
CMando
BD Ext. Metadato Data Mining

¿El nivel de descripción del dato, sus atributos de identificación y la


funcionalidad que aportan las herramientas de DW? Son preguntas que implican
– El catálogo de datos es el corazón del sistema, en éste quedan identificados los datos de
forma única y se definen en función a un conjunto de atributos:
– Técnicos: BD origen, fuente, periodicidad de carga, método de enriquecimiento, formatos,
cálculos,...
– Negocio: descripción, significado para las distintas áreas, alias, variable tomadas en su
calculo,...
– Otros: es agregable o no, nivel de acceso, nivel de agregación, procedimientos y normas de
administración de referencias …
– Las herramientas de administración del Repositorio son una fuente de ayuda para los
ETC y para las herramientas de usuario. (Suelen incluirse en el DW)
Seminario - Data Warehouse
Página 17 de 35
Arquitectura Conceptual de un Data Warehouse

• Las herramientas de extracción de la información son muy variadas y permiten


desde simples consultas a análisis estadísticos complejísimos
FUENTES DE DATOS ETC DW HERR. USUARIO
EXTRACCIÓN Query & Reporting
TRANSFORMACIÓN
BD TR. CALCULO DW OLAP, EIS
CMando
BD Ext. Metadato Data Mining

El tipo de análisis de la información de los usuarios determina el tipo de


herramientas de consulta
– Sencillas de manejar y permiten navegar (drill down) por la información almacenada
– Los más básico es las herramientas que permiten construir consultas e informes sin
utilizar SQL, sino simplemente utilizando herramientas gráficas.
– Permiten hacer consultas ad-hoc o planificadas
– OLAP a partir de la información del DW se construye un cubo con diferentes dimensiones
y jerarquías del modelo de datos. Una vez construido puedes navegar por los valores
– Ej. Ventas en 2001, Ventas en Madrid en Marzo 2001, Ventas el 2-3-2001 en el CP28001
– Cuadro de Mando, EIS,..: herramientas de control de gestión (Robert y Kaplan)
– Data Mining: permite analizar grandes volúmenes para extraer información no evidente
Seminario - Data Warehouse
Página 18 de 35
Arquitectura Conceptual de un Data Warehouse

• Por cada elemento hay una serie de alternativas y posibilidades sobre las que
hay que tomar una decisión.

COMPONENTE DECISIÓN RESULTADO


FUENTES DE DATOS
BD BD • Lista definitiva de BD interna origen.
Transacc Externa
• Lista definitiva de BD externas a integrar.

Procesos E.T.C
• Elegir entre desarrollo a medida vs
herramientas de extracción.
• Determinar frecuencia de volcado y
herramienta de planificación. ARQUITECTURA
CONCEPTUAL
ALMACEN DATOS
• Elegir entre técnica de modelado dimensional DEFINITIVA
vs relacional.
DW Metadat • Determinar la herramienta gestión DW.
o
• Determinar la herramienta gestión metadatos.
HERRAMIENTAS USUARIO
Query & Reporting • Elegir tecnología soporte: cliente servidor vs
OLAP, EIS Web.
CMando
• Elegir proveedor único herramientas vs
distintas herramientas.
Data Mining
• Relación de herramientas de análisis definitiva.
Seminario - Data Warehouse
Página 19 de 35
Índice
• Objetivos del Seminario

• Evolución de los sistemas y justificación de los DW

• ¿Qué es un Data Warehouse?

• Arquitectura conceptual de un Data Warehouse

• Modelado de Datos y Ejemplos de Extracción

• Herramientas de extracción de datos: Data Mining

• Documentación

• Conclusiones

Seminario - Data Warehouse


Página 20 de 35
Modelado de Datos y Ejemplos de Extracción
• Las Bases de Datos se construyen a partir de dos técnicas de modelado de
datos
– E-R o relacional: los datos de los procesos se soportan en entidades y relaciones que
deben cumplir las normas formales
 Son adecuados y muy comunes para los sistemas transaccionales
 Las entidades representan conceptos relevantes (Pedidos, productos, clientes).
Los atributos describen las entidades (Código Pedido, Fecha pedido, Estado,…)
 Las relaciones pueden ser 1 a 1, 1 a n y n a n
 El proceso de normalización elimina la redundancia del dato (único) favoreciendo
su integridad.
 Ejemplo
1 N
Clientes Pedidos

ok
1
x
N
N N
1 N
1 N
ok
Familia Productos Producto Pedido

Seminario - Data Warehouse


Página 21 de 35
Modelado de Datos y Ejemplos de Extracción
• Las Bases de Datos se construyen a partir de dos técnicas de modelado de
datos
– Dimensional: los modelos de datos son conocidos por modelos de estrella, la
información se organiza en dos tipos de tablas Hechos - Dimensiones
 Las Tablas de Hechos: representan las cifras importantes del negocio, y se
relacionan con cada una de las dimensiones (Ventas, minutos gastados,…)
 Las tablas de dimensiones describen los hechos, son entidades de atributos que
califican el dato (Se produce en Madrid en determinada fecha)
 Las dimensiones pueden tener jerarquías, esto permite navegar “drill-down” por
los datos
DIMENSIÓN CLIENTE DIMENSIÓN PRODUCTO DIMENSIÓN TIEMPO DIME. ORGANIZACIÓN
País Línea Año Mercado

Provincia Familia Mes Canal

Cliente Producto Día Sucursal

FACTS o Hechos
•Saldos, intereses
•Facturación, Ventas, Número clientes
•Nivel de Satisfacción, Repetición de compra
Seminario - Data Warehouse
Página 22 de 35
Modelado de Datos y Ejemplos de Extracción

• Comparando los dos modelos: comprobamos que para el análisis son mas
adecuados los modelos dimensionales.

Modelos Entidad Relación Modelos Dimensionales


– Requieren menos recursos para
almacenamiento y hay mas – Son mas intuitivos para el
sistemas gestores de bases de usuario
datos – Pueden navegar por la
información a través de drill -
– Son muy eficientes con las
down
actualizaciones e inserciones
(indexación) penalizan las – Son aconsejables para análisis
consultas. VS OLAP si el número de
dimensiones es limitado
– Suelen Tener datos de un año, – Permiten agregar valores
dificultando el análisis – La tabla de hechos tiene como
– Requieren SQL para hacer foreing key a las dimensiones
consultas. relacionadas
– Ej. Acceso: muestrame las ventas
– El análisis requiere múltiples de clientes en Madrid en el
joints trimestre primero realizadas por
– Ej.Acceso: Select sum saldos from... el canal directo de la familia
Tarjetas de crédito
Seminario - Data Warehouse
Página 23 de 35
Índice
• Objetivos del Seminario

• Evolución de los sistemas y justificación de los DW

• ¿Qué es un Data Warehouse?

• Arquitectura conceptual de un Data Warehouse

• Principales conceptos de un Data Warehouse

• Herramientas de extracción de datos: Data Mining

• Documentación

• Conclusiones

Seminario - Data Warehouse


Página 24 de 35
Herramientas de Extracción de Datos: Data Mining

• Una vez los datos están almacenados en el Data Warehouse, el usuario puede
acceder a estos con diversas herramientas
– A mayor grado de complejidad del análisis, ergonomía y flexibilidad los precios de
las herramientas suelen dispararse.

• El data mining es el método de extracción mas sofisticado y se puede definir


como:
Data Mining: es la exploración y análisis, con
herramientas de un gran volumen de datos, con el
objeto de obtener información no evidente y
relevante para la Empresa

• El data mining incluye los métodos de extracción mas sencillos:


– Query & Report: facilita la elaboración de consultas e informes a partir de los datos
del DW
 El usuario cuenta con la guía del repositorio de metadatos (definido el dato)
 El nivel de análisis es bajo: se centra en el pasado y sólo permite contrastar y
verificar hipótesis que el usuario ya intuye (la herramienta no descubre)
Seminario - Data Warehouse
Página 25 de 35
Herramientas de Extracción de Datos: Data Mining

• El data mining incluye los métodos de extracción mas sencillos


(cont.):
– Análisis OLAP: permite hacer análisis y presentar los datos bajo aquellos
ejes de interés del usuario.
 En los casos de BD multidimensional (MOLAP) permite hacer drill -
down
 Este tipo de herramientas se pueden complementar con herramientas
de Balance Score Card o EIS
 Por ejemplo, en vez de considerar cada transacción individualmente,
las ventas de una compañía pueden organizarse en función del tiempo
y de la zona geográfica, y analizarse con diferentes niveles de detalle
(país, región, localidad...).
– Ej. ¿Ventas del la gama de producto prime en la localidad de Arganda en el trimestre
anterior?. Si tenemos herramientas MOLAP con un click accederemos al siguiente nivel de
la dimensión producto con un mero ckick: ¿Ventas del producto cenicero (perteneciente a
la categoria primera,…?¿Tienen algo en común los clientes de Gerona?

 Navegar a través de datos agregados vistos desde difrentes


perspectivas, permiten un análisis superior a las consultas de
transacciones puntuales
Seminario - Data Warehouse
Página 26 de 35
Herramientas de Extracción de Datos: Data Mining

• El data mining es un paso más en el análisis ya que trata de descubrir nuevas


hipótesis
– El análisis OLAP tiene un enfoque deductivo, parte de las hipótesis del usuario e
intenta contrastar este hipótesis con la navegación por los datos agregados
– Minería de datos: el enfoque es inductivo a partir de datos individuales.
Ejemplo OLAP Ejemplo Data Mining

En cambio, un problema típico para resolver


utilizando minería de datos sería, por ejemplo:
Una pregunta típica de un sistema
"Hallar un modelo que determine las
OLAP/DSS sería: "El año pasado, ¿se
características más relevantes de las personas
compraron más furgonetas en Cataluña o
que compran furgonetas". A partir de los datos
en Madrid?". La respuesta del sistema sería
del pasado, el sistema de minería de datos
del tipo "En Cataluña se compraron 12.000
proporcionaría una respuesta del tipo: "Depende
furgonetas, mientras que, durante el
de la época del año y la situación geográfica: En
mismo intervalo, en Madrid se compraron
invierno, los habitantes de Madrid que
10.000". Obviamente, es una información
pertenecen a un cierto grupo de edad y nivel de
interesante y útil, pero restringida por las
ingresos probablemente comprarán más
hipótesis realizadas a priori.
furgonetas que gente de las mismas
características en Cataluña".

Seminario - Data Warehouse


Página 27 de 35
Herramientas de Extracción de Datos: Data Mining

• Los principales usos del Data Mining son:


– Segmentaciones: analizando los datos de clientes las herramientas buscan un
patrón - grupo - segmento en el que encuadrar a cada uno de ellos
 Los nuevos candidatos se clasifican dentro de un segmento al ingresar sus datos.
Ej. Les puedo asignar el nivel de descuento automáticamente a los trabajadores
de Telefónica
– Proyecciones y predicciones: utilizando técnicas estadísticas te dan un conjunto
de escenarios de resultados asociados a un grado de certeza
 Puedes anticipar la evolución de una variable y dar distintos escenarios en
función al pasado
 Puedes evaluar o puntuar un nuevo elemento en función a sus valores. Ej las
– Análisis de Desviaciones: descubre situaciones anómalas; éstas suelen ser de
gran interés. Ej. Un cliente que no hace retiros con tarjeta a crédito, ha empezado a
hacerlos tras la concesión de un prestamos personal
– Detección de correlaciones: identifica relaciones causales o eventos que tienden
a producirse de forma conjunta Ej. El que compra un cochecito necesita un aumento
en su línea de crédito)
– Otros: sendas de consumo, clustering, ….
Seminario - Data Warehouse
Página 28 de 35
Herramientas de Extracción de Datos: Data Mining

• Algunos objetivos que pretende cubrir el dataminig


– Conocer mejor a los clientes
 Adecuar mi oferta a su perfil, momento, gustos
– Reducir el coste de mi marketing, gracias al incremento de la eficiencia de mis
acciones
 Promociones mas apuntadas
– Aumentar la calidad de las decisiones de dirección
 Facilita la simulación de escenarios, la identificación de óptimos,..
– Mejorar nuestra capacidad de predicción y aumentar nuestra capacidad de
anticipación
 Prevención de problemas (alarmas)
 Optimización de stocks (se reducen al disminuir el nivel de incertidumbre)
 Detección de oportunidades
– Mejora en la calidad de nuestros productos
 Detección de fraudes
 Mejora la identificación de productos defectuosos.
Seminario - Data Warehouse
Página 29 de 35
Índice
• Objetivos del Seminario

• Evolución de los sistemas y justificación de los DW

• ¿Qué es un Data Warehouse?

• Arquitectura conceptual de un Data Warehouse

• Principales conceptos de un Data Warehouse

• Herramientas de extracción de datos: Data Mining

• Documentación

• Conclusiones

Seminario - Data Warehouse


Página 30 de 35
Ejemplos y Documentación

• Libros de interés
– El Data Warehouse por Jean-Michael Franco y EDS - Institut Prometheus editorial
gestión 2000

• Links de interés
– Herramientas
 www.ibm.com
 www.sas.com Web de la empresa líder en el sector
 http://www.microstrategy.com/ Site de la empresa de software con soluciones
muy interesantes de Data Warehouse y Data mining
– Portales
 http://www.web-datamining.net/
 www.ebusinessintelligence.com

Seminario - Data Warehouse


Página 31 de 35
Índice
• Objetivos del Seminario

• Evolución de los sistemas y justificación de los DW

• ¿Qué es un Data Warehouse?

• Arquitectura conceptual de un Data Warehouse

• Principales conceptos de un Data Warehouse

• Herramientas de extracción de datos: Data Mining

• Documentación

• Conclusiones

Seminario - Data Warehouse


Página 32 de 35
Conclusiones

ElLos sistemas
objetivo transaccionales
de un de las
Data Warehouse es
mejorar la toma
compañías dan de decisionesde
información mediante
gestión
el acceso a mejor
pobreinformación

Una vez tienes


Implementar unlos datos
Data almacenados
Warehouse en
implica
un DW
unir unapuedes explotar
serie de los datos
componentes: de
BD,
formas muy diferentes
Metadatos y herramientas de extracción

ElDetectar
Data Warehouse es el almacén,
correlaciones, segmentardata
minig espuede
clientes,… un tipo de herramientas
apoyar parade
las estrategias
extraer información, aunque se puede
encuadrar dentro deCRMlas piezas de un CRM

Seminario - Data Warehouse


Página 33 de 35
Conclusiones

¿Alguna pregunta?

Seminario - Data Warehouse


Página 34 de 35
Seminario - Data Warehouse
Página 35 de 35

You might also like