Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Eps Sistemas PDF
Eps Sistemas PDF
Facultad de Ingeniería
TRABAJO DE GRADUACIÓN
I
2.4. Tipificación de los ETL ...........................................................................................14
3. DATAMINING ....................................................................................................19
3.1. Descubrir el conocimiento (KDD) ..........................................................................19
3.2. Técnicas para descubrir el conocimiento ..............................................................19
3.3. Minería de datos ...................................................................................................21
3.4. Algoritmos de minería de datos ............................................................................22
3.5. Proceso de minería de datos .................................................................................23
3.6. ¿Por qué minería de datos? ..................................................................................24
3.7. Datamining en la base de datos............................................................................25
3.8. Oracle ® Data Mining (ODM) .................................................................................25
3.9. Funciones soportadas por ODM® .........................................................................26
3.10. Ejemplos de aplicaciones de ODM ....................................................................28
4. RESULTADOS.....................................................................................................31
CONCLUSIONES........................................................................................................33
RECOMENDACIONES ................................................................................................35
BIBLIOGRAFÍA ..........................................................................................................37
II
ÍNDICE DE ILUSTRACIONES
FIGURAS
IV
48. Extensiones de minería de datos .............................................................................. 62
49. Por qué usar minería de datos .................................................................................. 63
50. Portada sesión 3, curso 2 .......................................................................................... 63
51. Agenda sesión 3, curso 2 ........................................................................................... 64
52. Proceso de datamining ............................................................................................. 64
53. Continuación proceso de datamining ....................................................................... 65
54. Datamining en BDD ................................................................................................... 65
55. Oracle (R) Datamining .............................................................................................. 66
56. Funciones de ODM .................................................................................................... 66
57. Continuación de funciones de ODM ......................................................................... 67
58. Funciones soportadas por ODM ............................................................................... 67
59. Continuación de funciones soportadas por ODM ..................................................... 68
60. Continuación de funciones soportadas por ODM ..................................................... 68
61. Portada sesión 4, curso 2 .......................................................................................... 69
62. Agenda sesión 4, curso 2 ........................................................................................... 69
63. Ejemplo 1 de ODM .................................................................................................... 70
64. Ejemplo 2 de ODM .................................................................................................... 70
65. Ejemplo 3 de ODM .................................................................................................... 71
66. Ejemplo 4 de ODM .................................................................................................... 71
67. Aplicación de ejemplos de ODM ............................................................................... 72
68. Componentes de ODM .............................................................................................. 72
TABLAS
V
VI
GLOSARIO
1
http://es.wikipedia.org/wiki/Red_bayesiana consultado en diciembre 2008
VII
Rollback Palabra reservada en las bases de datos, utilizada para
deshacer o reversar una transacción, y que los datos no
se vean afectados.
VIII
RESUMEN
IX
Capítulo 3 – Datamining, en este capítulo se estudia el concepto de la
minería de datos, se define el proceso de la minería de datos, donde se hace
énfasis que la mayor parte del trabajo se consume en el procesamiento de los
datos, y se enumeran algunas de las técnicas más usadas en la minería de
datos. Adicionalmente se evalúa la herramienta ODM de Oracle ® y sus
aplicaciones a la minería de datos.
X
OBJETIVOS
GENERAL
ESPECÍFICOS:
XI
4. Evaluar el grado de conocimiento alcanzado por los estudiantes, y
reportarlo al catedrático titular.
XII
INTRODUCCIÓN
Por esta razón, este tema ocupa dos cursos del pensum de estudios de la
Maestría en Tecnología de la Información y la Comunicación, de la Facultad de
Ingeniería, de la Universidad de San Carlos de Guatemala. El presente trabajo
comprende una recolección de los principales conceptos relacionados con la
Inteligencia de Negocios, así como el resumen de las presentaciones utilizadas
en el laboratorio de los dos cursos, impartidos en la promoción 2008-2009 de
dicha maestría.
XIII
XIV
DESCRIPCIÓN DEL PROYECTO
XV
Para ambos cursos, la metodología utilizada fue, previo a las sesiones,
investigación y elaboración de presentaciones y/o ejemplos, y durante la sesión
la presentación participativa con los estudiantes, así como la realización de los
ejemplos con ellos, adicional de las tareas de investigación que los estudiantes
elaboraron.
XVI
1. CONCEPTOS DE INTELIGENCIA DE NEGOCIOS
1.1.1. Datos: son los elementos mínimos de información que por sí mismos son
irrelevantes para la toma de decisiones. Ejemplo:
23,423.
Juan Pérez.
La Estrella.
1
1.1.3. Conocimiento: es la mezcla de la información y la experiencia (saber
por qué y cómo) que se utiliza para adquirir nueva información, que a la
vez ayuda a tomar decisiones acertadas, ejemplo:
Ventas del mes 23,423, 15% más alto que el mes anterior.
2
Los formatos de los datos pueden variar entre un departamento y
otro, debido a que tienen fuentes distintas.
3
Los datos que alimentan las bases de datos OLAP por lo general
proceden de los sistemas operacionales existentes, por medio de
procesos de extracción, transformación y carga (ETL).
1.3.3. Características:
5
1.4.1. Extracción: procesos encargados de obtener la información de las
distintas fuentes, las cuales pueden ser tanto internas como externas.
6
1.5.3. HOLAP – OLAP Híbrido, una combinación entre los dos esquemas
anteriores, en el cual las estructuras se almacenan con la técnica de
MOLAP y las agregaciones por medio de ROLAP.
1.6. Datamining
2
http://www.sinnexus.com/business_intelligence/index.aspx consultada en Agosto 2008
3
Idem 2
7
“Predecir ¿qué ocurriría si…?”4
Mejorar la competitividad
4
http://www.sinnexus.com/business_intelligence/index.aspx consultada en Agosto 2008
5
Idem 4
6
Idem 4
8
Obtener el verdadero valor de las aplicaciones de gestión
9
10
2. HERRAMIENTAS DE INTELIGENCIA DE NEGOCIOS
11
2.1.4. Dimensiones: describe dimensiones, tipos de dimensión,
almacenamiento de dimensiones y objetos de dimensiones, incluidos
atributos, relaciones de atributos, jerarquías, niveles y miembros.
12
2.2.1. Mezclar datos de almacenes de datos heterogéneos.
13
Su estructura es muy parecida a la estructura del sistema OLTP, con
cierta información adicional, y que nos puede ayudar también, para consolidar
la información de varios sistemas heterogéneos, ya que el objetivo es que sea
un unificador de los datos, provenientes de distintas fuentes, y ésta base de
datos será la encargada de procesar los distintos procesos de ETL.
14
Para las tablas de hechos: obtiene datos en rango de tiempo
según la periodicidad definida, convirtiendo los identificadores del
sistema OLTP a los identificadores del Andamio.
15
Realizan pre-cálculos necesarios para la estrella, (conversiones)
16
Si se permite volver a cargar ciertos datos, deben ser capaces de
actualizar esa información en la Estrella (más óptimo: borrar y
volver a trasladar)
17
18
3. DATAMINING
“El proceso de descubrir el conocimiento toma los datos tal como vienen,
los transforma en información útil y entendible, procesando grandes cantidades
de datos crudos, identificando los patrones significativos y relevantes y los
presentan como conocimiento apropiado para satisfacer las metas del usuario.”7
7
http://exa.unne.edu.ar/depar/areas/informatica/SistemasOperativos/MineriaDatosBressan.htm
Consultado en enero 2009
8
Idem 7
19
3.2.2. Método probabilístico: utilizando modelos de representación gráfica, se
basa en las probabilidades e independencia de los datos, “puede usarse
en sistemas de diagnóstico, planeación y sistemas de control”9.
9
http://exa.unne.edu.ar/depar/areas/informatica/SistemasOperativos/MonografiaMD.PDF consultado
en enero 2009.
10
Idem 9
11
http://exa.unne.edu.ar/depar/areas/informatica/SistemasOperativos/MineriaDatosBressan.htm
Consultado en enero 2009
12
Idem 11
20
3.3. Minería de datos
Aspectos climatológicos
Medicina
Mercadotecnia
13
http://exa.unne.edu.ar/depar/areas/informatica/SistemasOperativos/MineriaDatosBressan.htm
Consultado en enero 2009
21
Análisis de canasta de mercado
Industria y Manufactura
14
http://exa.unne.edu.ar/depar/areas/informatica/SistemasOperativos/MineriaDatosBressan.htm
Consultado en enero 2009
15
Idem 14
22
3.5. Proceso de minería de datos
16
http://exa.unne.edu.ar/depar/areas/informatica/SistemasOperativos/MineriaDatosBressan.htm
Consultado en enero 2009
17
Idem 16
23
3.6. ¿Por qué minería de datos?
18
http://www.at-systems.es/soluciones/data_mining.htm consultado en enero 2009.
19
http://exa.unne.edu.ar/depar/areas/informatica/SistemasOperativos/Mineria_Datos_(Vallejos).pdf
consultado en enero 2009
20
http://www.monografias.com/trabajos26/data-mining/data-mining2.shtml consultado en enero 2009
21
http://exa.unne.edu.ar/depar/areas/informatica/SistemasOperativos/MineriaDatosBressan.htm
Consultado en enero 2009
24
3.7. Datamining en la base de datos
25
Con el ODM, las tareas de minería de datos pueden ejecutarse
asíncronamente e independientes de alguna interface como parte de una base
de datos normal. Y las herramientas pueden ejecutarse en línea con comandos
de Java o bien con PL/SQL.
3.9.1.3. Importancia del atributo: identificar los atributos que son más
importantes en la predicción de resultados.
26
3.9.1.4. Detección de anomalías: identificar los elementos que no cumplan
las características de los datos "normales".
27
3.10. Ejemplos de aplicaciones de ODM
28
Solución: una función de importancia de atributos para reducir el
número de factores a un subconjunto manejable de atributos.
29
30
4. RESULTADOS
31
Tabla II - Resultado Laboratorio Inteligencia de Negocios 2
32
CONCLUSIONES
33
34
RECOMENDACIONES
35
5. Organizar más conferencias, en donde los estudiantes puedan conocer
las opciones comerciales de aplicaciones disponibles en el mercado,
adicionales a las que utilizan en sus prácticas, para que puedan tener un
mayor panorama de las distintas formas en que esas herramientas
aplican los conceptos.
36
BIBLIOGRAFÍA
7. Haberstroh, Robert. Oracle Data Mining Tutorial for Oracle Data Mining
10g Release 2, Oracle Data Mining 11g Release 1. Oracle USA, 2008.
9. msdn.microsoft.com/es-es/library/ms175609(SQL.90).aspx páginas
similares (Consultado 06-sep-2008)
37
38
APÉNDICE - MATERIAL ELABORADO PARA
LABORATORIOS
39
Figura 3 - Instalación de SQL Server (R) 2005
40
Figura 5 - Continuación de instalación ...
41
Figura 7 - Datos e información
Figura 8 - Conocimiento
42
Figura 9 - Pirámide de conocimiento
22
Figura 10 - OLTP
22
http://www.sinnexus.com/business_intelligence/index.aspx consultada en agosto 2008
43
Figura 11 - OLAP
44
Figura 13 - Características de datawarehouse
45
Figura 15 - Agenda sesión 2, curso 1
Figura 16 - ETL
46
Figura - 17 Proceso de ETL
23
23
http://www.sinnexus.com/business_intelligence/index.aspx consultada en agosto 2008
47
Figura 19 - Datamining
48
Figura 21 - ¿Por qué BI?
24
24
http://www.sinnexus.com/business_intelligence/index.aspx consultada en agosto 2008
49
Figura 23 - Bibliografía sesiones 1 y 2
50
Figura 25 - Agenda sesión 3, curso 1
51
Figura 27 - Continuación de componentes de SSAS
52
Figura 29 - Usos típicos de SSIS
53
Figura 31 - ETL de extracción
54
Figura 33 - ETL de preparación
55
Figura 35 - ETL de procesamiento
56
Figura 37 - Agenda sesiones 1 y 2, curso 2
25
25
http://www.sinnexus.com/business_intelligence/index.aspx consultada en agosto 2008
57
Figura 39 - Descubrir el conocimiento
58
Figura 41 - Continuación técnicas de KDD
59
Figura 43 - División de la minería de datos
60
Figura 45 - Técnicas de minería de datos
61
Figura 47 - Proceso de minería de datos
62
Figura 49 - Por qué usar minería de datos
63
Figura 51 - Agenda sesión 3, curso 2
64
Figura 53 - Continuación proceso de datamining
65
Figura 55 - Oracle (R) Datamining
66
Figura 57 - Continuación de funciones de ODM
67
Figura 59 – Continuación de funciones soportadas por ODM
68
Figura 61 - Portada sesión 4, curso 2
69
Figura 63 - Ejemplo 1 de ODM
70
Figura 65 - Ejemplo 3 de ODM
71
Figura 67 - Aplicación de ejemplos de ODM
72