Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 29

CIENCIA DE DATOS EN LAS

ORGANIZACIONES

Mg. Freddy Claydermam Vigilio Arratea


Big Data
Enormes cantidades de datos.

Para su procesamiento requieren aplicaciones


informáticas no convencional.

Servidores Cluster (unión de varios servidores como


si fuera uno solo, comparten software y hardware).

Ejem: Manualmente es imposible llevar datos de un


servidor a otro.

Datos Metereológicos, etc


Ciencia de Datos

Requiere de métodos científicos para extraer


conocimiento.
Características de un En 2005, The National Science Board publicó "Long-
Lived Digital Data Collections Enabling Research and

científico de datos Education in the 21st Century",

Definiendo a los científicos de datos como "científicos


de computación e información, programadores de
bases de datos y software, y expertos disciplinarios.
que son cruciales para la gestión exitosa de una
colección digital de datos, cuya actividad primaria es
realizar investigación creativa y análisis"
Minería de Datos Campo de la estadística y las ciencias de la
computación referido al proceso que intenta descubrir
patrones en grandes volúmenes de conjuntos de
datos.

Detectar información que se pueda procesar de un


conjunto grande de datos.

Proceso de descubrir patrones, modelos de grandes


volúmenes de un conjunto o conjunto de datos.

Realiza el análisis de resultados.


Datos, Información,
conocimiento,
decisiones
Dato Representación simbólica, conjunto de
símbolos (alfanuméricos, numéricos, gráficos).
Se utiliza para representar o describir un valor.

● Pueden ser almacenados en digital.


● En programación un dato describe las
características de una entidad.
● En estadística: Son valores que
representan categorías y estas se dividen
en variables cuantitativas y cualitativas.
Declaración de variables
en un Lenguaje de
Programación
Datos Estructurados
Dato que pueden ser almacenados en texto
o archivos. (Ejem. Datos en Excel o una DB)

Pueden ser ordenados y procesados de


manera rápida y concisa.
Datos no estructurados No se ajusta a un modelo relacional.

No se ajusta a un modelo de tablas de base de datos


estructurado.
Información Conjunto de datos organizados para ser objeto de
tratamiento.

Se puede transmitir o comunicar en forma de mensaje


Conocimiento Significado extraído de la información.

Facultad para comprender por medio de la razón


cualidades y relación de objetos.

Entendimiento, inteligencia, razón natural (Según RAE)


Decisión Proceso que realiza una elección entre diferentes
opciones o formas posibles para resolver diferentes
situaciones.

Elegir una opción entre las varias que existen.


Datos, Información,
Conocimiento, Decisión
En resumen: Datos e Información.

Tienen distintos volúmenes de ocupación,


almacenamiento en los sistemas digitales.

Conocimiento y Decisión.

Ocupan menos espacio y tiene un valor explícito.


Electrocardiograma Decisión: Determina qué tipo de
tratamiento usar.

Conocimiento: Extracción de su
significado (reconocer posibles
síntomas).

Información: Conjunto de muestras


ordenadas (No interesa ningún
conocimiento porque no soy
experto).

Dato: Muestra numéricas.


Preguntas para los ¿De qué manera Ud. almacena sus
datos (especificar un formato)?
maestrandos.
¿Donde almacena Ud. sus datos?

¿Cómo administra Ud. sus datos?


Los datos e información
se suele representar en
códigos binarios
¿Qué hacer con los - Operaciones básicas.

datos? Rutinarias del día a día. Base de datos


(Crear, modificar, eliminar, consultar)

Transacciones (Compras por internet,


pagos con tarjeta de crédito)
- Agrupar (Clauser)
Operaciones Segmentar en grupos o clases.

descriptivas - Identificar reglas de asociación.

Relación entre variables.


Operaciones Predictivas - Clasificar o segmentar.

Preferencia, clasificación de usuarios

- Estimar relación entre parámetros.

Análisis de regresión

- Detectar desviaciones o anomalías.

Detección de acciones fraudulentas,


detección de accidentes

- Identificación de series temporales.

Pronóstico sobre nuevos datos o


tendencias
- Sistema Operativo

Desde el punto de vista Sistema de directorios y archivos

de la informática: - Base de Datos

Niveles de Gestión de datos día a día, transacciones,

Organización. - Sistema de Información

Software, apps, etc.

- Almacén de datos (Data warehouse)

Procesamiento analitico, dimensional, ejemp.


(producto, cliente, tiempo)

- Minería de Datos.

Extracción de patrones de información a partir


de grandes cantidades de datos
GRACIAS

También podría gustarte