EDX TecMTY Evaluación Entre Pares Julio Pantoja

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 7

INTRODUCCIÓN A LA

CIENCIA DE DATOS Y EL BIG


DATA

Utilizando Ciencia de Datos en


una Organización
Caso de Estudio: Librería
Iztaccihuatl
EDX - Tecnológico de Monterrey

REALIZADO POR:

Julio Cesar Pantoja Barroso Agosto de 2024


Índice:
Introducción…………………………………………...…..3
Desarrollo del caso…………………………………….......3
Indicadores de desempeño……………………………3
Análisis y justificación…………………………….…4
Decisiones……………………………………………4
Conclusión………………………………………………...6

2
Introducción:
En este proyecto, analizaremos los datos proporcionados por la Librería Iztaccíhuatl para
mejorar sus indicadores de desempeño (KPI’s) y desarrollar una mejor estrategia de toma de
decisiones. Utilizaremos herramientas de Ciencia de Datos para extraer información valiosa
de los archivos de datos disponibles.
Objetivo: Analizar fuentes de información externas e internas de una organización a través
de herramientas computacionales para generar un modelo basado en Ciencia de Datos como
apoyo a la toma de decisiones.
La Librería Iztaccíhuatl ubicada en la ciudad de Monterrey, Nuevo León, México ha decidido
desarrollar un proyecto basada en ciencia de datos para mejorar sus indicadores de
desempeño (KPI’s) y a la vez desarrollar una mejor estrategia en la toma de decisiones.
El modelo CRISP-DM (Cross-Industry Standard Process for Data Mining) es un enfoque
estructurado y ampliamente utilizado en proyectos de Ciencia de Datos. Este modelo consta
de seis fases: comprensión del negocio, comprensión de los datos, preparación de los datos,
modelado, evaluación y despliegue. En este proyecto, se siguieron estas fases para garantizar
un análisis exhaustivo y preciso. La comprensión del negocio permitió identificar los
objetivos y necesidades de la librería, mientras que la comprensión y preparación de los datos
aseguraron que la información estuviera lista para el análisis. Las fases de modelado y
evaluación permitieron desarrollar y validar modelos predictivos, y finalmente, la fase de
despliegue facilitó la implementación de las estrategias basadas en los insights obtenidos.
En la carpeta denominada “datasets_books” se encuentran los siguientes archivos: books;
top_books; raitings; to_read.
Una vez analizada la información de la carpeta “datasets_books” deberás presentar en un
documento Word la respuesta a las siguientes preguntas:

Desarrollo del caso:


1. ¿Qué indicadores serían los más importantes a determinar de acuerdo con la
información presentada?

 Promedio de Clasificación de los Libros (Average Rating)

o Importancia: Este indicador muestra la satisfacción del cliente con los libros
disponibles.
o Decisión: Identificar libros con bajas clasificaciones para posibles
promociones o retirarlos del inventario.

3
 Volumen de Ventas (Volume)

o Importancia: Mide la popularidad y demanda de los libros.


o Decisión: Aumentar el stock de los libros más vendidos y planificar campañas
de marketing para libros menos vendidos.

 Número de Ediciones (Number Editions)

o Importancia: Indica la disponibilidad y diversidad de versiones de un libro.


o Decisión: Evaluar la necesidad de más ediciones para libros populares o
reducir ediciones para libros con baja demanda.

2. ¿Qué tipo de análisis sería el más adecuado y por qué?


o Análisis Descriptivo
o Justificación: Para entender las características básicas de los datos,
como la distribución de clasificaciones y ventas.
o Herramientas: Estadísticas descriptivas, gráficos de barras,
histogramas.
o Análisis Predictivo
o Justificación: Para predecir tendencias futuras en ventas y
clasificaciones.
o Herramientas: Modelos de regresión, algoritmos de machine
learning.
o Análisis de Sentimiento
o Justificación: Para entender la percepción del cliente sobre los libros.
o Herramientas: Procesamiento de lenguaje natural (NLP) en reseñas
y comentarios.

3. ¿Qué decisiones se podrían tomar basadas en los descubrimientos o inferencias de la


información analizada?
Estrategia de Implementación
Paso 1: Recolección y Limpieza de Datos
Este paso implica reunir todos los datos relevantes de las diferentes fuentes disponibles y
asegurarse de que estén en un formato adecuado para el análisis.
 Acciones:
o Recolección: Descargar y consolidar los datos de los archivos “books”,
“top_books”, “ratings” y “to_read”.

4
o Limpieza: Eliminar duplicados, manejar valores faltantes y corregir errores
en los datos.
o Transformación: Convertir los datos a formatos adecuados (por ejemplo,
fechas en formato estándar, normalización de texto).
Herramientas: Python (pandas, numpy), Excel, herramientas de ETL (Extract, Transform,
Load).
Paso 2: Análisis Descriptivo
Realizar un análisis inicial para entender las características básicas de los datos y obtener una
visión general de las tendencias y patrones.
 Acciones:
o Estadísticas Descriptivas: Calcular medidas como promedio, mediana,
desviación estándar, etc.
o Visualización de Datos: Crear gráficos como histogramas, gráficos de barras
y diagramas de dispersión para visualizar la distribución de los datos.
o Exploración de Datos: Identificar relaciones y correlaciones entre diferentes
variables.
Herramientas: Python (matplotlib, seaborn), Excel, Tableau.
Paso 3: Implementación de Modelos Predictivos
Utilizar técnicas de machine learning para predecir tendencias futuras y obtener insights más
profundos.
 Acciones:
o Selección de Modelos: Elegir modelos adecuados como regresión lineal,
árboles de decisión, random forest, etc.
o Entrenamiento y Validación: Dividir los datos en conjuntos de
entrenamiento y prueba, entrenar los modelos y validar su precisión.
o Evaluación de Modelos: Utilizar métricas como RMSE (Root Mean Square
Error), precisión, recall, etc., para evaluar el rendimiento de los modelos.
Herramientas: Python (scikit-learn, TensorFlow), Jupyter Notebooks.
Paso 4: Evaluación Continua y Ajuste de Estrategias
Monitorear continuamente los KPI’s y ajustar las estrategias basadas en los resultados
obtenidos.
 Acciones:

5
o Monitoreo de KPI’s: Revisar los indicadores de desempeño mensualmente
para detectar cambios y tendencias.
o Ajuste de Estrategias: Modificar las estrategias de marketing, inventario y
precios basadas en los insights obtenidos del análisis de datos.
o Reportes y Comunicación: Generar reportes periódicos y comunicar los
hallazgos y recomendaciones a la gerencia.
Herramientas: Dashboards interactivos (Tableau, Power BI), Python (dash), Excel.
Buenas Prácticas
 Uso de Datos Actualizados: Asegurarse de que los datos utilizados estén
actualizados y sean precisos.
 Validación Cruzada: Implementar validación cruzada en los modelos de machine
learning para evitar el sobreajuste.
 Transparencia: Mantener una comunicación clara y transparente sobre las decisiones
basadas en datos.
Justificación de la Estrategia
La estrategia de implementación se basa en un enfoque sistemático y basado en datos, lo que
proporciona una base sólida para la toma de decisiones informadas. Al seguir estos pasos, la
Librería Iztaccihuatl podrá mejorar sus indicadores de desempeño y optimizar sus
operaciones y estrategias de marketing.
Algunas otras estrategias para implementar podrían ser:
 Estrategias de Inventario: Basadas en las tendencias de ventas y popularidad.
 Promociones y Descuentos: Basadas en el rendimiento de ventas y clasificaciones.
 Recomendaciones Personalizadas: Utilizando datos de clasificaciones y "to_read"
para sugerir libros a los clientes.
 Optimización de Precios: Ajustar el ASP y RRP para maximizar las ventas y la
satisfacción del cliente.

Conclusión:
La implementación de un modelo basado en Ciencia de Datos permitirá a la Librería
Iztaccíhuatl mejorar sus indicadores de desempeño y tomar decisiones más informadas. Los
análisis descriptivos y predictivos proporcionarán una comprensión profunda de las
tendencias y preferencias de los clientes, lo que ayudará a optimizar el inventario y las
estrategias de marketing.

6
La Ciencia de Datos se ha convertido en una herramienta esencial para las empresas
modernas, ya que permite transformar grandes volúmenes de datos en información valiosa
para la toma de decisiones. A través de técnicas como el análisis descriptivo, predictivo y de
sentimiento, las organizaciones pueden obtener insights profundos sobre el comportamiento
de sus clientes, la eficiencia de sus operaciones y las oportunidades de mercado. En el caso
de la Librería Iztaccíhuatl, la implementación de un modelo basado en Ciencia de Datos no
solo mejorará sus KPI’s, sino que también proporcionará una base sólida para decisiones
estratégicas informadas.

También podría gustarte