EDX Proyecto Aplicando La Ciencia de Datos Entregable 2

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 10

EDX - Ciencia de datos – Rafael Wierna

Proyecto Aplicando la Ciencia de Datos


Librería Iztaccihuatl

05 - 2023

1
EDX - Ciencia de datos – Rafael Wierna

Proyecto Indicadores librería Iztaccihuatl


Introducción

La Librería Iztaccihuatl ubicada en la ciudad de Monterrey, Nuevo León, México ha decidido


desarrollar un proyecto basada en ciencia de datos para mejorar sus indicadores de
desempeño (KPI’s) y a la vez desarrollar una mejor estrategia en la toma de decisiones.

Librerías Iztaccíhuatl
Monterrey, N.L., México · +52 81 8387 0191
Monterrey, N.L., México · +52 81 8358 7070
Compras en tienda · Retiro en tienda · Entrega a domicilio

Es por esto que convoca a su equipo de Data, quien será el encargado de llevar a cabo el
proyecto. Con el Objetivo de analizar los datos y poner en práctica una estrategia para abordar
los KPIs más importantes según dataset suministrado, para luego poder tomar decisiones
óptimas.

Hitos

1- Dataset,
a. Estructuras, interpretación del negocio y datos, preparación de los mismos.
(Pag.3).
2- Definiremos algunas hipótesis. (Pág. 4).
3- Preguntas y respuestas (Pág.5).
4- gráficas se pueden realizar sobre el análisis de datos (Pág.5).
5- comparaciones (Pág.6).
6- correlaciones y análisis descriptivo (Pag.7).
7- predicción (Pág. 7).
8- historia (Pág.7).
9- indicadores (Pág.8)
10- tipo de análisis (Pág.8)
11- Propuestas de decisiones (Pág.9)
12- Conclusiones (Pág.10)

2
EDX - Ciencia de datos – Rafael Wierna

DATASET

En esta etapa nos enfocaremos en


1- La comprensión del negocio
2- La comprensión de los datos
3- Preparación de los datos

Contamos con el siguiente dataset (DS):

1- El archivo BOOKS contiene los datos generales de cada libro existente en la librería y
además menciona el promedio de clasificación de cada libro de acuerdo a las
votaciones y compras del cliente.
2- El archivo TOP_BOOKS contiene el top 20 de los libros más vendidos de acuerdo a
una clasificación general.
3- El archivo RATINGS contiene los datos de los libros más votados por los clientes
dentro del sitio web de la librería.
4- El archivo TO_READ contiene las recomendaciones que cada cliente o usuario realiza
en el sitio web sobre libros para leer.

Estructuras

1) El archivo BOOKS contiene los siguientes datos:


a) Id - Identificador del registro
b) Book Id - Identificador del libro
c) Number Editions - Número de ediciones
d) ISBN - Clave estándar internacional del libro
e) ISBN13 - Clave estándar extendida internacional del libro
f) Authors - Autor del libro
g) Original Publication - Fecha de publicación
h) Original Title - Título original del libro
i) Title - Título del libro
j) Language Code - Clave de idioma del libro
k) Average Rating - Promedio de la clasificación del libro
l) Image - Enlace a la imagen de la portada del libro
m) Small Image - Enlace a la imagen en versión optimizada de la portada del libro.

2) El archivo TOP_BOOKS contiene los siguientes datos:


a) Position - Posición del libro en la clasificación del libro
b) ISBN - Clave estándar extendida internacional del libro
c) Title - Título del libro
d) Author - Autor del libro
e) Imprint - Editorial
f) Publisher Group - Grupo Editorial
g) Volume - Volumen de ventas hasta el 2010
h) Value - Ventas determinadas por el volumen
i) RRP - Precio recomendado para minoristas
j) ASP - Precio promedio para venta
k) Binding - Tipo de encuadernación

3
EDX - Ciencia de datos – Rafael Wierna

l) Publ Date - Fecha de publicación


m) Product Class - Clasificación del libro
n) Classification - Clasificación General del libro

3) El archivo RATINGS contiene los siguientes datos:


a) Book Id - Identificador del libro
b) User Id - Identificador del cliente/usuario que clasifico un libro
c) Rating - Nivel de clasificación del libro.

4) El archivo TO_READ contiene los siguientes datos:


a) User Id - Identificador del cliente/usuario que clasifico un libro
b) Book Id - Identificador del libro

Hipótesis
1) Los libros con un mayor número de ediciones tienen una clasificación promedio más alta.
2) Existe una relación entre el volumen de ventas de un libro y su posición en la clasificación.
3) Los libros con una calificación promedio más alta tienen un precio promedio más alto.
4) Existe una relación entre la clasificación promedio de un libro y el número de veces que ha
sido clasificado.

4
EDX - Ciencia de datos – Rafael Wierna

Preguntas y Respuestas

1- ¿Qué gráficas se pueden realizar sobre el análisis de datos de la Librería Iztaccihuatl?

5
EDX - Ciencia de datos – Rafael Wierna

Posible dashboard

2- ¿Qué comparaciones se podrían realizar sobre los datos de la Librería Iztaccihuatl?

a. Cantidad de libros por autor


b. Cantidad de libros por autor clasificado por idioma
c. Cantidad de libros por ediciones
d. Cantidad de libros por ediciones clasificado por idioma
e. Cantidad de libros x idioma
f. Cantidad de libros clasificados x usuarios
g. Cantidad de usuarios que clasificaron un libro

3- ¿Qué correlaciones se pueden tener de los datos de la Librería Iztaccihuatl para poder
realizar un análisis descriptivo?

a) Descriptivo: Para entender las características de los libros deberíamos encontrar los
posibles patrones y relaciones con la que se pueden relacionar los distintos archivos

6
EDX - Ciencia de datos – Rafael Wierna

por ejemplo

En el archivo BOOKS, podríamos realizar un análisis descriptivo para ver la distribución


de las variables, como el promedio de clasificación (Average Rating), la cantidad de
ediciones (Number Editions) o el idioma en el que se escribieron (Language Code).
También podríamos comparar los libros en función de su género o categoría para ver si
hay diferencias en los promedios de clasificación o en el número de ediciones.
Identificar las variables categóricas de las variables continuas (diferenciar).

4- ¿Es posible realizar alguna predicción sobre los datos de la Librería Iztaccihuatl?

a. Predictivo: Si tenemos datos históricos de las ventas de los libros en el archivo


TOP_BOOKS, podríamos realizar un análisis predictivo para predecir las ventas futuras
en función de diferentes variables, como el autor, la editorial, la fecha de publicación o
el precio de venta. Podríamos utilizar técnicas de modelado estadístico o de
aprendizaje automático para predecir la demanda de los libros y ajustar nuestras
estrategias de marketing y de producción en consecuencia.

5- ¿Qué historia se podría contar de las visualizaciones a


los datos de la Librería Iztaccihuatl?

La mayoría de los libros están escritos en ingles


Tenemos gran cantidad de libros sin clasificar por idioma

En la distribución por idiomas y ediciones, predominan los


libros en ingles

Se observa que en el la distribución por autores


encontramos que se destaca el ingles como asi
también el autor Stephen King

7
EDX - Ciencia de datos – Rafael Wierna

6- ¿Qué indicadores serían los más importantes a determinar de acuerdo a la información


presentada?
i. KPI 1: Promedio de calificaciones de los libros (Average Rating) Este indicador permite
medir la calidad percibida de los libros por parte de los usuarios. Calcularemos el
promedio de las calificaciones asignadas a cada libro en el archivo RATINGS. Esto
brindará una idea de qué libros tienen una mejor recepción por parte de los usuarios.
ii. KPI 2: Número de clasificaciones por libro Este indicador proporciona información sobre
la popularidad y la participación de los usuarios en la clasificación de libros.
Contaremos el número de clasificaciones registradas para cada libro en el archivo
RATINGS. Esto dará una idea de qué libros generan más interacción y participación de
los usuarios.
iii. KPI 3: Ventas y posición en la clasificación de los libros utilizaremos los datos del
archivo TOP_BOOKS para analizar el rendimiento de los libros en términos de ventas y
posición en la clasificación. También utilizaremos indicadores como el volumen de
ventas (Volume) y la posición en la clasificación (Position) para identificar los libros más
exitosos y populares.
iv. KPI 4: Valor de ventas Este indicador permite evaluar el valor de las ventas generadas
por cada libro. Utilizaremos el campo "Value" en el archivo TOP_BOOKS para obtener
información sobre las ventas generadas por el volumen de ventas de cada libro.

7- ¿Qué tipo de análisis sería el más adecuado y por qué?

Tipo de análisis
b) Descriptivo: Para entender las características de los libros deberíamos encontrar los
posibles patrones y relaciones con la que se pueden relacionar los distintos archivos
por ejemplo

En el archivo BOOKS, podríamos realizar un análisis descriptivo para ver la distribución


de las variables, como el promedio de clasificación (Average Rating), la cantidad de
ediciones (Number Editions) o el idioma en el que se escribieron (Language Code).
También podríamos comparar los libros en función de su género o categoría para ver si
hay diferencias en los promedios de clasificación o en el número de ediciones.
Identificar las variables categóricas de las variables continuas (diferenciar).

8
EDX - Ciencia de datos – Rafael Wierna

c) Predictivo: Si tenemos datos históricos de las ventas de los libros en el archivo


TOP_BOOKS, podríamos realizar un análisis predictivo para predecir las ventas futuras
en función de diferentes variables, como el autor, la editorial, la fecha de publicación o
el precio de venta. Podríamos utilizar técnicas de modelado estadístico o de
aprendizaje automático para predecir la demanda de los libros y ajustar nuestras
estrategias de marketing y de producción en consecuencia.
d) Prescriptivo: Una vez que hayamos realizado el análisis predictivo, utilizaremos los
resultados para tomar decisiones prescriptivas, como ajustar el precio de venta de un
libro para maximizar las ventas, mejorar la promoción de los libros con mejor
desempeño o incluso ajustar la oferta de nuevos libros en función de los resultados de
la demanda prevista.

8- ¿Qué decisiones se podrían tomar basadas en los descubrimientos o inferencias


de la información analizada?

Propuestas de decisiones:

1- Identificar los libros más populares: Utilizando los datos del archivo TOP_BOOKS
que contienen la posición en la clasificación y el volumen de ventas, podríamos
identificar los libros más exitosos en términos de ventas. Esta información puede
ayudar a tomar decisiones sobre la promoción de esos libros, la asignación de recursos
de marketing y la planificación de nuevas ediciones.

2- Mejorar la selección de títulos: Analizando los datos del archivo BOOKS, podemos
evaluar el rendimiento de diferentes títulos en función de su calificación promedio y el
número de ediciones. Utilizando esta información, podemos tomar decisiones sobre
qué títulos promover más, cuáles deben tener más ediciones y cuáles pueden requerir
estrategias de marketing adicionales para mejorar su aceptación y calificación por parte
de los usuarios.

3- Personalizar recomendaciones: Utilizando el archivo RATINGS que contiene


información sobre las calificaciones de los usuarios para diferentes libros, podemos
implementar un sistema de recomendación personalizado para sus usuarios. Si
tenemos en cuenta las preferencias y clasificaciones anteriores de los usuarios,
podemos ofrecer recomendaciones específicas y adaptadas a los intereses de cada
cliente, lo que mejoraría su experiencia de usuario y fomentaría la fidelidad.

4- Segmentar el público: Utilizando los datos de los archivos BOOKS y TOP_BOOKS,


podemos identificar los subgéneros y clasificaciones más populares entre diferentes
grupos de usuarios. Esto permitirá una segmentación más efectiva del público y una
estrategia de marketing más dirigida, adaptando las campañas promocionales y de
publicidad a los gustos y preferencias de cada segmento.

5- Optimizar precios y promociones: Al analizar los datos del archivo TOP_BOOKS


que contienen información sobre precios promedio y ventas determinadas por el
volumen, podemos evaluar la efectividad de sus estrategias de precios y promociones.
Identificar qué precios o descuentos generan un mayor volumen de ventas y una mayor
rentabilidad puede ayudar a optimizar las estrategias de fijación de precios y
promociones para maximizar los ingresos.

Estas propuestas de decisiones se basan en la información del dataset, además de tener en


cuenta las metas y objetivos comerciales de la empresa.

9
EDX - Ciencia de datos – Rafael Wierna

Conclusiones

El análisis de los datos proporciona información valiosa para tomar decisiones estratégicas en
áreas como promoción, selección de títulos, recomendaciones personalizadas, segmentación
de público y optimización de precios y promociones.

Por ejemplo:

El análisis de los datos de ventas y clasificación puede ayudar a identificar los libros
más exitosos y tomar decisiones estratégicas relacionadas con la promoción y el
marketing de esos libros.

Al evaluar el rendimiento de diferentes títulos en función de las calificaciones promedio


y el número de ediciones, se puede tomar decisiones informadas sobre qué libros
promover, cuántas ediciones hacer y cómo mejorar la aceptación de ciertos títulos.

Utilizando la información de calificaciones de los usuarios, se puede implementar un


sistema de recomendación personalizado que mejore la experiencia del usuario y
fomente la fidelidad al ofrecer recomendaciones adaptadas a los intereses individuales.

Mediante el análisis de los subgéneros y clasificaciones más populares entre diferentes


grupos de usuarios, es posible realizar una segmentación efectiva del público y ajustar
las estrategias de marketing para dirigirse a cada segmento de manera más precisa.

El análisis de los datos de precios y ventas puede ayudar a determinar las estrategias de
precios y promociones más efectivas para maximizar los ingresos, identificando los
precios y descuentos que generan un mayor volumen de ventas y rentabilidad.

Rafael Wierna

10

También podría gustarte