Análisis de embudo de ventas y test A/B
Fragmentos del notebook, para ver proyecto completo hacer click aquí
Se ha recibido una tarea analítica de una tienda en línea internacional. no se ha conseguido completarla: se lanzó una prueba A/B y luego se abandonó. Solo se dejaron las especificaciones técnicas y los resultados de las pruebas.
- Lenguaje de Programación: Python.
- Entorno de Desarrollo: Jupyter Notebook.
- Bibliotecas: Pandas, Numpy, Math, Seaborn, Matplotlib, Plotly, Stats, Datetime.
Este informe estará dividido en cuatro partes, cada una de ellas tendrá diferentos objetivos:
Preanálisis: Etapa en la cual se cargan los datos y se optimizan en caso de ser necesario, se trabajan los valores duplicados y ausentes, y finalmente, se modifican los datos para facilitar el posterior análisis. Describe los objetivos del estudio.
- ¿Es necesario convertir los tipos?
- ¿Hay valores ausentes o duplicados? Si es así, ¿cómo se caracterizarían?
Análisis exploratorio de datos: En esta fase se estudiarán las diferentes variables y la calidad de los datos para el desarrollo de una prueba A/B.
- Estudiar la conversión en las diferentes etapas del embudo.
- ¿El número de eventos por usuario está distribuido equitativamente entre las muestras?
- ¿Hay usuarios que están presentes en ambas muestras?
- ¿Cómo se distribuye el número de eventos entre los días?
- ¿Hay alguna peculiaridad en los datos que hay que tener en cuenta antes de iniciar la prueba A/B?
Evaluar los resultados de la prueba A/B: Una vez determinada la calidad de los datos, se realizan las pruebas estadísticas para determinar si se cumplen los objetivos.
- Utilizar una prueba z para comprobar la diferencia estadística entre las proporciones.
- ¿Qué se puede concluir sobre los resultados de la prueba A/B?
Conclusiones: Se presentarán las conclusiones con respecto a la etapa EDA y los resultados de la prueba A/B.
El análisis del del test A/B reveló algunos patrones importantes de comportamiento, sin embargo, la calidad de los descubrimientos es proporcional a la calidad de la información y, en este proyecto, los descubrimientos más importantes tienen que ver con eso.
Ejecuta el proyecto aquí
Para ver el diccionario de datos, el desarrollo completo en código, todos los gráficos y las conclusiones, haga click en el enlace de arriba.