Análisis con pyspark de películas publicadas en Netflix, en base a preguntas predefinidas, en formato notebook.
Para usar el notebook, se requiere de algún programa específico, como Jupyter o VS Code.
El notebook se ha elaborado en Google Colab, por lo que el archivo de requirements.txt contiene muchas más librerías de lo realmente necesario, y por ello no es recomendable instalar todo en el entorno de Python. No obstante, de querer hacerlo, se puede realizar por ejemplo con pip: pip install -r requirements.txt
.
Es posible que se deban cambiar las rutas de acceso. El programa descarga los datos de csv de Internet a través de comandos de Linux, con rutas específicas.