На 14 июля 2020:
- Две курсовые по аналитике сдали около 200 студентов;
- Курсовую по ML - около 25.
На 17 августа 2020:
- Две курсовые по аналитике сдали около 250 студентов;
- Курсовую по ML - около 40.
- 👨🎓️📊 Как научиться Data Science онлайн: 12 шагов от новичка до профи
- Руководство для начинающих - ML BootCamp
Alexander Kamyshnikov: ... статья - подробно с примерами от загрузки данных, их трансформации, преобразования, очистки до обучения и получения результатов
- Уставновить Docker - для этого, включить виртуализацию в BIOS, в Windows включить WSL2 или Hyper-V.
- WSL2 - более новая и должна работать лучше, но установка чуть сложнее и состояние beta, работает начиная с windows 2004.
- Проще пока (на конец июля 2020) включить Hyper-V.
docker pull jupyter/datascience-notebook
- получаем докер файл. Есть различные готовые образы с различным набором библиотек- Подключить папку для доступа из Docker. Вот инструкция, но возможно не обязательно делать..
- Подробная инструкция по Docker и Jupyter Lab.
Основное (запуск происходит вот такой командой):
docker run --rm -p 8888:8888 -e JUPYTER_ENABLE_LAB=yes -v "//D/DataScientist:/home/jovyan/work" jupyter/datascience-notebook
--rm
- "очистить" контейнер после выключения (все на заводские).-p 8888:8888
- связать порт локального компьютера и порт Docker-контейнера.-v //D/DataScientist:/home/jovyan/work
- связать директорию локального компьютера и контейнера//D/
- замена пути для windowsD:\
:
- соединитель путей/home/jovyan/work
- рабочая директория контейнера (задана его создателями)"..."
- кавычки не обязательны, если нет пробелов в пути к нужной папке
jupyter/datascience-notebook
- какой контейнер запускать.- В консоли будет ссылка, по которой можно будет подключится к Jupyter Lab
- Если не хватает пакетов в контейнере можно их доставить
docker ps
- когда контейнер работает покажет его IDdocker exec 06b8394227e1 pip install requests
exec
- выполнить команду в контейнере06b8394227e1
- id контейнера- всё что после
docker exec 06b8394227e1
- просто команды которые передаются в консоль контейнера
- Установленное не сохранится после выключения контейнера, можно собрать контейнер под себя, с этим нужно разбираться.
Для Jupyter lab есть плагин, который позволяет работать с git. Плагин и инструкция по установке выложены на github: jupyterlab / jupyterlab-git Также можно поставить из репозитория Anaconda:
conda install jupyterlab-git
jupyter lab build
Для анаконды возможно придётся подключить сторонний репозиторий conda-forge
- conda config --add channels conda-forge