Данный проект включает в себя четыре лабораторные работы, посвященные различным аспектам машинного обучения и статистического анализа. Каждая лабораторная работа фокусируется на уникальной задаче, начиная с линейной регрессии и заканчивая кластеризацией и текстовой классификацией.
-
Лабораторная работа №1: Прогнозирование моделью линейной регрессии
Построение линейной регрессионной модели для прогнозирования ожидаемой продолжительности жизни мужчин на основе демографических показателей. -
Лабораторная работа №2: Бинарная классификация
Решение задачи бинарной классификации для определения регионов с выраженностью демографических трендов. -
Лабораторная работа №3: Кластеризация демографических данных
Кластеризация демографических данных по регионам с использованием иерархической кластеризации и метода k-средних. -
Лабораторная работа №4: Определение семантической окраски твитов
Подготовка и анализ набора данных для обучения моделей классификации текста на основе твитов.
- Python
- NumPy
- Pandas
- SciPy
- scikit-learn
- statsmodels