Написать проект по анализу данных. Пожелания и особенности: Проект по анализу данных — это работа, где вы выбираете подходящий датасет, а затем полностью анализируете. Вам нужно взять таблицу с минимум 100 наблюдениями, в которой есть и числовые, и категориальные признаки, а также одна целевая переменная, по которой можно строить линейную или логистическую регрессию. После выбора данных вы загружаете их в Jupyter Notebook и проводите разведочный анализ. В ходе EDA вы описываете признаки, определяете их типы, проверяете наличие пропусков и дубликатов и очищаете данные. Затем вы строите графики распределений количественных и категориальных признаков, находите и удаляете выбросы двумя методами — по стандартным отклонениям и по межквартильному размаху. После этого считаете описательные статистики, интерпретируете их и перекодируете категориальные признаки с помощью OneHotEncoder и LabelEncoder. Далее начинается исследовательский этап: вы рассчитываете корреляции между целевой переменной и предикторами, строите корреляционную матрицу, выбираете наиболее связанные признаки и при желании масштабируете числовые данные. Затем вы строите модель регрессии: делите данные на тренировочную и тестовую выборки, обучаете модель, записываете уравнение регрессии в LaTeX, интерпретируете коэффициенты и оцениваете качество модели по метрикам. После этого вы проводите все статистические тесты, которые проходили на курсе, формулируете гипотезы, оформляете их в LaTeX и интерпретируете результаты. Также для бонуса можно выполнить бутстрап-тест. Весь проект должен быть оформлен в одном Jupyter Notebook формата .ipynb и содержать код, графики, выводы и пояснения в markdown.