Написать проект в университет. Пожелания и особенности: Скину подробное описание самому кандидату. Проект по анализу данных — это командная работа, где вы выбираете подходящий датасет, согласовываете его с ассистентом, а затем полностью анализируете. Вам нужно взять таблицу с минимум 100 наблюдениями, в которой есть и числовые, и категориальные признаки, а также одна целевая переменная, по которой можно строить линейную или логистическую регрессию. После выбора данных вы загружаете их в Jupyter Notebook и проводите разведочный анализ. В ходе EDA вы описываете признаки, определяете их типы, проверяете наличие пропусков и дубликатов и очищаете данные. Затем вы строите графики распределений количественных и категориальных признаков, находите и удаляете выбросы двумя методами — по стандартным отклонениям и по межквартильному размаху. После этого считаете описательные статистики, интерпретируете их и перекодируете категориальные признаки с помощью OneHotEncoder и LabelEncoder. Далее начинается исследовательский этап: вы рассчитываете корреляции между целевой переменной и предикторами, строите корреляционную матрицу, выбираете наиболее связанные признаки и при желании масштабируете числовые данные. Затем вы строите модель регрессии: делите данные на тренировочную и тестовую выборки, обучаете модель, записываете уравнение регрессии в LaTeX, интерпретируете коэффициенты и оцениваете качество модели по метрикам. После этого вы проводите все статистические тесты, которые проходили на курсе, формулируете гипотезы, оформляете их в LaTeX и интерпретируете результаты. Также для бонуса можно выполнить бутстрап-тест. Весь проект должен быть оформлен в одном Jupyter Notebook формата .ipynb и содержать код, графики, выводы и пояснения в markdown. Потом вы защищаете проект: каждому участнику задают по пять вопросов по любому месту проекта, и количество правильных ответов влияет на итоговую оценку. В итоге проект — это полный анализ выбранного датасета от его подготовки до построения модели и статистических выводов, оформленный в ноутбуке и устно защищённый перед преподавателем. ДАТАСЕТ УЖЕ ВЫБРАН.