Для работы Проверяющий домашних заданий по машинному обучению (ML) ?? Частичная занятость | ? 1–2 часа в неделю | ?? Удалённо Ищем проверяющего для курса по машинному обучению. Подходит студентам и начинающим специалистам с опытом от 6 месяцев до 1,5 лет в Data Science / ML. Задача — проверять домашние работы по готовым решениям и оставлять комментарии. Будет плюсом опыт преподавания или проверки работ (в вузах, на курсах и т.д.) и желание развиваться в сфере преподавания. Можно совмещать с учёбой или основной работой. Есть возможность бесплатно пройти курс. Как откликнуться: Отправьте краткое сообщение о себе (где учитесь/работаете, опыт в ML, интерес к преподаванию) и ссылку на профиль (GitHub, Telegram или LinkedIn).
Для себя Вид заказа: машинное обучение. Описание: Нужна помощь в обучении машинному обучению в области ИБ. Имеется проект, реализовать классификатор событий ИБ, результатом которого будет вероятность ИИБ. Мне необходимо с нуля обьяснить что такое машинное обучение, как работает, помочь выбрать модель для классификации. Желательно за одно занятие, можно несколько часов. Результатом, я должен сам, с нуля выполнять похожие задачи.
Для себя Используя наборы данных StateNames.csv и NationalNames.csv, отображающие: популярность имён новорождённых по штатам; изменение популярности имён новорождённых по годам. Построить модель, которая бы позволила предсказывать популярные мужские имена в разрезе дат (лет) и штатов. Девушки выполняют Вариант 1, юноши -- Вариант 2. Входными параметрами являются название штата и имя: например, NY и Sarah или FL и Edward.
Для себя Вкатиться в ML разработку. Подготовка по линейной алгебре и мат анализу. Разработка Deep Learning моделей под мои задачи. Пример проекта, который я себе поставил как цель - анализ книг на нарушения по категориям. Имею опыт разработки. Обладаю гибкостью в разработке и тестировании. Python могу писать только с помощью гугла, знаю C# и подходы к разработке. В большинстве своём занимался разработкой игр на том же C#.
Для себя Нужно помочь улучшить скор в моей задаче. Использую градиентный бустинг catboost, но пока не получается сильно улучшить результаты в задаче регрессии. Данных 10 тысяч, это временной ряд.
Дз университет Мне нужно по моему датасету сделать следующее: И желательно в ближайшие дни Прогнозирование выручки с использованием моделей временных рядов 1. Подготовка данных ? Создайте датафрейм из двух столбцов: date (дата) и sales (продажи/выручка). ? Преобразуйте столбец date в тип datetime. ? Установите date в качестве индекса датафрейма (df.set_index('date', inplace=True)). ? Проверьте данные на пропуски и дубликаты. Решите, как их обработать (интерполяция, заполнение средним и т.д.). 2. Агрегация и первичный анализ ? Используйте df.resample('M').sum() (или 'W', 'Q') для выбора периода (месяц — оптимально для большинства бизнес-задач). Обоснуйте выбора периода. ? Постройте линейный график агрегированного ряда (plot()). Оцените визуально: есть ли тренд, сезонность, выбросы, структурные изменения. 3. Декомпозиция ряда ? Выполните декомпозицию (аддитивную или мультипликативную) с помощью seasonal_decompose. Мультипликативная модель подходит, если амплитуда сезонных колебаний растет со временем. ? Визуализируйте тренд, сезонную компоненту и остаток. 4. Проверка на стационарность и стационаризация ? Определите тип колеблемости с помощью автокорреляции первого порядка по отклонению от тренда. ? Определите стационарность набора данных с помощью теста Дики-Фуллера (ADF). Если p-value > 0.05, ряд нестационарен. ? Примените первое дифференцирование: df_diff = df.diff().dropna(), если ряд нестационарен. ? Повторно провести ADF-тест для df_diff. Если ряд все еще нестационарен, применить второе дифференцирование. Порядок дифференцирования d = 1 (реже 2). 5. Идентификация модели ? Постройте графики ACF и PACF для стационарного ряда (df_diff). ? Определите p (порядок AR). Смотреть на график PACF. Порядок p — это количество значимых выбросов до того, как корреляции перестанут быть значимыми (окажутся внутри доверительного интервала). ? Определите q (порядок MA). Смотреть на график ACF. Порядок q — это количество значимых выбросов до того, как корреляции перестанут быть значимыми. ? Определите наличие сезонности. Если на графике ACF исходного ряда есть значимые пики на лагах, кратных периоду (например, на 12, 24, 36 для месячных данных), нужна SARIMA с сезонными параметрами (P, D, Q, S), где S — период сезонности (12 для месяцев). 6. Разделение данных и обучение модели ? Разделите ряд на обучающую (70-80%) и тестовую (20-30%) выборки. Не перемешивать! Тестовая часть — это последние периоды временного ряда. ? Подберите несколько моделей-кандидатов на основе шага 5 (например, ARIMA(1,1,1), ARIMA(0,1,2), SARIMA(1,1,1)(1,1,1,12)). ? Обучите каждую модель на тренировочных данных. 7. Валидация и выбор лучшей модели ? Сделайте прогноз по каждой модели на длину тестовой выборки. ? Рассчитайте метрики ошибок (MAE, RMSE, MAPE) на тестовой выборке, сравнив прогноз с реальными значениями. ? Выберите модель с наименьшими ошибками. ? Визуализируйте: на одном графике тренировочные данные, тестовые данные и прогноз выбранной модели. 8. Диагностика остатков ? Получите остатки (ошибки) финальной модели: residuals = model_fit.resid. ? Проверьте на нормальность полученные ошибки. Постройте гистограмму с кривой распределения и/или Q-Q plot. Выполнить тест Шапиро-Уилка (если данных не очень много). ? Проверьте на автокорреляцию полученные остатки. Постройте график ACF для остатков. Выполнить тест Льюнга-Бокса (p-value должен быть > 0.05, что говорит об отсутствии автокорреляции). ? Проверьте остатки на гомоскедастичность. Постройте график остатков от времени. Не должно быть какой-либо структуры (например, увеличения разброса со временем). Хорошие остатки похожи на "белый шум". 9. Финальное прогнозирование ? Если диагностика остатков удовлетворительная, переобучите выбранную модель на всем доступном наборе данных (train + test). ? Постройте прогноз на нужное количество шагов вперед. ? Постройте график итогового прогноза с доверительными интервалами. В чем проблема - у меня вроде получилось сделать 5 первых шагов, но датасет всего из 12 месяцев и это создает проблемы, которые я не уверена, что решаю и интерпретирую правильно Так же до этого делала анализ по этому датасету (что-то вроде предобработка, eda, статистический анализ) и там есть некоторые моменты по rfm анализу, где хотелось бы тоже услышать мнение, но это уже по возможности и не так важно
Для себя Есть датасет и первые пять пунктов вроде сделаны, но с остальными не получается Сделать надо сегодня-завтра Прогнозирование выручки с использованием моделей временных рядов 1. Подготовка данных ? Создайте датафрейм из двух столбцов: date (дата) и sales (продажи/выручка). ? Преобразуйте столбец date в тип datetime. ? Установите date в качестве индекса датафрейма (df.set_index('date', inplace=True)). ? Проверьте данные на пропуски и дубликаты. Решите, как их обработать (интерполяция, заполнение средним и т.д.). 2. Агрегация и первичный анализ ? Используйте df.resample('M').sum() (или 'W', 'Q') для выбора периода (месяц — оптимально для большинства бизнес-задач). Обоснуйте выбора периода. ? Постройте линейный график агрегированного ряда (plot()). Оцените визуально: есть ли тренд, сезонность, выбросы, структурные изменения. 3. Декомпозиция ряда ? Выполните декомпозицию (аддитивную или мультипликативную) с помощью seasonal_decompose. Мультипликативная модель подходит, если амплитуда сезонных колебаний растет со временем. ? Визуализируйте тренд, сезонную компоненту и остаток. 4. Проверка на стационарность и стационаризация ? Определите тип колеблемости с помощью автокорреляции первого порядка по отклонению от тренда. ? Определите стационарность набора данных с помощью теста Дики-Фуллера (ADF). Если p-value > 0.05, ряд нестационарен. ? Примените первое дифференцирование: df_diff = df.diff().dropna(), если ряд нестационарен. ? Повторно провести ADF-тест для df_diff. Если ряд все еще нестационарен, применить второе дифференцирование. Порядок дифференцирования d = 1 (реже 2). 5. Идентификация модели ? Постройте графики ACF и PACF для стационарного ряда (df_diff). ? Определите p (порядок AR). Смотреть на график PACF. Порядок p — это количество значимых выбросов до того, как корреляции перестанут быть значимыми (окажутся внутри доверительного интервала). ? Определите q (порядок MA). Смотреть на график ACF. Порядок q — это количество значимых выбросов до того, как корреляции перестанут быть значимыми. ? Определите наличие сезонности. Если на графике ACF исходного ряда есть значимые пики на лагах, кратных периоду (например, на 12, 24, 36 для месячных данных), нужна SARIMA с сезонными параметрами (P, D, Q, S), где S — период сезонности (12 для месяцев). 6. Разделение данных и обучение модели ? Разделите ряд на обучающую (70-80%) и тестовую (20-30%) выборки. Не перемешивать! Тестовая часть — это последние периоды временного ряда. ? Подберите несколько моделей-кандидатов на основе шага 5 (например, ARIMA(1,1,1), ARIMA(0,1,2), SARIMA(1,1,1)(1,1,1,12)). ? Обучите каждую модель на тренировочных данных. 7. Валидация и выбор лучшей модели ? Сделайте прогноз по каждой модели на длину тестовой выборки. ? Рассчитайте метрики ошибок (MAE, RMSE, MAPE) на тестовой выборке, сравнив прогноз с реальными значениями. ? Выберите модель с наименьшими ошибками. ? Визуализируйте: на одном графике тренировочные данные, тестовые данные и прогноз выбранной модели. 8. Диагностика остатков ? Получите остатки (ошибки) финальной модели: residuals = model_fit.resid. ? Проверьте на нормальность полученные ошибки. Постройте гистограмму с кривой распределения и/или Q-Q plot. Выполнить тест Шапиро-Уилка (если данных не очень много). ? Проверьте на автокорреляцию полученные остатки. Постройте график ACF для остатков. Выполнить тест Льюнга-Бокса (p-value должен быть > 0.05, что говорит об отсутствии автокорреляции). ? Проверьте остатки на гомоскедастичность. Постройте график остатков от времени. Не должно быть какой-либо структуры (например, увеличения разброса со временем). Хорошие остатки похожи на "белый шум". 9. Финальное прогнозирование ? Если диагностика остатков удовлетворительная, переобучите выбранную модель на всем доступном наборе данных (train + test). ? Постройте прогноз на нужное количество шагов вперед. ? Постройте график итогового прогноза с доверительными интервалами.
Для себя Разработка 3-ех слойной нейронной сети и ее машинное обучение для корреляционного и регрессионного анализа вклада 3 основных параметров в измерения
Для работы Разработать: 1. Методические материалы по практической и самостоятельной работе студентов 2. Контрольно-оценочные средства по дисциплинам: Разработка программных модулей в системах искусственного интеллекта Разработка мобильных приложений с поддержкой искусственного интеллекта Тестирование программных модулей Есть разработанные образовательные программы, названия практических работ.
Для сдачи работ и подготовке к их защите Нужна помощь написать практические работы по машинному обучению, подробно их разобрать, разобраться в логике работы кода и теории. В практических заданиях нужно писать методы машинного обучение ВРУЧНУЮ, без использования библиотек. Надо также разобрать не только код, но и теорию, чтобы хорошо подготовиться к защите. Конкретно, нужно реализовать наивный байес, plug-in (подстановочный), лдф, рбф, линейную регрессию (или любое из регрессии/ классификации), knn но необычный (расскажу) Осталось на сдачи работ две недели (два практических занятия)
Как мне найти учеников по профилю машинное обучение в России?
Зарегистрируйтесь и создайте привлекательный профиль с упоминанием вашей специализации. Обратите внимание на количество доступных заявок от учеников, которое на июнь 2026 года составляет 72
Какие требования к преподавателям на вашем сайте?
На нашем сайте приветствуются преподаватели с любым уровнем квалификации. Мы рекомендуем указать все свои сертификаты и образование, чтобы увеличить шансы на нахождение учеников
Могу ли я установить гибкий график работы?
Вы полностью контролируете свой график и можете обсуждать его напрямую с учениками, чтобы найти удобное время для обеих сторон
Каков потенциальный заработок для репетитора машинное обучение?
Заработок зависит от количества занятий и квалификации. В среднем, за одно занятие можно заработать 711.67 рублей с занятия. Больше занятий в неделю – выше доход