Выполнить задание. Нужно будет написад код и сделать презентацию Датасет: https://www.kaggle.com/datasets/tawfikelmetwally/employee-dataset Задание: Подберите дополнительные параметры (не менее 5) по которым будете проводить анализ данных. Для этого можно создать дополнительные столбцы с категориями Очистите данные, при необходимости уберите, занулите или усредните данные (в зависимости от выбранного датасета) 1) Создайте круговую диаграмму, которая отражает соотношение между выбранными параметрами для анализа по бинарной переменной (например, по мужчинам и женщинам) по среднему значениям из выбранных Вами столбцов. Создайте подписи и легенду для графика. Вставьте скриншоты полученных диаграмм в презентацию. 2) Сгруппируйте данные по выбранным вами критерииям из нескольких столбцов (например, год) используя GroupBy и pivot table. (не менее 3 группировок) 3) Критерии должны содержать не менее 3 и не более 30 различных вариантов значений. Сравните результат. Отразите выводы в презентации. 4) Постройте две линейных диаграммы на одном графике. Каждая должна соответствовать своему значению бинарной переменной (например, первая должна отражать результаты выбранного сгруппированного столбца для мужчин, вторая для женщин). Вставьте подписи по осям, подберите размер, чтобы график читался. Вставьте скриншот полученного графика в презентацию. 5) Постройте диаграмму рассеивания, которая отражает взаимосвязь между выбранными вами столбцами. Разделите значения для двух значений бинарной переменной (например, для мужчин и для женщин) разными цветами. Ограничьте диапазон введенных данных используя фильтр (например, отбросьте результаты людей младше 18 лет). Объясните полученные результаты. Вставьте скриншот полученной диаграммы в презентацию и добавьте объяснение взаимосвязи. 6) Выдвиньте дополнительные 3 гипотезы, которые имеют отношение к имеющимся данным. Опишите их в презентации. Подтвердите или опровергните их используя различные виды графических представлений. Добавьте в презентацию графики разных типов и опишите свои наблюдения, подтверждения или опровержения выдвинутых гипотез. 7) При выполнении задания воспользуйтесь минимум 3 нейросетями, сравните результат и вынесете его на отдельный слайд.
Выполнить задачу. Нужно будет написад код и сделать презентацию Датасет: https://www.kaggle.com/datasets/tawfikelmetwally/employee-dataset Задание: Подберите дополнительные параметры (не менее 5) по которым будете проводить анализ данных. Для этого можно создать дополнительные столбцы с категориями Очистите данные, при необходимости уберите, занулите или усредните данные (в зависимости от выбранного датасета) 1) Создайте круговую диаграмму, которая отражает соотношение между выбранными параметрами для анализа по бинарной переменной (например, по мужчинам и женщинам) по среднему значениям из выбранных Вами столбцов. Создайте подписи и легенду для графика. Вставьте скриншоты полученных диаграмм в презентацию. 2) Сгруппируйте данные по выбранным вами критерииям из нескольких столбцов (например, год) используя GroupBy и pivot table. (не менее 3 группировок) 3) Критерии должны содержать не менее 3 и не более 30 различных вариантов значений. Сравните результат. Отразите выводы в презентации. 4) Постройте две линейных диаграммы на одном графике. Каждая должна соответствовать своему значению бинарной переменной (например, первая должна отражать результаты выбранного сгруппированного столбца для мужчин, вторая для женщин). Вставьте подписи по осям, подберите размер, чтобы график читался. Вставьте скриншот полученного графика в презентацию. 5) Постройте диаграмму рассеивания, которая отражает взаимосвязь между выбранными вами столбцами. Разделите значения для двух значений бинарной переменной (например, для мужчин и для женщин) разными цветами. Ограничьте диапазон введенных данных используя фильтр (например, отбросьте результаты людей младше 18 лет). Объясните полученные результаты. Вставьте скриншот полученной диаграммы в презентацию и добавьте объяснение взаимосвязи. 6) Выдвиньте дополнительные 3 гипотезы, которые имеют отношение к имеющимся данным. Опишите их в презентации. Подтвердите или опровергните их используя различные виды графических представлений. Добавьте в презентацию графики разных типов и опишите свои наблюдения, подтверждения или опровержения выдвинутых гипотез. 7) При выполнении задания воспользуйтесь минимум 3 нейросетями, сравните результат и вынесете его на отдельный слайд.
Data Science. Разработка с нуля. Необходимо очень быстро, разово подать заявку на покупку. В связи с тем, что интернет не быстрый и имеет свою задержку. Нужно, что бы команда по отправке заявки исполнялась по логике (системное время - заданное время) речь о миллисекундах. Нужно максимально незаметное решение, что бы в логах торгового терминала не было следа от этого алгоритма.
Прохождение онлайн-курса. Необходимо допройти онлайн курс на data-инженера с выполнением всех заданий и итоговой работы в сжатые сроки (Python, SQL, Airflow).
Data Science. Доработка существующего продукта, разработка с нуля. Здравствуйте! Меня зовут Даниил, я сейчас работаю над исследовательской работой в области применения методов машинного обучения к финансовым данным. Тема проекта — использование новостного сентимента для прогнозирования краткосрочного движения цен акций (на примере Amazon). Я собираю датасет новостей, оцениваю их сентимент с помощью языковых моделей, агрегирую признаки (среднее, стандартное отклонение, количество новостей, а также скользящие окна) и объединяю их с рыночными данными (OHLCV) для построения модели предсказания направления движения цены на следующий день. На текущем этапе я столкнулся рядом проблем: — сложности со сбором и качеством данных (в частности, неполные временные метки, неоднородность источников) — добавление признаков на основе сентимента практически не улучшает метрику модели — итоговая точность остаётся на уровне, близком к базовой, и сложно интерпретировать, есть ли в данных значимый сигнал Я хотел бы лучше понять, является ли это следствием ограничений данных/подхода или же в текущей постановке задачи действительно сложно извлечь предсказательную силу, и как корректно это исследовать. Вы могли бы помочь мне с этой задачей?.
Data Science. Разработка с нуля. Добрый день. нужно доработать отчеты ВБ продавца в Excel. При выгрузке отчетов, чтобы добавлялась дополнительная колонка и считала вес.
Разработка с нуля. “Нужен практический формат: минимум теории, максимум задач. Учусь по выходным. Цель: Excel-аналитика для бизнеса + Power Query + сводные + базовая автоматизация. Хочу работать на моих кейсах (маржа, план/факт, KPI). На каждом занятии: 10 минут объяснение ? 60 минут делаем ? 20 минут разбор ошибок. GPT использую для формул/шагов PQ.”.
Разработка с нуля, Ищу наставника. Пожелания и особенности: Ищу наставника в области аналитики данных, сама самоучка. Много работала с таблицами, структуризацией. Хочу полностью освоить данную профессию под руководством специалиста своего дела.
Задачи по сбору данных, очистке данных, созданию визуализаций (дашбордов) и коммуникации результатов анализа с заинтересованными сторонами. -Сбор требований от бизнес-заказчиков для разработки аналитических решений -Написание SQL-запросов для извлечения нужных данных из различных источников -Очистка и преобразование данных для подготовки к анализу -Разработка и поддержка интерактивных дашбордов в BI-инструментах (Power BI) -Создание ETL-процессов для автоматизации сбора и обработки данных -Анализ бизнес-показателей и выявление причинно-следственных связей -Подготовка презентаций и коммуникация результатов анализа заинтересованным сторонам.
Data Science. Разработка с нуля. Добрый день. Необходимо подготовить программу для парсера цен с сайтов конкурентов, авито, таблицы Ексель - оформление отчета в таблицу. Нужно, чтобы писало сравнение нашей цены, цены конкурента, цены с авито. С возможностью в дальнейшем интегрировать на наш сайт - сайт на Битриксе. По парсеру еще нужно чтобы формировался график движения цен и можно было выбирать.
Data Science. Разработка с нуля, настройка, доработка существующего продукта. Создать ETL процесс по загрузке данных из открытых источников используя Python, Airflow.
Разработка с нуля. Пожелания и особенности: Требуется разработка управленческого аналитического дашборда для внутреннего использования театром. Цель: перейти от просмотра отдельных показателей к портфельному анализу репертуара и управлению решениями через KPI и интегральный рейтинг спектаклей. Это не маркетинговый лендинг и не простой отчёт, а полноценная BI-модель: • расчётные KPI, • интегральный score, • сценарный анализ, • работа с историческими данными. Данные обезличены. Персональных данных нет. Что нужно реализовать 1. Модель данных Источник — Excel (несколько таблиц): • Показы (каждый показ — строка) • Справочник спектаклей • Общие показатели театра 2. Расчёт 9 KPI Зрительские KPI 1. Заполняемость зала (%) 2. Глубина продаж (дни до показа) Финансовые KPI 3. Выручка на показ 4. Маржинальность показа (%) 5. Доля спектакля в общей выручке театра (%) Репертуарный KPI 6. Портфельная категория спектакля (якорный / стабильный / экспериментальный / проблемный) Репутационный KPI 7. Репутационный индекс (0–10) (задаётся справочником) Маркетинговые KPI 8. CAC — стоимость привлечения зрителя 9. ROMI — возврат маркетинговых инвестиций 3. Интегральный рейтинг спектакля • Нормализация KPI • Весовая модель • Итоговый score 0–100 • Возможность менять веса блоков 4. Визуализация Обязательно: ✅ Матрица «Спектакль × KPI» (цветовая индикация) ✅ Карточка спектакля ✅ Динамика показателей по времени ✅ Анализ портфеля (распределение ролей спектаклей) ✅ Фильтры (год / месяц / спектакль / зал) 5. Сценарный анализ (What-If) Например: • изменение количества показов • изменение цены билета • изменение маркетингового бюджета • вывод спектакля из репертуара Что я предоставляю • Excel-данные (реальные, обезличенные) • Описание KPI • Логику бизнес-процесса • Требования к визуализации Что нужно получить на выходе • Файл Power BI (.pbix) или Excel BI • Настроенную модель данных • Все KPI в расчётах • Инструкцию по обновлению данных • 1–2 итерации правок Обязательные требования к исполнителю Важно: ✔ Опыт разработки BI-дашбордов (не только визуалов) ✔ Опыт расчётных показателей (DAX / Power Pivot / SQL-логика) ✔ Понимание KPI-моделей ✔ Опыт работы с несколькими источниками данных Будет большим плюсом — Опыт управленческой аналитики — Опыт построения рейтингов / scoring моделей — Опыт What-If сценариев — Опыт Power BI DAX на хорошем уровне В отклике прошу сразу указать 1. В какой BI системе будете делать 2. Примеры похожих проектов 3. Работали ли с KPI-score моделями 4. Работали ли с What-If параметрами 5. Оценку сроков Важно Проект выполняется в рамках управленческого и исследовательского проекта в сфере культуры. Нужен человек, который понимает, что это не просто визуализация, а управленческий инструмент принятия решений.
Data Science. Разработка с нуля. Ищу Python-разработчика для создания системы сравнительного анализа двух источников данных – полей БД SQLite и Excel. Задача: - автоматизировать cсопоставление полей БД (нормализованные таблицы: группа, альбом, лейбл, страна, кат.номер, дата/год и страна релиза) с данными Excel (заголовок, описание – неструктурированные данные) - проводить ранжирование приоритетных сопоставлений по рейтингу и цене. Технологии: - Python 3.10+ (pandas, numpy, sqlite3) - Fuzzy matching (rapidfuzz/fuzzywuzzy или sentence-transformers) - SQLite - Excel Требования к специалисту: - Опыт pandas/SQLite - Понимание fuzzy string matching (rapidfuzz, Levenshtein) - Навыки data preprocessing (регулярки, очистка текста) - Опыт ранжирования по весовым коэффициентам - Желательно: ML (sentence embeddings).
Data Science. Доработка существующего продукта. Необходимо доработать файл сбора данных формата xlsx по определенным требованиям к формированию, необходима установка макросов, диаграм, возможность получения документа на печать по определенному виду.
Data Science. Разработка с нуля. Задача: Сделать скрипт для Эксель с целью: 1, Получить и записать в таблицу эксель котировки ценной бумаги по соотв. тикеру за выбранный период времени, например 5 мин, 15 мин, 1час, 1 день 2, За выбранный период получить и записать в таблицу эксель объем торгов 3, Получить и записать в эксель минимум, максимум, цену открытия и закрытия выбранной ценной бумаги за выбранный временной период. По сути, искомый результат таблицы состоит из столбцов, содержащих время с заданным интервалом (5 мин, 15 мин, 1час, 1 день или др.). И строк, соотв. заданному интервалу А (тикер ценной бумаги), В (цена открытия). С (цена закрытия). D (минимум), Е (максимум), F (объем торгов).
Data Science. Разработка с нуля. Пожелания и особенности: Необходимо выбрать файл, содержащий информацию об экономических показателях. Источник может служить World Bank, Росстат, ЦБ, или другой ресурс. Можно выбрать данные по логистике или маркетингу. Нужно проанализировать данные из файла при помощи Python, пользуясь теми конструкциями, которые есть в файле. Использование сторонних библиотек запрещено. Критериев по объему кода нет. Файл с более точным заданием и кодом отправлю лично.
Доработка существующего продукта. Пожелания и особенности: Нужно собрать данные через апи с АРШИНА и как-то автоматизировать это. Нужна логика как добавлять туда данные и отслеживать появление новых продуктов. задача будет разработать инструмент по аналитике конкурентов. Есть онлайн система Аршин, там куча данных. Надо научиться забирать оттуда данные, очистить, структурировать, и визуализировать.
Data Science. Тестирование. Добрый вечер! Нужна помощь в решении экзаменационной задачи. ER- диаграммы, язык прогр-я VBA, коды в draw.io. Пожелания и особенности: Нужна помощь в решении задачи. ER- диаграммы.
Почему стоит искать работу для фриласнеров по профилю data scientist в России у нас?
🔸 Более 3 предложений о работе за сегодня в тематике data scientist
🔸 Работа и подработка на бирже фриланса от прямых заказчиков, которым нужна помощь специалистов по профилю data scientist уже сегодня!
🔸 Свежих заказов на data scientist в России для фрилансеров на июнь 2026 года — 250 шт.
Как найти удалённую работу для фриланс-специалистов по профилю data scientist в России?
Вы специалист по data scientist и ищете проекты и заказы на удалёнке в России? Нам всегда есть что вам предложить. Ежедневно мы публикуем новые проекты и заказы по вашей специальности. Найдите интересную работу уже сегодня
Сколько проектов для IT-специалистов по профилю data scientist в России?
На июнь 2026 года опубликовано 250 предложений удалённой работы от прямых заказчиков для исполнителей по специализации data scientist
Сколько можно заработать выполняя проекты по data scientist?
Специалисты по профилю data scientist зарабатывают от 0.00 рублей с заказа. Хотите больше? Выполняйте как можно больше заказов и зарабатывайте сколько пожелаете