Вход Блог
Строительство и ремонт
Репетиторы
Красота
Фрилансеры
Разные специалисты
Тренеры
Уход за животными
Автоинструкторы

Парсинг — удалённая работа в Москве

Дата: 2026-01-28
Детали
Регион
Москва
Занятость
дистанционно
Стоимость
договорная
Дата публикации
2026-01-28
Описание
Спарсить: Парсинг истории чатов Авито с сохранением структуры. Пожелания и особенности: ТЕХНИЧЕСКОЕ ЗАДАНИЕ Парсинг истории чатов Авито с сохранением структуры диалогов 1. Цель проекта Выгрузить полную историю сообщений из аккаунта Авито (все диалоги за всё время) в структурированном электронном виде для последующего импорта в CRM и обучения AI-ассистента. 2. Требования к результату 2.1. Формат данных · Основной формат: JSON (предпочтительно) или CSV/Excel · Кодировка: UTF-8 · Все тексты должны сохранять оригинальное форматирование (смайлы, переносы строк) 2.2. Структура файла ```json { “profile_info“: { “avito_profile_id“: “[Телефон скрыт]“, “export_date“: “2024-01-20“, “total_dialogs“: 347 }, “dialogs“: [ { “dialog_id“: “dialog_001“, “client_info“: { “avito_user_id“: “client_789012“, “profile_url“: “https://www.avito.ru/user/...“, “username“: “Иван_Петров“, “registration_date“: “2022-05-15“ // если доступно }, “ad_info“: { “ad_id“: “avito_ad_456“, “ad_title“: “Нанесение номеров на спортивную форму“, “ad_url“: “https://www.avito.ru/...“, “ad_category“: “Услуги“ }, “messages“: [ { “message_id“: “msg_001“, “timestamp“: “2024-01-15T14:30:25+03:00“, “sender“: “client“, // или “me“ “message_type“: “text“, // text, image, document “text“: “Здравствуйте! Подскажите, делаете ли вы номера для футбольной команды?“, “attachments“: [] // если есть файлы }, { “message_id“: “msg_002“, “timestamp“: “2024-01-15T14:32:10+03:00“, “sender“: “me“, “message_type“: “text“, “text“: “Добрый день! Да, делаем. Сколько номеров нужно и на какую форму?“, “attachments“: [] } ], “metadata“: { “first_message_date“: “2024-01-15T14:30:25+03:00“, “last_message_date“: “2024-01-16T10:15:00+03:00“, “total_messages“: 12, “has_phone“: true, // был ли в диалоге обмен телефонами “has_order“: true, // по контексту можно определить был ли заказ “status“: “completed“ // completed, pending, rejected } } ] } ``` 2.3. Дополнительные файлы · contacts.csv — отдельный файл со всеми контактами: ``` user_id,phone,email,first_name,last_name,source_dialog client_789012,[Телефон скрыт],,Иван,Петров,dialog_001 ``` 3. Технические требования 3.1. Метод сбора данных · Предпочтительно: Использование официального API Авито (если доступно) · Альтернатива: Парсинг через Selenium/Puppeteer с эмуляцией браузера · Запрещено: Использование вредоносного ПО, взлом, нарушение ToS Авито 3.2. Требования к обработке 1. Авторизация: под моим аккаунтом Авито (предоставлю логин/парскод или cookies) 2. Полнота: выгрузить ВСЕ диалоги без ограничений по времени 3. Пагинация: обработать все страницы сообщений 4. Медиафайлы: если есть фотографии/документы — сохранить ссылки на них 5. Дедупликация: избегать дублирования сообщений 3.3. Производительность · Выгрузка должна работать без падений аккаунта Авито · Возможность приостановки и возобновления процесса · Логирование: вести лог процесса выгрузки 4. Критерии приемки Обязательные: · Выгружены все диалоги без пропусков · Сохранена хронология сообщений в каждом диалоге · Есть ссылки на профили клиентов · Номера телефонов извлечены там, где они есть в переписке · Даты сообщений в машиночитаемом формате (ISO 8601) · Структура JSON соответствует примеру выше Желательные: · Определение языка сообщений (русский/другой) · Классификация диалогов по темам (запрос цены, уточнение деталей и т.д.) · Экспорт в несколько форматов (JSON + CSV) · Визуальный отчет по статистике (графики количества диалогов по месяцам) 5. Безопасность и конфиденциальность 1. Конфиденциальность: исполнитель обязуется не хранить и не использовать данные после передачи 2. Безопасность аккаунта: не использовать данные аккаунта для других целей 3. Удаление данных: после завершения проекта удалить все промежуточные данные 4. Подписание NDA: готов подписать соглашение о неразглашении 6. Этапы работы и оплата Этап 1: Подготовка (10%) · Анализ структуры Авито · Написание скрипта/программы · Оплата: после предоставления плана работы Этап 2: Тестовая выгрузка (30%) · Выгрузка 50 последних диалогов · Проверка структуры и качества данных · Оплата: после утверждения тестовой выборки Этап 3: Полная выгрузка (60%) · Выгрузка всей истории · Формирование итоговых файлов · Оплата: после получения всех данных и проверки 7. Сроки · Тестовая выгрузка: 1-2 дня с момента начала · Полная выгрузка: 3-5 дней (зависит от объема истории) 8. Бюджет 3000 , оплата в соответствии с процентами выполнения этапов работ.
Похожие заказы

Парсинг

дистанционно
договорная
Спарсить: товары, цены. Ежедневный мониторинг соблюдения рекомендованных розничных цен (RRP) в сетях: • Рив Гош • Золотое яблоко Иль де боде По брендам: • Nishane • Montale • Carloff ?? Объем работ Сотрудник обязан: • Проверять весь ассортимент указанных брендов на сайтах сетей • Охват: 100% SKU, представленных на момент мониторинга ? 4. ?? Что необходимо фиксировать По каждому товару: Основные данные: • Название товара • Объем (мл) • Ссылка на товар • Рекомендованная цена (RRP) • Фактическая цена на сайте Скидки и акции: • Скидка по карте лояльности • Дополнительные скидки • Промокоды (если отображаются или применимы) • Акции / спецпредложения ? 5. ?? Требования к скриншотам Обязательно: • Скриншот каждой карточки товара • На скриншоте должны быть видны: • Цена • Размер скидки • Название товара • Скриншоты должны быть: • Четкими • С актуальной датой (если возможно — в кадре) ? 6. ?? Ведение таблицы Формат: Excel / Google Sheets Обязательные столбцы: • Дата • Сеть • Бренд • SKU / Название • Объем • RRP • Цена на сайте • Размер скидки (%) • Итоговая цена • Отклонение от RRP (%) • Тип акции • Ссылка • Комментарий ? 7. ?? Выявление нарушений Сотрудник обязан отдельно отмечать: • Цена ниже установленного RRP • Скрытые скидки (через промокоды) • Двойные / дополнительные скидки • Любые несоответствия ценовой политике Все нарушения должны быть: • Выделены цветом в таблице • Кратко описаны в комментарии ? 8. ?? Отчетность Ежедневно предоставляется: • Заполненная таблица • Папка со скриншотами Формат передачи: • Google Drive / Dropbox / Email Название файла: Мониторинг_цены_дата.xlsx ? 9. ? Требования к качеству • Полнота данных — 100% ассортимента • Отсутствие ошибок в ценах • Актуальность информации (на момент проверки) • Соблюдение сроков ? 10. ? Недопустимо • Пропуск товаров • Отсутствие скриншотов • Указание приблизительных цен • Использование устаревших данных ? 11. ?? Коммуникация • В случае сомнений или отсутствия товара — фиксировать в комментарии.
Москва Фрилансеры

Парсинг

дистанционно
договорная
Спарсить: Телефоны.
Крым Фрилансеры

Парсинг

дистанционно
договорная
Спарсить: объявления. # Задача: собрать базу частных клиник по ЮЗАО Москвы Нужно заполнить Excel-базу частных клиник по ЮЗАО Москвы. Я прикреплю Excel-файл (скрин) с уже частично заполненной таблицей. Нужно продолжить заполнять его в том же формате. ## Кого нужно искать Только актуально работающие организации: * частные медицинские центры; * стоматологии; * ветеринарные клиники. Не добавлять: * государственные поликлиники и больницы; * аптеки; * лаборатории без приема пациентов; * салоны красоты; * закрытые организации; * дубли. ## Районы ЮЗАО Искать клиники по районам: Академический, Гагаринский, Зюзино, Коньково, Котловка, Ломоносовский, Обручевский, Северное Бутово, Южное Бутово, Тёплый Стан, Черёмушки, Ясенево. ## Какие данные нужно заполнить Заполнять только существующие колонки в Excel: * ИНН клиники; * адрес; * контакт клиники; * сайт; * профиль; * район. Профиль указывать только одним из вариантов: * Медицинский центр; * Стоматология; * Ветеринарная клиника. Район указывать так: ЮЗАО, Коньково ЮЗАО, Ясенево ЮЗАО, Тёплый Стан и так далее. ## Важно 1. Не менять структуру Excel-файла. 2. Не добавлять новые колонки. 3. Не удалять уже заполненные строки. 4. Новые клиники добавлять ниже уже заполненных. 5. Не добавлять дубли. 6. Не придумывать данные. 7. Если ИНН не найден — оставить ячейку пустой. 8. Если нет сайта — можно указать карточку в Яндекс Картах, 2ГИС или актуальную соцсеть. 9. Телефон желательно указывать в формате +7 XXX XXX-XX-XX. 10. Адрес указывать полностью: Москва, улица, дом, корпус/строение, если есть. ## Где искать Можно использовать: * Яндекс Карты; * 2ГИС; * Google Maps; * сайты клиник; * ПроДокторов; * Zoon; * НаПоправку; * 32top; * StartSmile; * Rusprofile; * Контур.Фокус; * ФНС; * SBIS. ## Объем работы: добавить 450-500 строк с информацией. Можно через ИИ, главное, чтобы всё было актуальное.
Москва Фрилансеры

Парсинг

дистанционно
договорная
Спарсить: Контакты. Пожелания и особенности: Необходим Парсинг контактов из 70 чатов. Стоимость предложите.
Санкт-Петербург Фрилансеры

Парсинг

дистанционно
договорная
Спарсить: Базы. Нужен специалист по сбору и структурированию открытых данных о компаниях Ищем исполнителя для регулярной подготовки таблиц с компаниями по разным нишам: медицина, образование, услуги, B2B-сегмент и другие направления. Что нужно собрать: — название компании; — ниша/сфера деятельности; — город/регион; — сайт или соцсети; — общие контакты компании, если они указаны в открытом доступе; — должности ответственных сотрудников, если информация есть на сайте или в открытых источниках. Важно: — без дублей; — без случайных и нерелевантных компаний; — аккуратное оформление в таблице; — желательно показать пример похожей работы. Интересует регулярное сотрудничество. В отклике напишите, пожалуйста, с какими нишами работали, какие источники используете и какая стоимость.
Москва Фрилансеры

Парсинг

дистанционно
договорная
Спарсить: Контакты. Нужно собрать актуальную базу контактов компаний, которые участвуют/планируют участвовать в выставках: например, строительство, IT, медицина, HoReCa в 2025–2026 гг. из открытых каталогах участников выставок Формат: • Файл: Excel Объем: • Ориентир: 2000–3000 компаний (обсуждаемо) • География: РФ Срок: • 5–10 рабочих дней Предоставление отчета о методах сбора данных.
Москва Фрилансеры

Парсинг

дистанционно
договорная
Спарсить: Контакты.
Москва Фрилансеры