Спарсить: Парсинг истории чатов Авито с сохранением структуры. Пожелания и особенности: ТЕХНИЧЕСКОЕ ЗАДАНИЕ Парсинг истории чатов Авито с сохранением структуры диалогов 1. Цель проекта Выгрузить полную историю сообщений из аккаунта Авито (все диалоги за всё время) в структурированном электронном виде для последующего импорта в CRM и обучения AI-ассистента. 2. Требования к результату 2.1. Формат данных · Основной формат: JSON (предпочтительно) или CSV/Excel · Кодировка: UTF-8 · Все тексты должны сохранять оригинальное форматирование (смайлы, переносы строк) 2.2. Структура файла ```json { "profile_info": { "avito_profile_id": "[Телефон скрыт]", "export_date": "2024-01-20", "total_dialogs": 347 }, "dialogs": [ { "dialog_id": "dialog_001", "client_info": { "avito_user_id": "client_789012", "profile_url": "https://www.avito.ru/user/...", "username": "Иван_Петров", "registration_date": "2022-05-15" // если доступно }, "ad_info": { "ad_id": "avito_ad_456", "ad_title": "Нанесение номеров на спортивную форму", "ad_url": "https://www.avito.ru/...", "ad_category": "Услуги" }, "messages": [ { "message_id": "msg_001", "timestamp": "2024-01-15T14:30:25+03:00", "sender": "client", // или "me" "message_type": "text", // text, image, document "text": "Здравствуйте! Подскажите, делаете ли вы номера для футбольной команды?", "attachments": [] // если есть файлы }, { "message_id": "msg_002", "timestamp": "2024-01-15T14:32:10+03:00", "sender": "me", "message_type": "text", "text": "Добрый день! Да, делаем. Сколько номеров нужно и на какую форму?", "attachments": [] } ], "metadata": { "first_message_date": "2024-01-15T14:30:25+03:00", "last_message_date": "2024-01-16T10:15:00+03:00", "total_messages": 12, "has_phone": true, // был ли в диалоге обмен телефонами "has_order": true, // по контексту можно определить был ли заказ "status": "completed" // completed, pending, rejected } } ] } ``` 2.3. Дополнительные файлы · contacts.csv — отдельный файл со всеми контактами: ``` user_id,phone,email,first_name,last_name,source_dialog client_789012,[Телефон скрыт],,Иван,Петров,dialog_001 ``` 3. Технические требования 3.1. Метод сбора данных · Предпочтительно: Использование официального API Авито (если доступно) · Альтернатива: Парсинг через Selenium/Puppeteer с эмуляцией браузера · Запрещено: Использование вредоносного ПО, взлом, нарушение ToS Авито 3.2. Требования к обработке 1. Авторизация: под моим аккаунтом Авито (предоставлю логин/парскод или cookies) 2. Полнота: выгрузить ВСЕ диалоги без ограничений по времени 3. Пагинация: обработать все страницы сообщений 4. Медиафайлы: если есть фотографии/документы — сохранить ссылки на них 5. Дедупликация: избегать дублирования сообщений 3.3. Производительность · Выгрузка должна работать без падений аккаунта Авито · Возможность приостановки и возобновления процесса · Логирование: вести лог процесса выгрузки 4. Критерии приемки Обязательные: · Выгружены все диалоги без пропусков · Сохранена хронология сообщений в каждом диалоге · Есть ссылки на профили клиентов · Номера телефонов извлечены там, где они есть в переписке · Даты сообщений в машиночитаемом формате (ISO 8601) · Структура JSON соответствует примеру выше Желательные: · Определение языка сообщений (русский/другой) · Классификация диалогов по темам (запрос цены, уточнение деталей и т.д.) · Экспорт в несколько форматов (JSON + CSV) · Визуальный отчет по статистике (графики количества диалогов по месяцам) 5. Безопасность и конфиденциальность 1. Конфиденциальность: исполнитель обязуется не хранить и не использовать данные после передачи 2. Безопасность аккаунта: не использовать данные аккаунта для других целей 3. Удаление данных: после завершения проекта удалить все промежуточные данные 4. Подписание NDA: готов подписать соглашение о неразглашении 6. Этапы работы и оплата Этап 1: Подготовка (10%) · Анализ структуры Авито · Написание скрипта/программы · Оплата: после предоставления плана работы Этап 2: Тестовая выгрузка (30%) · Выгрузка 50 последних диалогов · Проверка структуры и качества данных · Оплата: после утверждения тестовой выборки Этап 3: Полная выгрузка (60%) · Выгрузка всей истории · Формирование итоговых файлов · Оплата: после получения всех данных и проверки 7. Сроки · Тестовая выгрузка: 1-2 дня с момента начала · Полная выгрузка: 3-5 дней (зависит от объема истории) 8. Бюджет 3000 , оплата в соответствии с процентами выполнения этапов работ.
Спарсить: Организации / компании (отели, хостелы, санатории, производители кроватей, магазины матрасов), объявления. Парсинг баз по Москве и Мо / сбор базы компаний по Москве и Мо Категории: — отели — глемпинги — санатории — дома отдыха — общежития — хостелы — производители кроватей — магазины матрасов Нужна таблица (Excel): название / категория / город / телефон / сайт - email / ссылка на источник Задача: — парсинг открытых данных — без покупок, без оформления заказов — без регистрации и авторизации Напишите: — опыт подобных работ — сроки — стоимость.
Спарсить: Телеграм группы и чаты. Добрый день, необходимо спарсить группы, чаты по тематикам в Телеграмм, а также группы в ВК. Сделать это в табличный вид по нашей форме ЦА: Владельцы определенных сфер бизнеса. Какие сферы бизнеса: 1. Селлеры 2. Кофейни 3. Салоны красоты 4. Табачные магазины 5. Цветочные магазины 6. Шиномонтаж и Автосервис 7. Стоматологии 8. Агентства недвижимости 9. Ремонт техники Ждем ваших ответов.
Спарсить: Соц сети. Пожелания и особенности: Нужно создать дашборд в Яндекс дейтлейнс, который автоматически обновляется и выгружает метрики по параметрам заданными. По соц сетям ютуб, тик ток и инст Аккаунтов 20 шт.
Спарсить: Надо спарсить у нас есть расширение в браузере с помощью которого можно читать платные главы. нужно настроить так чтобы парсер мог им пользоваться и выкачивать платные главы. Пожелания и особенности: Надо спарсить у нас есть расширение в браузере с помощью которого можно читать платные главы. нужно настроить так чтобы парсер мог им пользоваться и выкачивать платные главы.
Спарсить: товары, объявления, цены, отзывы, Нужно спарсить всех продавцов автозапчастей по рф (у которых более 500 отзывов на аккаунте), после Парсинга необходимо получить ексель файл уже переработанный с топ 30-50 позиций наиболее повторяющихся запчастей у всех этих продавцов. Задачу обсудим по телефону.
Спарсить: Компании. Нужно собрать базу данных из компаний, собирая информацию вручную и вносить в СРМ. Есть алгоритм действий, который нужно последовательно выполнить. Данные нужно собирать ежедневно на постоянной основе. Из-за масштаба задачи потребуется много исполнителей.
Спарсить: Данные с сайта. Пожелания и особенности: Здравствуйте! Нужно спарсить данные с сайта в несколько потоков/процессов. Данные приходят в network -> response. Для обновления данных нужно нажимать кнопку на экране, дожидаться загрузки и забирать данные.
Сбор данных. Спарсить: товары, объявления, новости. Необходимо создать +- похожий сайт по сбору данных из открытых источников (https://xn----7sbajahheyaepn1ca0aveqcb0fxl.xn--p1acf/) Только чтобы этот сайт был с доступом только у меня.
Спарсить: цены, товары. У нас есть Excel таблица с перечнем товаров и их закупочными ценами. Также есть 7 сайтов магазинов конкурентов, на которых публикуются розничные цены на те же товары. Требуется: разработать решение, которое будет автоматически подгружать актуальные цены с сайтов конкурентов в нашу Excel таблицу.
Спарсить: товары, цены, отзывы. Спарсить данные о выручке, уставном капитале, численности и сфере деятельности в 1С и google таблицу. Данные о компаниях брать с трёх сайтов: 1. www.checko.ru 2. www.rusprofile.ru 3. Сайт компании.
Спарсить: товары, объявления, Фонды, службы. Нужны база гуманитарных служб с контактами для помощи СВО Также подойдут контакты епархии. ФОНДЫ, СООБЩЕСТВА, ГРУППЫ в ТГ ВК ОК.
Спарсить: товары, Гуманитарка. Нужна база данных отечественных организаций, компаний. Личные номера, заместителей или генеральных, компании занимались благотворительностью, помогали сво,.
Спарсить: Ссылки участников и ссылки на каналы из био. Пожелания и особенности: Чат на 300+ участников. Нужно сделать excel таблицу со списком участников: имя, ссылка, ссылка на канал из био (если есть).
Спарсить: Аудиторию. Пожелания и особенности: Есть база в документе, нужно добавить людей в сообщество. Присылайте сразу кейсы, сроки и цены, пожалуйста Накрутка ботов не интересна.
Спарсить: ИНН и ФИО директора. Нужно собрать базу уникальных организаций в нише «Банкротство физических лиц» по Москве (пилотный проект). Алгоритм действий: Сбор исходников: Спарсить все организации по запросу «Банкротство физических лиц» из Яндекс.Карт и 2ГИС. Дедупликация: Очистить список от повторов. Если у компании 10 офисов, в итоговом списке должна остаться одна строка (головная организация/юридическое лицо). Ориентироваться по названию и телефонам. Обогащение данными через Rusprofile (или аналоги): Найти юридическое лицо по названию/адресу/телефону. Из карточки компании достать ФИО Директора и его личный ИНН (физического лица). Важно: Мне нужен именно ИНН самого человека (директора), а не только ИНН организации. Результат: Таблица Google Sheets со столбцами: Название компании (бренд). Юридическое название (ООО/ИП). ФИО Директора. ИНН Директора (как физлица). Ссылка на карточку Rusprofile. Требования: Только уникальные записи. Сначала делаем Москву (тест). Если всё корректно — заказываю всю РФ (1600+ компаний). Срок на Москву: 24 часа.
Спарсить: объявления. Нужно парсить свежие объявления от собственников жилой недвижимости по аренде с поиском свежих объявлений каждые 30 секунд и выгрузкой в CRM-систему в виде таблицы (время публикации, кол-во комнат и квадратура объекта, цена, адрес, станция метро, контакт или кнопка для перехода на объявление с контактом собственника, источник объявления) и с хранением информации в течении 1 час.
Спарсить: цены. Нужно спарсить цены конкрунтов (Рестораны новосибирска). Цены на товары в карточках организаций, средний чек, и в идеале отзывы и место в поисковой выдаче.
Спарсить: цены. Пожелания и особенности: Нужно спарсить цены на детское питание в крупнейших интернет-площадках (файл, который необходимо заполнить - скину исполнителю).
Спарсить: Клиенты для digital агентства. Пожелания и особенности: Здравствуйте! Необходима хорошая база для менеджера по продажам digital агентства. Услуги: разработка и продвижение сайтов, мобильных приложений, smm, веб дизайн.
Спарсить: Номера телефонов и email. Требуется собрать базу юридических компаний (от 2-3 сотрудников), из 5000 номеров и/или email адресов. Нужно 1000 номеров и 4000 email.
Спарсить: объявления. Парсинг недвижимости, сайтов типа: Авито, Циан, Домклик и тому подобное. Информация: Цена, локация, ссылка на объявление и так далее. постоянное обновление.
Спарсить: Музыкальные файлы mp3. Пожелания и особенности: Нужно спарсить музыкальный сайт Musify.ru на все треки, которые там находятся, а потом рассортировать эти треки по папкам жанр/поджанр/исполнитель/"название трека".mp3. Причём кавер-версии и записи с концертов, инструментальные версии и прочие "нечистые" версии треков нужно поместить одним скопом в папку "другое", таким образом отсеив их от основного датасета и оставив его чистым и готовым к разметке.
Почему стоит искать работу для фриласнеров по профилю парсинг в России у нас?
🔸 Более 2 предложений о работе за сегодня в тематике парсинг
🔸 Работа и подработка на бирже фриланса от прямых заказчиков, которым нужна помощь специалистов по профилю парсинг уже сегодня!
🔸 Свежих заказов на парсинг в России для фрилансеров на май 2026 года — 114 шт.
Как найти удалённую работу для фриланс-специалистов по профилю парсинг в России?
Вы специалист по парсинг и ищете проекты и заказы на удалёнке в России? Нам всегда есть что вам предложить. Ежедневно мы публикуем новые проекты и заказы по вашей специальности. Найдите интересную работу уже сегодня
Сколько проектов для IT-специалистов по профилю парсинг в России?
На май 2026 года опубликовано 114 предложений удалённой работы от прямых заказчиков для исполнителей по специализации парсинг
Сколько можно заработать выполняя проекты по парсинг?
Специалисты по профилю парсинг зарабатывают от 0.00 рублей с заказа. Хотите больше? Выполняйте как можно больше заказов и зарабатывайте сколько пожелаете