Вход Блог
Строительство и ремонт
Репетиторы
Красота
Фрилансеры
Разные специалисты
Тренеры
Уход за животными
Автоинструкторы

Парсинг — удалённая работа в Москве

Дата: 2023-11-26
Детали
Регион
Москва
Занятость
дистанционно
Стоимость
договорная
Дата публикации
2023-11-26
Описание
Спарсить: Расписание. Необходимо брать файл pdf по адресу: https://cs.msu.ru/sites/cmc/files/docs/3_kurs_osen_2023_14.pdf и обрабатывать на языке python, создавая небольшую базу данных: a. База данных, должна форматироваться на базе уникального ключа занятий, который будет выступать связующим звеном групп, преподавателей, дней, времени, предмета, аудиторий. То есть по уникальному ключу занятия можно восстановить предмет занятия, аудиторию/аудитории в которой/которых проходит это занятие, день в который проходит это занятие, преподаватель/преподаватели, который/которые ведут это занятие, группа/группы у которой/которых это занятие. Например, для занятия определяемого: ‘day’: ‘cреда’ ‘time’: ‘10:30 12:05’ ‘lesson’: ‘Введение в сети ЭВМ’, ‘auditorium’: [‘П-14’, ‘506’, ‘523’, ‘685’] 'full name': [ ‘grade’: ‘None’ ‘Surn’: ‘Антоненко’ ‘Name’: ‘В.’ ‘Patr’: ‘А.’, ‘grade’: ‘None’ ‘Surn’: ‘Волканов’ ‘Name’: ‘Д.’ ‘Patr’: ‘Ю.’, … ] 'group': ['320', '321', '322', '323', '324', '325', '327', '328'] ‘key”: 203 В базу данных будет внесено: 1. В основной словарь Keys_base будет добавлен элемент: ‘203’: ‘day’: ‘среда’ ‘time’: ‘10:30 12:05’ ‘lesson’: ‘введение в сети эвм’ ‘auditorium’: [‘П-14’, ‘506’, ‘523’, ‘685’] 'surname': [ ‘Антоненко’, ‘Волканов’, ‘Бабернов’, ‘Пашков’, ‘Степанов’, ‘Рязанов’, ‘Гаркавый’, ‘Никифоров’] 'group': ['320', '321', '322', '323', '324', '325', '327', '328'] 2. А в словарь Lessons_base будет создан или расширен элемент: ‘введение в сети эвм’: [ … , ‘203’] 3. В словарь Surname_base будет создан или расширен, например, элемент: ‘Бабернов’: ‘full name’: ‘grade’: ‘None’ ‘Name’: ‘В.’ ‘Patr’: ‘В.’ ‘keys’: […, ‘203’] В случае если будет обнаружена более расширенная информация о «Бабернова» ученая степень ‘grade’, полное имя или полное отчество, то этой информацией можно заменить данные из ‘full name’. 4. В словарь Day_base будет создан или расширен элемент: ‘среда’: […, ‘203’] 5. В словарь Time_base будет создан или расширен элемент: ‘10:30 12:05’: […, ‘203’] 6. В словарь Auditorium_base будет создан или расширен, например, элемент: ‘П-14’: […, ‘203’] 7. В словарь Group_base будет создан или расширен, например, элемент: '320': […, '203',] b. Для выделения предмета занятия, аудиторию/аудитории в которой/которых проходит это занятие, преподаватель/преподаватели, который/которые ведут это занятие из строки может функция analyze_text_block_from_schedule из файла func.py. Она принимает строку, в которой содержатся некоторые из этих данных и возвращает словарь, например для: «Введение в сети ЭВМ П-14, 506, 523, 685 Антоненко В.А., Волканов Д.Ю., Бабернов В.В., Пашков В.Н., Степанов Е.П., Рязанов А.М., Никифоров Н.И.», будет выдано: { 'lesson': 'Введение в сети ЭВМ', 'auditorium': ['П-14', '506', '523', '685'], 'full name': [ { 'grade': None, 'Surn': 'Антоненко', 'Name': 'В.', 'Patr': 'А.' }, { 'grade': None, 'Surn': 'Волканов', 'Name': 'Д.', 'Patr': 'Ю.' }, … ]} Вспомогательные файлы с функцией analyze_text_block_from_schedule и примером бд могу скинуть в телеграмме.
Похожие заказы

Парсинг

дистанционно
договорная
Спарсить: товары, цены, объявления, отзывы. Пожелания и особенности: Разработать Парсинг.
Санкт-Петербург Фрилансеры

Парсинг

дистанционно
договорная
Спарсить: api. Для увеличения скорости работы нашей разработки для парсинга необходимы 900+ дополнительных сервисных ключей ВК. Создаются просто: через любой акк зайти в раздел разработчиков, дать рандомное название для приложения, сгенерировать СЕРВЕРНЫЕ ключи. На один аккаунт можно создать 10 ключей, для каждого ключа нужно подтверждение смской или в приложении вк. инструкция: 1. Открываешь https://dev.vk.com/ru 2. Нажимаешь на плюсик или создать приложение 3. Вводишь любую шляпу в название и нажимаешь создать 4. Приложение создано! Нам нужен сервисный ключ от него - нажимаешь разработка слева в панели 5. Нажимаешь ключи доступа 6. Копируешь сервисный ключ.
Москва Фрилансеры

Парсинг

дистанционно
договорная
Спарсить: товары, цены. Ежедневный мониторинг соблюдения рекомендованных розничных цен (RRP) в сетях: • Рив Гош • Золотое яблоко Иль де боде По брендам: • Nishane • Montale • Carloff ?? Объем работ Сотрудник обязан: • Проверять весь ассортимент указанных брендов на сайтах сетей • Охват: 100% SKU, представленных на момент мониторинга ? 4. ?? Что необходимо фиксировать По каждому товару: Основные данные: • Название товара • Объем (мл) • Ссылка на товар • Рекомендованная цена (RRP) • Фактическая цена на сайте Скидки и акции: • Скидка по карте лояльности • Дополнительные скидки • Промокоды (если отображаются или применимы) • Акции / спецпредложения ? 5. ?? Требования к скриншотам Обязательно: • Скриншот каждой карточки товара • На скриншоте должны быть видны: • Цена • Размер скидки • Название товара • Скриншоты должны быть: • Четкими • С актуальной датой (если возможно — в кадре) ? 6. ?? Ведение таблицы Формат: Excel / Google Sheets Обязательные столбцы: • Дата • Сеть • Бренд • SKU / Название • Объем • RRP • Цена на сайте • Размер скидки (%) • Итоговая цена • Отклонение от RRP (%) • Тип акции • Ссылка • Комментарий ? 7. ?? Выявление нарушений Сотрудник обязан отдельно отмечать: • Цена ниже установленного RRP • Скрытые скидки (через промокоды) • Двойные / дополнительные скидки • Любые несоответствия ценовой политике Все нарушения должны быть: • Выделены цветом в таблице • Кратко описаны в комментарии ? 8. ?? Отчетность Ежедневно предоставляется: • Заполненная таблица • Папка со скриншотами Формат передачи: • Google Drive / Dropbox / Email Название файла: Мониторинг_цены_дата.xlsx ? 9. ? Требования к качеству • Полнота данных — 100% ассортимента • Отсутствие ошибок в ценах • Актуальность информации (на момент проверки) • Соблюдение сроков ? 10. ? Недопустимо • Пропуск товаров • Отсутствие скриншотов • Указание приблизительных цен • Использование устаревших данных ? 11. ?? Коммуникация • В случае сомнений или отсутствия товара — фиксировать в комментарии.
Москва Фрилансеры

Парсинг

дистанционно
договорная
Спарсить: Телефоны.
Крым Фрилансеры

Парсинг

дистанционно
договорная
Спарсить: объявления. # Задача: собрать базу частных клиник по ЮЗАО Москвы Нужно заполнить Excel-базу частных клиник по ЮЗАО Москвы. Я прикреплю Excel-файл (скрин) с уже частично заполненной таблицей. Нужно продолжить заполнять его в том же формате. ## Кого нужно искать Только актуально работающие организации: * частные медицинские центры; * стоматологии; * ветеринарные клиники. Не добавлять: * государственные поликлиники и больницы; * аптеки; * лаборатории без приема пациентов; * салоны красоты; * закрытые организации; * дубли. ## Районы ЮЗАО Искать клиники по районам: Академический, Гагаринский, Зюзино, Коньково, Котловка, Ломоносовский, Обручевский, Северное Бутово, Южное Бутово, Тёплый Стан, Черёмушки, Ясенево. ## Какие данные нужно заполнить Заполнять только существующие колонки в Excel: * ИНН клиники; * адрес; * контакт клиники; * сайт; * профиль; * район. Профиль указывать только одним из вариантов: * Медицинский центр; * Стоматология; * Ветеринарная клиника. Район указывать так: ЮЗАО, Коньково ЮЗАО, Ясенево ЮЗАО, Тёплый Стан и так далее. ## Важно 1. Не менять структуру Excel-файла. 2. Не добавлять новые колонки. 3. Не удалять уже заполненные строки. 4. Новые клиники добавлять ниже уже заполненных. 5. Не добавлять дубли. 6. Не придумывать данные. 7. Если ИНН не найден — оставить ячейку пустой. 8. Если нет сайта — можно указать карточку в Яндекс Картах, 2ГИС или актуальную соцсеть. 9. Телефон желательно указывать в формате +7 XXX XXX-XX-XX. 10. Адрес указывать полностью: Москва, улица, дом, корпус/строение, если есть. ## Где искать Можно использовать: * Яндекс Карты; * 2ГИС; * Google Maps; * сайты клиник; * ПроДокторов; * Zoon; * НаПоправку; * 32top; * StartSmile; * Rusprofile; * Контур.Фокус; * ФНС; * SBIS. ## Объем работы: добавить 450-500 строк с информацией. Можно через ИИ, главное, чтобы всё было актуальное.
Москва Фрилансеры

Парсинг

дистанционно
договорная
Спарсить: Контакты. Пожелания и особенности: Необходим Парсинг контактов из 70 чатов. Стоимость предложите.
Санкт-Петербург Фрилансеры

Парсинг

дистанционно
договорная
Спарсить: Базы. Нужен специалист по сбору и структурированию открытых данных о компаниях Ищем исполнителя для регулярной подготовки таблиц с компаниями по разным нишам: медицина, образование, услуги, B2B-сегмент и другие направления. Что нужно собрать: — название компании; — ниша/сфера деятельности; — город/регион; — сайт или соцсети; — общие контакты компании, если они указаны в открытом доступе; — должности ответственных сотрудников, если информация есть на сайте или в открытых источниках. Важно: — без дублей; — без случайных и нерелевантных компаний; — аккуратное оформление в таблице; — желательно показать пример похожей работы. Интересует регулярное сотрудничество. В отклике напишите, пожалуйста, с какими нишами работали, какие источники используете и какая стоимость.
Москва Фрилансеры