Вход Блог
Строительство и ремонт
Репетиторы
Красота
Фрилансеры
Разные специалисты
Тренеры
Уход за животными
Автоинструкторы

Создание ИИ-ассистента — удалённая работа в Москве

Дата: 2026-02-04
Детали
Регион
Москва
Занятость
дистанционно
Стоимость
договорная
Дата публикации
2026-02-04
Описание
Сделать AI RAG-ассистента, который принимает документы (фото/сканы), голос, текст; извлекает факты; сохраняет; и по запросу пользователя возвращает нужную информацию. Это не «память модели», а управляемое хранилище + поиск + генерация ответа. 1) Что именно строим (компоненты) Ingestion (загрузка данных) Фото/сканы (билеты, паспорт) ? OCR ? текст + поля. Голос ? ASR (speech-to-text) ? текст. Текстовые заметки ? сразу текст. Нормализация и структурирование Разбиваем на чанки (кусочки текста). Опционально: извлекаем сущности/поля (ФИО, номер паспорта, даты вылета, PNR, номер рейса). Сохраняем: исходный файл (объектное хранилище), текст/чанки, структуру (JSON с полями), метаданные (пользователь, тип документа, дата загрузки, язык и т.д.). Индекс для RAG Эмбеддинги чанков ? векторная БД (Qdrant/Milvus/pgvector). Параллельно — ключевый поиск (BM25/Elastic) полезен для номеров/дат/кодовых строк. Гибридный поиск (vector + keyword) обычно лучший вариант. Retrieval + Answering Пользовательский вопрос ? переписывание запроса (опционально) ? поиск релевантных чанков ? LLM отвечает строго на основе найденного. Для «точных данных» (номер паспорта, дата, PNR) лучше дополнительно делать извлечение/проверку из структурных полей. Безопасность и изоляция Все данные привязаны к user_id (или tenant_id). Шифрование, контроль доступа, аудит. Для паспортов и билетов (PII) — маскирование при показе или политика “показывать только последние 4 цифры” по умолчанию. 2) Поток обработки: фото билета/паспорта Фото ? OCR ? классификация документа ? извлечение полей ? сохранение ? индексирование Рекомендуемые техники: OCR: Tesseract (просто) / PaddleOCR (часто лучше на сложных изображениях) / облачные OCR (Google/AWS/Azure). Паспорт: часто важен MRZ (машиночитаемая зона) — отдельный парсер MRZ даёт высокую точность. Билет: парсинг ключевых паттернов (рейс, дата, аэропорты, PNR/booking reference). 3) Поток обработки: голос Голос ? ASR ? текст ? (опционально) выделение фактов ? сохранение ? индекс ASR: OpenAI Whisper (локально/облачно) или аналоги. Сохраняйте также таймкоды/аудио-ссылку, если нужно подтверждение. 4) Как отвечать на запросы (2 режима) Режим A: “RAG-ответ” Вопрос: “Когда мой вылет в Берлин?” ? retrieval ? LLM формирует ответ + ссылка на источник (“из билета от …”). Режим B: “Факт из профиля” (структурные поля) Вопрос: “Какой номер паспорта я загружал?” ? лучше брать из структурных полей, а не из LLM-пересказа. ? выводить с маскированием: *******1234, и по запросу пользователя показывать полностью. На практике делают router: если вопрос про конкретные поля (номер документа, дата рождения, PNR) ? structured store иначе ? RAG 5) Минимальный стек (быстро собрать) Backend: Python + FastAPI OCR: PaddleOCR (или Tesseract на старте) ASR: Whisper Embeddings: любой совместимый (например, text-embedding-*), локальные тоже можно Vector DB: Qdrant (самый простой старт) Файлы: S3-совместимое (MinIO) Реляционка: Postgres (метаданные, пользователи, поля) 6) Схема данных (упрощённо) documents (id, user_id, type, created_at, original_uri) doc_chunks (id, document_id, chunk_text, chunk_index) embeddings (chunk_id, vector, metadata: user_id, doc_type, даты) extracted_facts (document_id, jsonb) — структурные поля 7) Ключевые детали, чтобы “работало как память” Версионирование: если пользователь перезалил документ, сохраняйте новую версию. Дедупликация: хэш файла/текста. Цитирование источника: возвращайте “взято из: билет …”. Политика конфиденциальности: какие поля можно показывать сразу, какие только после подтверждения. Оценка качества OCR: хранить confidence; при низком — просить переснять/переговорить. Многоязычность: нормализация дат/форматов. 8) Пример логики ответа (псевдопроцесс) Вопрос пользователя Классификатор запроса: “паспорт номер / дата рождения / PNR / номер рейса” ? structured lookup иначе ? RAG retrieval Retrieval: filter: user_id = текущий topK = 5–10 LLM: строгий системный промпт “отвечай только по контексту”.
Похожие заказы

Создание ИИ-ассистента

дистанционно
договорная
Пожелания и особенности: Необходим - ИИ агент для ниши бьюти/косметология Который будет обучен по качественной инструкции ,и сможет помогать космеилогам генерить идеи ,создавать контент планы и вирусные ролики и тд , + возможно добавить врзмооможншсть генерить посты и обложки для постов ,вообщем мини помощник вместо смм специалиста.
Москва Фрилансеры

Создание ИИ-ассистента

дистанционно
договорная
Пожелания и особенности: Школа музыки, продажа абонементов.
Калуга Фрилансеры

Создание ИИ-ассистента

дистанционно
договорная
Доработка ИИ-ассистента для посуточной аренды квартир на Hermes Есть частично реализованный проект, но сейчас часть функций работает нестабильно. Требуется провести аудит, найти ошибки, доработать систему и довести её до стабильной работы. Система состоит из двух контуров: 1. ИИ-ассистент для гостей (работает в Telegram и MAX). Функционал: ответы на вопросы по проживанию, информация по квартире, инструкции по заселению, Wi-Fi, парковка, правила проживания, напоминания перед заездом, согласие на обработку персональных данных, запрос паспорта, отправка ссылки на оплату залога, проверка оплаты, выдача кодов доступа после подтверждения паспорта и залога. 2. ИИ-ассистент для менеджера (работает в Telegram и MAX). Функционал: просмотр активных броней и информации по гостям, контроль этапов заселения, отметка получения паспорта и залога, отправка сообщений гостям, временное отключение/включение бота для конкретного гостя, просмотр и редактирование данных по квартирам, контроль работы системы и обработка нестандартных ситуаций. Также необходимо: — проверить и доработать интеграцию с RealtyCalendar; — настроить автоматические уведомления; — проверить хранение и актуализацию данных по квартирам; — реализовать удобное редактирование данных через Google Sheets или аналогичный инструмент; — протестировать полный цикл от бронирования до заселения гостя. Рассматриваем разработчика, которому интересно не только выполнить текущие задачи, но и участвовать в дальнейшем развитии проекта. В отклике просьба указать: — опыт работы с Hermes; — опыт интеграции Telegram-ботов и AI-ассистентов; — ориентировочные сроки выполнения; — стоимость работ.
Москва Фрилансеры

Создание ИИ-ассистента

дистанционно
договорная
Пожелания и особенности: Ищу ассистента с выездом ко мне домой (Москва). ЧТО НУЖНО СДЕЛАТЬ (разово, 1-2 встречи): 1. Структурировать файлы на MacBook Все материалы из обучений, презентации, курсы — разложить по чётким папкам, чтобы я легко находила нужное. 2. Помочь установить Claude Code Это AI-инструмент который интегрируется в MacBook и помогает работать с файлами и задачами. Нужна установка через терминал + краткое объяснение как пользоваться. КТО ПОДОЙДЁТ — Разбираешься в MacOS и файловой системе — Умеешь работать с терминалом (базово) — Терпелив, объясняешь понятно — Готов приехать на встречу (район обсудим) ФОРМАТ Почасовая оплата или фиксированная сумма — обсуждаем. Пишите в личку: расскажите о себе и опыте.
Москва Фрилансеры

Создание ИИ-ассистента

дистанционно
договорная
Пожелания и особенности: Создать ИИ-помощника для НКО, который будет помогать находить потенциальных доноров и партнёров, анализировать их интересы и деятельность, выявлять возможности для сотрудничества и готовить персонализированные предложения на основе целей обеих сторон.
Кострома Фрилансеры

Создание ИИ-ассистента

дистанционно
договорная
Интеграция с iiko.
Москва Фрилансеры

Создание ИИ-ассистента

дистанционно
договорная
Нужно автоматизировать тех поддержку и пост поддержку продаж через ВК / Вацап/ ТГ/ Макс (рассматриваем в том числе часть из этих источников).
Ярославль Фрилансеры