Вход Блог
Строительство и ремонт
Репетиторы
Красота
Фрилансеры
Разные специалисты
Тренеры
Уход за животными
Автоинструкторы

Администраторы баз данных — удалённая работа в Москве

Дата: 2023-01-11
Детали
Регион
Москва
Занятость
дистанционно
Стоимость
договорная
Дата публикации
2023-01-11
Описание
Разработать базу данных с нуля. СУБД: по рекомендации специалиста. Желательно созвониться и обучить меня этому +1500р Тз 1.Создать оперативную базу данных в любом из видов баз данных(не важно реляционной или нет) 3 таблицы: а.Таблица продаж - sales : customerId, productId, qty б.Таблица клиентов - customers: id, name, country в.Таблица продуктов- products : id, name, groupname Это будет оперативной базой данных 2.Создать дополнительные три базы данных на другом инстансе от оперативной (обязательно реляционная mysql, postgresql, etc…. : mrr, stg, dwh - нужно почитать и понять почему мы строим 3 базы и для чего каждая из них 3.Во все таблицы с мерами мы добавляем приставку fact в имени, c измерениями dimension + приставка имени базы данных. Пример: если таблица в базе данных mrr то таблица с продажами будет mrr_fact_sales, если таблица с продуктами в stg то stg_dim_products. В именах только английский, и все имена одного формата(камел кейс или снейк кейс).Почитать что такое fact и dimension 4.Создать ETL(airflow, nifi, spark, SSIS либо любой другой ETL) с переходами данными из оперативной базы в mrr -> stg -> dwh Из оперативной базы данных в mrr брать данные с помощью high water mark(дельта).Для этого создать таблицу high_water_mark в который будет последний день или апдейт каждой таблицы. В mrr вытягиваем в параметр время в соответствии с таблицей источникам и в dwh обновляем high_water_mark последним значением которое есть в таблице. 5.В каждом пакете/даге/процессе сделать систему логов которые будут писаться в созданную для этого таблицу, время исполнения пакета + если есть ошибка(это делаеться в event handler) 6.Создать процедуру и использовать там cursor, try и catch(при ошибки будет писаться лог в созданную для этого таблицу), сделать какую нибудь функцию. Все процедуры и функции сохранить в базе данных dwh. 7.Сделать простой дашборд и модель данных на ваше усмотрение в Power BI из данных в dwh. 8.Создать скрипт который будет делать backup для трех баз данных(mrr, stg, dwh). Что нужно ещё: интегрировать базу данных с другими системами, провести инструктаж и обучить пользователей.
Похожие заказы

Администраторы баз данных

дистанционно
договорная
Перенос БД для сайта. Нужно сделать перенос БД с supabase на российские для сайта.
Москва Фрилансеры

Администраторы баз данных

дистанционно
договорная
Протестировать имеющуюся базу данных. СУБД: Excel. Нужно залить базу в битрикс24.
Москва Фрилансеры

Администраторы баз данных

дистанционно
договорная
Доработать существующую базу данных. СУБД: Excel. Нужен человек для ведения CRM и таблиц с данными. Не сложная подработка на 2-3 часа в день. По оплате в районе 20 тысяч в месяц.
Владимир Фрилансеры

Администраторы баз данных

дистанционно
договорная
Разработать базу данных с нуля. СУБД: Airtable. Нужно создать связку airtable-bas-Gpt Для автопостинга. Что нужно ещё: интегрировать базу данных с другими системами.
Москва Фрилансеры

Администраторы баз данных

дистанционно
договорная
Разработать базу данных с нуля. СУБД: по рекомендации специалиста. Нужен инженер с опытом работы с векторными БД и embedding-моделями для разработки модуля семантического поиска по большому справочнику. Задача Из 256 тысяч размеченных пар «текстовое описание ? код позиции» построить систему, которая для нового входящего описания возвращает топ-50 наиболее релевантных позиций из справочника на 5 тысяч записей. Это первый этап двухстадийного пайплайна (вторая стадия — LLM-ранжирование — реализуется отдельно). Состав работ • Подготовка и индексация двух наборов данных в векторной БД: справочник работ (5 тыс позиций) и исторические сопоставления (256 тыс пар) • Подбор и настройка embedding-модели для русскоязычных технических описаний • Реализация пайплайна препроцессинга текста (нормализация, обработка кириллица/латиница, технические термины) • Реализация поискового API с метриками similarity и фильтрацией дублей • Замер качества на отложенной выборке: top-1, top-3, top-5 accuracy, [Email скрыт] • Документация и Docker-окружение для развёртывания Требования к исполнителю • Опыт работы с Qdrant / Milvus / Weaviate или аналогами • Опыт с embedding-моделями (BGE, E5, multilingual sentence-transformers) • Python, FastAPI или аналог • Понимание метрик качества retrieval-систем • Опыт работы с русскоязычными техническими данными — плюс Что предоставляется • Готовые JSON-данные (256 тыс размеченных пар, 5 тыс позиций справочника) • Целевая архитектура и описание интеграции • Доступ к тестовой среде для замера метрик Формат работы Удалённо. Передача исходного кода, инструкции по развёртыванию. Бюджет и сроки Обсуждается. Ориентировочный объём — 3–4 недели. Просьба указать в отклике релевантный опыт и ориентировочную стоимость.
Москва Фрилансеры

Администраторы баз данных

дистанционно
договорная
Разработать базу данных с нуля. СУБД: по рекомендации специалиста. Необходима база потенциальных покупателей известняковой муки в сибирском федеральном округе.
Москва Фрилансеры

Администраторы баз данных

дистанционно
договорная
Актуальная БД по СПб и МСК. СУБД: Excel. Необходимо предоставить актуальную БД производств, складских комплексов по СПб,МСК. Что нужно ещё: -.
Санкт-Петербург Фрилансеры