IOS — работа в Москве

Дата: 2023-11-01
Детали
Регион
Москва
Метро
Строгино, Щукинская, Речной вокзал, Кропоткинская
Занятость
на дому или дистанционно
Стоимость
от 1000.00 руб.
Дата публикации
2023-11-01
Описание
Для работы Оценить уровень знаний. Дополнить недостающие знания. Помощь в составлении резюме и прохождении собеседования. Помощь в трудоустройстве. В идеале - участие в учебных проектах. Закончил МГУ факультет ВМК, но по специальности не работал. Окончил онлайн курс в Нетологии и Angela Yu. Знание технического английского.
Похожие заказы
Обучение созданию нейросетей
без разницы
от 2000.00 руб.
Для себя Требуется специалист, который внятно объяснит и научит работать с нейросетями
Москва
Репетиторы
2024-05-15
Подробнее
Обучение C++
дистанционно
договорная
Написание анимации в Qt Написать анимацию, на языке C++ в Qt creator
Москва
Репетиторы
2024-05-15
Подробнее
Обучение Python
дистанционно
от 1500.00 руб.
Для себя Во всех заданиях данного раздела запрещено использовать циклы и list comprehensions. Под вектором и матрицей в данных заданиях понимается одномерный и двумерный numpy.array соответственно. In [ ]: import numpy as np 1. (0.5 балла) Реализуйте функцию, возвращающую максимальный элемент в векторе x среди элементов, перед которыми стоит нулевой. Для x = np.array([6, 2, 0, 3, 0, 0, 5, 7, 0]) ответом является 5. Если нулевых элементов нет, функция должна возвращать None. In [ ]: def max_element(arr): # Your code here 2. (0.5 балла) Реализуйте функцию, принимающую на вход матрицу и некоторое число и возвращающую ближайший к числу элемент матрицы. Например: для X = np.arange(0,10).reshape((2, 5)) и v = 3.6 ответом будет 4. In [ ]: def nearest_value(X, v): # Your code here 3. (0.5 балла) Реализуйте функцию scale(X), которая принимает на вход матрицу и масштабирует каждый ее столбец (вычитает выборочное среднее и делит на стандартное отклонение). Убедитесь, что в функции не будет происходить деления на ноль. Протестируйте на случайной матрице (для её генерации можно использовать, например, функцию numpy.random.randint). In [ ]: def scale(X): # Your code here 4. (0.5 балла) Реализуйте функцию, которая для заданной матрицы находит: определитель след наименьший и наибольший элементы норму Фробениуса собственные числа обратную матрицу Для тестирования сгенерируйте матрицу с элементами из нормального распределения N (10,1) In [ ]: def get_stats(X): # Your code here 5. (0.5 балла) Повторите 100 раз следующий эксперимент: сгенерируйте две матрицы размера 10x10 из стандартного нормального распределения, перемножьте их (как матрицы) и найдите максимальный элемент. Какое среднее значение по экспериментам у максимальных элементов? 95-процентная квантиль? In [ ]: for exp_num in range(100): # Your code here Pandas Ответьте на вопросы о данных по авиарейсам в США за январь-апрель 2008 года. Данные и их описание In [ ]: import pandas as pd %matplotlib inline 6. (0.3 балла) Какая из причин отмены рейса (CancellationCode) была самой частой? (расшифровки кодов можно найти в описании данных) In [ ]: # Your code here 7. (0.3 балла) Найдите среднее, минимальное и максимальное расстояние, пройденное самолетом. In [ ]: # Your code here 8. (0.3 балла) Не выглядит ли подозрительным минимальное пройденное расстояние? В какие дни и на каких рейсах оно было? Какое расстояние было пройдено этими же рейсами в другие дни? In [ ]: # Your code here 9. (0.3 балла) Из какого аэропорта было произведено больше всего вылетов? В каком городе он находится? In [ ]: # Your code here 10. (0.3 балла) Найдите для каждого аэропорта среднее время полета (AirTime) по всем вылетевшим из него рейсам. Какой аэропорт имеет наибольшее значение этого показателя? In [ ]: # Your code here 11. (1 балл) Найдите аэропорт, у которого наибольшая доля задержанных (DepDelay > 0) рейсов. Исключите при этом из рассмотрения аэропорты, из которых было отправлено меньше 1000 рейсов (используйте функцию filter после groupby). In [ ]: # Your code here Линейная регрессия В этой части мы разберемся с линейной регрессией, способами её обучения и измерением качества ее прогнозов. Будем рассматривать датасет из предыдущей части задания для предсказания времени задержки отправления рейса в минутах (DepDelay). Отметим, что под задержкой подразумевается не только опоздание рейса относительно планируемого времени вылета, но и отправление до планируемого времени. Подготовка данных 12. (1 балл) Считайте выборку из файла при помощи функции pd.read_csv и ответьте на следующие вопросы: Имеются ли в данных пропущенные значения? Сколько всего пропущенных элементов в таблице "объект-признак"? Сколько объектов имеют хотя бы один пропуск? Сколько признаков имеют хотя бы одно пропущенное значение? In [ ]: # Your code here Как вы понимаете, также не имеет смысла рассматривать при решении поставленной задачи объекты с пропущенным значением целевой переменной. В связи с этим ответьте на следующие вопросы и выполните соответствующие действия: Имеются ли пропущенные значения в целевой переменной? Проанализируйте объекты с пропущенными значениями целевой переменной. Чем вызвано это явление? Что их объединяет? Можно ли в связи с этим, на ваш взгляд, исключить какие-то признаки из рассмотрения? Обоснуйте свою точку зрения. Исключите из выборки объекты с пропущенным значением целевой переменной и со значением целевой переменной, равным 0, а также при необходимости исключите признаки в соответствии с вашим ответом на последний вопрос из списка и выделите целевую переменную в отдельный вектор, исключив её из матрицы "объект-признак". In [ ]: # Your code here 13. (0.5 балла) Обратите внимание, что признаки DepTime, CRSDepTime, ArrTime, CRSArrTime приведены в формате hhmm, в связи с чем будет не вполне корректно рассматривать их как вещественные. Преобразуйте каждый признак FeatureName из указанных в пару новых признаков FeatureName_Hour, FeatureName_Minute, разделив каждое из значений на часы и минуты. Не забудьте при этом исключить исходный признак из выборки. В случае, если значение признака отсутствует, значения двух новых признаков, его заменяющих, также должны отсутствовать. Например, признак DepTime необходимо заменить на пару признаков DepTime_Hour, DepTime_Minute. При этом, например, значение 155 исходного признака будет преобразовано в значения 1 и 55 признаков DepTime_Hour, DepTime_Minute соответственно. In [ ]: # Your code here 14. (1 балл) Некоторые из признаков, отличных от целевой переменной, могут оказывать чересчур значимое влияние на прогноз, поскольку по своему смыслу содержат большую долю информации о значении целевой переменной. Изучите описание датасета и исключите признаки, сильно коррелирующие с ответами. Ваш выбор признаков для исключения из выборки обоснуйте. Кроме того, исключите признаки TailNum и Year. In [ ]: # Your code here 15. (0.5 балла) Приведем данные к виду, пригодному для обучения линейных моделей. Для этого вещественные признаки надо отмасштабировать, а категориальные — привести к числовому виду. Также надо устранить пропуски в данных. В первую очередь поймем, зачем необходимо применять масштабирование. Следующие ячейки с кодом построят гистограммы для 3 вещественных признаков выборки. In [ ]: X['DepTime_Hour'].hist(bins=20) In [ ]: X['TaxiIn'].hist(bins=20) In [ ]: X['FlightNum'].hist(bins=20) Какую проблему вы наблюдаете на этих графиках? Как масштабирование поможет её исправить? Некоторые из признаков в нашем датасете являются категориальными. Типичным подходом к работе с ними является бинарное, или one-hot-кодирование. Реализуйте функцию transform_data, которая принимает на вход DataFrame с признаками и выполняет следующие шаги: Замена пропущенных значений на нули для вещественных признаков и на строки 'nan' для категориальных. Масштабирование вещественных признаков с помощью StandardScaler. One-hot-кодирование категориальных признаков с помощью DictVectorizer или функции pd.get_dummies. Метод должен возвращать преобразованный DataFrame, который должна состоять из масштабированных вещественных признаков и закодированных категориальных (исходные признаки должны быть исключены из выборки). In [ ]: def transform_data(data): # Your code here Примените функцию transform_data к данным. Сколько признаков получилось после преобразования? In [ ]: # Your code here 16. (1 балл) Разбейте выборку и вектор целевой переменной на обучение и контроль в отношении 70/30 (для этого можно использовать, например, функцию train_test_split). In [ ]: # Your code here Scikit-learn Теперь, когда мы привели данные к пригодному виду, попробуем решить задачу при помощи метода наименьших квадратов. Напомним, что данный метод заключается в оптимизации функционала MSE Заметим, что решение данной задачи уже реализовано в модуле sklearn в виде класса LinearRegression. 17. (1 балл) Обучите линейную регрессию на 1000 объектах из обучающей выборки и выведите значения MSE и R2 на этой подвыборке и контрольной выборке (итого 4 различных числа). Проинтерпретируйте полученный результат — насколько качественные прогнозы строит полученная модель? Какие проблемы наблюдаются в модели? Подсказка: изучите значения полученных коэффициентов w, сохраненных в атрибуте coef_ объекта LinearRegression. In [ ]: # Your code here Для решения описанных вами в предыдущем пункте проблем используем L1- или L2-регуляризацию, тем самым получив Lasso и Ridge регрессии соответственно и изменив оптимизационную задачу одним из следующих образов: где α — коэффициент регуляризации. Один из способов его подбора заключается в переборе некоторого количества значений и оценке качества на кросс-валидации для каждого из них, после чего выбирается значение, для которого было получено наилучшее качество. 18. (1 доп. балл) Обучите линейные регрессии с L1- и L2-регуляризатором, подобрав лучшее значение параметра регуляризации из списка alpha_grid при помощи кросс-валидации c 5 фолдами на тех же 1000 объектах, что и в п.17. Выведите значения MSE и R2 на обучающей и контрольной выборках. Удалось ли решить указанные вами ранее проблемы? Для выполнения данного задания вам могут понадобиться реализованные в библиотеке объекты LassoCV, RidgeCV и KFold. In [ ]: # Your code here Срок 20.05, оплата после проверки на работоспособность и правильность кода
Москва
Репетиторы
2024-05-14
Подробнее
Обучение языку R
дистанционно
договорная
Для себя Решить задание по статистике. Нужно знание английского языка Вот задание: A psychologist is interested in short-term working memory under (1) sleep deprivation, (2) a strong dose of caffeine, (3) following 8 hours sleep. They conduct a between subjects design. Each participant is given a list of 7 words to read, then asked to remember the words 30 seconds later. The data set has three variables: Participant: 1 to 90 (column name ‘PARTICIPANT’) Group: 1 = sleep deprivation, 2 = strong dose of caffeine, 3 = 8 hours sleep (column name ‘GROUP’) Score: 4 to 7 (column name ‘SCORE’) They hypothesise that short-term working memory will be significantly greater following highest following 8 hours sleep compared to sleep deprivation and a caffeine dose. They also hypothesise that short-term working memory will be significantly worse under sleep deprivation, compared to a caffeine dose.
Москва
Репетиторы
2024-05-14
Подробнее
Обучение Python
дистанционно
договорная
Для себя Нужна помощь кодера (Python), который разбирается в криптографии. Требуется помощь в выполнении следующих заданиях (на выбор): 1) написать программную реализацию одной из следующих хэш-функций (по выбору): - ГОСТ Р 34.11-2012 (или его международный вариант ГОСТ 34.11-2018) с длиной хэш-значения 256 или 512 бит по выбору; - SHA-3 (вариант алгоритма по выбору); 2) написать программную реализацию алгоритмов на выбор: - ASCON-128 в режиме AEAD; - PRESENT в режиме AEAD в стандарте GCM mode; - CLEFIA в режиме AEAD в стандарте GCM mode; Требования по программной реализации вышлю.
Москва
Репетиторы
2024-05-14
Подробнее
Программирование
дистанционно
договорная
Язык программирования: Java, SQL Для себя Совместно выполнить лабораторную работу в университете: Создать простое приложение тестирования с использованием Spring Framework. Вам могут понадобиться зависимости: 1 spring-contex 2 spring-core 3 spring-web 4 junit Приложение должно спросить у пользователя фамилию и имя, спросить 5 вопросов из CSV-файла, запросить ответы пользователя и вывести результат тестирования.
Москва
Репетиторы
2024-05-14
Подробнее
Обучение Python
дистанционно
договорная
Написание кода для диплома Написать код для обнаружения, детекции и классификации транспортных средств с помощью YOLOv4 либо обучить нейронную сеть взяв уже готовый датасет. 1. Решение задач обнаружения и классификации движущихся ТС. 2. Отслеживание траектории движения ТС. 3. Анализ характеристики транспортных потоков. 4. Разработка алгоритмов обработки видеоданных на языке Python с применением библиотеки OpenCV.
Москва
Репетиторы
2024-05-14
Подробнее