Для диплома Нужно сделать заказ на дообучение и сравнение полученных LLM. Тема: Генерация ответов для письменной части международных экзаменов по английскому языку. Т.е. примерно на такие вопросы https://www.ielts.org/-/media/pdfs/writing-sample-tests/academic-writing-sample-task-2a.ashx https://www.ielts.org/-/media/pdfs/writing-sample-tests/academic-writing-sample-task-2b.ashx Пока план был с huggingface взять предобученные модельки, сравнить их (может без дообучения и нет смысла сравнивать). Потом дообучить на чем-то похожем. Например, нашел такой датасет (U.S students in grades 6-12) на 37k строк- https://www.kaggle.com/competitions/feedback-prize-effectiveness/data?select=train.csv. Ну и потом сравнить их. Можно что-то и сложнее. По моделям интересно выглядят LLaMA, alpaca, dolly