Для себя Сейчас делаю проект, для него нужно закодить среду (или можифицировать существующую) и добавить двух рл агентов. Среда по типу: есть поле из квадратиков, по которым агент может перемещаться, стены и двери, которые он может открывать. Цель первого агента: добраться до яблока. Это должно быть связано с q learning, я пока не дочитала)) Помощь нужна с кратким экскурсом в рл и объяснением, как написать этот код (не обязательно полностью его писать со мной, важно разобрать, что для него нужно, из каких кусков он состоит и тд) Хотя бы примерно)) Ожидаю, что занятие будет от 2 до 4 часов