Пожелания и особенности: В текущей логике система уже использует OCR для распознавания содержания документа. После этого этапа необходимо реализовать следующий ключевой шаг — автоматический маппинг данных. Задача заключается в том, чтобы после распознавания документа система определяла поставщика и автоматически назначала соответствующий бухгалтерский счёт (GL account). Если поставщик распознан и присутствует в базе, система должна напрямую подтянуть заранее настроенный для него счёт. Если поставщик не распознан или отсутствует в базе, необходимо реализовать классификацию по содержанию документа. Например, если в описании указаны транспортные услуги, такие расходы должны относиться на транспортные расходы; если маркетинговые — на маркетинг и т.д. Если система не может однозначно определить категорию, необходимо присвоить счёт общего характера (например, miscellaneous / general expenses), но при этом обязательно пометить такую операцию (флаг/статус), чтобы пользователь мог быстро обратить на неё внимание и проверить вручную. У меня уже есть подготовленные файлы: план счетов (покрывает более 95% типовых операций для большинства компаний), master vendor list (список поставщиков, привязанных к конкретным типам расходов). Ключевая задача — встроить этап маппинга между OCR и формированием выходного файла (Excel/CSV). То есть логика должна быть следующей: OCR ? определение поставщика и содержания ? маппинг (vendor / category ? GL account) ? формирование файла. На этапе маппинга система должна выбирать наиболее подходящий счёт на основе либо поставщика, либо содержания документа, с возможностью последующего обучения на действиях пользователя.