student
Russian Federation
The paper analyzes the planned composition of the multi-agent electronic document manage-ment system of an educational organization. The possibilities of using intelligent agents and the main tasks solved with their help in electronic document management systems. Examples of ex-isting services with similar functionality are considered
intelligent agents, multi-agent system, electronic document management
Одним из направлений, занимающих центральное место в эволюции искусственного интеллекта и информационных технологий в настоящее время, является исследование и разработка систем, называемых мультиагентными системами (МАС). Мультиагентный подход предлагает новый метод решения задач, стоящих перед информационной системой. В отличие от классического способа, когда проводится поиск некоторого четко определенного алгоритма, позволяющего найти наилучшее решение проблемы, в мультиагентных технологиях решение получается в результате взаимодействия множества самостоятельных целенаправленных программных модулей – так называемых программных интеллектуальных агентов (ИА) [1].
В настоящее время многие организации активно используют системы электронного документооборота (СЭД) для обработки и управления цифровыми документами. Для дополнения и расширения их функциональных возможностей также могут использоваться мультиагентные технологии, что позволяет значительно улучшить эффективность и качество обработки документов. Они автоматизируют процессы, улучшают обработку, увеличивают скорость и эффективность работы.
МАС позволяют автоматизировать про-цессы согласования решений и взаимодействие лиц, принимающих решения, функции которых выполняют ИА. Программные агенты отдельно друг от друга не решают всех задач, возникающих при автоматизации процессов СЭД, но им делегируются отдельные функции, что делает возможным эффективно разделять работу на логические части, взаимодействовать между собой и синхронизировать работу ИА.
Управление документационным процес-сом становится одним из главных факторов конкурентоспособности любого предприятия в целом и образовательного учреждения – в частности, поэтому внедрение ИА требует учитывать специфические потребности организации. Это включает в себя организацию работы с документами и данными, координацию процессов создания, изменения и распространения документов.
Для систем электронного документооборота в целом в формате отдельных ИА можно выделить следующий набор алгоритмов (рисунок 1).
Актуальность применения таких подходов нарастает в случае необходимости обработки большого количества документов, особенно при строго ограниченном времени для их обработки, при этом с сохранением качества и эффективности документационного взаимодействия. Эф-фективность интеллектуальных алгоритмов также увеличивается в случае, если процессы и документы типизированы, в отличие от организаций со сложной и уникальной организационной структурой.
Рисунок 1 – Алгоритмы обработки для ИА в СЭД
Рассмотрим на примере ИА кластеризации документов. Это одна из первоочередных и важных задач анализа данных, полученных из системы электронного документооборота – построение кластерной модели данных. Кластерный анализ представляет собой разбиение набора данных, в данном случае документов, на кластеры – группу однотипных элементов – и имеет широкий круг применимости.
Кластеризация может быть предварительным этапом для решения задач поиска дубликатов, похожих или однотипных документов, позволит построить алгоритм для более точного предсказания атрибутов документов. Наиболее очевидные варианты практического применения результатов кластеризации – это автоматическая классификация новых документов.
Чтобы определиться с набором кластеров для начала необходимо проанализировать структуру учебного заведения, особенности деятельности каждого подразделения и определить конечный набор документов, который функционирует внутри каждого подразделения и однозначно определен в утвержденной номенклатуре дел.
Работа над документооборотом учебного заведения заключается в анализе состава документации.
В укрупненном формате были условно выделены следующие классы и компонентный состав документации:
• организационные документы (Устав, должностная инструкция, положение, штатное расписание, структура и штатная численность);
• распорядительные документы (приказ, распоряжение, решение);
• информационно - справочные документы (акт, протокол, докладная записка, объяснительная записка, служебная записка, заявление, письмо, факс, справка, доклад, телеграмма, телефонограмма).
• документы, связанные с учебной деятельностью (государственные образовательные стандарты, учебные планы, рабочие программы дисциплин, фонд оценочных средств, график рабочего процесса и др.)
• документы, подтверждающие результаты учебной деятельности (ведомости и др.).
• документы, отражающие результаты учебной деятельности (пояснительные записки ВКР, отчёты по практике, работы студентов).
Каждый из этих типов документов обладает определенными свойствами, характерными элементами, обязательными реквизитами по которым можно идентифицировать его тип.
Аналогичным образом был определён состав ИА, которые планируется включить в СЭД. При этом они могут решать задачи независимо друг от друга, обладая каждый своим функциональным набором (рисунок 2).
ИА могут определить типы документов, такие как договоры, письма, приказы или специфические виды документов, учебные планы, рабочие программы дисциплин, ведомости и др. Это может позволить эффективно распределять документы между различными отделами и сотрудниками, а также облегчает маршрутизацию и управление знаниями в организации.
Интеллектуальные агенты также обладают способностью проверять наличие необходимых полей или подписей в документе, а также осуществлять проверку на соответствие правилам оформления. Например, они могут извлекать данные, такие как название организации, даты, суммы и другие ключевые элементы, из различных типов документов. Или проверить наличие и корректность номера протокола утверждения документа. Это упрощает процессы маршрутизации документов и управления знаниями в организации. Как правило в каждом классе документов имеются свои узкие места, в которых наиболее часто встречаются ошибочные данные, приводящие к ощутимым последствиям.
Рисунок 2 – ИА в процессе управления документами
Кроме того, ИА обладают высокой точностью в распознавании текста и способностью извлекать данные из отсканированных документов, изображений и рукописного текста. Это упрощает редактирование, поиск и индексирование документов, значительно расширяя возможности поиска в СЭД.
Они также предоставляют возможность автоматизированной обработки документов, такой как удаление пустых страниц, исправление орфографических ошибок и улучшение качества изображений. Например, ИА могут автоматически удалять пустые страницы из отсканированных документов, что упрощает их последующую обработку и архивирование [2].
Также ИА способны автоматически создавать отчеты и проводить анализ данных на основе информации, содержащейся в документах. Например, они могут генерировать сводные отчеты о количестве и типах документов, их комплектности, сроках обработки и других показателях. Это позволяет руководству принимать информированные решения и оптимизировать процессы управления документами в организации.
Ниже представлен обзор существующих сервисов с аналогичными возможностями, которые могут применяться в СЭД:
• Автоматическая классификация документов (Abbyy FlexiCapture). Сервис позволяет автоматически классифицировать и категорировать документы на основе их содержания и других признаков.
• Извлечение структурированных данных из документов (Rossum Elis) Сервис использует нейронные сети для извлечения определенной информации из документов.
• Распознавание оптического текста (Google Cloud Vision OCR). Предоставляет API для точного распознавания текста с изображений и отсканированных документов на различных языках.
• Автоматическая проверка и обеспечение качества текстовых материалов. (Grammarly) Осуществляет исправление ошибок, грамматики, пунктуации и стилистики текстов.
Таким образом, в работе проведен анализ планируемого состава мультиагентной системы электронного документооборота образовательной организации. Возможности использования ИА и основные задачи, решаемые с их помощью в СЭД. Рассмотрены примеры существующих сервисов аналогичной функциональности.
1. Landsberg S.E., Hovanskih A.A. Osobennosti postroeniya informacionnyh sistem s ispol'zovaniem mul'tiagentnyh tehnologiy // Vestnik VGTU. 2014. №3-1. URL: https://cyberleninka.ru/article/n/osobennosti-postroeniya-informatsionnyh-sistem-s-ispolzovaniem-multiagentnyh-tehnologiy (data obrascheniya: 10.09.2023).
2. Aver'yanova A.N., Atanov V.V., Kesya M.S., Mozhnov E.S. Ispol'zovanie intellektual'nyh mikroservisov v so-vremennyh sistemah elektronnogo dokumentooborota // Forum molodyh uchenyh.- 2023.- №5 (81). URL: https://cyberleninka.ru/article/n/ispolzovanie-intellektualnyh-mikroservisov-v-sovremennyh-sistemah-elektronnogo-dokumentooborota (data obrascheniya: 10.09.2023).