Российские ученые обучили искусственный интеллект читать хрупкие свитки и книги. Теперь исследователи могут прочесть древние надписи, всего лишь нажав одну кнопку и не тратя время на долгое и скрупулёзное разматывание свитков. Новая технология, помимо удобства, обеспечивает сохранность ценных старинных источников и снижает риски их повреждения. Это первая полностью автоматическая система виртуального разворачивания свитков: она не требует вмешательства человека.
В чём суть?
«Учёные российской компании Smart Engines и Федерального исследовательского центра «Информатика и управление» РАН обучили искусственный интеллект извлекать содержимое хрупких свитков, не разворачивая их. Теперь получить восстановленный текст из манускрипта можно нажатием одной кнопки. Разработка позволит изучать тексты бумажных, берестяных и серебряных свитков и печатных книг, которые пострадали вследствие естественного старения, воздействия влажности или пожаров и хранятся в особых условиях», — рассказывают о своей разработке исследователи.
Как искусственный интеллект это делает? Для чтения применяется неразрушающий метод рентгеновской томографии и алгоритмы машинного зрения. То есть, свиток помещается в томограф, затем создаётся цифровая копия документа, над которой производятся все последующие действия.
Новизна технологии
Мировая наука уже более 20 лет ищет подходы к тому, как анализировать старинные свитки при помощи томографии и инструментов с машинным обучением. Например, в марте 2023 года в США был запущен общемировой конкурс под названием Vesuvius Challenge — зарегистрировавшиеся на него команды должны были найти метод чтения знаменитых свитков из Геркуланума.
Одно из самых больших собраний древних документов нашли в Геркулануме. Рассказываем об этих документах и о городе, уничтоженном извержением Везувия, в статье «Свитки Геркуланума»
Однако никому в мире до этого не удавалось полностью автоматизировать процесс чтения: участие человека было необходимо. Исследователь должен был подбирать параметры, чтобы запустить работу алгоритмов, что требовало много времени и сил. Вдобавок, часто случались сбои: слои свитков – нередко слипшиеся, и это провоцировало неправильное их считывание.
Учёные из Smart Engines создали корпус данных, который включает в себя шесть образцов свёрнутых разными способами документов с нанесёнными на них буквами и цифрами разного размера и с различными графическими элементами. На этих образцах они обучили нейросеть распознавать данные из свёртков. Стоит заметить, что Smart Engines – это коммерческая компания и научная организация, которая занимается исследованиями в области искусственного интеллекта и поставляет на рынок решения для распознавания документов в принципе.
Что дальше?
Уже опубликован специально подготовленный датасет — то есть набор данных, которые используются при машинном анализе и машинном обучении. А научная статья по результатам работы российских учёных будет представлена в августе 2024 года на The International Conference on Document Analysis and Recognition (ICDAR) – ведущей международной научной конференции в области анализа и распознавания документов, которая проходит в греческих Афинах.