Альманах "Наследие"

ИИ читает древние свитки

Российские учёные обучили искусственный интеллект читать древнейшие хрупкие свитки и книги, не разворачивая их и не разрушая их ценный материал

Российские ученые обучили искусственный интеллект читать хрупкие свитки и книги. Теперь исследователи могут прочесть древние надписи, всего лишь нажав одну кнопку и не тратя время на долгое и скрупулёзное разматывание свитков. Новая технология, помимо удобства, обеспечивает сохранность ценных старинных источников и снижает риски их повреждения. Это первая полностью автоматическая система виртуального разворачивания свитков: она не требует вмешательства человека.

Знаменитая Вилла папирусов, где при раскопках было найдено множество древних документов
Источник pinterest.com // Знаменитая Вилла папирусов, где при раскопках было найдено множество древних документов

В чём суть?

«Учёные российской компании Smart Engines  и Федерального исследовательского центра «Информатика и управление» РАН обучили искусственный интеллект извлекать содержимое хрупких свитков, не разворачивая их. Теперь получить восстановленный текст из манускрипта можно нажатием одной кнопки. Разработка позволит изучать тексты бумажных, берестяных и серебряных свитков и печатных книг, которые пострадали вследствие естественного старения, воздействия влажности или пожаров  и хранятся в особых условиях», — рассказывают о своей разработке исследователи. 

Как искусственный интеллект это делает? Для чтения применяется неразрушающий метод рентгеновской томографии и алгоритмы машинного зрения. То есть, свиток помещается в томограф, затем создаётся цифровая копия документа, над которой производятся все последующие действия. 

Новизна технологии

Мировая наука уже более 20 лет ищет подходы к тому, как анализировать старинные свитки при помощи томографии и инструментов с машинным обучением. Например, в марте 2023 года в США был запущен общемировой конкурс под названием Vesuvius Challenge — зарегистрировавшиеся на него команды должны были найти метод чтения знаменитых свитков из Геркуланума. 

Одно из самых больших собраний древних документов нашли в Геркулануме. Рассказываем об этих документах и о городе, уничтоженном извержением Везувия, в статье «Свитки Геркуланума»

Однако никому в мире до этого не удавалось полностью автоматизировать процесс чтения: участие человека было необходимо. Исследователь должен был подбирать параметры, чтобы запустить работу алгоритмов, что требовало много времени и сил. Вдобавок, часто случались сбои: слои свитков – нередко слипшиеся, и это провоцировало неправильное их считывание. 

Учёные из Smart Engines создали корпус данных, который включает в себя шесть образцов свёрнутых разными способами документов с нанесёнными на них буквами и цифрами разного размера и с различными графическими элементами. На этих образцах они обучили нейросеть распознавать данные из свёртков. Стоит заметить, что Smart Engines – это коммерческая компания и научная организация, которая занимается исследованиями в области искусственного интеллекта и поставляет на рынок решения для распознавания документов в принципе. 

Что дальше? 

Уже опубликован специально подготовленный датасет — то есть набор данных, которые используются при машинном анализе и машинном обучении. А научная статья по результатам работы российских учёных будет представлена в августе 2024 года на The International Conference on Document Analysis and Recognition (ICDAR) – ведущей международной научной конференции в области анализа и распознавания документов, которая проходит в греческих Афинах.

Оставьте ваши координаты, и с вами свяжется специалист для презентации Цифровой капсулы времени


    Поделиться:

    Ранее по теме

    Что делать, если хочется свежей зелени, а на дачу не...

    Что если будущее уже наступило, а люди даже не...

    Компания Neuralink наконец получила разрешение...

    26.05.2023 Илон Маск

    Скоро у человечества станет на одну проблему меньше....

    11.05.2023 Наука

    Мало кто хочет жить в каменных городских джунглях. А...