Альманах "Наследие"

ИИ читает древние свитки

Российские учёные обучили искусственный интеллект читать древнейшие хрупкие свитки и книги, не разворачивая их и не разрушая их ценный материал

Российские ученые обучили искусственный интеллект читать хрупкие свитки и книги. Теперь исследователи могут прочесть древние надписи, всего лишь нажав одну кнопку и не тратя время на долгое и скрупулёзное разматывание свитков. Новая технология, помимо удобства, обеспечивает сохранность ценных старинных источников и снижает риски их повреждения. Это первая полностью автоматическая система виртуального разворачивания свитков: она не требует вмешательства человека.

Знаменитая Вилла папирусов, где при раскопках было найдено множество древних документов
Источник pinterest.com // Знаменитая Вилла папирусов, где при раскопках было найдено множество древних документов

В чём суть?

«Учёные российской компании Smart Engines  и Федерального исследовательского центра «Информатика и управление» РАН обучили искусственный интеллект извлекать содержимое хрупких свитков, не разворачивая их. Теперь получить восстановленный текст из манускрипта можно нажатием одной кнопки. Разработка позволит изучать тексты бумажных, берестяных и серебряных свитков и печатных книг, которые пострадали вследствие естественного старения, воздействия влажности или пожаров  и хранятся в особых условиях», — рассказывают о своей разработке исследователи. 

Как искусственный интеллект это делает? Для чтения применяется неразрушающий метод рентгеновской томографии и алгоритмы машинного зрения. То есть, свиток помещается в томограф, затем создаётся цифровая копия документа, над которой производятся все последующие действия. 

Новизна технологии

Мировая наука уже более 20 лет ищет подходы к тому, как анализировать старинные свитки при помощи томографии и инструментов с машинным обучением. Например, в марте 2023 года в США был запущен общемировой конкурс под названием Vesuvius Challenge — зарегистрировавшиеся на него команды должны были найти метод чтения знаменитых свитков из Геркуланума. 

Одно из самых больших собраний древних документов нашли в Геркулануме. Рассказываем об этих документах и о городе, уничтоженном извержением Везувия, в статье «Свитки Геркуланума»

Однако никому в мире до этого не удавалось полностью автоматизировать процесс чтения: участие человека было необходимо. Исследователь должен был подбирать параметры, чтобы запустить работу алгоритмов, что требовало много времени и сил. Вдобавок, часто случались сбои: слои свитков – нередко слипшиеся, и это провоцировало неправильное их считывание. 

Учёные из Smart Engines создали корпус данных, который включает в себя шесть образцов свёрнутых разными способами документов с нанесёнными на них буквами и цифрами разного размера и с различными графическими элементами. На этих образцах они обучили нейросеть распознавать данные из свёртков. Стоит заметить, что Smart Engines – это коммерческая компания и научная организация, которая занимается исследованиями в области искусственного интеллекта и поставляет на рынок решения для распознавания документов в принципе. 

Что дальше? 

Уже опубликован специально подготовленный датасет — то есть набор данных, которые используются при машинном анализе и машинном обучении. А научная статья по результатам работы российских учёных будет представлена в августе 2024 года на The International Conference on Document Analysis and Recognition (ICDAR) – ведущей международной научной конференции в области анализа и распознавания документов, которая проходит в греческих Афинах.

Оставьте ваши координаты для записи на консультацию Цифровой капсулы времени «Первый шаг»


    Поделиться:

    Ранее по теме

    6 июня Россия отмечает главный литературный праздник...

    06.06.2024 Наследие

    Академия наук готова привлечь заинтересованных лиц к...

    08.05.2024 История

    Петербургские археологи обнаружили уникальные...

    07.05.2024 История

    Перечень охраняемых памятников всемироного наследия...

    22.09.2023 Наследие

    Сегодня в Ульяновской области отмечают очень уютный...

    Что мы оставим нашим внукам? Цветущую Землю, богатую...

    03.08.2023 Наследие