Портал "Наследие"

Обратная сторона фотографии

Мы даже не задумываемся о том, какое количество бесценных бумажных фото-архивов хранится по всему миру

Сокровища The New York Times Сохранение визуальной истории Как это работает в Google Cloud ИИ расшифрует надписи и назовет объекты Атрибутирование личного архива

Мы даже не задумываемся о том, какое количество бесценных бумажных фотоархивов хранится по всему миру. 

в архивах  The New York Times
 Источник blognone.com // в архивах  The New York Times

Это и личные семейные архивы, и  архивы крупных компаний и СМИ. И любая из этих коллекций рискует быть утраченной навсегда. Ведь в помещении, в котором находится архив, может произойти пожар или затопление. Так, например, однажды из-за прорыва трубы чуть не погиб  фотоархив газеты The New York Times, который хранится в подвале с мрачным названием «морг».  

Сокровища The New York Times

Мало кто знает, что в архивах  The New York Times находится от пяти до семи миллионов старинных фотографий, которые собирали в редакции на протяжении более ста лет. 

фотовыставка
Источник regnum.ru

Их хранят в сотнях каталожных шкафов в месте, которое называют «морг». И есть доля правды в том, что этому месту дали именно такое название. Ведь многие из фотографий не извлекались из папок десятилетия. И, хотя в специальных каталогах перечислены все снимки  — это всего лишь сухие названия. Большинство изображений остаются недоступными для широкой публики. Так что, можно сказать, что в этом месте фотографии обречены на медленное умирание и забвение. 

Вот  как описал этот фотоархив главный технический директор газеты, Ник Рокуэлл:

«Морг» — это сокровищница скоропортящихся документов, которые являются бесценной хроникой не только истории «Таймс», но и более чем столетних глобальных событий, сформировавших наш современный мир.

в архивах  The New York Times
Источник Twitter // в архивах  The New York Times

К тому же в помещении, которое находится на минус третьем этаже, старым снимкам угрожает опасность и физического уничтожения. Например, в 2015 году прорвало трубы и архив был затоплен. К счастью в большинстве своем коллекция не пострадала. Однако даже небольшое количество утраченных снимков — это уже трагедия. Ведь многие из них хранятся в архиве в единственном экземпляре и не подлежат восстановлению. 

Иногда даже цифровые архивы оказываются под угрозой. Читайте, как избежать утраты ценной информации в статье «Как восстановить удаленные файлы»

Сотрудники фотоотдела давно уже думают над тем, чтобы оцифровать всю коллекцию, сохранив уникальные снимки для потомков.

Сохранение визуальной истории

Безусловно, старинные снимки имеют огромную ценность. Но не меньшее значение имеют детали — надписи, сделанные на обороте фотографий, указание места и времени, когда был сделан снимок. 

Подчас само по себе изображение не несет никакой смысловой нагрузки — оно уже потеряло значение для современного поколения. Но надписи, сделанные на фотографии, заметки и пояснения заставляют снимок вновь наполниться смыслом.  

семейное фото . фотоархив
 Источник miihaaiil.livejournal.com

Именно эти надписи долгое время были препятствием для тотальной оцифровки архива. Было понятно, как оцифровать и сохранить фотографии, но непонятно — что делать с пояснениями к снимкам? Неужели их необходимо заносить вручную? Учитывая объем коллекции задача выглядела невыполнимой. 

Но теперь, с помощью облачного хранения, можно не только оцифровать фотографии, но и сохранить пояснения и записи, сделанные на снимке, в автоматическом режиме. И использовать эти пояснения в описании изображения. Попробуем разобраться — как именно происходит оцифровка таких глобальных фотоархивов, как тот, которым располагает The Times.

Как это работает в Google Cloud

Для того, чтобы создать систему, в которой пользователи могут искать и просматривать фотографии, простой оцифровки недостаточно. В системе, которую предлагает, например, облачное хранилище Google, создается настоящий конвейер, который обеспечивает не только хранение и обработку фотографий, но и распознавание текста, почерка и других деталей, которые могут найтись на снимке. 

открытка . фотоархив
 Источник www.ma-shops.com

После того, как фотография загружается в облачное хранилище, включается функция Cloud Pub/Sub , которая запускает конвейер операций с этим изображением. При этом все метаданные изображения сохраняются в базе данных PostgreSQL , работающей на Cloud SQL, то есть опять же внутри управляемой системы Google. Возможность решать все необходимые задачи по обработке, атрибутированию и сохранению информации и изображений в одной структуре, избавляют клиентов от необходимости создавать отдельную систему для отслеживания и объединения всех этих бизнес-процессов.

Изображения, сохраняемые на Cloud Storage, а также их метаданные, которые хранятся в базе данных Cloud SQL, доступны онлайн через интернет. Таким образом, снимки не только сохраняются, но также становятся доступными для широкого круга пользователей. А расшифрованные надписи и пометки дают новые критерии для поиска нужного снимка.

ИИ расшифрует надписи и назовет объекты

Итак, понятно, что атрибутирование фотографий — это неотъемлемая часть оцифровки архива. Любого, не только газеты The Times. Но как именно происходит это атрибутирование? Остановимся на этом подробнее. 

Дополнительную информацию к фотографии можно получить с помощью искусственного интеллекта. И речь идет не только о расшифровке надписей. 

открытка . фотоархив
 Источник www.ma-shops.com

Функция Cloud Vision API поможет обнаружить эмоции, распознать печатный и рукописный текст. Кроме того, эта функция помогает обнаружить на снимке известные объекты или людей. Даже если на снимке присутствует логотип, или вывеска, ИИ заметит это и распознает.

Конечно, цифровая транскрипция не всегда идеально распознает надписи, но это лучшее решение, учитывая количество изображений в архиве. Вручную этот объем было бы не обработать.

Кроме атрибутирования фотографий существуют и другие сервисы. Они  помогут не только сохранить архив, но и свободно в нем ориентироваться и находить нужную информацию. 

Так, сервис Cloud Natural Language API позволяет находить дополнительную семантическую информацию к тому тексту, который был распознан. Например, если в рукописном пояснении присутствовали упоминания названий вокзалов, железной дороги, станций то ИИ может предложить поместить файл с изображением в категорию «путешествия» и в подкатегорию «железные дороги». Таким образом возможности для поиска нужного изображения становятся гораздо шире.

Атрибутирование личного фотоархива

Так же, как и в описанном примере, атрибутирование крайне важно и при сохранении личного фотоархива. Ведь со временем многое забывается. Например — кто изображен на этой фотографии. Или — почему важен билет в кино, который почему-то сохранился в документах.  

открытка с подписью. фотоархив
Источник fishki.net

При огромных объемах информации, а также если снимки и документы сопровождались пояснительными надписями, работу по атрибутированию можно доверить облачным сервисам. Но это не всегда возможно. 

Во-первых, не все подписывают снимки и памятные документы. Во-вторых, облачные сервисы, конечно, распознают рукописный текст, но не всегда делают это корректно. При большом объеме ошибки несущественны, но если речь идет о семейном или личном архиве, то атрибутирование лучше выполнять вручную.

открытка . фотоархив
 Источник m.fishki.net

В этом могут помочь сотрудники компании «Наследие.Диджитал». Они опишут каждый снимок и документ, а Персональный историк поможет вспомнить полузабытые события или имена, если Автор о чем-то забыл.  

Таким образом, каждая фотография в фотоархиве вновь наполнится смыслом, а жизнь Автора предстанет захватывающей историей, которую он рассказывает своим потомкам.

Сотрудники компании "Наследие. Диджитал" помогут вам упорядочить и систематизировать архив, атрибудитьвать фотографии и воссоздать утраченные воспоминания. Оставьте координаты, чтобы узнать больше

    Поделиться:

    Ранее по теме

    У человека должны быть увлечения, которые наполняют...

    Архив

    Сегодня мы публикуем перевод статьи Лучано Кьяппини...

    11.05.2022 История
    Архив

    Впереди - очередные длинные праздники. Кто-то поедет...

    Архив

    Изобретение книгопечатания стало прорывом в развитии...

    04.05.2022 История
    Архив

    Так неужели для того, чтобы сделать качественные...

    Архив

    В наши дни самым ценным ресурсом становится не золото...

    Архив

    Комментариев: 0 обсудить?

    Добавить комментарий

    Ваш адрес email не будет опубликован.

    2 × 5 =

    Подпишитесь, чтобы получать новый контент.

    Мы не спамим! Прочтите нашу политику конфиденциальности, чтобы узнать больше.