Избранное сообщение

четверг, 26 января 2023 г.

Можно попробовать прямо сейчас и отыскать предка-князя: нейросети Яндекса теперь справляются с расшифровкой дореволюционных рукописей

  • 25 января 2023
  • Доступно более чем 2,5 миллиона страниц исторических документов
Команда Яндекса сообщила о новом достижении проекта по развитию нейросетей, распознающих текст. Разработчики научили фирменные нейросети расшифровывать архивные записи со сложной дореволюционной орфографией. 
Можно попробовать прямо сейчас и отыскать предка-князя: нейросети Яндекса теперь справляются с расшифровкой дореволюционных рукописей

Пользователи могут протестировать технологию в действии в сервисе «Поиск по архивам». В рамках проекта доступно более чем 2,5 миллиона страниц исторических документов XVIII — начала XX веков с текстовой расшифровкой, включая метрические книги, исповедные ведомости и ревизские сказки с результатами переписи населения. 

Как отмечают разработчики, сервис «Поиск по архивам» пригодится историкам, социологам, демографам, генеалогам и простым пользователям, которые ищут сведения о своей семье.

Можно попробовать прямо сейчас и отыскать предка-князя: нейросети Яндекса теперь справляются с расшифровкой дореволюционных рукописей

Новый алгоритм оптического распознавания учитывает особенности почерка и структуру архивных документов, справляется с символами и буквами, больше не использующимися в русском языке. Нейросеть прошла обучение на сотнях тысяч рукописных строк из реальных текстов XVIII–XIX веков и десятков миллионов сгенерированных примеров.

Руководитель «Поиска Яндекса» Елена Бубнова рассказала:

Для расшифровки одной страницы архивного рукописного текста профессионалу может потребоваться до получаса времени. Наш сервис справляется с этим за несколько секунд. В перспективе технологию можно использовать и для решения других задач в продуктах Яндекса.

 

25 января 2023 в 12:37

 

Автор: 

  

| Источник: Поиск по архивам



 https://www.ixbt.com/news/2023/01/25/mozhno-poprobovat-prjamo-sejchas-i-otyskat-predkaknjazja-nejroseti-jandeksa-teper-spravljajutsja-s-rasshifrovkoj.html

https://creativecommons.org/licenses/by/3.0/legalcode