Рет қаралды 367,053
Рукописи, может быть, и не горят, но точно ветшают и портятся. Понять, что написано в двухсотлетних документах, бывает непросто - и из-за их состояния, и из-за особенностей языка. Но на помощь приходят нейросети.
В прошлом году Яндекс запустил «Поиск по архивам». Это сервис, который помогает людям искать упоминания своих предков в архивных документах так же, как в интернете. Для этого команда обучила модель читать старинные тексты, и она уже распознала миллионы страниц.
👀 Попробуйте найти в архивах корни своей семьи: yandex.ru/archive
Это рубрика «Вопрос со звёздочкой», в которой разработчики Яндекса простым языком объясняют сложные технологии. Татьяна Сапатова занимается распознаванием текста в Яндексе и, в частности, в «Поиске по архивам». В «Вопросе со звёздочкой» она рассказывает об особенностях дореформенной орфографии и поиске по старинным записям, которые раньше могли читать только эксперты.
#поискпоархивам #технологии #нейросети #it #яндекс #генеалогия
тайм-коды:
00:00 - Что такое «Поиск по архивам»
00:46 - Огонь, вода, титло и другие сложности распознавания
01:39 - Как эксперты учили нейросеть читать
02:37 - Как модель находила слова в узорах
03:22 - Планы на будущее