Как нейросеть научили читать тексты XVII века

  Рет қаралды 367,053

Яндекс

Яндекс

Күн бұрын

Рукописи, может быть, и не горят, но точно ветшают и портятся. Понять, что написано в двухсотлетних документах, бывает непросто - и из-за их состояния, и из-за особенностей языка. Но на помощь приходят нейросети.
В прошлом году Яндекс запустил «Поиск по архивам». Это сервис, который помогает людям искать упоминания своих предков в архивных документах так же, как в интернете. Для этого команда обучила модель читать старинные тексты, и она уже распознала миллионы страниц.
👀 Попробуйте найти в архивах корни своей семьи: yandex.ru/archive
Это рубрика «Вопрос со звёздочкой», в которой разработчики Яндекса простым языком объясняют сложные технологии. Татьяна Сапатова занимается распознаванием текста в Яндексе и, в частности, в «Поиске по архивам». В «Вопросе со звёздочкой» она рассказывает об особенностях дореформенной орфографии и поиске по старинным записям, которые раньше могли читать только эксперты.
#поискпоархивам #технологии #нейросети #it #яндекс #генеалогия
тайм-коды:
00:00 - Что такое «Поиск по архивам»
00:46 - Огонь, вода, титло и другие сложности распознавания
01:39 - Как эксперты учили нейросеть читать
02:37 - Как модель находила слова в узорах
03:22 - Планы на будущее

Пікірлер: 52
@val4521
@val4521 24 күн бұрын
Да я и свой подчерк не всегда потом распознать могу, что уж говорить про чужие
@gametraveleryt
@gametraveleryt 24 күн бұрын
Жиза
@rwr518
@rwr518 19 күн бұрын
Почерк
@shabbytie21925
@shabbytie21925 24 күн бұрын
Ждём пока нейронка научится распознавать рецепты врачей
@TheBirdOfDesire
@TheBirdOfDesire 18 күн бұрын
И речь машинистов электричек
@abstinentelven
@abstinentelven 24 күн бұрын
А как же тëтенька в архиве, у которой каждый прогон сканера стоит от 100 рублей?
@katerinavikhoreva
@katerinavikhoreva 13 сағат бұрын
Пользовалась сервисом) Очень увлек🤗 Смогла найти не все данные, конечно, но понимаю, что оцифровка еще продолжается. Спасибо вам огромное за то, что делаете такие крутые вещи и за то, что они бесплатные!🥰
@MishaGoncharov
@MishaGoncharov 24 күн бұрын
Вот только свой документ не закинуть в этот сервис... Вот у меня есть свидетельство о браке 1920го года, кого-то из родственников. Но я не могу прочитать.. В поиске его не находится. Приходится искать другие сервисы по распознаванию, но качество у них по-моему похуже.
@user-zo4hw6wt4z
@user-zo4hw6wt4z 24 күн бұрын
Спасибо за сервис ❤
@yandex
@yandex 24 күн бұрын
❤️🙌
@AleksanderChuikov
@AleksanderChuikov 24 күн бұрын
У вас список архивов расположен в неудобном порядке. Лучше на первое место поставить название региона, а потом всё остальное
@alex_prav
@alex_prav 24 күн бұрын
Саша, попробуй найти в сервисе "оставить отзыв" или что то на подобии такого
@AleksanderChuikov
@AleksanderChuikov 24 күн бұрын
@@alex_prav ок
@yguzik
@yguzik 24 күн бұрын
В первую очередь интерес вызывают описи документов которые ждут оцифровки. Ведь не в одном архиве оцифровку вели).
@her0189
@her0189 16 күн бұрын
Отправьте пожалуйста мой заказ, месяц уже лежит
@realamour2856
@realamour2856 24 күн бұрын
Учат нейросети всякой сложной херне, сперва научите ваши нейросервисы не ломаться, как ни зайдешь в браузер, переводчик не работает, помощник не работает, завтра снова работает что то одно из двух, послезавтра работает все, еще через день нихера не работает, переустановил браузер, та же херня. Начал гуглить и узнал, что у кучи людей та же беда.
@vlabangog
@vlabangog 22 күн бұрын
Незнай, пользуюсь сервисами Яндекса уже около 3-ёх лет, за всё это время Яндекс Музыка только отваливалась пару раз
@user-qt7nu6gc2s
@user-qt7nu6gc2s 16 күн бұрын
Здравствуйте почему когда нажимаешь скачать картинку то не скачивается а открывается всё фото
@yandex
@yandex 15 күн бұрын
Здравствуйте! Пожалуйста, расскажите подробнее о ситуации. Правильно понимаем, что вы говорите о скачивании изображения в десктопной версии Яндекс Браузера?
@user-qt7nu6gc2s
@user-qt7nu6gc2s 15 күн бұрын
Я говорю про то что когда вводишь запрос и открываешь раздел картинки выбираешь то что нужно и нажимаешь скачать то ничего не скачивается а просто открывается фото на полный экран
@yandex
@yandex 15 күн бұрын
Спасибо за уточнение! Ваш вопрос не теряем, скоро вернёмся.
@user-qt7nu6gc2s
@user-qt7nu6gc2s 15 күн бұрын
Спасибо
@yandex
@yandex 15 күн бұрын
Мы убрали возможность скачать изображение из Картинок, чтобы не нарушать авторское право на интеллектуальную собственность. Скачать картинку можно на сайте-источнике: под картинкой выберите «Скачать» → она откроется на сайте → нажмите на неё и удерживайте → Скачать или Сохранить изображение.
@TheBirdOfDesire
@TheBirdOfDesire 18 күн бұрын
Насколько же вы крутые! 😍
@yandex
@yandex 18 күн бұрын
Спасибо за поддержку, приятно читать такое ❤️
@WithoutNumbers
@WithoutNumbers 18 күн бұрын
​@@yandex Было бы также приятно прочитать ответ на удаленные комментарии по теме нахождения Яндекса в Диспетчере задач даже после отключения пункта «Разрешить работу в фоне» на странице настроек: значок меню (≡) → Настройки → Системные → Автозапуск и фоновый режим после закрытия браузера. В итоге кстати удалось избавиться от автоматического запуска Алисы при старте системы, несанкционированного и неуправляемого поведения Яндекса в ОС, сейчас нагрузки на систему нет, хотя сам браузер не удален, лишь два файла - "service_update.exe". Все это напоминает вирус, майнер или хакеров, особенно после удаления переписки, словно мошенничество, реально скам какой-то. Такое ощущение и осадок остается после всего увиденного.
@yandex
@yandex 18 күн бұрын
Ваш комментарий видим! Совсем скоро ответим.
@yandex
@yandex 18 күн бұрын
Голосовой помощник Алиса интегрирован в Яндекс Браузер и упоминается в названии программы, но это не означает, что он включён. Все процессы браузера называются Yandex with voice assistant Alice или «Яндекс с голосовым помощником Алиса». Работающие в фоновом режиме процессы помогают Яндекс Браузеру открываться быстрее. Попробуйте, пожалуйста, отключить опцию в настройках: меню ≡ → Настройки → Системные → Производительность → Ускорить запуск браузера.
@WithoutNumbers
@WithoutNumbers 18 күн бұрын
@@yandex Спасибо за предложение с пояснения и простите за беспокойство. Что касается самого вопроса, на данный момент смог добиться исчезновения элементов Яндекс из Диспетчера задач после закрытия браузера удалив файл "service_update.exe" в двух папках. Необходимость ручного обновления никак не мешает в сравнении с неконтролируемым поведением фоновых процессов и так или иначе это единственно что сейчас сработало, а в будущем, если и это поломается, что ж, значит опять буду читать субтитры из обучающих видео на иностранных языках. Возможно людям на топовых ПК эти процессы на фоне не заметны и это не является для них проблемой, но не у всех под рукой топ железо, чтоб обеспечивать различному софту постоянное потребление ресурсов системы или связь с интернетом, хотя конечно ваши безопасники могут поспорить, я не технарь в IT по образованию. Пункт "Производительность" и опции "Обновлять Браузер, даже если он не запущен" и "Ускорять запуск Браузера" уже нашел самостоятельно по видео, которые записывают люди последние 4 года пытаясь как-то решить этот вопрос с фоновыми процессами. Так что думаю можно закругляться, благодарю за потраченное время и поддержку. Теперь и я могу сказать, что вы крутые, раз уделяете столько внимание своим пользователям!
@MrGidella
@MrGidella 23 күн бұрын
Когда вы договорились с РГАДА, где и хранятся все эти тексты, без этого толку от ваших технологий, основной корпус данных там.
@playinlifecom
@playinlifecom 23 күн бұрын
после просмотра этого видео врачи совсем расслабятся
@nemodendi
@nemodendi 24 күн бұрын
Очень симпатичная девушка всё коротко и понятно объяснила, спасибо за видео и за сервис.
@yandex
@yandex 18 күн бұрын
@arch6544
@arch6544 22 күн бұрын
не знал, что в Яндексе работает бывшая жена Эдварда Билла
@gametraveleryt
@gametraveleryt 24 күн бұрын
Ура видео
@yandex
@yandex 24 күн бұрын
@WithoutNumbers
@WithoutNumbers 19 күн бұрын
@@yandex Смотрите, есть видео - "19 яндекс браузеров в Диспетчере задач" и там ваша компания 4 года назад с этого аккаунта оставила ответ, цитата: "@yandex 4 года назад Здравствуйте! Несколько процессов браузера, которые вы видите в диспетчере задач компьютера, возникают из-за включенных у вас расширений и открытых вкладок. Все браузеры на основе Chromium (в том числе Google Chrome и Opera) работают подобным образом и создают отдельный процесс для каждого приложения или вкладки браузера. Количество потребляемой оперативной памяти зависит от того, какие вкладки открыты у вас в данный момент и какие расширения используются." Вопрос в следующем - Как сделать так, чтобы после закрытия вашего браузера, все эти вкладки, несколько десятков, исчезли из Диспетчера задач и браузер после закрытия не потреблял ресурсы системы? Для тех, кто не в курсе - Приходится убирать процессы Яндекса вручную, выбирать по одному элементу из списка и нажимать на кнопку "Снять задачу", это ужасно неудобно, долго и муторно, ведь не всегда с первого раза получается завершить процесс. Почему ваш браузер сам целиком и полностью до сих пор не закрывается окончательно, как это происходит в других браузерах? Это так сложно реализовать? Единственна причина, почему многие все еще держат ваш Яндекс браузер в системе и закрывают все вручную таким неудобным образом - это возможность аудио перевода некоторых видео на Ютубе. Поэтому, когда у самого Ютуба, Гугл или других компаний будет такой ИИ, то Яндекс будет удален окончательно, чтобы не нагружать систему скрытыми и неконтролируемыми процессами в системе, которые используют ресурсы памяти, дисков SSD, процессоры и тд. У SSD и NVMe такое вообще неприемлемо, когда что-то постоянно записывается, считывается, висит и тормозит. 2024 год и эта мелочь все ще не исправлена, просто жесть, учитывая какими возможностями обладает ваша компания и тот факт, что у других браузеров этой проблемы нет.
@yandex
@yandex 18 күн бұрын
Здравствуйте! Попробуйте, пожалуйста, отключить пункт «Разрешить работу в фоне» на странице настроек: значок меню (≡) → Настройки → Системные → Автозапуск и фоновый режим. Функция обеспечивает работу браузера в фоновом режиме и активность некоторых фоновых расширений после закрытия браузера.
@gametraveleryt
@gametraveleryt 18 күн бұрын
@@yandex хорошо :)
@gametraveleryt
@gametraveleryt 18 күн бұрын
@@yandex а в каком приложении?
@user-yx6fd5ht3h
@user-yx6fd5ht3h 22 күн бұрын
у яндекс есть 1 - то что их нету
@fleeshka4896
@fleeshka4896 24 күн бұрын
Как круто!
@user-gz7qc4hf5h
@user-gz7qc4hf5h 24 күн бұрын
Яндекс пробил очередное дно
@user-wu5tt3fy5w
@user-wu5tt3fy5w 23 күн бұрын
В Яндексе жирных много
@user-eq2eq3wz4m
@user-eq2eq3wz4m 22 күн бұрын
Никакой у вас культуры нет
@vlabangog
@vlabangog 22 күн бұрын
Ты походу не отличаешь жирных от пышных. Именно эта девушка пышная, красивая, приятная на голос, вызывает симпатию и не побоюсь этой фразы "есть за что ухватиться". К жирным её ни как не отнесёшь.
@WithoutNumbers
@WithoutNumbers 19 күн бұрын
А в интернете тупых
АМЕРИКАНЕЦ впервые сдаёт ЕГЭ по-Английскому
39:21
Энтони Американец
Рет қаралды 1,3 МЛН
ИРИНА КАЙРАТОВНА - АЙДАХАР (БЕКА) [MV]
02:51
ГОСТ ENTERTAINMENT
Рет қаралды 1,2 МЛН
Which one of them is cooler?😎 @potapova_blog
00:45
Filaretiki
Рет қаралды 3,6 МЛН
Её Старший Брат Настоящий Джентельмен ❤️
00:18
Глеб Рандалайнен
Рет қаралды 7 МЛН
Как обойти АНТИПЛАГИАТ в 2024 году.
9:20
Малинович Евгения
Рет қаралды 62 М.
стажировка в яндексе [говорим]
20:36
marieaesth
Рет қаралды 2,3 М.
Мозг ничего не забывает Татьяна Черниговская
34:44
БЕСПЛАТНАЯ ПСИХОЛОГИЯ
Рет қаралды 1,4 МЛН
КРУПНЕЙШИЙ Мошенник в Истории Телевидения
12:42
Ваня Продюсер
Рет қаралды 1,4 МЛН
Glitter Bomb 2.0 vs Porch Pirates
16:03
Mark Rober
Рет қаралды 74 МЛН
КАК УСТРОЕН PNG-ФАЙЛ?
36:46
Alek OS
Рет қаралды 294 М.
World's Most Dangerous Trap!
19:48
MrBeast
Рет қаралды 233 МЛН
Samsung S24 Ultra professional shooting kit #shorts
0:12
Photographer Army
Рет қаралды 15 МЛН
Will the battery emit smoke if it rotates rapidly?
0:11
Meaningful Cartoons 183
Рет қаралды 12 МЛН
ПОКУПКА ТЕЛЕФОНА С АВИТО?🤭
1:00
Корнеич
Рет қаралды 1,5 МЛН