Нейросеть научили расшифровывать рукописные записи с дореволюционной орфографией
Следи за успехами России в Телеграм @sdelanounas_ruСтоличный Главархив совместно с «Яндекс» разработали платформу «Поиск по архивам». Нейросеть распознает рукописные тексты в документах
О скором создании этой платформы говорили еще в сентябре 2022 года. Сейчас сервис уже работает, опробовать можно здесь. Пока доступно 2,5 млн страниц метрических книг с текстовой расшифровкой из Главархива Москвы, а также архивов Оренбургской и Новгородской областей. В дальнейшем количество фондов и источников будет расти.
Сервис существенно экономит время в составлении генеалогического древа. Для сравнения: расшифровка страницы рукописного текста у профессионала займет до получаса, нейросеть же справится за несколько секунд. К тому же, на платформе «Поиск по архивам» есть фильтры по годам, архивам, фондам и описям. Неочевидный плюс технологии состоит еще и в минимизации выдачи оригиналов документов, тем самым спасая их от быстрого обветшания.
Нейросеть обучалась на сотнях тысяч рукописных строк из реальных текстов
Кстати, а вы знали, что на «Сделано у нас» статьи публикуют посетители, такие же как и вы? И никакой премодерации, согласований и разрешений! Любой может добавить новость. А лучшие попадут в телеграмм @sdelanounas_ru. Подробнее о том как работает наш сайт здесь👈