mail@texterra.ru
Заказать звонок
Заказать услугу
Позвонить: 8 (800) 775-16-41
Связаться со мной

Нейросеть распознает почерк и переводит его в печатный текст

Созданная российскими учеными программа — единственная в своем роде.

Нейросеть распознает почерк и переводит его в печатный текст
Дата публикации: 3 августа 2022
Никита Шевцев
570
Время чтения: 7 минут
Нейросеть распознает почерк и переводит его в печатный текст Редакция «Текстерры»
Редакция «Текстерры»

Цифровизация сегодня — наше всё. Мы постепенно переходим на электронный документооборот, груды бумаги с написанными от руки буквами заменяются файлами со стройными рядами машинных символов. Но людям все еще приходится писать некоторые вещи от руки. Перевести такой текст в электронный формат без существенных ошибок не так-то просто. К счастью, в последнее время ученые разрабатывают все более совершенные нейросети, для которых оцифровать текст, даже написанный непонятным почерком, проще простого.

«Смотри, это – кот»: специалист TexTerra по нейросетям о том, как они работают на бизнес

«Смотри, это – кот»: специалист TexTerra по нейросетям о том, как они работают на бизнес

Распознающую русские рукописные буквы нейросеть создали ученые Сибирского федерального университета. По их словам, новая программа с глубоким обучением способна переводить почерк любого конкретного человека в печатный вид, обучаясь по небольшому набору ранее написанных букв.

С появлением печатных документов для них сразу же появилась технология по распознаванию текстовых символов с документа обратно в электронный вид. Также была задача по распознаванию рукописных цифр, которая была успешно решена исследователями.

И на основе этого возникла идея научить нейросеть распознавать рукописные русские буквы. Я думаю, что потребность в обратном преобразовании сначала букв, а потом и целого рукописного текста в электронный вид будет иметь потребность среди многих людей, так как рукопись из нашей жизни полностью не ушла.

Анастасия Сафонова, руководитель исследования, доцент кафедры систем искусственного интеллекта СФУ

И правда, сегодня в плане перевода написанного на бумаге текста в цифровой формат на рынке есть несколько решений, но ни одно из них не лишено недостатков – например, ABBY Finereader работает только с печатным текстом, а другие программы не поддерживают кириллицу или просто имеют очень низкую точность.

Продвигаем сайты. Обсудим?
Ошибка заполнения!
Ошибка заполнения!
Ошибка заполнения!
Нажимая кнопку “Зарегистрироваться”, вы даете согласие на обработку своих персональных данных.

Российская нейросеть, по словам ее создателей, отличается от аналогов тем, что работает на стороне пользователя, не передавая данные через интернет, имеет высокую точность распознавания и учитывает изменения в почерке.

Исследователи обучили программу, код которой состоит всего из 154 строк, на массиве из 13 299 изображений. На 85% картинок нейросеть училась распознавать почерк, а еще на 15% ученые проверяли работу программы.

Мы поинтересовались у авторов исследования прикладным значением созданной ими нейросети: сможет ли она распознать почерк врачей, ведь до сих пор многие специалисты пишут выписки от руки.

Тесты подобные на данный момент ещё не проводили. У врачей довольно специфический почерк, который может распознать только другой врач, для обычного человека это может быть довольно непростой задачей, как и для нейронной сети. Однако я думаю, что справиться с этой задачей она может, но не в полной мере.

Если же попробовать провести дополнительное обучение модели именно на почерке врачей, то есть вероятность, что нейронная сеть сможет распознавать такой почерк с большим успехом.

Анастасия Сафонова, руководитель исследования, доцент кафедры систем искусственного интеллекта СФУ

В любом случае, такая нейросеть будет очень полезна для всех русскоговорящих людей: она поможет переводить рукописный текст в печатный, редактировать и копировать его, отметая нужду в перепечатывании рукописей и экономя время и деньги. Авторы также отмечают, что программа будет улучшаться, становясь все более удобной для использования:

Планируется собрать дополнительные данные для обучения, а именно использовать почерк с различными стилями, возможно попробовать реализовать в текущей модели, либо обучить новую для распознавания почерка врачей. Возможно будут предприняты попытки по улучшению архитектуры существующей нейронной сети.

Анастасия Сафонова, руководитель исследования, доцент кафедры систем искусственного интеллекта СФУ

Оглавление
Сейчас читают

© «TexTerra», при полном или частичном копировании материала ссылка на первоисточник обязательна.
Нашли ошибку в тексте? Выделите нужный фрагмент и нажмите ctrl + enter.

Закажите бесплатную консультацию

Оставьте свои контакты,
мы свяжемся с вами в ближайшее время.

Ошибка заполнения!