Созданная российскими учеными программа — единственная в своем роде.

Цифровизация сегодня — наше всё. Мы постепенно переходим на электронный документооборот, груды бумаги с написанными от руки буквами заменяются файлами со стройными рядами машинных символов. Но людям все еще приходится писать некоторые вещи от руки. Перевести такой текст в электронный формат без существенных ошибок не так-то просто. К счастью, в последнее время ученые разрабатывают все более совершенные нейросети, для которых оцифровать текст, даже написанный непонятным почерком, проще простого.

Распознающую русские рукописные буквы нейросеть создали ученые Сибирского федерального университета. По их словам, новая программа с глубоким обучением способна переводить почерк любого конкретного человека в печатный вид, обучаясь по небольшому набору ранее написанных букв.

С появлением печатных документов для них сразу же появилась технология по распознаванию текстовых символов с документа обратно в электронный вид. Также была задача по распознаванию рукописных цифр, которая была успешно решена исследователями.

И на основе этого возникла идея научить нейросеть распознавать рукописные русские буквы. Я думаю, что потребность в обратном преобразовании сначала букв, а потом и целого рукописного текста в электронный вид будет иметь потребность среди многих людей, так как рукопись из нашей жизни полностью не ушла.

Анастасия Сафонова, руководитель исследования, доцент кафедры систем искусственного интеллекта СФУ

И правда, сегодня в плане перевода написанного на бумаге текста в цифровой формат на рынке есть несколько решений, но ни одно из них не лишено недостатков – например, ABBY Finereader работает только с печатным текстом, а другие программы не поддерживают кириллицу или просто имеют очень низкую точность.

Российская нейросеть, по словам ее создателей, отличается от аналогов тем, что работает на стороне пользователя, не передавая данные через интернет, имеет высокую точность распознавания и учитывает изменения в почерке.

Исследователи обучили программу, код которой состоит всего из 154 строк, на массиве из 13 299 изображений. На 85% картинок нейросеть училась распознавать почерк, а еще на 15% ученые проверяли работу программы.

Мы поинтересовались у авторов исследования прикладным значением созданной ими нейросети: сможет ли она распознать почерк врачей, ведь до сих пор многие специалисты пишут выписки от руки.

Тесты подобные на данный момент ещё не проводили. У врачей довольно специфический почерк, который может распознать только другой врач, для обычного человека это может быть довольно непростой задачей, как и для нейронной сети. Однако я думаю, что справиться с этой задачей она может, но не в полной мере.

Если же попробовать провести дополнительное обучение модели именно на почерке врачей, то есть вероятность, что нейронная сеть сможет распознавать такой почерк с большим успехом.

Анастасия Сафонова, руководитель исследования, доцент кафедры систем искусственного интеллекта СФУ

В любом случае, такая нейросеть будет очень полезна для всех русскоговорящих людей: она поможет переводить рукописный текст в печатный, редактировать и копировать его, отметая нужду в перепечатывании рукописей и экономя время и деньги. Авторы также отмечают, что программа будет улучшаться, становясь все более удобной для использования:

Планируется собрать дополнительные данные для обучения, а именно использовать почерк с различными стилями, возможно попробовать реализовать в текущей модели, либо обучить новую для распознавания почерка врачей. Возможно будут предприняты попытки по улучшению архитектуры существующей нейронной сети.

Анастасия Сафонова, руководитель исследования, доцент кафедры систем искусственного интеллекта СФУ

#
Новости Нейросети
© «TexTerra», при полном или частичном копировании материала ссылка на первоисточник обязательна.