Система обнаружения заимствований «Антиплагиат» сообщила о новой функции сервиса — теперь он может определять, написала текст нейросеть или человек. Разобрались, как работает система, и как ее обойти.
Как «Антиплагиат» распознает нейросетевой текст
Похоже, активная разработка нового сервиса внутри системы «Антиплагиат» началась после появления новости о том, что студент Российского государственного гуманитарного университета (РГГУ) Александр Жадан написал при помощи ChatGPT диплом.
Для того, чтобы выявлять следы ChatGPT в дипломных работах, «Антиплагиат» разработал алгоритм «на основе многолетних исследований по обработке естественного языка», который позволяет успешно обнаруживать текст, сгенерированный нейросетью.
На посвященном этой новости вебинаре руководитель «Антиплагиата» Юрий Чехович рассказал, что компания работала над системами распознавания «машинного» текста довольно давно, эти наработки позволили быстро внедрить новую функцию по выявлению «следов деятельности нейросети».
Вот что говорит о новой функции «Антиплагиат»:
«Новый функционал включен в стандартную лицензию проверки текстов на обнаружение заимствований. Система проверки анализирует текст на наличие фрагментов, предположительно созданных при использовании моделей глубокого обучения GPT2, GPT-3, ChatGPT. Детектор машинно-сгенерированных текстов обучен и протестирован на большом наборе данных, что минимизирует риск ложного срабатывания».
Проблема только в том, что пользователи платной подписки на ChatGPT уже вовсю используют модель GPT-4, а ее возможности в разы выше, чем даже у более массовой GPT-3.5.
В любом случае, судя по показанным на вебинаре слайдам, новая функция системы «Антиплагиат» может обнаруживать фрагменты нейросетевого текста и выделять его как «подозрительный». По словам разработчиков программы, алгоритм «Антиплагиата», также использующий инструменты искусственного интеллекта, может находить в тексте следы, оставленные языковыми моделями GPT. Если такие следы найдены, алгоритм помечает текст как «подозрительный». Вероятнее всего, в будущем дипломные и другие работы с такими фрагментами проверку на плагиат проходить не будут.
Как обойти «Антиплагиат»
Но пока что функция довольно сырая: да, она может находить фрагменты текста, написанного целиком при помощи нейросети, однако в большинстве случаев такой текст автор все же редактирует потом вручную, и это позволяет скрыть следы участия нейросети. Кроме того, с ростом обучающей выборки нейросети будут генерировать тексты, все более похожие на творения человеческих рук. И, вероятнее всего, модель GPT-5 окажется на это способна. И тут «Антиплагиат» будет бессилен, ведь ужесточение методов обнаружения нейросетевого вмешательства приведет к тому, что помечаться «подозрительными» будут даже написанные вручную тексты.
Тот самый Александр Жадан, написавший диплом с помощью нейросети, нашел способ создать при помощи ChatGPT текст, который пройдет проверку на «Антиплагиате» — при помощи одного запроса уникальность работы выросла с 0,07% до 94,89%. По крайней мере, по словам Жадана. Вот этот запрос:
Переписать текст, поменять структуру и сделать его более читаемым. Он должен быть оригинальным, избегать повторов и проходить проверку Антиплагиата: [текст, который нужно переписать].
Вот еще несколько наблюдений от Жадана о том, что именно выдает ChatGPT в тексте:
- Наличие обобщающей части, после которой идет двоеточие, а затем уточнение;
- Повторение фраз в тексте из абзаца в абзац;
- Большое количество идущих подряд существительных, как в старых учебниках.
Чтобы не переживать за уникальность своих текстов, вы можете заказать тексты для сайта у TexTerra — мы позаботимся о качестве.
Читайте также:
Вы сами напросились! – нейросеть написала книгу с угрозами людям
70 бесплатных нейросетей на все случаи жизни – выбор TexTerra