Коллектив Stability AI, известный своей бесплатной нейросетью Stable Diffusion с открытым исходным кодом и языковой моделью StableLM, порадовал анонсом нейросети StableCode, которая обещает генерировать код и облегчить работу программистам.
Как работает StableCode
По сути, StableCode — та же языковая модель StableLM, но обученная на наборе данных, содержащем строки кода на различных языках программирования. Содержит она 3 миллиарда параметров — столько же, сколько и самая слабая версия StableLM.
Для сравнения, у ChatGPT 175 миллиардов параметров — то есть, примерно в 58 раз больше. Однако это не значит, что StableLM в 58 раз хуже, ведь, по словам Stability AI, их языковая модель «работает эффективнее других, поэтому большое число параметров ей не нужно». С другой стороны, такое относительно небольшое число параметров облегчает скачивание и использование модели обычными пользователями.
Но вернемся к StableCode. По данным Stability AI, языковая модель может хорошо генерировать код пока только на шести языках программирования и одном языке разметки:
- Python
- Java
- JavaScript
- Go
- C
- C++
- markdown
Интересная особенность нейросети в том, что она может работать даже с большими проектами, которые содержат несколько файлов. Stability AI выпустила StableCode в трех вариантах:
StableCode Completion 4K — нейросеть для завершения написания кода, поддерживает ввод до 4000 токенов (1 токен = 0,75 символа);
StableCode Instruct — нейросетевая модель для генерации кода по одним текстовым инструкциям;
StableCode Completion — модель для завершения написания кода, поддерживающая ввод до 16 000 токенов. Подойдет для длинных массивов кода.
Проверить нам удалось первые две модели — третья оказалась слишком мощной для запуска локально или бесплатно онлайн. Мы запустили обе модели на сервисе Hugging Face и… были очень разочарованы.
Вместо генерации кода с нуля или хотя бы дописывания отрывка программы нейросеть выдавала точно тот же код:
Благо хоть генерация длилась три секунды, но такое ощущение, что нейросеть просто не поняла запроса. К слову, в прошлый раз мы писали, что и StableLM на Hugging Face работала очень и очень плохо — выдавала набор не связанных слов. Такое ощущение, что сервис искусственно урезает мощности бесплатных серверов и заставляет программу останавливаться в самом начале генерации.
Но есть шанс, что программа заработает после запуска на локальном компьютере. Попробуйте и вы запустить StableCode и поделитесь результатами в комментариях.
Читайте также:
Запущен редактор кода на Python для новичков — просто и сердито
Еще одна нейросеть: пишет код и судебные иски (но это не точно!)