Что такое ИИ или AI
ИИ – это аббревиатура от словосочетания «искусственный интеллект» (AI – англ. artificial intelligence) и представляет собой область компьютерных знаний. Их цель – разработка компьютерных систем, наделенных способностью мыслить подобно человеку.
Однако этот термин очень часто стали использовать и маркетологи, что существенно затрудняет его понимание. В современной медиасфере постоянно звучат заявления от больших компаний («Сбер», «Яндекс», «МТС», и т.д.), что они постоянно инвестируют в разработки ИИ и его использование в своих продуктах. В большинстве случаев такие заявления создают не совсем правильное представление об ИИ.
Ниже мы собрали ключевые термины, которые часто используются в сфере искусственного интеллекта.
- Машинное обучение (machine learning) – это одна из ключевых составляющих в область ИИ (более подробно, этот термин мы раскроем дальше), с помощью которой система способна «предсказывать» дальнейшие события.
- Сверхинтеллект (Superintelligence) – это система искусственного интеллекта, которая находиться на уровне интеллекта человека или выше. Пока такая технология еще не реализована, но многие передовые компании ведут разработки в этой области, стремясь первыми достичь этой цели. Такая перспектива пугает многих людей, но прогресс неумолим.
- Генеративный ИИ (generative AI) – система AI, которая способна генерировать контент различного содержания: тексты, программный код, изображения, видео и т.д. по промптам (словам-указаниям).
- Промпт (prompt) – это набор терминов, фраз, предложений, которые используются для генерации контента.
- «Галлюцинации ИИ» (AI hallucinations) – в зависимости от качества данных, которые используются для обучения генеративных моделей AI, результат их генерации может быть фактически ошибочным, либо совсем выбиваться из нормального человеческого представления.
Что такое модель ИИ
Модели ИИ тесно связаны с машинным обучением и представляют собой программы для обучения на наборе данных для распознавания определенных типов шаблонов. В общем понимании – это правила, числа и любые другие структуры данных, необходимые для решения задач и прогнозирования. Модели подразделяются на:
Базовые модели – это вид генеративных моделей, которые используют для обучения огромную базу данных, что дает им возможность выполнять широкий спектр задач. Примеры таких моделей: GPT, Gemini, Llama, Claude.
Мультимодальные модели – это вид генеративных моделей, которые способны обрабатывать несколько типов данных: текст, изображение и видео.
Большие языковые модели (LLM) – способны обрабатывать и генерировать тексты. Они могут отвечать на вопросы, кратко пересказать содержание, переводить и генерировать тексты.
Диффузионные модели – больше всего подходят для генерации изображений, а также видео и аудио контента по текстовым запросам. Диффузионная модель состоит из трех основных компонентов: прямого процесса, обратного процесса и процедуры выборки. Цель таких моделей – изучить процесс диффузии для данного набора данных таким образом, чтобы этот процесс мог генерировать новые элементы, которые распределяются аналогично исходному набору данных.
Как проходит обучение моделей
Обучение моделей (или машинное обучение) – это процесс, в результате которого модели выявляют закономерности в наборах данных, для дальнейшего их использования. Например, большие языковые модели используют для своего обучения огромные объемы текстовой информации: книги, издания, публикации, статьи и т.д. Когда вы задаете вопрос такой модели, она сопоставляет ключевые закономерности вопроса с закономерностями в своей базе (их называют токенами) и генерирует наиболее вероятный ответ, который привычен человеку и отражает суть вопроса.
Процесс обучения требует больших вычислительных мощностей. В настоящее время такими мощностями обладают графические процессоры. Как оказалось, современные графические процессоры можно использовать не только для требовательных к графике игр – они отлично справляются с вычислениями, связанными с обучением моделей. В память графических процессоров можно загружать различные данные, в том числе текст, видео, музыку и изображение. Эти данные называются обучающими данными.
Самый известный на сегодняшний день из графический процессов для обучения искусственного интеллекта – это чип от Nvidia H100. Компание Nvidia занимает одно из лидирующих мест в области разработки AI, а также выпуске специализированных чипов для задач в этой области.
Однако Nvidia не единственная компания, которая выпускает свои чипы для ИИ. Такие чипы называются NPU (Neural Processing Unit) – процессоры, используемые для ускорения операций нейронной сети и задач искусственного интеллекта. Важным показателем таких чипов является TOPS (тераопераций в секунду) – позволяет быстро оценить скорость NPU и сравнить её с конкурентами.
Важным составляющим обучения модели являются параметры – это набор оценочных критериев модели (весов), с помощью которых она учиться правильно генерировать ответы. Параметры многократно подбираются в процессе обучения специальными математическими методами, пока ответы модели не станут максимально близкими к правильным. Чем больше параметров учитывается моделью, тем точнее она справляется со своей задачей. Более глубоко погрузиться в тонкости машинного обучения поможет эта статья.
Что такое нейросеть
Нейронная сеть (или нейросеть) – это вид организации модели искусственного интеллекта, при которой данные обрабатываются с помощью последовательно расположенных узлов. Каждый узел в такой последовательности – это довольно простой процесс, который принимает сигнал, обрабатывает его и отдает дальше по цепочки, формируя, таким образом сеть. Объединяя огромное количество таких процессов в искусственную нейронную сеть, можно добиться от модели выявления сложных закономерностей без явного программирования.
При изучении темы нейросетей можно встретить ещё ряд интересных терминов:
- Обработка естественного языка (NLP) – способность модели искусственного интеллекта понимать человеческий язык благодаря обучению. Например, с YandexGPT можно вести диалог на обычном человеческом языке, а специально обученные модели могут легко переводить аудио информацию в текстовую.
- Токены – это фрагменты текста, часто используемые при анализе текста языковыми моделями. Модели разбивают текст на токены, для определения связи токенов друг с другом и генерации, на основе этой информации, ответов.
- Трансформер – тип архитектуры нейронной сети, при которой создается цифровое представление каждого элемента последовательности. Оформленные таким образом данные можно передавать другим нейросетям для дальнейшей обработки. Такая последовательность нейросетей помогает лучше выявить паттерны и взаимосвязи входных данных.
- RAG (Retrieval Augmented Generation) – это генерация с дополненным поиском. Языковая модель сама добавляет в контекст запроса дополнительную информацию из других источников, на основе которой она может дать пользователю более полный и точный ответ.
Самые известные нейросети
Нейронные сети очень быстро завоевывают рынок сервисов и устройств. Многие компании внедряют эту технологию, которые могут упростить нам жизнь или просто стать игрушкой. У всех на слуху умные колонки «Яндекс», «Сбер», «МТС», «VK». Помимо устройств появилось еще и множество приложений, которые можно использовать в своей жизни и работе:
- ChatGPT – нейросеть от компании OpenA. Этот чат-бот с искусственным интеллектом, выпущенный в 2022 году, может поддерживать диалог с человеком и генерировать тексты из различных областей, в том числе программный код.
- Copilot – генеративный AI от компании Microsoft. Встроен в продукты от Microsoft как сервис в виде чат-интерфейса, позволяющий искать информацию, генерировать тексты и создавать изображения по текстовым запросам. Copilot также может генерировать код на распространенных языках программирования.
- Gemini AI – это модель ИИ от Google, созданная специалистами из объединенных команд искусственного интеллекта DeepMind и Google Brain. Эта технология позиционируется как конкурент продуктам компании OpenAI. Одной из особенностей Gemini является возможность обработки различные типы данных.
- Apple Intelligence – еще одна платформа искусственного интеллекта от Apple. Функционал данного продукта основан на ИИ от OpenAI. Для обладателей техники от Apple этот функционал совершенно бесплатен.
- Claude – модель AI от американского стартапа Anthropic. Компания очень старается превзойти ИИ от OpenAI, при этом в данный стартап финансируют средства такие компании как Amazon и Google.
- Grok – генеративный AI чат-бот от компании xAI, созданный по инициативе Илона Маска. Эта нейросеть позиционируется как свободная от цензуры и восприимчивая к юмору.
- Perplexity AI – нейросеть от одноименной компании, позиционируется как умная поисковая система, способная генерировать ответы на вопросы, предлагать варианты контента, пересказывать краткое содержание текста.
- YandexGPT – российская нейросеть от «Яндекс», может отвечать на вопросы, генерировать краткое содержание страниц сайтов, либо перевести их на другие языки.
- GigaChat – нейросеть от разработчиков «Сбера», генерирует текстовой контент и изображения. GigaChat умеет поддерживать диалог, рисовать картинки, писать программный код, сочинять стихи, поздравления, сказки и озвучивать их.
- Kandinsky – помогает генерировать картинки, анимации и видео.
- «Шедеврум» – генерирует изображения очень приличного качества. Полученными изображениями можно поделиться с друзьями через публикацию.
Это не весь перечень приложений ИИ, которые доступны на сегодняшний день для использования. С более расширенным списком, в том числе и отечественных, приложений AI и подробным их описанием можно ознакомиться в этой статье.
Читайте также:
73 бесплатные нейросети на все случаи жизни – выбор TexTerra