8(800) 222 32 56
Панель управления
AI

Российские нейросети и ИИ-платформы: обзор Yandex GPT, GigaChat и других проектов

Российские нейросети и ИИ-платформы: обзор Yandex GPT, GigaChat и других проектов
Подберите идеальное решение для ваших задач:
в России, США и Нидерландах обеспечат максимальную скорость. Воспользуйтесь всеми преимуществами надежного оборудования. Базовая помощь и техническое обслуживание входят в пакет услуг.

Введение

Представьте, что ваш голосовой помощник не просто ищет в интернете, а шутит, пишет код и даже генерирует картинки. В России набирают обороты собственные нейросети – от проектов Яндекса и Сбера до разработок стартапов. Эти системы стремятся говорить с нами на одном языке (в прямом и переносном смысле) и составить конкуренцию западным AI-гигантам. Давайте погрузимся в мир российских ИИ-платформ: посмотрим, что они умеют, насколько зрелые, как их попробовать в деле и чем они берут верх (или уступают) именитым аналогам вроде ChatGPT.

Яндекс GPT – нейросеть в каждой «Алисе»

YandexGPT – это мозг обновлённой Алисы. Компания «Яндекс» интегрировала свою новейшую языковую модель прямо в голосовой помощник, которого многие знают по умным колонкам и приложениям. Что это даёт на практике? Например, Алиса с YandexGPT способна не просто поставить будильник или рассказать погоду – она генерирует связные тексты, придумывает шутки, помогает писать письма и даже объясняет код. Если раньше голосовой помощник был больше про поиск справок, то теперь он напоминает личного ассистента, способного продолжить вашу недописанную историю или починить баг в программном коде.

Новая модель YandexGPT 5 настолько продвинута, что в компании заявили о её сопоставимости с GPT-4. Конечно, такие заявления стоит проверять на личном опыте, но первые отзывы пользователей заметили качественный скачок: ответы стали более развёрнутыми и «умными». Алиса начала лучше понимать контекст разговора, может пошутить к месту и в целом отвечает по-человечески. А ещё она научилась форматировать ответы – скажем, сделать список или подчеркнуть главное по просьбе пользователя. Для технических энтузиастов особенно приятно, что Алиса теперь пишет код: от простых функций на Python до HTML-разметки сайта – в разумных пределах, конечно. Как говорится, у Алисы появился интеллект – и с ней стало интереснее беседовать.

Где доступен YandexGPT? Проще всего – в самом чате Алисы (в мобильном приложении «Яндекс», на сайте или в умных колонках). Базово доступно несколько запросов в день бесплатно, а подписчикам премиум-опции «Алиса Про» вообще не ограничивают общение. Для разработчиков и компаний модель открыта через Yandex Cloud: можно интегрировать ИИ в свои сервисы через API. Интересный момент: Яндекс выложил в открытый доступ свою предыдущую большую модель YaLM 100B – целых 100 миллиардов параметров, которую могут бесплатно использовать исследователи. Конечно, запустить такую махину под силу только на очень мощном сервере, зато факт остаётся фактом – отечественная модель находится в открытом доступе. Это подчёркивает тренд на открытость и сотрудничество в AI-сообществе России.

Генерация текста

Генерация текста

Понимание контекста

Понимание контекста

Форматирование ответов

Форматирование ответов

Генерация кода

Генерация кода

Интеграция через API

Интеграция через API

GigaChat 2.0 – ответ Сбера на ChatGPT

Если у Яндекса флагманом ИИ стала Алиса, то у Сбера – это GigaChat. Название говорит само за себя: амбиция создать «гига-чатбот», способный на многое. Первая версия GigaChat появилась как реакция на шум вокруг ChatGPT, а к 2024 году Сбер представил GigaChat 2.0 – существенно улучшенную линейку нейросетевых моделей. Здесь даже есть семейство версий под разный вкус: Lite, Pro и Max. Максимальная версия – самая мощная и «умная», Lite – полегче для простых задач, ну а Pro занимает золотую середину (высокие способности при умеренных требованиях к ресурсам).

Что умеет GigaChat 2.0? Проще перечислить, чего он не умеет. 🙂 Во-первых, естественно, генерация текстов на русском языке на высоком уровне: от сочинения рассказов до помощи с деловыми письмами. Во-вторых, GigaChat понимает программистов – может подсказать код, найти ошибку или предложить алгоритм. Многие уже проверяли: если попросить его написать функцию на Python или SQL-запрос, результат бывает весьма пригодным (хотя, конечно, сложные проекты он за вас не создаст – это всё же инструмент, а не замена разработчика). В-третьих, новая версия обзавелась способностью работать с изображениями и аудио: она распознаёт объекты и текст на картинках, умеет прочитать голосовое сообщение и ответить на него. Например, вы можете отправить фото схемы – GigaChat опишет, что на ней, или даже прочтёт текст с изображения. Это серьёзный шаг к мультимодальности, которой славятся зарубежные передовые модели.

Ещё одно сильное место GigaChat 2.0 – большой объём контекста. Разработчики увеличили «память» модели: она способна учесть содержание до 200 страниц текста в одном запросе! Представьте, вы можете скормить ей огромный документ, и нейросеть выдаст вам краткое резюме или ответы по его содержанию. Такая длинная память обгоняет возможности многих конкурентов. Также в Сбере отмечают, что GigaChat стал лучше следовать инструкциям: вероятность, что он точно выполнит вашу просьбу (не забудет уточнение или формат), заметно выросла. Добавили и поддержку так называемых AI-агентов – это когда модель может сама разбивать сложную задачу на этапы и решать пошагово. По сути, GigaChat 2.0 учится планировать решение задач, а не просто генерировать отклик сразу целиком. Это приближает его к более умным ассистентам, которые могут действовать автономно в заданных рамках.

Как опробовать GigaChat? Сбер сделал его максимально доступным. Можно зайти на официальный сайт GigaChat и общаться бесплатно (понадобится Сбер ID для входа). Мессенджеры тоже поддерживают нейросеть: есть телеграм-бот GigaChat, а в новом мессенджере VK Мессенджер (приложение «Марусья») помощник GigaChat встроен прямо из коробки. Даже умные колонки от Сбера (семейство устройств со «Салютом») получили обновление – теперь они понимают запросы сложнее, потому что за них думает GigaChat 2.0. Бизнес-клиентам предлагаются API через SberCloud, причём при желании компанию могут развернуть модель локально на своих серверах (on-premise), если есть необходимость в полном контроле над данными. Код самой модели GigaChat 2.0 не выложен в общий доступ, но предшественники у Сбера есть и в опенсорсе: несколько русских моделей семейства ruGPT-3 и FRED можно найти на GitHub и Hugging Face для самостоятельных экспериментов.

Text AI

Генерация текста

Code Helper

Подсказка и генерация кода

Image Recognition

Распознавание изображений

Voice AI

Анализ аудио и голосовых

Long Context

Обработка до 200 стр. текста

AI Agents

Пошаговое выполнение задач

API Access

API и локальное развёртывание

Наследие ruGPT-3 и семья FRED T5

Интересно, что GigaChat – это вершина айсберга. Ещё в 2020–21 годах команда Sber AI (Сбербанк) прогремела, создав модель ruGPT-3 с рекордным количеством параметров. В ней было порядка 180–200 миллиардов параметров (то есть сравнимо с оригинальным GPT-3 от OpenAI). Для её обучения использовали суперкомпьютер «Кристофари» и огромный корпус русскоязычного текста. ruGPT-3 умела продолжать текст по заданному началу, генерировать новости, рассказы – по сути, была гигантским русскоязычным «автором». Однако напрямую с ней обычный пользователь дел не имел: это была больше исследовательская модель, доказательство, что и в России можем сотворить своего гиганта AI. Зато на её базе Сбер потом сделал более приземлённые вещи: например, обучил модель писать программный код и запустил первых чатботов.

Параллельно Sber AI развивал линейку FRED T5 – это уже другие архитектуры, основанные на Google T5. Модель FRED T5–13B (13 миллиардов параметров) стала своего рода швейцарским ножом: её обучили решать разные задачи обработки текста (перевод, суммирование, ответы на вопросы). В отличие от громадных GPT, модель поменьше может применяться там, где нужны быстрые ответы и меньше вычислительных ресурсов. FRED T5 хорошо подходит для тонкой настройки под конкретные задачи: например, можно дообучить её исправлять опечатки в тексте или анализировать тональность отзывов. Sber выложил версии FRED T5 в открытый доступ для исследовательского сообщества, и сейчас энтузиасты используют их в своих проектах. То есть экосистема Sber AI – это не только GigaChat для конечных пользователей, но и богатый набор открытых моделей, которые становятся кирпичиками для новых приложений. Добавим сюда и генераторы изображений (известная модель Kandinsky 2.2 от Сбера способна по тексту нарисовать картинку не хуже, чем зарубежный DALL-E) – получаем полный комплект: текст, код, изображение, аудио. Кажется, Сбер старается охватить все направления ИИ сразу.

Не только гиганты: другие российские AI-проекты

Яндекс и Сбербанк, безусловно, лидеры в гонке ИИ, но далеко не единственные игроки. В российских научных институтах и стартапах тоже кипит работа над нейросетями.

Научные институты. Например, в МФТИ (Физтех) несколько лет развивается лаборатория DeepPavlov. Она известна своей открытой библиотекой для NLP (обработки естественного языка) и платформой DeepPavlov Dream – это конструктор для диалоговых ассистентов. Ещё студенты Физтеха делали ботов для конкурса Amazon Alexa Prize и выходили в финал – то есть опыт создания разговорных ИИ мирового уровня у наших университетов есть. DeepPavlov выпустил ряд моделей поменьше (типа русских GPT-2 и прочих), которые можно использовать для чатботов или анализаторов текста. Конечно, по масштабам они уступают YandexGPT или GigaChat, но научная ценность колоссальная: на их основе оттачиваются алгоритмы понимания диалога, смешивания разных навыков (поговорить на любую тему, рассказать анекдот, обсудить погоду – всё в одном боте).

Стартапы. В сфере стартапов тоже оживление. Многие небольшие компании берут за основу открытые модели (например, международные LLaMA от Meta или наши же FRED/T5) и обучают под свои нужды. Есть проекты, делающие AI-тьюторов для образования – они натаскивают нейросеть помогать студентам решать задачи и объяснять ошибки. Кто-то работает над юридическими ассистентами, которые умеют читать законы и помогать готовить документы. Появляются даже творческие ИИ, заточенные под генерацию рекламных текстов или дизайн-концептов – их тоже делают небольшие команды, комбинируя готовые нейросетевые «кирпичики». Заметим, в условиях ограниченных ресурсов стартапы редко учат модель с нуля (это слишком дорого и долго), зато берут существующий open-source мозг и учат его нужным трюкам. Получается своеобразная кооперация: большие корпорации дают модели в открытый доступ, а мелкие игроки внедряют их в прикладные сервисы. В выигрыше все: крупные модели получают проверку в бою, а пользователи – полезные продукты на основе отечественного ИИ.

Отдельно стоит упомянуть проекты на стыке коммерции и государства. Создан Институт искусственного интеллекта AIRI, призванный объединить усилия учёных в области ИИ. Они не выпускают коммерческие продукты, но проводят фундаментальные исследования – например, как улучшить обучение больших моделей или сделать их интерпретируемыми. Такие исследования в перспективе помогут всем разработчикам делать нейросети умнее и надёжнее. По стране проходят хакатоны и конкурсы по применению ИИ (например, соревнования по созданию лучших моделей для анализа документов на русском). Всё это создает среду, где развитие AI идёт полным ходом, даже если не каждый проект на слуху у широкой публики.


Готовы перейти на современную серверную инфраструктуру?

В King Servers мы предлагаем серверы как на AMD EPYC, так и на Intel Xeon, с гибкими конфигурациями под любые задачи — от виртуализации и веб-хостинга до S3-хранилищ и кластеров хранения данных.

  • S3-совместимое хранилище для резервных копий
  • Панель управления, API, масштабируемость
  • Поддержку 24/7 и помощь в выборе конфигурации

Создайте аккаунт

Быстрая регистрация для доступа к инфраструктуре


Сравнение с ChatGPT, Claude, Gemini: держим планку?

Невозможно не сравнить российские модели с их зарубежными кумирами. Ещё недавно все говорили: "Вот, мол, вышел ChatGPT – где же наш ответ?" Теперь ответ есть, и не один. Так насколько же наши решения дотягиваются до уровня западных?

Качество ответов и интеллект. Модели вроде GPT-4 (сердце ChatGPT) по-прежнему задают планку в многих областях: у них огромное количество знаний, множество примеров для обучения, они сильны в логических рассуждениях. Российские аналоги быстро подтягиваются. YandexGPT 5 Pro уже показала себя достойно: по некоторым тестам на русском она не уступает GPT-4, а где-то даже точнее с фактами (не забываем, что западные модели могут хуже знать реалии России или, скажем, путаться в русских датах истории). GigaChat 2.0 тоже заявлен Сбером как превосходящий многих конкурентов на русскоязычных задачах. Конечно, в глобальном плане ChatGPT пока более универсален (он свободно говорит на десятках языков, знает узкоспециальные области типа биологии или теории игр благодаря масштабному обучению). Но в своем сегменте – общение на русском о повседневных вещах, написание типичных текстов – наши нейросети уже играют практически на равных. А где-то берут реванш: например, по длине обрабатываемого контекста GigaChat обходит даже свежий GPT-4 (тот ограничен меньшим количеством символов). Или возьмём Anthropic Claude – известен умением держать в памяти огромные чаты, но он мало доступен русскому пользователю и не обучен специально на нашей культуре. Российский же AI может процитировать Пушкина к месту или учесть последние новости Рунета, что для иностранного аналога может оказаться непосильным.

Сильные стороны российских ИИ. Одним словом – локализация. Они изначально учились на русскоязычном контенте, впитали наш интернет, литературу, даже мемы. От этого их ответы получаются ближе и понятнее отечественной аудитории. К тому же, разработчики специально адаптируют их под наши реалии: включают поддержку государственных сервисов, учитывают тонкости языка (те же вежливые формы обращений или жаргон). Ещё один плюс – суверенность данных. Обращаясь к отечественной модели, компания или человек может не беспокоиться, что данные улетят на иностранные серверы. Для бизнеса и госструктур это серьезный фактор: можно внедрять ИИ-ассистентов, не нарушая режим секретности или требования по хранению данных внутри страны. Ну и, конечно, доступность: ни геосанкции, ни отключение зарубежных API не помешают использовать локальный AI. Сбер и Яндекс не зависят от решений OpenAI или Google, они разворачивают модели в своих облаках. Это своего рода страховка на будущее.

Слабые стороны и вызовы. Без честности никуда: наши модели всё ещё нагоняют лидеров. Тот же GPT-4 обучался на колоссальном мультиязычном датасете и на сверхдорогом облаке – бюджеты несопоставимы. Поэтому может встретиться, что в крайне сложных задачах (например, точные научные расчёты или глубокое программирование) ChatGPT окажется сильнее. Также важен момент экосистемы: вокруг OpenAI выросло сообщество, тысячи плагинов, готовых интеграций. Российским платформам предстоит создать похожую экосистему: удобные инструменты для разработчиков, обучающие материалы, сообщества, которые делятся лучшими практиками запросов (prompt engineering). Но это лишь вопрос времени. Уже сейчас API наших моделей доступны, примеры кода выложены, а значит – всё больше людей будут их применять и совершенствовать.

Российские ИИ выходят на один уровень с мировыми

200+

страниц контекста обрабатывает GigaChat 2.0

95%

точности ответов на бытовые запросы по-русски (YandexGPT 5)

3

основных русскоязычных модели с API-доступом (YandexGPT, GigaChat, FRED)

100B

параметров в открытой модели YaLM от Яндекса

2 место

в неофициальном рейтинге русскоязычных LLM занял GigaChat

свобода от санкций и геоограничений — данные обрабатываются внутри страны

Отдельно стоит упомянуть импортозамещение в сфере железа и решений. Пока что обучать супер-модели приходится на импортных видеокартах и процессорах. Полной независимости в этом плане нет: мы пользуемся теми же NVIDIA GPU, что и все. Однако активное развитие отечественных софтверных решений – половина дела. Если свои нейросети есть, их всегда можно перенести на любое доступное «железо» или даже дождаться появления российских мощных чипов. И наоборот, если моделей не было бы, никакое железо не помогло бы создать конкурентный продукт мгновенно. Так что текущая стратегия – догнать в алгоритмах, а железо приложится.

AI-нацбезопасность. Зачем вообще встала задача иметь свои ChatGPT? Дело не только в гордости, но и в стратегической необходимости. Искусственный интеллект становится базовой технологией, проникающей во все сферы – от экономики до обороны. Полагаться в этом на чужие чёрные ящики рискованно. Собственные ИИ-системы – это элемент национальной безопасности, как спутники или шифры. В критический момент доступа к чужому ИИ может не оказаться, или он может внезапно «отказать» в обслуживании по чьему-то указанию. Своя же нейросеть продолжит работать для вас при любых условиях. Поэтому инвестиции государства и бизнеса в российские нейроплатформы оправданы: они обеспечивают цифровой суверенитет. И приятно, что при всех этих серьёзных мотивах, выходят продукты, которыми может пользоваться каждый школьник или пенсионер в бытовых целях – ведь национальная безопасность проявляется и в том, что технологии делают жизнь людей лучше.

Вывод: в будущее с отечественным ИИ

Российские нейросети прошли путь от любопытных исследований до реальных повседневных помощников за считанные годы. Теперь у нас есть свой "GPT" в разных воплощениях – будь то разговорчивая Алиса на стероидах YandexGPT или всесторонне развитый собеседник GigaChat от Сбера. Они умеют и пошутить, и дело сделать: напишут кусок кода, подытожат документ, нарисуют концепт по описанию. Конечно, нет предела совершенству – и Yandex, и Sber, и десятки других команд продолжают учить своих искусственных интеллектов новым трюкам. Конкуренция с западными моделями не пугает, а скорее мотивирует: гонка интеллектов набирает обороты, и у России в ней свои сильные козыри.

Что это значит для нас с вами? То, что технологии становятся ближе. Если вы предприниматель, уже сегодня можно внедрить русского AI-ассистента в бизнес и не зависеть от чужих платформ. Если разработчик – попробовать открытые модели и построить что-то свое, оригинальное. А обычным пользователям доступно побаловаться с умными ботами на родном языке – задать любой вопрос, получить совет или просто развлечься, обсуждая с нейросетью любимый фильм. И это только начало. Чем больше людей подключаются к этой теме, тем умнее и полезнее становятся сами модели.

Можно с уверенностью сказать: у отечественного ИИ большое будущее. Возможно, очень скоро мы будем говорить не «наш аналог ChatGPT», а наоборот – «западный аналог такого-то нашего AI». Пока же важно продолжать путь – учить, тестировать, улучшать. Впереди нас ждёт ещё немало прорывов, а значит, беседа человека с машиной станет ещё более естественной и продуктивной. Кто знает, может быть, следующий великий русскоязычный писатель окажется нейросетью? 😉 В любом случае, здоровая конкуренция и прогресс в этой сфере – отличная новость для всех нас. Будем на связи – и с умными машинами тоже!

ИИ и персональные данные: как использовать облачные технологии и соблюдать 152-ФЗ
AI

ИИ и персональные данные: как использовать облачные технологии и соблюдать 152-ФЗ

ИИ открывает бизнесу огромные возможности, но вместе с ними — и риски при работе с персональными данными. В этом гайде разбираем, как использовать облачные AI-технологии, не нарушая 152-ФЗ: где хранить данные, как их защищать и что поможет упростить комплаенс.

Как создать собственного чат-бота с ИИ: развёртывание ChatGPT-аналога на своём сервере
AI

Как создать собственного чат-бота с ИИ: развёртывание ChatGPT-аналога на своём сервере

Развёртывание собственного чат-бота с ИИ — это уже не фантастика. В статье вы узнаете, как создать аналог ChatGPT на своём сервере с помощью open-source моделей, настроить окружение, интегрировать с сайтом или мессенджером и сохранить полный контроль над данными.