Добавили GLM 5 от Z.ai и Kimi K2 от MoonshotAI

Добавили GLM 5 от Z.ai и Kimi K2 от MoonshotAI
Подключили сразу шесть моделей от двух китайских команд. Четыре из семейства GLM 5 (Z.ai) и две из линейки Kimi K2 (MoonshotAI). Обе команды последний год активно догоняют топовые западные модели по кодингу и агентским сценариям, и теперь их можно гонять прямо из GPTIK — оплата в рублях, без VPN и зарубежных карт.
Коротко: если нужен дешёвый длинный контекст под код и агентов — смотрите GLM 5 и Kimi K2.5. Если хочется максимум качества из этой линейки — GLM 5.1 или Kimi K2.6. Дальше по каждой.
Семейство GLM 5 от Z.ai
Z.ai (бывшая Zhipu AI) делает ставку на агентов и кодинг. У всех моделей серии контекст 202K токенов — это примерно 150 тысяч слов, в один запрос влезает большая кодовая база или несколько документов.
GLM 5
Базовая модель серии. Берёт текст, заточена под рассуждения, агентские цепочки и работу с кодом. Картинки не понимает — это чисто текстовая рабочая лошадка.
- prompt: 90 ₽ за 1M токенов
- completion: 288 ₽ за 1M токенов
- минимальный баланс на запрос: 1 ₽
GLM 5.1
Флагман линейки. Та же специализация, что у GLM 5, но сильнее на сложных рассуждениях и длинных агентских задачах. Платите за это примерно в полтора раза больше.
- prompt: 147 ₽ за 1M токенов
- completion: 462 ₽ за 1M токенов
- минимальный баланс: 1 ₽
Когда брать 5.1 вместо обычной 5? Когда задача реально упирается в качество рассуждений — многошаговые агенты, разбор запутанного легаси-кода, длинные планы. На простой генерации и шаблонном коде разница вы вряд ли заметите, а переплата будет.
GLM 5 Turbo
Тот же GLM 5, но оптимизирован под скорость и высокий поток запросов. Контекст 202K, максимум на выход — 131K токенов. Текст, без картинок.
- prompt: 180 ₽ за 1M токенов
- completion: 600 ₽ за 1M токенов
- минимальный баланс: 2 ₽
Turbo дороже обычной версии — это плата за пропускную способность, а не за ум. Имеет смысл, когда вы прогоняете много запросов параллельно и упираетесь во время ответа: чат-боты с живыми пользователями, массовая обработка, стриминг.
GLM 5V Turbo
Единственная в серии модель с глазами. Понимает текст, изображения и видео на входе. Контекст 202K, выход до 131K. Цена как у GLM 5 Turbo.
- prompt: 180 ₽ за 1M токенов
- completion: 600 ₽ за 1M токенов
- минимальный баланс: 2 ₽
Это вариант, когда в задаче есть визуал: разбор скриншотов интерфейса, анализ кадров из видео, мультимодальные агенты. Поддержка видео на входе пока редкость даже у крупных провайдеров, так что для таких сценариев модель интересная.
Kimi K2 от MoonshotAI
MoonshotAI известна тем, что её Kimi заметно прибавила в агентских и кодинг-бенчмарках. У обеих моделей контекст 262K токенов — это даже больше, чем у GLM, — и обе умеют работать с картинками.
Kimi K2.5
Рабочая модель линейки. Vision на входе, контекст 262K, выход тоже до 262K. Хороший баланс цены и качества под агентов и код.
- prompt: 60 ₽ за 1M токенов
- completion: 285 ₽ за 1M токенов
- минимальный баланс: 1 ₽
На входе это, пожалуй, самый дешёвый длинный контекст из всего, что мы сегодня подключили: 60 ₽ за миллион токенов промпта при 262K окне. Если кормите модели большими документами и кодом, на этом реально экономится.
Kimi K2.6
Флагман MoonshotAI. Те же 262K контекста и поддержка картинок, но сильнее в сложных агентских задачах и кодинге. Ценник почти вдвое выше, чем у K2.5.
- prompt: 102.6 ₽ за 1M токенов
- completion: 513 ₽ за 1M токенов
- минимальный баланс: 2 ₽
Логика та же, что и с GLM: K2.6 берут под задачи, где качество важнее стоимости. Для остального K2.5 покрывает почти всё и стоит дешевле.
Что в итоге выбирать
Если упрощать:
- нужен дешёвый длинный контекст под текст и код — Kimi K2.5 (60 / 285 ₽) или GLM 5 (90 / 288 ₽);
- нужно максимум качества рассуждений — GLM 5.1 или Kimi K2.6;
- в задаче есть картинки или видео — GLM 5V Turbo (видео) либо Kimi K2.5 / K2.6 (картинки);
- много параллельных запросов и важна скорость — GLM 5 Turbo.
Все шесть моделей работают через OpenRouter, оплата в рублях с вашего баланса в GPTIK.
Как попробовать
Если у вас уже есть аккаунт, модели появились в каталоге автоматически. В чате выбираете нужную в селекторе, остаток по балансу считается в реальном времени по тарифу модели.
В API обращаетесь по полному ID или короткому алиасу:
z-ai/glm-5(glm-5)z-ai/glm-5.1(glm-5.1,glm-5-1)z-ai/glm-5-turbo(glm-5-turbo)z-ai/glm-5v-turbo(glm-5v-turbo)moonshotai/kimi-k2.5(kimi-k2.5,kimi-k2-5)moonshotai/kimi-k2.6(kimi-k2.6,kimi-k2-6)
Полный список моделей и актуальные цены всегда в разделе «Модели» в кабинете. Если что-то не работает или непонятно — пишите в поддержку.