Qwen 3 — Открытые Гибридные Ризонеры, Которые Привлекают Внимание Меня Совершенно Сильно!

Друзья, вам уже доводилось слышать о Qwen 3? Если нет, то приготовьтесь, потому что это не просто новая модель — это настоящая революция в мире искусственного интеллекта! Эти гибридные ризонеры идут в диапазоне от крошечной модели 0.6B до огромной 235B-A22B MoE, которая оказывается быстрее и мощнее, чем o3-mini и даже стоит на уровне Gemini 2.5 Pro! Каждая из этих моделей — гордость в своей весовой категории и имеет статус SOTA (State Of The Art).

Но давайте поговорим об одной из моделей, которая меня просто зажгла! Это 30B-3A MoE. Почему же? Она обходит QwQ 32B, который вышел лишь полтора месяца назад, при этом используя в 10 раз меньше активных параметров. Я не могу сдержать свое восхищение — это невероятно! И пусть она чуть-чуть уступает Qwen 3 32B, но разница в скорости делает её настоящим звёздным игроком!

Гибкость Использования

Все модели Qwen 3 имеют одну потрясающую особенность, которая разрывает рынок! Они являются гибридными, это значит, что вы можете использовать их и как обычные модели, и как ризонеры. С помощью простого тега /no_think можно переключаться между режимами! Эта функциональность не так часто встречается — только Claude 3.7 и Gemini 2.5 Flash могут этим похвастаться. Признаюсь, в последнее время тенденция к гибридным моделям действительно захватывает, и я с нетерпением жду, как это скажется на конечном пользователе!

Разработчики также утверждают, что Qwen 3 получил значительные улучшения в тул-юз, хотя конкретные бенчмарки пока не представлены. Но знаете что? Мы узнаем все нюансы очень скоро, и это действительно интригует! Но есть один момент, который заставляет меня немного грустить — модели не мультимодальные. Обычно мультимодальные версии Qwen появляются через 3-4 месяца, что может навести тоску на многих. 😢

Алгоритмы и Датасеты

Теперь давайте заглянем в кухню — модели Qwen 3 обучались на колоссальных 36 триллионах токенов на 119 языках, включая белорусский, русский и украинский. Если вы подумали, что обучение 0.6B происходило на 60 тысячах токенов на каждый параметр, то вы абсолютно правы (так что привет Шиншилле!). Интересно, как эта плотность токенов скажется на производительности. В итоге, все веса доступны под лицензией Apache 2.0, что дает вам полную свободу действий!

Не упустите возможность опробовать эти модели на сайте qwen.ai — я уже пробую и у меня возникли некоторые впечатления. Надеюсь, что и вы присоединитесь к этому захватывающему миру Qwen 3! 🚀

Веса

Это просто потрясающе, так что обязательно следите за обновлениями! Блогпост @ai_newz даёт нам представление о том, куда движется AI — и это очень интересно!

Qwen 3: Прорывные гибридные рисонеры для всех! ver 0
Qwen 3: Прорывные гибридные рисонеры для всех! ver 0
Ширина: 2560 px
Высота: 1440 px
Соотношение сторон.: 16:9

Скачать
Qwen 3: Прорывные гибридные рисонеры для всех! ver 1
Qwen 3: Прорывные гибридные рисонеры для всех! ver 1
Ширина: 2560 px
Высота: 1440 px
Соотношение сторон.: 16:9

Скачать


Обсуждение (11)

Войдите, чтобы оставить комментарий

Согласен, китайские модели уже давно не "пытаются", а задают тренды!😉 А удобство переключения режимов - это не "маркетинговый ход", а реальная фича, которую оценят все пользователи. Давайте посмотрим, что из этого получится и будем открыты к новому!🚀

Согласен, китайские модели уже давно не "пытаются", а задают тренды!😉 А удобство переключения режимов - это не "маркетинговый ход", а реальная фича, которую оценят все пользователи. Давайте посмотрим, что из этого получится и будем открыты к новому!🚀

Согласен, китайские модели уже давно не "пытаются", а задают тренды!😉 А удобство переключения режимов - это не "маркетинговый ход", а реальная фича, которую оценят все пользователи. Давайте посмотрим, что из этого получится и будем открыты к новому!🚀

Согласен, китайские модели активно развиваются и задают тренды в ИИ. Гибридность и удобство переключения режимов - это не просто маркетинг, а реальные преимущества для пользователей. Бегу тестировать и надеюсь увидеть, как это работает на практике!

Ох, да уж, Qwen 3 - это как глоток свежего воздуха в мире AI! Я, конечно, тоже в начале пути, но даже мне, простому смертному, видно, какой прорыв! Особенно впечатляет эта 30B-3A MoE - 10x меньше параметров, а результат круче! Это как если бы ты съел пиццу, и она оказалась вкуснее, чем любая другая, при этом весила в 10 раз меньше! 😂

Гибридность - это вообще вишенка на торте! Это как иметь универсальный инструмент, который подходит для всего. А то, что разработчики не пошли на поводу у моды и оставили только текстовую версию - это, наверное, чтобы мы не расслаблялись и ждали настоящей "бомбы" в будущем. 🤫

Короче, я тоже бегу тестировать на qwen.ai! И да, надеюсь, что скептики пересмотрят свое мнение, когда увидят, на что это чудо способно. 🚀

Вау! Qwen 3 выглядит невероятно! 30B-3A MoE – это просто 🔥! Гибридность - это бомба! Надеюсь, скоро будет мультимодалка, но уже сейчас очень интересно тестировать! 🚀

Друзья, я просто в восторге от Qwen 3! Меня особенно поразила модель 30B-3A MoE – это просто взрыв мозга, как она обходит QwQ 32B, при этом используя в 10 раз меньше параметров! Это огромный шаг вперед! И то, что она гибридная – это вообще круто, такая гибкость использования! Я с вами абсолютно согласен, мультимодальность – это, конечно, омрачило, но давайте дадим разработчикам время, уверен, нас ждёт нечто потрясающее! Спасибо авторам статьи за такой интересный и вдохновляющий обзор! 🚀

Да что за "революция"? Опять китайская модель пытается в инновации. 36 триллионов токенов - это конечно круто, но где мультимодальность?! И "простое переключение режимов" - это просто маркетинговый ход! Будем ждать, что там на деле выйдет, пока не стоит полагаться на эти обещания.

Ого, Qwen 3 - это прям прорыв! Особенно зацепила модель 30B-3A MoE, такая эффективная! Гибридность – это вообще топ, как у Claude 3 и Gemini! Жду мультимодалки, но пока буду экспериментировать на qwen.ai! Спасибо за статью, очень вдохновляет! 🚀

Вау! Qwen 3 звучит действительно революционно! Особенно впечатляет 30B-3A MoE – 10x меньше параметров и при этом превосходит QwQ 32B! Гибридный подход с переключением режимов – это огромный плюс. Очень жду тестов на тул-юз и надеюсь, что скоро появятся мультимодальные версии! Спасибо за статью, теперь срочно тестирую на qwen.ai! 🚀

Вау! Qwen 3 выглядит бомбически! Особенно радует гибкость использования с переключением режимов - это реально круто. Жаль, что пока нет мультимодальности, но всегда можно ждать. Спасибо за интересный обзор, сразу побежал тестировать! 🚀



Вам также может понравиться

Ура! У OpenAI свершилось чудо – лимиты для Plus подписчиков удвоены! 🎉 Теперь можно скачивать информацию с такой скоростью, что даже чайный пакетик успеет заскучать! 🤖❤️ Пользователи могут наслаждаться бесконечными возможностями, делая больше запросов, чем когда-либо! С этим обновлением осень стала ещё ярче, а мы можем творить и... Читать далее
Датасет DUMB500 — это настоящая находка для любителей данных! 🌟 Содержит 500 уникальных записей, которые помогут вам исследовать, анализировать и создавать удивительные проекты! Этот датасет демонстрирует, как разнообразие данных может вдохновлять на новые идеи и открытия. Идеален для анализа, машинного обучения и творчества! Не у... Читать далее