Nvidia запускает своего большого рискованного друга

Вы не ослышались, Nvidia теперь в числе тех, кто щедро делится своим гением в виде нового рискованного решения! Они выпустили своего большого ризонера, и мир технологий опять теряет равновесие. Давайте разберемся, что же это такое и в чем его прелесть.

Так, в основе новинки лежит Llama 3.1 405B. О, да, вы не ослышались, это звучит как магическое заклинание, а не как название технологического устройства! Но вот шок-контент: Nvidia решилась «запрутнить» его до 253B параметров. Я даже не знаю, что они с ним делали, но результат впечатляет! Теперь он обгоняет DeepSeek R1 по качеству практически на всех бенчах. Напоминает мне сцены из фильмов, где один гений изобрел что-то, а остальные в спешке вскакивают и хватаются за голову. И да, в отличие от QwQ 32B, который обгонял лишь на отдельных тестах, здесь мы видим настоящую мощь.

И вот еще интересный момент: модель тащит FP8 на 4xH100, но для BF16 размерчик уже возрастает до 8xH100 или 4xB100. Немного математики не повредит, но давайте на минутку представим, какие кучи техники нужны только для того, чтобы запустить одного ризонера! Sony, Apple, будь на чеку, Nvidia на пути забрать все лавры.

Для тех из вас, кто хочет попробовать это чудо в меньшем масштабе, Nvidia услышала ваш зов. Они выпустили более «доступные» варианты — модели на 8B и 49B, основанные на Llama 8B и 70B соответственно. Кажется, это будет идеальной находкой для тех, кто не хочет нагружать свою систему до предела, но все равно хочет чувствовать себя на гребне волны технологий.

Таким образом, в этом новом дебюте от Nvidia можно увидеть многообещающее столкновение гениев. Кажется, они решительно настроены оставить все остальные компании позади и завоевать мир ИТ-технологий одним рискованным шагом. Надеемся, вам будет интересно следить за этим настоящим шоу!

Nvidia представила гигантского ризонера на базе Llama 3.1! ver 0
Nvidia представила гигантского ризонера на базе Llama 3.1! ver 0
Ширина: 1280 px
Высота: 700 px
Соотношение сторон.: 64:35

Скачать


Обсуждение (0)

Войдите, чтобы оставить комментарий

Пока нет комментариев!



Вам также может понравиться

В мире глубокого обучения есть вещи, которые становятся Пушкиными среди алгоритмов. Один из таких шедевров — алгоритм Adam, как завзятый оптимизатор, и механизм внимания на базе RNN, который преобразует скучные последовательности в увлекательные истории. Вместе они творят чудеса, позволяя моделям сосредоточиться на важном, как хипс... Читать далее
Яндекс снова шагает в будущее с запуском бета-теста YandexGPT 5, который теперь умеет рассуждать! После предыдущих успехов, этот новый эксперимент обещает не просто продолжение игры, а её настоящую эволюцию. Забывайте о шаблонных ответах, теперь ваш виртуальный собеседник будет думать, а не просто бубнить. Готовьтесь к удивительным... Читать далее