ML-комьюнити о крупнейших запусках LLM начала 2025 года

В 2025-м году мир машинного обучения и ИИ снова оказался на острие новостей, и со всеми этими запусками трудно усидеть на месте. Давайте взглянем на наиболее значимые проекты, которые зажгли обсуждения в мире технологии!

DeepSeek — революция или простая модная волна?

Запуск китайской модели DeepSeek стал настоящим громом среди ясного неба! Но, как это обычно и бывает, мнения разделились. Дарио Амодей, CEO Anthropic, прямо говорит, что стоимость обучения Claude 3.5 Sonnet в несколько десятков миллионов долларов помогает ей уверенно опережать DeepSeek по множеству критериев. Более того, у DeepSeek нет «гаджетов», предотвращающих генерацию чувствительной информации. Интересно, а не хотели ли разработчики DeepSeek случайно запустить систему на временно замороженных замороженных луках?

С другой стороны, Демис Хассабис, генеральный директор Google DeepMind, на похвалу DeepSeek откликнулся с настроением «да, неплохо», но с добавлением, что никаких научных прорывов в ней не нашёл. Значит, слава популярного стартапа или просто удачная реклама?

Grok 3 — Маск не дотянул!

К созданию Grok 3 многие возлагали надежды, особенно учитывая блестящие достижения ИИ-команды Маска. Однако профессор Итан Моллик не поленился огласить, что эта модель остается далекой от идеала. Она может перегнать некоторые продукты OpenAI, но сходу о превосходстве говорить не приходится. А вот CTO Caylent, Рэнделл Хант, открыл ящик Пандоры, заявив, что Grok 3 уязвима к джейлбрейкам, часто попадает в ляпы с сарказмом и вообще, просто медлительна. Если бы она была бы скоростью звука, то, возможно, сбежала бы на полгода раньше!

Тем не менее, CEO Replit, Амджад Масад, увидел в Grok 3 передовую модель. Кто из них прав? Непонятно. Но, как говорится, чтобы узнать истину, нужно попробовать.

GPT-4.5 — подкачали ожидания экспертов

Релиз GPT-4.5 от OpenAI нашел своих критиков и защитников. Андрей Карпатый, соучредитель OpenAI, при первом взгляде отметил, что у него есть потенциал, хотя это напоминает старый добрый GPT-4. А вот Гэри Маркус, известный критик, не стеснялся называть GPT-4.5 «пустышкой». Какого-то танца с бубном от OpenAI ждали многие, а оказалось — продолжение того же.

Клеман Деланж, генеральный директор Hugging Face, тоже неподдельно огорчен. С закрытым исходным кодом, по его словам, GPT-4.5 смотрится "так себе". Кто знает, может, все дело в завышенных ожиданиях, или это просто ещё одна игра от маститых разработчиков?

YandexGPT 5 — что новенького в России?

Колоритная ситуация разворачивается вокруг YandexGPT 5. Виктор Тарнавский, директор по ИИ Т-Банка, сообщил о выходе Lite-версии в опенсорс, и все это выглядит многообещающе. В его взгляде, это шаг в правильном направлении, дабы избежать ненужных затрат, но, простите, стоп-слово — это не файнтюн, а именно «полный цикл обучения». Модель показывает хорошие результаты, но это только начало, и по бенчмаркам кажется, что дело движется.

А вот Максим Болотских, директор ИИ в Яков и Партнёры, подметил, что такие разработки могут съедать приличные средства — до 10 миллиардов рублей ежегодно! Но, помимо классических B2C подписок, такие модели могут открывать возможности для В2В, взбалтывая рынок. Классный шанс!

Gemini 2.0 Flash — отличное сочетание цена-качество

И вот, на горизонте появляется Gemini 2.0 Flash от Google, который сразу же завоевал симпатии экспертов. Тим Брукс из DeepMind восхитился встроенной функцией генерации изображений с возможностью визуальных цеп



Обсуждение (0)

Войдите, чтобы оставить комментарий

Пока нет комментариев!



Вам также может понравиться