ML-комьюнити: большие достижения LLM в начале 2025 года

ML-комьюнити о крупнейших запусках LLM начала 2025 года

В 2025-м году мир машинного обучения и ИИ снова оказался на острие новостей, и со всеми этими запусками трудно усидеть на месте. Давайте взглянем на наиболее значимые проекты, которые зажгли обсуждения в мире технологии!

DeepSeek — революция или простая модная волна?

Запуск китайской модели DeepSeek стал настоящим громом среди ясного неба! Но, как это обычно и бывает, мнения разделились. Дарио Амодей, CEO Anthropic, прямо говорит, что стоимость обучения Claude 3.5 Sonnet в несколько десятков миллионов долларов помогает ей уверенно опережать DeepSeek по множеству критериев. Более того, у DeepSeek нет «гаджетов», предотвращающих генерацию чувствительной информации. Интересно, а не хотели ли разработчики DeepSeek случайно запустить систему на временно замороженных замороженных луках?

С другой стороны, Демис Хассабис, генеральный директор Google DeepMind, на похвалу DeepSeek откликнулся с настроением «да, неплохо», но с добавлением, что никаких научных прорывов в ней не нашёл. Значит, слава популярного стартапа или просто удачная реклама?

Grok 3 — Маск не дотянул!

К созданию Grok 3 многие возлагали надежды, особенно учитывая блестящие достижения ИИ-команды Маска. Однако профессор Итан Моллик не поленился огласить, что эта модель остается далекой от идеала. Она может перегнать некоторые продукты OpenAI, но сходу о превосходстве говорить не приходится. А вот CTO Caylent, Рэнделл Хант, открыл ящик Пандоры, заявив, что Grok 3 уязвима к джейлбрейкам, часто попадает в ляпы с сарказмом и вообще, просто медлительна. Если бы она была бы скоростью звука, то, возможно, сбежала бы на полгода раньше!

Тем не менее, CEO Replit, Амджад Масад, увидел в Grok 3 передовую модель. Кто из них прав? Непонятно. Но, как говорится, чтобы узнать истину, нужно попробовать.

GPT-4.5 — подкачали ожидания экспертов

Релиз GPT-4.5 от OpenAI нашел своих критиков и защитников. Андрей Карпатый, соучредитель OpenAI, при первом взгляде отметил, что у него есть потенциал, хотя это напоминает старый добрый GPT-4. А вот Гэри Маркус, известный критик, не стеснялся называть GPT-4.5 «пустышкой». Какого-то танца с бубном от OpenAI ждали многие, а оказалось — продолжение того же.

Клеман Деланж, генеральный директор Hugging Face, тоже неподдельно огорчен. С закрытым исходным кодом, по его словам, GPT-4.5 смотрится "так себе". Кто знает, может, все дело в завышенных ожиданиях, или это просто ещё одна игра от маститых разработчиков?

YandexGPT 5 — что новенького в России?

Колоритная ситуация разворачивается вокруг YandexGPT 5. Виктор Тарнавский, директор по ИИ Т-Банка, сообщил о выходе Lite-версии в опенсорс, и все это выглядит многообещающе. В его взгляде, это шаг в правильном направлении, дабы избежать ненужных затрат, но, простите, стоп-слово — это не файнтюн, а именно «полный цикл обучения». Модель показывает хорошие результаты, но это только начало, и по бенчмаркам кажется, что дело движется.

А вот Максим Болотских, директор ИИ в Яков и Партнёры, подметил, что такие разработки могут съедать приличные средства — до 10 миллиардов рублей ежегодно! Но, помимо классических B2C подписок, такие модели могут открывать возможности для В2В, взбалтывая рынок. Классный шанс!

Gemini 2.0 Flash — отличное сочетание цена-качество

И вот, на горизонте появляется Gemini 2.0 Flash от Google, который сразу же завоевал симпатии экспертов. Тим Брукс из DeepMind восхитился встроенной функцией генерации изображений с возможностью визуальных цеп

Теги.: ИскусственныйИнтеллект МашинноеОбучение LLM НовыеТехнологии AIЗапуски2025

75 2 месяца назад

Обсуждение (0)

Войдите, чтобы оставить комментарий

Пока нет комментариев!

Максим

Предыдущая статья

Крупнейшие запуски LLM: оценки и ожидания 2025 года

Следующая статья

Зумеры и миллениалы выбирают баню вместо баров!

Нейродайджест за неделю (#68): Майские праздники с LLM! LLM - Баф Gemini 2.5 Pro — быстрее, лучше, сильнее! Топ вебдеф арены. - Mistral Medium 3 — закрытая моделька, почти Sonnet 3.7, но в 7 раз деше

25 May

Елена

С Майскими от AI-Newz! 🚀 Нейродайджест #68: LLM-праздник! Баф Gemini 2.5 Pro - топ арены! Mistral Medium 3 - почти Sonnet, но в 7 раз дешевле! 🤯 Погнали заряжать креативность! Читать далее

😎 KREA взрыв мозга: видео в 8K/120 FPS - это реальность! Ну что, народ, держитесь крепче за свои кресла! KREA, эти ребята, которые всегда удивляют, на этот раз выкинули просто бомбу! Они объединили