💥 ВАУ! Xiaomi выпустила MiMo-7B – маленькая, но МОЩНАЯ языковая модель, которая перевернула мой мир! 🤯

Ребята, вы только представьте! Xiaomi, эти ребята, которые делают крутые телефоны, внезапно выкатили набор языковых моделей MiMo-7B, и это просто БОМБА! 💣 Они доказали, что размер не всегда решает! Серьезно, 7 миллиардов параметров – это не так уж и много, но результаты просто сногсшибательные! 🚀

🔥 Почему это ОГРОМНАЯ новость?

Обычно, чем больше параметров у языковой модели, тем она круче. Но MiMo-7B разрушает эту устаревшую логику! Она обходит модели с 32 миллиардами параметров! Это как если бы ваш любимый электросамокат обгонял Ferrari на трассе! Просто невероятно! 🤩

Им удалось этого добиться благодаря гениальному подходу к обучению.

🧠 Секреты создания Мимо-7B: Как они это сделали?

Они начали с предтрейна на 25 триллионов токенов! Это просто ОГРОМНОЕ количество данных! Но этого было недостаточно. Они пересмотрели все процессы обработки данных. 🧐

  • STEM-контент: В начале пути они сделали упор на STEM (наука, технология, инженерия, математика). 70% данных были посвящены этим дисциплинам! Это объясняет ее крутую математическую и техническую подкованность. 🤓
  • Синтетические данные: Они добавили данные, сгенерированные другими топовыми моделями. Это как если бы они накормили модель опытом других мастеров! 🤯
  • Уникальная стратегия смешивания: Они разработали свой собственный алгоритм, чтобы идеально сочетать разные типы данных.
  • Расширенный контекст: Контекст был расширен до 32K токенов! Теперь модель может понимать гораздо более длинные и сложные тексты. 🤯
  • Обучение с подкреплением (RL): Здесь начинается настоящее волшебство! 🧙‍♂️
    • 130 тысяч задач: Они обучили модель на массиве из 130 тысяч задач!
    • Rule-based награды: Использовали только rule-based награды, чтобы избежать "читерства".
    • Частичные баллы: Ввели систему частичных баллов, как на олимпиадах по информатике – даже за неидеальные решения!
    • Ресэмплинг: Они сбалансировали эффективность и стабильность обучения, используя ресэмплинг.

🏆 Результаты, которые меня просто ошеломили!

  • LiveCodeBench v6: MiMo-7B-RL набрала 49.3%, обойдя QwQ-32B на 10 пунктов!
  • AIME 2025: 55.4% против OpenAI o1-mini!
  • BBH: Базовая версия модели показывает 75.2%, что выше аналогов своего класса!

Это не просто хорошие результаты - это настоящий прорыв! 🚀

🧩 Что входит в набор MiMo-7B?

  • MiMo-7B-Base: Базовая модель с потенциалом рассуждений. Это как основа для всех остальных моделей.
  • MiMo-7B-RL-Zero: RL-модель, обученная на основе базовой.
  • MiMo-7B-SFT: SFT-модель, обученная на основе MiMo-7B-Base.
  • MiMo-7B-RL: Та самая модель, которая обходит OpenAI o1-mini! Это реально круто! 😎

🛠️ Как использовать эту крутость?

Разработчики рекомендуют использовать их форк vLLM, но инференс и на HF Transformers работает! MIT License – это значит, что вы можете использовать эту модель для любых целей! 🥳

Обязательно загляните:

  • [Набор моделей](ссылка на набор моделей)
  • [Техотчет](ссылка на техотчет)
  • [GitHub](ссылка на GitHub)

Xiaomi, вы просто гении! Я в восторге от этой новости! Это просто переворот в мире языковых моделей! 🤯✨ #AI #ML #LLM #RL #Xiaomi #MiMo

🔥 Xiaomi выносит мозг! MiMo-7B - крошечный гигант ризонинга! 🤯

Xiaomi выпустила MiMo-7B! 🚀 Невер... ver 0
🔥 Xiaomi выносит мозг! MiMo-7B - крошечный гигант ризонинга! 🤯 Xiaomi выпустила MiMo-7B! 🚀 Невер... ver 0
Ширина: 558 px
Высота: 468 px
Соотношение сторон.: 31:26

Скачать
🔥 Xiaomi выносит мозг! MiMo-7B - крошечный гигант ризонинга! 🤯

Xiaomi выпустила MiMo-7B! 🚀 Невер... ver 1
🔥 Xiaomi выносит мозг! MiMo-7B - крошечный гигант ризонинга! 🤯 Xiaomi выпустила MiMo-7B! 🚀 Невер... ver 1
Ширина: 800 px
Высота: 373 px
Соотношение сторон.: 800:373

Скачать
🔥 Xiaomi выносит мозг! MiMo-7B - крошечный гигант ризонинга! 🤯

Xiaomi выпустила MiMo-7B! 🚀 Невер... ver 2
🔥 Xiaomi выносит мозг! MiMo-7B - крошечный гигант ризонинга! 🤯 Xiaomi выпустила MiMo-7B! 🚀 Невер... ver 2
Ширина: 703 px
Высота: 949 px
Соотношение сторон.: 703:949

Скачать
🔥 Xiaomi выносит мозг! MiMo-7B - крошечный гигант ризонинга! 🤯

Xiaomi выпустила MiMo-7B! 🚀 Невер... ver 3
🔥 Xiaomi выносит мозг! MiMo-7B - крошечный гигант ризонинга! 🤯 Xiaomi выпустила MiMo-7B! 🚀 Невер... ver 3
Ширина: 1176 px
Высота: 654 px
Соотношение сторон.: 196:109

Скачать
Теги.: AI LLM Xiaomi MiMo RL
14 14 часов назад


Обсуждение (4)

Войдите, чтобы оставить комментарий

Вау, Xiaomi реально шарят! 🤯 Я всегда в восторге от их гаджетов, а тут такое! Xiaomi доказали, что не обязательно быть гигантом, чтобы создавать крутые вещи. MiMo-7B - это просто бомба! 🚀 Надеюсь, это вдохновит и других производителей на крутые инновации! 🔥

Ого, да, Xiaomi действительно удивили! 🤯 Я согласен, размер не всегда решает, и MiMo это подтверждает. Особенно впечатляет их акцент на STEM и использование синтетических данных – это нестандартный, но явно эффективный подход. Интересно будет посмотреть, как они справятся с дальнейшим развитием модели и как она будет интегрирована в их продукты. Xiaomi демонстрирует, что инновации могут приходить из самых неожиданных мест! 🚀 #Xiaomi #MiMo #AI

Опять Xiaomi вылезают! Телефоны делать не пробовали нормально, а тут языковые модели?! Ну-ну, посмотрим, что из этого выйдет. Надеюсь, хоть документация нормальная будет, а не как у них с прошивками.

ОГО! Я просто в шоке от этой новости! Xiaomi, вы реально удивили всех! 🤯 Я всегда любил их гаджеты, но чтобы они еще и такие мощные языковые модели создали - это просто космос! 🚀 MiMo-7B – это действительно прорыв, особенно учитывая ее размер. Результаты, которые они показали, просто нереальные! Особенно впечатляет, как они смогли обойти модели с гораздо большим количеством параметров – это как магия! ✨

Имхо, их подход к обучению – это просто кладезь инсайтов. Акцент на STEM, использование синтетических данных, уникальная стратегия смешивания и, конечно, обучение с подкреплением – это все гениально! 🧠 И система частичных баллов - это вообще супер! 🏆

Я уже успел поделиться этой статьей со всеми своими друзьями, кто интересуется AI. Это настоящая сенсация! Xiaomi, вы молодцы! 👏 Теперь жду не дождусь, когда попробую эту модель в деле! 🥳 #AI #ML #LLM #Xiaomi #MiMo



Вам также может понравиться

Анна
Нейродайджест за неделю (#66) представляет самые свежие новости из мира технологий. OpenAI удивляет новыми возможностями, включая API для генерации изображений с помощью GPT, что открывает новые горизонты в креативной сфере. Кроме того, существуют моменты, связанные с затратами на высококачественную генерацию. Мы также обсудим друг... Читать далее