Gemma 3: Квантизированные версии для всех, кто хочет свои модели!
Ботаники в мире искусственного интеллекта явно не спят на ходу! Недавно мир увидел, как Gemma 3 выпустила свои квантизированные версии, что, в общем-то, стало тем еще событием для поклонников красивых графиков и глубоких нейросетей. Квантизация – это не просто модное слово из лексикона смарт-специалистов, а настоящая находка для большинства пользователей, которые уже давно заметили, что запускать модели в нативных bf16 - это, как искать иголку в стоге сена.
На самом деле, большинство юзеров уже давно перешли на 4 битную квантизацию, и тут проблема: многие модели разрабатываются с расчетом на бф16, и никто не предполагал, что кто-то когда-то начнет их запускать по-другому. Это, представьте, как если бы вы купили новый компьютер, а в нем оказалась лишь одна тема — "Привет, я Mac!". Ох, как же хочется иногда сделать что-то по-другому!
Но, вернемся к Gemma 3. Google, как всегда, не мог упустить возможность прокачать свою модель, и они специально проводили дотренировку с помощью quantization aware training. Говорят, что качество теперь "схоже" с bf16 моделями. Но вот беда — результаты бенчей не были предоставлены. Знайте, когда говорят "схоже", это значит «мы не знаем, но надеемся, что вы свяжете концы с концами». Как-то сомнительно, не правда ли?
Кстати, Meta не отстает и тоже выпустила свою квантизированную версию Llama 3.2, но только для моделей с 1B и 3B параметрами. В отличие от Google, который снова своей классикой – выпустили сразу всю линейку. Вопрос: почему остальные разработчики открытых моделей не последуют этому примеру? Что за таинственная завеса сокрытия маркетинговых стратегий в этой мегамашине?
Не стесняйтесь, если хочется скачать, дерзайте! Зачем ждать мимо проходящих возможностей в мире технологий? Куда ни глянь, квантизация радостно скачет по всему полю!
Так что, если вы все еще сомневаетесь, стоит вам это или нет, подумайте об этой революции на пальцах. Квантизация - это не просто тренд, это необходимость для достижения максимальной производительности. И кто знает, может, именно вы станете следующим кем-то, кто займет свое место в этой цепочке.
Скачать здесь:
@ai_newz
Вам также может понравиться






















