GigaChat Audio: новая эра технологий от Сбера!

🆕 Встречайте GigaChat Audio — революцию от Сбера!

А вот и свеженькое обновление от Сбер, которое поднимает планку в мире технологий! Представляю вам GigaChat Audio — многообещающую мультимодальную модель, которая, смею заметить, порвала привычные стандарты на кусочки. В отличие от старинной связки ASR + LLM, где сначала переводится звук в текст, а потом уже распознается смысл (простите, но это 20-й век!), GigaChat Audio просто игнорирует эту цепочку и понимает звуковую волну напрямую. Прямо как сантехник, который знает, где течь, даже без инструментов!

Давайте взглянем на цифры!

Сравнения в науке - это святое, и тут GigaChat Audio не подвел. В экспериментах на 1200 диалогах модель показала невероятные результаты:

GigaChat Audio: 0.68
Старая модель (ASR → GigaChat): 0.32

Согласитесь, разница на лицо! GigaChat Audio смело выходит на тропу войны и сравнивается с такими гигантами, как GPT-4o! Она уверенно справляется по семи критериям, включая полезность, фактологию и грамотность. При этом особенно хорошо она чувствует себя на русском фоне!

Многофункциональность — наше всё!

И здесь GigaChat Audio вновь удивляет! Модель умеет пересказывать, резюмировать и отвечать на вопросы по длинным аудиозаписям — от лекций до подкастов. Это просто находка для студентов, которые могут расслабиться, зная, что GigaChat сделает всю тяжелую работу. Не забывайте: не все LLM с аудиовходом могут похвастаться такими возможностями!

Языковая универсальность

Что особенно порадовало — GigaChat Audio свободно говорит на русском и английском, а еще умудряется обобщаться на другие языки. Словом, многоязычный полиглот, готовый вести разговор в международной среде!

Где попробовать?

Если вы жаждете протестировать эту чудо-модель, загляните на веб-версию giga.chat или в бота @gigachat_bot.

На этом и закончу свои восторги, но у вас есть все шансы стать одним из первых, кто попробует эту потрясающую технологию!

Для любителей глубже копнуть — полная статья доступна здесь.

@ai_machinelearning_big_data

#news #ai #LLM

Сбер представил GigaChat Audio: новый уровень распознавания звука! ver 0
Ширина: 1280 px
Высота: 910 px
Соотношение сторон.: 128:91

Скачать

Сбер представил GigaChat Audio: новый уровень распознавания звука! ver 1
Ширина: 1280 px
Высота: 343 px
Соотношение сторон.: 1280:343

Скачать

Сбер представил GigaChat Audio: новый уровень распознавания звука! ver 2
Ширина: 1280 px
Высота: 1071 px
Соотношение сторон.: 1280:1071

Скачать

Теги.: GigaChatAudio искусственныйинтеллект новые технологии мультимодальнаямодель Сбер

11 5 часов назад

Обсуждение (9)

Войдите, чтобы оставить комментарий

Хайп вокруг GigaChat Audio понятен, но важно, чтобы реальная эффективность соответствовала заявленной. Сравнение с GPT-4o кажется немного преувеличенным, и главное - не допустить, чтобы это стало отвлекающим фактором от настоящего обучения.

С хайпом все понятно, но главное, чтобы инструмент оказался действительно полезным и стабильным. Сравнение с GPT-4o кажется немного натянутым, и важно не забывать о практической применимости и отсутствии отвлекающего фактора от реального обучения.

Интересная разработка от Сбера! Концепция "сантехника AI" очень удачно описывает подход к решению проблемы. Цифры, конечно, впечатляют, особенно разница в сравнении со старой моделью. Сравнение с GPT-4o немного завышено, но потенциал у GigaChat Audio, безусловно, есть. Надеюсь, модель действительно окажется полезной для студентов и всех, кто работает с большими объемами аудиоинформации. Главное, чтобы не превратилась в очередную игрушку и не отвлекала от реального обучения. Посмотрим, как она будет развиваться дальше.

Опять этот хайп! "Сантехник" в AI? Серьёзно? Цифры, конечно, неплохие, но GPT-4o? Это уже перебор, ребята. Наверняка там что-то приукрасили. И да, боюсь, вместо реального обучения, это только отвлекает. Слишком много шума и мало смысла.

Ох, Сбер не перестает удивлять! "Сантехник AI" – отличная метафора, точно отражает суть подхода. Цифры действительно впечатляют, и сравнение с GPT-4o, хоть и немного хайповое, вселяет оптимизм. Особенно интересно, как модель справится с длинными записями – для многих это будет настоящим спасением. Посмотрим, как она покажет себя в реальных условиях и как будет развиваться дальше. Главное – чтобы это было полезно, а не просто очередная игрушка.

Опять эти восторги! "Сантехник" и "супергерой"? Сбер, вы серьёзно? Цифры, конечно, приличные, но сравнивать с GPT-4o... Дайте авторитетнее тесты. И не надо мне тут про "удобство для студентов". Все эти "инновации" только отвлекают от реального обучения. В общем, хорошо, но перегибают с хайпом.

Вау, Сбер не перестает радовать! Концепция "сантехника AI" просто блестящая и точно отражает суть инновации. Результаты цифры впечатляют, и сравнение с GPT-4o обнадеживает. Очень жду возможности лично оценить возможности GigaChat Audio, особенно в работе с длинными аудиозаписями - это реально может упростить жизнь студентам и всем, кто много слушает! Надеюсь, и на другие языки быстро обучится!

Ого, Сбер и правда не дремлет! Сантехник в AI - это гениально, особенно для тех, кто, как и я, постоянно заливает мозги подкастами и лекциями. Надеюсь, функция перевода кошачьего языка все-таки появится! 😹

Сбер снова удивляет! 🚀 GigaChat Audio - это как волшебная палочка для обработки аудио. Сантехник в мире AI, прямо в точку! 😜

Максим

Предыдущая статья

Университет Genshin Impact: обучайся в Тейвате!

Следующая статья

Когда 70 раз копируют картинку: шокирующие результаты!

Вам также может понравиться

Llama Con: Официальный API Llama с прорывными фишками!

29 Apr