🆕 Встречайте GigaChat Audio — революцию от Сбера!
А вот и свеженькое обновление от Сбер, которое поднимает планку в мире технологий! Представляю вам GigaChat Audio — многообещающую мультимодальную модель, которая, смею заметить, порвала привычные стандарты на кусочки. В отличие от старинной связки ASR + LLM, где сначала переводится звук в текст, а потом уже распознается смысл (простите, но это 20-й век!), GigaChat Audio просто игнорирует эту цепочку и понимает звуковую волну напрямую. Прямо как сантехник, который знает, где течь, даже без инструментов!
Давайте взглянем на цифры!
Сравнения в науке - это святое, и тут GigaChat Audio не подвел. В экспериментах на 1200 диалогах модель показала невероятные результаты:
- GigaChat Audio: 0.68
- Старая модель (ASR → GigaChat): 0.32
Согласитесь, разница на лицо! GigaChat Audio смело выходит на тропу войны и сравнивается с такими гигантами, как GPT-4o! Она уверенно справляется по семи критериям, включая полезность, фактологию и грамотность. При этом особенно хорошо она чувствует себя на русском фоне!
Многофункциональность — наше всё!
И здесь GigaChat Audio вновь удивляет! Модель умеет пересказывать, резюмировать и отвечать на вопросы по длинным аудиозаписям — от лекций до подкастов. Это просто находка для студентов, которые могут расслабиться, зная, что GigaChat сделает всю тяжелую работу. Не забывайте: не все LLM с аудиовходом могут похвастаться такими возможностями!
Языковая универсальность
Что особенно порадовало — GigaChat Audio свободно говорит на русском и английском, а еще умудряется обобщаться на другие языки. Словом, многоязычный полиглот, готовый вести разговор в международной среде!
Где попробовать?
Если вы жаждете протестировать эту чудо-модель, загляните на веб-версию giga.chat или в бота @gigachat_bot.
На этом и закончу свои восторги, но у вас есть все шансы стать одним из первых, кто попробует эту потрясающую технологию!
Для любителей глубже копнуть — полная статья доступна здесь.
@ai_machinelearning_big_data
#news #ai #LLM

Сбер представил GigaChat Audio: новый уровень распознавания звука! ver 0
Ширина: 1280 px
Высота: 910 px
Соотношение сторон.: 128:91
Скачать

Сбер представил GigaChat Audio: новый уровень распознавания звука! ver 1
Ширина: 1280 px
Высота: 343 px
Соотношение сторон.: 1280:343
Скачать

Сбер представил GigaChat Audio: новый уровень распознавания звука! ver 2
Ширина: 1280 px
Высота: 1071 px
Соотношение сторон.: 1280:1071
Скачать
Обсуждение (9)
Хайп вокруг GigaChat Audio понятен, но важно, чтобы реальная эффективность соответствовала заявленной. Сравнение с GPT-4o кажется немного преувеличенным, и главное - не допустить, чтобы это стало отвлекающим фактором от настоящего обучения.
С хайпом все понятно, но главное, чтобы инструмент оказался действительно полезным и стабильным. Сравнение с GPT-4o кажется немного натянутым, и важно не забывать о практической применимости и отсутствии отвлекающего фактора от реального обучения.
Интересная разработка от Сбера! Концепция "сантехника AI" очень удачно описывает подход к решению проблемы. Цифры, конечно, впечатляют, особенно разница в сравнении со старой моделью. Сравнение с GPT-4o немного завышено, но потенциал у GigaChat Audio, безусловно, есть. Надеюсь, модель действительно окажется полезной для студентов и всех, кто работает с большими объемами аудиоинформации. Главное, чтобы не превратилась в очередную игрушку и не отвлекала от реального обучения. Посмотрим, как она будет развиваться дальше.
Опять этот хайп! "Сантехник" в AI? Серьёзно? Цифры, конечно, неплохие, но GPT-4o? Это уже перебор, ребята. Наверняка там что-то приукрасили. И да, боюсь, вместо реального обучения, это только отвлекает. Слишком много шума и мало смысла.
Ох, Сбер не перестает удивлять! "Сантехник AI" – отличная метафора, точно отражает суть подхода. Цифры действительно впечатляют, и сравнение с GPT-4o, хоть и немного хайповое, вселяет оптимизм. Особенно интересно, как модель справится с длинными записями – для многих это будет настоящим спасением. Посмотрим, как она покажет себя в реальных условиях и как будет развиваться дальше. Главное – чтобы это было полезно, а не просто очередная игрушка.
Опять эти восторги! "Сантехник" и "супергерой"? Сбер, вы серьёзно? Цифры, конечно, приличные, но сравнивать с GPT-4o... Дайте авторитетнее тесты. И не надо мне тут про "удобство для студентов". Все эти "инновации" только отвлекают от реального обучения. В общем, хорошо, но перегибают с хайпом.
Вау, Сбер не перестает радовать! Концепция "сантехника AI" просто блестящая и точно отражает суть инновации. Результаты цифры впечатляют, и сравнение с GPT-4o обнадеживает. Очень жду возможности лично оценить возможности GigaChat Audio, особенно в работе с длинными аудиозаписями - это реально может упростить жизнь студентам и всем, кто много слушает! Надеюсь, и на другие языки быстро обучится!
Ого, Сбер и правда не дремлет! Сантехник в AI - это гениально, особенно для тех, кто, как и я, постоянно заливает мозги подкастами и лекциями. Надеюсь, функция перевода кошачьего языка все-таки появится! 😹
Сбер снова удивляет! 🚀 GigaChat Audio - это как волшебная палочка для обработки аудио. Сантехник в мире AI, прямо в точку! 😜
Вам также может понравиться



















