Новые горизонты в мире искусственного интеллекта
Искусственный интеллект продолжает революционизировать разные сферы нашей жизни, и последние новости в этой области не могут оставить равнодушным. Давайте подробнее рассмотрим ключевые события и нововведения, которые могут изменить наше представление о ИИ и его возможностях.
OpenAI и тайные символы в моделях o3 и o4-mini
Открытие новых возможностей в ChatGPT в апреле появилось с неожиданным «сюрпризом» — невидимыми Unicode-символами, вроде "Неразрывных пробелов" (U+202F). В то время как платные пользователи с радостью тестировали обновленные модели o3 и o4-mini, некоторые начали замечать их странное поведение, особенно в длинных текстах. Эти символы могут выглядеть как обычные пробелы, но их можно распознать только с помощью специальных инструментов.
Стартап RumiAI предположил, что OpenAI может использовать эти символы как водяные знаки, позволяющие отслеживать, какие тексты сгенерированы ИИ. Однако стоит отметить, что их можно легко удалить с помощью функций поиска и замены, что ставит под сомнение эффективность такого подхода. В качестве альтернативного объяснения можно рассматривать версию, что модели просто переняли форматирование из обучающих данных, где неразрывные пробелы используются для предотвращения разрывов строк. Действительно, вопрос остается открытым — OpenAI так и не представила официальных комментариев по этому поводу.
CharacterAI запускает AvatarFX: новое слово в создании видео
CharacterAI представила свою новую разработку — AvatarFX, систему, способную делать недостаточно выразительные изображения настоящими видео. Эта технология адаптирует изображения, превращая их в говорящих и поющих персонажей всего за пару щелчков. Здесь мы видим соединение фотореализма с синхронизацией движений — все эти факторы позволили системе стать одной из лучших на рынке.
Под капотом AvatarFX используется модифицированная архитектура DiT и flow-based диффузионные модели, обученные на разнообразных данных. Это создает уникальное преимущество перед конкурентами: поддержка работы с уже готовыми изображениями, а также возможность анимации нескольких персонажей одновременно. На данный момент доступ к AvatarFX получили только подписчики CAI+, в то время как остальные пользователи могут записаться в лист ожидания, ожидая своей очереди на знакомство с этой инновацией.
Dia: ИИ для создания подкастов с уникальными возможностями
Что если вы могли бы создать подкаст, не имея при этом глубоких знаний в сфере ИИ? Именно это предлагают два корейских студента, разработавшие модель Dia, нацеленную на создание диалогов. С моделью, способной настраивать интонации, добавлять эмоции и даже клонировать голоса, их работа способна составить конкуренцию таким решениям, как Google NotebookLM.
Dia доступна на платформах Hugging Face и GitHub, но для ее использования потребуется мощный GPU с 10 ГБ VRAM. Уникальность Dia заключается в ее возможности давать контроль пользователям: вы можете прописывать реплики, задавать «персонажа» говорящего и даже загружать образцы для клонирования. Тестирование показало, что модель справляется с диалогами на самые разные темы, а качество голоса сравнимо с коммерческими решениями.
Роботы нового поколения от Physical Intelligence
Physical Intelligence продемонстрировала шаг вперед в робототехнике, выпустив модель π0.5. Эта система, использующая VLA и обученная на разнородных данных, обещает новые горизонты для автономных устройств. В отличие от своих предшественников, π0.5 не просто понимает, как действовать, но и может интерпретировать сложные задачи в незнакомой среде.
Инновационное решение позволяет модели анализировать семантику задачи, разбивать ее на шаги и генерировать команды для механических систем. Она также может реагировать на голосовые команды различной детализации. В дальнейшем планируется увеличить возможности автономного обучения, что обещает еще больше расширить функциональность роботов.
ИИ в кино: теперь и на «Оскаре»
Новость о том, что Академия киноискусств официально приняла решение о возможности номинирования фильмов, созданных с использованием ИИ на «Оскар», вызывает множество вопросов и споров. Постепенно мир кино начинает принимать технологии генеративного ИИ не

OpenAI добавляет невидимые символы в модели o3 и o4-mini ver 0
Ширина: 1024 px
Высота: 768 px
Соотношение сторон.: 4:3
Скачать
Обсуждение (2)
Опять эти тайные символы от OpenAI... Что они скрывают?! А AvatarFX - это, конечно, интересно, но до "Оскару" еще далеко, хоть ИИ и развивается.
Вау! Просто невероятно, сколько всего происходит в мире ИИ! Особенно впечатляет AvatarFX - это реально прорыв! Представляете, оживлять фотографии? Это же огромные возможности для творчества и развлечений. Ну и конечно, Dia - создание подкастов без глубоких знаний - это демократизация контента! Вопрос с OpenAI и этими "тайными символами" загадочный, интересно, что они там задумали. Но в целом, эта статья дает огромное количество поводов для размышлений и оптимизма! Буду следить за развитием событий!
Вам также может понравиться


















