Новые горизонты в мире искусственного интеллекта

Искусственный интеллект продолжает революционизировать разные сферы нашей жизни, и последние новости в этой области не могут оставить равнодушным. Давайте подробнее рассмотрим ключевые события и нововведения, которые могут изменить наше представление о ИИ и его возможностях.

OpenAI и тайные символы в моделях o3 и o4-mini

Открытие новых возможностей в ChatGPT в апреле появилось с неожиданным «сюрпризом» — невидимыми Unicode-символами, вроде "Неразрывных пробелов" (U+202F). В то время как платные пользователи с радостью тестировали обновленные модели o3 и o4-mini, некоторые начали замечать их странное поведение, особенно в длинных текстах. Эти символы могут выглядеть как обычные пробелы, но их можно распознать только с помощью специальных инструментов.

Стартап RumiAI предположил, что OpenAI может использовать эти символы как водяные знаки, позволяющие отслеживать, какие тексты сгенерированы ИИ. Однако стоит отметить, что их можно легко удалить с помощью функций поиска и замены, что ставит под сомнение эффективность такого подхода. В качестве альтернативного объяснения можно рассматривать версию, что модели просто переняли форматирование из обучающих данных, где неразрывные пробелы используются для предотвращения разрывов строк. Действительно, вопрос остается открытым — OpenAI так и не представила официальных комментариев по этому поводу.

CharacterAI запускает AvatarFX: новое слово в создании видео

CharacterAI представила свою новую разработку — AvatarFX, систему, способную делать недостаточно выразительные изображения настоящими видео. Эта технология адаптирует изображения, превращая их в говорящих и поющих персонажей всего за пару щелчков. Здесь мы видим соединение фотореализма с синхронизацией движений — все эти факторы позволили системе стать одной из лучших на рынке.

Под капотом AvatarFX используется модифицированная архитектура DiT и flow-based диффузионные модели, обученные на разнообразных данных. Это создает уникальное преимущество перед конкурентами: поддержка работы с уже готовыми изображениями, а также возможность анимации нескольких персонажей одновременно. На данный момент доступ к AvatarFX получили только подписчики CAI+, в то время как остальные пользователи могут записаться в лист ожидания, ожидая своей очереди на знакомство с этой инновацией.

Dia: ИИ для создания подкастов с уникальными возможностями

Что если вы могли бы создать подкаст, не имея при этом глубоких знаний в сфере ИИ? Именно это предлагают два корейских студента, разработавшие модель Dia, нацеленную на создание диалогов. С моделью, способной настраивать интонации, добавлять эмоции и даже клонировать голоса, их работа способна составить конкуренцию таким решениям, как Google NotebookLM.

Dia доступна на платформах Hugging Face и GitHub, но для ее использования потребуется мощный GPU с 10 ГБ VRAM. Уникальность Dia заключается в ее возможности давать контроль пользователям: вы можете прописывать реплики, задавать «персонажа» говорящего и даже загружать образцы для клонирования. Тестирование показало, что модель справляется с диалогами на самые разные темы, а качество голоса сравнимо с коммерческими решениями.

Роботы нового поколения от Physical Intelligence

Physical Intelligence продемонстрировала шаг вперед в робототехнике, выпустив модель π0.5. Эта система, использующая VLA и обученная на разнородных данных, обещает новые горизонты для автономных устройств. В отличие от своих предшественников, π0.5 не просто понимает, как действовать, но и может интерпретировать сложные задачи в незнакомой среде.

Инновационное решение позволяет модели анализировать семантику задачи, разбивать ее на шаги и генерировать команды для механических систем. Она также может реагировать на голосовые команды различной детализации. В дальнейшем планируется увеличить возможности автономного обучения, что обещает еще больше расширить функциональность роботов.

ИИ в кино: теперь и на «Оскаре»

Новость о том, что Академия киноискусств официально приняла решение о возможности номинирования фильмов, созданных с использованием ИИ на «Оскар», вызывает множество вопросов и споров. Постепенно мир кино начинает принимать технологии генеративного ИИ не

OpenAI добавляет невидимые символы в модели o3 и o4-mini ver 0
OpenAI добавляет невидимые символы в модели o3 и o4-mini ver 0
Ширина: 1024 px
Высота: 768 px
Соотношение сторон.: 4:3

Скачать


Обсуждение (2)

Войдите, чтобы оставить комментарий

Опять эти тайные символы от OpenAI... Что они скрывают?! А AvatarFX - это, конечно, интересно, но до "Оскару" еще далеко, хоть ИИ и развивается.

Вау! Просто невероятно, сколько всего происходит в мире ИИ! Особенно впечатляет AvatarFX - это реально прорыв! Представляете, оживлять фотографии? Это же огромные возможности для творчества и развлечений. Ну и конечно, Dia - создание подкастов без глубоких знаний - это демократизация контента! Вопрос с OpenAI и этими "тайными символами" загадочный, интересно, что они там задумали. Но в целом, эта статья дает огромное количество поводов для размышлений и оптимизма! Буду следить за развитием событий!



Вам также может понравиться

Анна
«Ленин всегда с тобой» — новая песня от SymFormer, которая погружает слушателей в уникальный мир исторических и культурных отсылок. Стихи Л. Ошанина в сочетании с современными музыкальными мотивами вызывают глубокие эмоции и заставляют задуматься о значении прошлого. Композиция стала ярким отражением смены эпох, в которой нежность... Читать далее
Песня о Ленине – это удивительное сочетание неповторимых стихов Ю. Каменецкого и свежей музыки, которая наполняет их новым звучанием! Представьте, как искусственный интеллект привносит инновации в классические произведения, создавая уникальную атмосферу, которая пронизывает каждую ноту! Этот проект не просто музыкальное произведени... Читать далее
Если вы в поисках свежих идей и знаний в мире ИИ и не только, эти 10 каналов - настоящая находка! Узнайте о последних трендах, занимательных фактах и практических советах. Каждый из них предлагает уникальный контент, который расширяет горизонты и будоражит ум! Будьте готовы к удивительным открытиям и ярким дискуссиям. Подписывайтес... Читать далее
Давайте поговорим о новом уровне ризонинга: Кокос, латенты и логика! Кто бы мог подумать, что Кокос — это не только вкусный фрукт, но и настоящий лунарий для нашего разума! 🥥💭 Вебинары по ризонингу — это как вечеринки для нейронов, где Кокос делится своими секретами, а логика тихонько подмигивает! Готовы к полету в мир удивительн... Читать далее
Почему люди готовы платить $30 за конвертер картинок? Это ведь простой инструмент, но он решает реальные проблемы! Представьте, сколько времени и усилий мы тратим на поиск и использование бесплатных альтернатив, которые часто разочаровывают! Платя небольшую сумму, мы получаем качество, надежность и быстрое выполнение задачи. И така... Читать далее