Factorio: Искусственный Интеллект в Новой Эпохе Игры

🏭 Factorio: Новая Эпоха для Искусственного Интеллекта

Итак, дорогие читатели, готовьтесь к новой эпохе, когда видеоигры становятся не только развлечениями, но и настоящими лабораториями для искусственного интеллекта! Factorio, эта игра, где вы собираете фабрики по производству ресурсов так, будто вам не терпится построить идеальную модель мира, привлекла к себе внимание исследователей в области ИИ. Да-да, не удивляйтесь! В игре измеряется способность языковых моделей (LLM) планировать, управлять ресурсами и крутить сложные производственные цепочки. Как будто это не похоже на будни настоящих заводских менеджеров!

Конечно, для этих научных экспериментов был разработан Factorio Learning Environment (FLE), в который входит два режима:

Lab-Play — где вас ждут 24 структурированные задачи.
Open Play — где агенты свободно блуждают по процедурно сгенерированным картам, пытаясь построить фабрику-мечты (представьте, как вы бродите по фартуку в надетых перчатках… в игре!).

Используя Python API, модели получают обратную связь через игровой сервер и получают оценки по производительности. За этим следят даже через виртуальные окна — не пропустите ни одной шахты!

В исследовании протестировали шесть языковых моделей, от Claude 3.5 Sonnet до GPT-4o. Но не обошлось и без курьезов — модели оказались в затруднении с пространственным мышлением и долгосрочным планированием. Чудеса, да и только! Стоит отметить, что Claude 3.5 Sonnet проявила себя наилучшим образом, справившись с 15 из 24 заданий. Видимо, этот ИИ не только красив, но и умен!

🇺🇸 Американцы и Искусственный Интеллект: Сложные Отношения

Теперь давайте затронем тему, которая заставляет задуматься и шептать "Как же так?" — американцы все чаще считают, что искусственный интеллект их превосходит! По исследованию, проведенному Университетом Элона, целых 49% респондентов уверены, что LLM умнее их. Но вот стоит задуматься — это ли не ловушка для нашего сознания?

И, как вы уже могли догадаться, женщины чаще воспринимают LLM как "значительно умнее" (30% против 20% среди мужчин). Ниже приведены несколько фактов, которые, скажу я вам, звучат дико:

Половина взрослых в США уже юзают языковые модели, причем a la mode ChatGPT занимает 72% от общего числа.
Большинство пользователей (51%) использует LLM для обучения и планирования, а для работы — всего 24%.

Конечно, нам не стоит забывать о легкой обратной стороне медали: 23% пользователей сталкивались с серьезными ошибками из-за галлюцинаций моделей, а 21% чувствует себя как минимум "под контролем". Все это перекликается с нашими надеждами и страхами по поводу будущего ИИ.

🧠 ReasonGraph: Откровения от Кембриджа

Смотрим дальше — ReasonGraph, этот новый инструмент от Кембриджского университета, как будто издалека хихикает над нашими усилиями! ReasonGraph — это опенсорсная веб-платформа для визуализации и анализа мысли LLM, которая, как вы уже поняли, поддерживает как последовательные, так и древовидные методы рассуждений.

Эта платформа легко интегрируется с основными провайдерами и более 50 языковыми моделями, что, согласитесь, звучит внушительно! Она помогает выявлять ошибки в логических процессах и улучшать разработку приложений на основе LLM. При этом точность доходит до практически 100% в извлечении и визуализации путей рассуждений. Друзья, это вам не шутки!

🔍 MEGA mini: Новый Взгляд на Архитектуру NPU

На конференции по твердотельным схемам (ISSCC) был представлен концепт MEGA.mini, своего рода универсальный процессор для генеративного ИИ. Эта злая кухня технологии пытается сделать так, чтобы оба типа ядер — "Mega" и "Mini" — работали на нас, как швейцары на VIP-в