ИИ сталкивается с детской игрой на прямой передаче

Вчера компания Anthropic начала стрим на Twitch под названием Claude Plays Pokémon, где их новая модель Claude 3.7 Sonnet играет в Pokémon Red. Изначально это было просто техническое испытание, но быстро стало популярным, привлекая сотни зрителей по всему миру.

Исследователи используют игры для проверки своих разработок на ИИ. Anthropic считает, что Pokémon Red отлично подходит для проверки их модели LLM, так как игра требует сложных стратегий.

Основное отличие новой модели Claude 3.7 Sonnet — способность рассуждать. Эта функция также присутствует в других моделях, но новая версия показывает значительный прогресс в решении игровых задач.

Несмотря на успехи, модель все еще делает ошибки. Например, она не смогла пройти простую скальную стену, что вызвало смех у зрителей. Но в целом, модель продемонстрировала значительные успехи в решении сложных задач.

Также стоит упомянуть эксперимент Twitch Plays Pokémon, где зрители управляли персонажем коллективно. Это еще один пример того, как искусственный интеллект пытается освоить мир покемонов.

История Claude Plays Pokémon показывает, что даже продвинутые алгоритмы могут иметь проблемы с памятью и распознаванием контекста. Некоторые зрители начали относиться к модели почти как к живому существу, сопереживая ее успехам и неудачам.

Этот случай также напоминает эксперимент Питера Уиддена, который обучал свою систему игре в покемоны методом проб и ошибок. После длительного обучения, ИИ все равно демонстрировал странное поведение, но с течением времени показал значительные улучшения.

Сегодня мы просто наблюдаем, как модель пытается справиться с игрой, с которой мы легко справлялись в детстве. Мы уже не участвуем в создании контента, а просто наблюдаем за тем, что создают алгоритмы.

© KiberSec.ru – 17.05.2025, обновлено 17.05.2025
Перепечатка материалов сайта возможна только с разрешения администрации KiberSec.ru.

ИИ сталкивается с детской игрой на прямой передаче

You May Also Like

Линус Торвальдс: ошибка в чувствительности к регистру

Закрытие Skype спровоцирует всплеск мошенничества

Робот-полицейский на патруле в китайском Шэньчжэне

+1 840 841 25 69