Skip to content Skip to sidebar Skip to footer

Битва за $6: уроки из эксперимента S1

Недавняя работа, которая была опубликована в пятницу, привлекла внимание сообщества искусственного интеллекта. Она не так удивила своей моделью, сколько показала, насколько близко мы к большим прорывам. Алгоритм, представленный в работе, может работать на обычном ноутбуке, хотя не превосходит передовые решения. Главное открытие заключается в том, что механизмы работы ИИ оказались не такими уж сложными.

Команда OpenAI впервые описала, как увеличить время размышления модели перед тем, как она даст ответ. Они использовали специальные теги для размышлений. Когда модель достигала закрывающего тега, её тон менялся на уверенный, и она выдавала ответ. Интересно, что разработчики S1 нашли способ заставить модель думать дольше, заменяя закрывающий тег на слово Wait. Этот трюк оказался простым и эффективным способом управлять временем размышлений.

Модель S1 обучалась всего за $6, так как использовался минимальный объём данных. Исходный датасет из 56 000 примеров был уменьшен до 1 000 наиболее информативных, что позволило достичь производительности на уровне OpenAI o1-preview. Модель обучалась всего 26 минут на 16 GPU H100, что позволило провести множество экспериментов.

Эти недорогие эксперименты ускоряют развитие искусственного интеллекта, делая исследования доступными для всех. Они также поднимают вопрос о роли крупных компаний, тратящих миллиарды на суперкомпьютеры. Также обсуждается проблема нелегального копирования данных в ИИ.

Работа S1 показывает, что прорывы в искусственном интеллекте происходят не только из-за масштабных вычислений, но и благодаря дешёвым, но продуманным экспериментам. Также она подтверждает, что традиционные методы обучения могут быть так же эффективны, как методы обучения с подкреплением.

В 2025 году нас ждут важные открытия в области искусственного интеллекта. Уже сейчас видно, что мы стоим на пороге новых открытий.