Битва за $6: уроки из эксперимента S1

Недавняя работа, которая была опубликована в пятницу, привлекла внимание сообщества искусственного интеллекта. Она не так удивила своей моделью, сколько показала, насколько близко мы к большим прорывам. Алгоритм, представленный в работе, может работать на обычном ноутбуке, хотя не превосходит передовые решения. Главное открытие заключается в том, что механизмы работы ИИ оказались не такими уж сложными.

Команда OpenAI впервые описала, как увеличить время размышления модели перед тем, как она даст ответ. Они использовали специальные теги … для размышлений. Когда модель достигала закрывающего тега, её тон менялся на уверенный, и она выдавала ответ. Интересно, что разработчики S1 нашли способ заставить модель думать дольше, заменяя закрывающий тег на слово Wait. Этот трюк оказался простым и эффективным способом управлять временем размышлений.

Модель S1 обучалась всего за $6, так как использовался минимальный объём данных. Исходный датасет из 56 000 примеров был уменьшен до 1 000 наиболее информативных, что позволило достичь производительности на уровне OpenAI o1-preview. Модель обучалась всего 26 минут на 16 GPU H100, что позволило провести множество экспериментов.

Эти недорогие эксперименты ускоряют развитие искусственного интеллекта, делая исследования доступными для всех. Они также поднимают вопрос о роли крупных компаний, тратящих миллиарды на суперкомпьютеры. Также обсуждается проблема нелегального копирования данных в ИИ.

Работа S1 показывает, что прорывы в искусственном интеллекте происходят не только из-за масштабных вычислений, но и благодаря дешёвым, но продуманным экспериментам. Также она подтверждает, что традиционные методы обучения могут быть так же эффективны, как методы обучения с подкреплением.

В 2025 году нас ждут важные открытия в области искусственного интеллекта. Уже сейчас видно, что мы стоим на пороге новых открытий.

Битва за $6: уроки из эксперимента S1

You May Also Like

Лидер Black Basta сбежал из зала суда

Каждый второй россиянин под угрозой дипфейковых атак

Новые открытия: кот Шредингера в квантовом вращении

+1 840 841 25 69