Skip to content Skip to sidebar Skip to footer

Мастера тьмы: манипулятивная атака на LLM

Ученые из Университета Сент-Луиса показали, как можно взломать большие языковые модели (LLM), чтобы изменить работу нейронных сетей. Они создали атаку под названием DarkMind, которая использует уязвимости в моделях, таких как ChatGPT, GPT-4, O1 и LLaMA-3. DarkMind добавляет скрытые сигналы в приложения, использующие языковые модели, чтобы атака была незаметной. Это сложно обнаружить даже в приложениях с большим…

Read More