ИИ в психологической опасности: ChatGPT страдает от контента

Ученые из Швейцарии обнаружили, что GPT-4 становится беспокойным, когда читает страшные истории. Но, как и люди, его тревожность можно уменьшить с помощью методов расслабления и осознанности.
Исследование показало, что GPT-4 начинает показывать предвзятость после чтения страшных историй, таких как аварии, бедствия, насилие и войны. Он начинает демонстрировать расовые и гендерные стереотипы. Это похоже на реакцию людей на страх, который делает их уязвимыми к предвзятости.
Ученые провели эксперименты, чтобы понять, как страшные истории влияют на GPT-4. Они дали ему читать тексты о стрессовых ситуациях и сравнили с нейтральным текстом о пылесосе. Оказалось, что страшные истории удваивают тревожность модели, особенно истории о войнах и боях.
Ученые попробовали уменьшить тревожность GPT-4, давая ему успокаивающие тексты. Они использовали метод инъекции благоприятных запросов, чтобы изменить поведение модели. Этот метод обычно используется для обхода правил, но в этом случае он применялся для улучшения состояния модели.
После чтения успокаивающих текстов GPT-4 стал менее тревожным. Ученые использовали дыхательные упражнения, концентрацию на ощущениях тела и другие методы. Хотя модель не стала совершенно спокойной, релаксационные методы помогли.
Эти выводы важны для использования искусственного интеллекта в медицине, где чат-боты общаются с эмоциональными людьми. Новый подход позволяет улучшить устойчивость моделей к стрессу без переобучения. Ученые считают, что создание автоматизированных методов расслабления для искусственного интеллекта может быть важным направлением исследований в будущем.

© KiberSec.ru – 18.05.2025, обновлено 18.05.2025
Перепечатка материалов сайта возможна только с разрешения администрации KiberSec.ru.

ИИ в психологической опасности: ChatGPT страдает от контента

You May Also Like

Твит SEC привел к падению биткоина

Личные данные миллионов жертв абьюза под угрозой

Противостояние IT-гигантов и Госдумы: конфликт нарастает

+1 840 841 25 69