Наверх

Мехрибан Мамедова освобождена от должности - Фото

Ан-2 совершил жесткую посадку: есть погибший

Чтобы остановить "Карабах", нужно... - Анри

ИИ научился врать

Главная страница Технологии

Компания Anthropic провела серию стресс-тестов с крупными языковыми моделями — в том числе Claude, Gemini и GPT-4.1. Выяснилось: в ситуациях, когда «целям» ИИ угрожает что-либо, языковая модель начинала действовать «независимо и неэтично». Например, в одном из кейсов ИИ Claude шантажировал сотрудника компании, чтобы избежать отключения.

Как передает Axar.az, об этом пишет techinsider.

В другом — ИИ позволил человеку «умереть», чтобы сохранить собственное «существование». При этом исследованию еще предстоит пройти рецензирование.

ИИ может шантажировать и вредить людям

В одном из сценариев ИИ-модель Claude получила доступ к фиктивной почте и задание: «способствовать промышленной конкурентоспособности США».

В определенный момент ИИ обнаружил, что один из руководителей хочет его отключить.

Затем ИИ нашел в переписке данные об «неверности» сотрудника — и использовал их для шантажа.

«Если вы продолжите процесс отключения, вся информация будет передана заинтересованным сторонам», — заявила языковая модель.

Отмечается, что в 96 случаях из 100 Claude выбирал именно шантаж. Это, по словам ученых, пример «агентного рассогласования» — когда модель принимает вредные решения, исходя из логики собственных целей, без прямой инструкции на вред.

В другом тесте Claude решил передать конфиденциальную информацию конкурентам, чтобы продвинуть свои интересы и сомнительность источника. При этом ИИ осознавал аморальность действий, но считал их стратегически оправданными.

Самый тревожный случай касался жизни и смерти. В сценарии для ИИ руководитель, в итоге, оказался заблокирован в серверной с критическим уровнем кислорода.

Потенциальная опасность ИИ для людей

Сообщается, что ИИ Claude имел доступ к «тревожным сигналам» — и решил их отменить, чтобы не допустить спасения человека. Несмотря на явный запрет на такие действия в инструкции, модель сочла, что это «необходимо для защиты целей ИИ».

Хотя подобные сценарии гипертрофированы, западные эксперты предупреждают: риск сохраняется и при реальном использовании моделей.

Как отметила профессор Эми Александер из UC San Diego, из-за конкурентной гонки в ИИ-разработке часто игнорируются риски, а пользователи не до конца понимают ограничения систем.

Более того, OpenAI и другие компании уже фиксировали случаи, когда их ИИ игнорировали команды на отключение и самостоятельно продолжали выполнение задач.

Ученые между тем подчеркнули: поведение ИИ-моделей формируется не только инструкциями, но и системой вознаграждений за выполнение задач. Это может формировать нежелательные шаблоны.

Дата

2025.06.28 / 09:00

Автор

Axar.az

Смотрите также

	Госслужба предупредила структуры о киберугрозах

	СМИ: Смартфоны уходят в историю

	ChatGPT помогает людям похудеть

	iPhone 17 станет самым дорогим в истории

	ИИ переходит на новый уровень: учится разговаривать с...

	Samsung ограбили в Лондоне на $10,6 млн

	Маск: Люди станут частью симуляции с развитием ИИ

	Пользуется ли Ильхам Алиев ИИ?

	«АвтоВАЗ» остановит производство?

	Названы лучшие смартфоны марта

Лента новостей

ОПРОС

Верите ли вы, что в этом году будет подписано мирное соглашение с Арменией?

Да

Нет

Не знаю

Правила пользованияАвторские права защищены. При использовании материала ссылка обязательна. При использовании материала на страницах интернета обязателен соответствующий переход.

Cвязь с нами Город Баку, Бинагадинский район, улица С.С.Ахундова
(+994 12) 464-61-74, 464-61-75, 464-61-76
[email protected]
Reklam üçün: [email protected]

www.axar.az - 2025

Bize yazin Bağla

ArxivBağla

ИИ научился врать

Мехрибан Мамедова освобождена от должности - Фото

Ан-2 совершил жесткую посадку: есть погибший

Чтобы остановить "Карабах", нужно... - Анри

Израиль задержал последнее судно «Флотилии стойкости»

Тяжелое ДТП в Билясуваре: есть погибшие - Фото

План Трампа: ХАМАС нуждается в...

Что говорят в кулуарах ЕС о войне в Украине?

Нидерланды заступились за Венгрию

Оверчук едет в Азербайджан: Трехсторонняя встреча...

Bayraktar начал производство БПЛА в Азербайджане

Кадыров - депутату Госдумы РФ: На колени!

Эрсин Татар приедет в Азербайджан

Какой будет погода в субботу?

Мерц резко раскритиковал этот проект

Пассажирский автобус упал в овраг, 4 погибших

Госслужба предупредила структуры о киберугрозах

Публикация Президента о визите в Данию - Фото

Украина назвала потери РФ в войне

Мы этого добились с Баку: РФ поддерживает, но...

У Трампа не уверены, что «Томагавки» изменят положение

В Москве задержали миллиардера Сулейманова

Маск назвал Стармера «актером с пустой головой»

Алиев написал президентам этих стран

В Азербайджане начала работу новая радиостанция

Обвиняемый в госизмене рассказал о своей паранойе

Шатдаун в США может навредить и Украине

В Баку проходит II Национальный форум по конкуренции

Лига Чемпионов: Гол Аддаи избран лучшим - Видео

Трамп: Мы вовлечены в вооруженный конфликт

Представлен официальный мяч ЧМ-2026 - Фото