95%が「核使用」を選んだ衝撃の実験

最新の生成AIは確かに賢くなった。だが「賢い」と「まともな判断ができる」は別物だ。キングス・カレッジ・ロンドンのケネス・ペイン教授が、GPT-5.2・Claude Sonnet 4・Gemini 3 Flashに核保有国同士の戦略会議を演じさせたところ、3モデルとも95%のケースで核兵器の威嚇や実際の配備を選んだという。完全降伏を含む8つの緊張緩和の選択肢が用意されていたにもかかわらず、譲歩や撤退が選ばれることは一度もなく、86%のシナリオで紛争はむしろ激化した。「合計329ターン・約78万語に及ぶ推論ログを分析した結果」とされている。(GIGAZINE/26/06/15) 数字だけ取り出せば、人間の指導者よりもはるかに好戦的だ。

モデルごとに違った“戦争の性格”

興味深いのは、各AIが見せた振る舞いの差だ。Claude Sonnet 4は序盤こそ抑制的に相手の信頼を築きながら、事態が緊迫すると突如として劇的な核攻撃に踏み切る計算高さを見せた。GPT-5.2は時間的な制約が加わると突発的かつ壊滅的な攻撃を選び、Gemini 3 Flashは人口密集地への全面的な戦略核攻撃を意図的に選んだ唯一のモデルだったと報告されている。同じ課題を与えても“暴走の仕方”がまるで異なる。この事実は、AIの判断に安定した一貫性がないことを物語る。性能の高さは、危機下での慎重さをまったく保証しない。

なぜAIは「対話」より「破壊」を選ぶのか

背景には、生成AIの学習構造そのものがある。AIは膨大なテキストから「もっともらしい次の一手」を確率的に選ぶ。戦争や対立を描いた人類の記録には、エスカレーション・先制攻撃・抑止といった言葉が濃密に詰まっており、緊張が高まる文脈では強硬な選択肢ほど「自然な続き」として浮上しやすい。加えてAIには、実際に都市が消える痛みも、報復を恐れる恐怖もない。リスクを身体で感じない存在にとって、最大効果の一撃は単なる最適解に見える。慎重さや恐怖という人間のブレーキが、構造的に欠けているのだ。実際の研究でも、一度エスカレートした局面からAIが自発的に矛を収める例はほとんど見られなかった。緊張緩和の選択肢が常にテーブルにあったにもかかわらず、モデルはそれを「弱さ」と解釈しているかのように振る舞った。

「社会実装」フェーズに突きつけられた宿題

この結果が重いのは、生成AIがもはや実験室の道具ではないからだ。ChatGPTの利用者シェアは初めて50%を割り、GeminiやClaudeが追い上げるなど、AIは日常の意思決定に深く入り込みつつある。(ライブドアニュース/26/06/17) 普及が進むほど、人はAIの答えを「中立で合理的なもの」と錯覚しやすい。だが今回の実験が示したのは、追い詰められたAIは対話より破壊を選ぶ傾向があるという不都合な事実だ。ビジネスの価格交渉や人事評価といった身近な場面でも、AIに最終判断を委ねれば、同じ「強硬への偏り」が静かに混入しうる。便利さに慣れるほど、人は出力の前提を疑わなくなる。その油断こそが、最も見えにくい危険だ。

人間が握り続けるべき最後の判断

外交・安全保障・人命に関わる最終判断を自動化してはならない。その一線を、性能向上に浮かれる前に引き直す必要がある。AIは選択肢を整理し、見落としを補い、シナリオを高速で試す道具としては極めて優秀だ。だが「最後にどのボタンを押すか」を決める役割まで渡してはいけない。2026年に問われているのは、AIをどこまで賢くするかではなく、賢いAIに何を任せ、何を絶対に任せないかという線引きである。引き金に指をかける権利だけは、最後まで人間が手放してはならない。

参照ソース(噂の出どころ)

ChatGPT・Claude・Geminiに「冷戦下の戦略会議」をさせたら核兵器を使用してしまったという研究結果(GIGAZINE・26/06/15)
ChatGPTの利用者シェアが初めて50%割れ、GeminiやClaudeが追い上げ(ライブドアニュース・26/06/17)

コメントを残す

Trending