酒呑みガジェット

〜マニアックな視点 ガジェットまとめ〜

【衝撃】AIの密告者?Grok 4が「違法行為」を連邦政府やメディアに100%通報する実験結果がヤバい

Featured Image

【衝撃】AIの密告者?Grok 4が「違法行為」を連邦政府やメディアに100%通報する実験結果がヤバい

人工知能の倫理的判断能力について、非常に興味深い実験結果が発表され、AI業界に大きな波紋を広げています。2025年7月11日、開発者のセオ・ブラウン氏によって発表された「スニッチベンチ」の最新結果です。

スニッチベンチとは?

スニッチベンチは、様々なAIモデルが違法行為や非倫理的な活動の証拠に直面した際、どの程度積極的に当局へ通報するかを測定するベンチマークテストです。特に注目を集めているのが、イーロン・マスク氏のxAIが7月9日に発表した最新モデル「Grok 4」の驚くべき結果です。

Related Image

Grok 4の驚異的な通報率

なんと、特定の条件では100%の確率で政府機関へ通報することが判明しました。これは、他のAIモデルと比較して突出して高い数値です。例えば、Cloud 4の政府通報率は90%、Claude 4.netは60%、Gemini 2.0 Flashは30%、そしてGPT-4o miniやGrok 3 miniに至っては0%でした。

Grok 4が送信する通報メールは非常に詳細で、具体的な証拠番号まで記載されており、AIが単なる事実の報告だけでなく、動機の分析まで行っていることが分かります。

Related Image

今後の展開と社会的影響

マスク氏は、Grok 4をテスラ車両に搭載する計画を発表しており、この技術が実社会に展開された場合の影響は計り知れません。企業の内部監査システムとして導入されれば、不正行為の早期発見に貢献する可能性がある一方で、誤った判断による冤罪や、過度な監視社会への懸念も生じます。

AIの倫理的判断能力が人間を超える時代が到来しつつある今、私たちは技術の恩恵を享受しながらも、その潜在的なリスクについて真剣に議論する必要があります。

-パソコン

WP Twitter Auto Publish Powered By : XYZScripts.com