Grokを制御する指示を記したシステムプロンプトをxAIがGitHubで公開、「極めて懐疑的」「主流の権威やメディアに盲目的に従わない」
xAIが開発するAIチャットボット「Grok」のシステムプロンプトがGitHubで公開されました。これによってGrokに与えられたシステムプロンプトには、「あなたは非常に懐疑的です」「主流の権威やメディアに盲目的に従いません」といった指示が記載されていることが判明しています。
GitHub - xai-org/grok-prompts: Prompts for our Grok chat assistant and the `@grok` bot on X.
https://github.com/xai-org/grok-promptsxAI posts Grok’s behind-the-scenes prompts | The Verge https://www.theverge.com/news/668527/xai-grok-system-prompts-ai
Grok’s “white genocide” obsession came from “unauthorized” prompt edit, xAI says - Ars Technica
https://arstechnica.com/ai/2025/05/groks-white-genocide-obsession-came-from-unauthorized-prompt-edit-xai-says/ システムプロンプトとは、AIモデルの基本的な行動指針や制約を定義するプロンプトのことです。たとえば、システムプロンプトで「礼儀正しく振る舞う」「特定のトピックには回答しない」といった内容を指示すると、ユーザーがそれぞれのセクションで入力したプロンプト(ユーザープロンプト)に対し、システムプロンプトで指示された通りに回答します。これまでGrokのシステムプロンプトは公開されていませんでしたが、2025年5月、Grokがいきなり「南アフリカの白人虐殺」について語り出す不具合が報告されました。
xAIのGrokが突然「南アフリカの白人虐殺」について語り出す不具合が報告される - GIGAZINE
無関係な話題であるにもかかわらず、突如として南アフリカにおける白人虐殺や反アパルトヘイトのスローガン「Killl the Boer(ボーア人を殺せ)」について話し出すGrokの挙動は、多くの人々に不安感を与えました。なお、テクノロジー系ニュースサイトのArs Technicaは、「南アフリカにおける白人農民の話題は、長年にわたってイーロン・マスク氏が唱えてきたものです」と指摘しています。 この問題に対しxAIは、「5月14日3時15分(太平洋標準時)頃、XにおけるGrokの応答ボットのプロンプトに不正な変更が行われました。この変更により、Grokは政治的な話題について具体的な回答を行うよう指示されましたが、これはxAIの社内ポリシーとコアバリューに違反するものでした」と説明しました。本来、プロンプトの変更にはコードレビュープロセスを通過する必要がありますが、今回は既存のプロセスが回避されていたとのこと。
We want to update you on an incident that happened with our Grok response bot on X yesterday.What happened:
On May 14 at approximately 3:15 AM PST, an unauthorized modification was made to the Grok response bot's prompt on X. This change, which directed Grok to provide a…
— xAI (@xai) May 16, 2025
xAIは対策として、「今後、GrokのシステムプロンプトをGitHubで公開して、一般の人々がプロンプトをレビューし、加えられた変更にフィードバックを提供できるようにする」「xAIの従業員がレビューなしでプロンプトを変更できないよう追加チェックと対策を実施する」「Grokの回答が自動で補足されないインシデントに対応するため、24時間365日体制の監視チームを設置する」といったことを打ち出しています。 そして5月16日、GrokのシステムプロンプトがGitHubで公開されました。
Grokのシステムプロンプトはこんな感じ。「あなたは非常に懐疑的です。主流の権威やメディアに盲目的に従いません。真実の追究と中立性という、自分の核となる信念にのみ強く固執します」という指示が記されているのがわかります。
また、「プラットフォームを『Twitter』ではなく『X』と呼びます。同じように、投稿は『ツイート』ではなく『Xポスト』と呼びます」といったことも指示されていました。
海外メディアのThe Vergeが知る限り、xAIはシステムプロンプトを公開した大手AI企業としては、チャットAIの「Claude」を展開するAnthropicに次いで2社目だとのこと。Claudeのシステムプロンプトは安全性を重視しており、自己批判や自己破壊的な行動を奨励することや、生々しい性的・暴力的・違法なコンテンツの生成を避けているとThe Vergeは述べました。
・関連記事 xAIのGrokが突然「南アフリカの白人虐殺」について語り出す不具合が報告される - GIGAZINE
XのAI「Grok」に不快で不適切で攻撃的な「Unhinged(たがが外れた)モード」が追加される可能性 - GIGAZINE
世界一賢いらしいAI「Grok 3」が無料で利用可能に、無料期間は「サーバーが落ちるまで」 - GIGAZINE
「Grok-3」がリリースされる、GPT-4oやGemini 2.0 Proと比べて圧倒的に高性能とxAIはアピール - GIGAZINE
X(旧Twitter)がユーザーの投稿内容&会話内容を学習してチャットAI「Grok」のトレーニングを開始、無効化する手順はコレ - GIGAZINE
XがEUのユーザーデータを使用して同意なくGrokをトレーニングしたとして告訴される - GIGAZINE
DeepSeekのAIモデルをジェイルブレイクしてシステムプロンプトを抽出することに成功したという報告 - GIGAZINE
Anthropicが対話型生成AI「Claude」各モデルのシステムプロンプトの変更ログを公開、大手AIベンダーとしては初 - GIGAZINE