プロンプトインジェクション攻撃に対する多層防御戦略
Googleは、Geminiと呼ばれるAIモデルに対するプロンプトインジェクション攻撃を軽減するための新しい防御戦略について詳しく共有しました。
この攻撃は、悪意ある指示を用いてユーザーデータを不正に取得したり、他の不正行動を実行したりするものです。今回のアップデートでは、Gemini 2.5モデルでの強化トレーニングを通じて、敵対的なデータに対する防御能力が向上しています。
具体的には、プロンプトインジェクションコンテンツを分類するためのモデルや、セキュリティに対する考えを強化する手法、マークダウンの安全化処理、疑わしいURLの削除、ユーザー確認フレームワーク、エンドユーザー向けのセキュリティ対策通知など、多層的な防御が採用されています。
これにより、Geminiを利用する際の安全性が全体として向上し、様々な攻撃手法に対する防御が強化されました。この新しいセキュリティ機能は、すべてのGoogle Workspaceのユーザーと個人のGoogleアカウントに対して利用可能となっています。
今後も、Google WorkspaceとGeminiは悪意あるコンテンツやプロンプトインジェクションからユーザーを守るための取り組みを続けていきます。
詳しくは、Googleのオンラインセキュリティブログ「Mitigating prompt injection attacks with a layered defense strategy」でご確認ください。