プロンプトインジェクションの攻撃手口は、「直接的プロンプトインジェクション」と「間接的プロンプトインジェクション」の2つに大別されます。前者は攻撃者がAIに直接悪意ある命令を入力する手法、後者は外部データに不正な命令を仕込んでAIに間接的に読み込ませる手法です。
- 直接的プロンプトインジェクション
攻撃者がAIチャットボットなどの入力欄に直接悪意ある命令を入力し、AIを意図的に誤動作させる。 - 間接的プロンプトインジェクション
Webサイトやファイル、データベースなどの外部情報源に不正なプロンプトを仕込み、AIが参照した際に攻撃が実行される。
いずれの手口もAIの動作ルールを迂回して機密情報の漏洩や有害コンテンツの生成を引き起こすため、両方の攻撃手法を理解したうえでの対策が求められます。
各手口の詳細についは「プロンプトインジェクションの攻撃手口」をご覧ください。
