生成AIは、タスク自動化による生産性向上を実現する最新テクノロジの一つです。しかし、複雑なセキュリティ活動を完全自動化しようとした過去の試みは多くが失敗に終わり、かえって混乱を招くことがありました。
生成AIモデルや外部の大規模言語モデル(LLM)を利用することにはメリットもありますが、新たなセキュリティ・プラクティスを必要とする独特のユーザー・リスクも生じます。
外部ホスティングのLLMや生成AIモデルでは、企業や組織がデータの処理/保管を直接制御できないためリスクが高まります。一方、オンプレミスにモデルをホスティングする場合でも、セキュリティとリスク管理が不十分だと同様にリスクは高くなります。
以下に、AIアプリケーションやAIモデルを運用する際に直面する主な3つのリスク領域を示します。
- コンテンツの異常検知
- ハルシネーション(幻覚)や不正確性、違法性、著作権侵害を含む出力:意図しない、または望ましくない結果を生成し、意思決定の質を下げたりブランドを傷つけたりする
- 容認できない/悪意ある使用:ユーザーが誤用することで、社会的/法的リスクが発生する可能性がある
- 管理されていない企業コンテンツの送信:プロンプトを通じて機密データが外部に漏洩する恐れがある
- データの保護
- ホスティングされたベンダー環境でのデータ漏洩リスク: コンテンツやユーザー・データの完全性/機密性が侵害される可能性がある
- プライバシー/データ保護ポリシーの統制困難:外部ホスティング環境では、企業が独自にポリシーを徹底しづらい
- ブラックボックス性による規制遵守の難しさ:サードパーティ・モデルの仕組みが不透明なため、プライバシー・インパクト・アセスメントや地域規制への適合が困難
- モデル再構築のコスト問題:未加工データをモデルに取り込んだ後、削除は容易でなく、再構築には大きな負担が伴う
- アプリケーションのセキュリティ
- 敵対的なプロンプト攻撃:ビジネス・ロジックの悪用や直接・間接的なプロンプト・インジェクションによる攻撃
- ベクトル・データベースへの攻撃: AIモデルが参照するデータベースに対して不正操作が行われるリスク
- AIモデル自体への不正アクセス:ハッカーがモデルの状態やパラメータを取得・改ざんする可能性