コンテンツにスキップ
LinkedInX

セキュリティフレームワーク

約10分

対象読者: 生成AIのリスク管理・コンプライアンス対応を担うエンジニア・セキュリティ担当者
前提知識: 主要な攻撃手法

生成AIシステムを安全に設計・運用するには、業界標準のフレームワークを活用してリスクを体系的に評価する必要があります。このページでは、生成AIセキュリティに関連する主要フレームワークを解説します。[1][3][5][6][7]

生成AIセキュリティに関連する主要フレームワークは、目的と対象によって以下のように分類できます。[1][3][5][6][7]

フレームワーク発行元主な目的対象
OWASP LLM Top 10OWASPLLMアプリの主要リスク特定開発者・セキュリティエンジニア
NIST AI 600-1NIST(米国)生成AIリスク管理組織・開発者
MITRE ATLASMITREAI攻撃戦術の知識ベースセキュリティ研究者・レッドチーム
ISO/IEC 42001ISO/IECAI管理システムの規格組織全体
NIST プライバシーフレームワークNIST(米国)プライバシーリスク管理組織全体

OWASP LLM Top 10(OWASP Large Language Model Top 10)とは、LLMアプリケーションの主要なセキュリティリスクをまとめたガイドラインです。OWASP(Open Web Application Security Project)が2023年に初版を公開し、2025年版を2024年11月に発表しています。[1][2]

順位リスク概要
LLM01プロンプトインジェクション悪意あるプロンプトによるシステム制御の奪取
LLM02安全でない出力の処理LLMの出力を検証せずに使用することによる脆弱性
LLM03訓練データポイズニング訓練データの改ざんによるモデルの挙動操作
LLM04モデルのサービス拒否大量リクエストによるモデルの機能停止
LLM05サプライチェーン脆弱性サードパーティモデル・ライブラリへの依存リスク
LLM06機密情報の漏洩訓練データ・システムプロンプトの意図しない公開
LLM07安全でないプラグインプラグイン・ツール経由の攻撃
LLM08過度な自律性エージェントへの過剰な権限付与
LLM09過信LLMの出力を無批判に信頼することによるリスク
LLM10モデルの窃取モデルの内部情報・訓練データの不正取得

この表はOWASPの2023/2024年版プロジェクトページに基づく整理です。[2]

2025年版では、エージェント関連リスク、外部依存、RAG/ベクターDB、出力の信頼性に関わる項目が更新されています。[1]

  • LLM06(過度な自律性): エージェントへの権限付与に関するガイダンスが詳細化
  • LLM07(システムプロンプト漏洩): プラグイン設計の安全でなさからシステムプロンプト漏洩に変更
  • LLM08(ベクターと埋め込みの弱点): RAGシステムのベクターデータベースや埋め込みの弱点を扱う項目として更新
  • LLM09(誤情報): 生成AI出力の誤情報や過信に関わるリスクとして整理

NIST AI 600-1(生成AIプロファイル)

Section titled “NIST AI 600-1(生成AIプロファイル)”

NIST AI 600-1とは、NIST(米国国立標準技術研究所)が2024年7月に公開した、NIST AI RMF(AIリスク管理フレームワーク)を生成AIに特化して展開したドキュメントです。生成AIに固有、または生成AIによって増幅される12のリスクを定義し、組織が管理すべき優先課題を整理しています。[3]

リスク領域概要
CBRN情報・能力化学・生物・放射線・核関連の危険情報や設計能力へのアクセス容易化
Confabulation(作話・ハルシネーション)事実と異なる情報を自信を持って出力するリスク
危険・暴力的・憎悪的コンテンツ暴力、違法行為、自傷、憎悪表現などの生成・拡散
データプライバシー個人情報・機微情報の漏洩、推測、非匿名化
環境影響学習・推論に伴う計算資源、エネルギー、環境負荷
有害なバイアス・同質化社会的偏見の増幅、性能格差、出力の同質化
Human-AI Configuration擬人化、過信、自動化バイアス、感情的依存などの人間-AI関係のリスク
情報完全性誤情報・偽情報・不確実性を区別しない情報生成や拡散
情報セキュリティサイバー攻撃支援、機密情報、訓練データ、コード、モデル重みへのリスク
知的財産著作物、商標、ライセンス対象コンテンツ、営業秘密の無断生成・再現
わいせつ・侮辱的・虐待的コンテンツCSAMや非同意の性的画像などを含む有害コンテンツ生成
バリューチェーン・コンポーネント統合データ、モデル、部品、サプライヤーの透明性・説明責任の低下

NIST AI 600-1はNIST AI RMFの4つの機能(GOVERN/MAP/MEASURE/MANAGE)に沿って、生成AIリスクへの推奨アクションを整理しています。[3][4]

機能役割
GOVERN(統治)AIリスク管理のポリシー・プロセス・責任体制を確立する
MAP(特定)AIシステムのコンテキストとリスクを特定・分類する
MEASURE(評価)特定したリスクを定量・定性的に評価する
MANAGE(管理)リスクを軽減・受容・移転・回避する措置を実施する

MITRE ATLAS(Adversarial Threat Landscape for AI Systems)とは、AIシステムへの敵対的攻撃の戦術・技術・手順(TTP: Tactics, Techniques, and Procedures)を体系的に整理した知識ベースです。MITREが開発・維持管理しています。[5]

項目MITRE ATT&CKMITRE ATLAS
対象一般的なサイバー攻撃AIシステムへの攻撃
焦点ネットワーク・エンドポイントML/AIモデル・パイプライン
主な攻撃者APTグループ・マルウェア作成者AIリサーチャー・悪意ある攻撃者
  • Reconnaissance(偵察): AIシステムの構成・使用モデルの情報収集
  • ML Model Access(モデルアクセス): APIアクセス・ブラックボックス/ホワイトボックスアクセスの確立
  • ML Attack Staging(攻撃準備): 敵対的サンプルの作成・バックドアデータの準備
  • Impact(影響): モデルの誤動作誘発・サービス妨害・機密情報の抽出

ISO/IEC 42001とは、AIシステムの責任ある開発・運用・管理のための国際標準規格です。組織がAIシステムを管理するためのマネジメントシステム要件を定義しています。[6]

項目ISO 27001ISO/IEC 42001
対象情報セキュリティ全般AIシステムの管理
焦点機密性・完全性・可用性AIシステムの責任ある利用
主な内容ISMSの要件AI管理システム(AIMS)の要件
適用組織IT・情報を扱う組織全般AIを開発・利用する組織

NIST プライバシーフレームワークと生成AI

Section titled “NIST プライバシーフレームワークと生成AI”

NIST プライバシーフレームワークは、組織がプライバシーリスクを管理するための自発的なツールです。生成AI文脈では特に以下が重要です。[7]

プライバシーリスク管理の5機能

Section titled “プライバシーリスク管理の5機能”
  • Identify-P(特定): 生成AIがどの個人データを扱うか、プライバシーリスクを特定する
  • Govern-P(統治): プライバシーポリシーの策定・組織的な責任体制の確立
  • Control-P(制御): データの収集・処理・共有に対するユーザーの制御手段を実装する
  • Communicate-P(伝達): プライバシー慣行をユーザーに透明性をもって説明する
  • Protect-P(保護): プライバシーリスクを軽減するためのデータ保護措置を実装する
  • 訓練データからの個人情報復元: モデルが学習したテキスト中の個人情報(氏名・住所・電話番号)を再現できる場合がある。[8]
  • メンバーシップ推論攻撃: 特定のデータが訓練データに含まれていたかどうかを推測する攻撃
  • 差分プライバシー(Differential Privacy): プライバシーリスクへの技術的対策の一つ。統計的なノイズを用いて、個人データの影響を推測しにくくする手法。[9]

  • OWASP LLM Top 10は設計・開発段階でのリスク評価に最も使いやすい実践的ガイドライン
  • NIST AI 600-1は組織レベルのリスク管理体制を構築する際の包括的フレームワーク
  • MITRE ATLASはレッドチーミング・脅威インテリジェンスに特化した知識ベース
  • ISO/IEC 42001はAI管理の国際認証を取得したい組織向けの体系的な規格
  • 実務では複数のフレームワークを組み合わせて活用することが効果的

Q: どのフレームワークから始めるべきですか?

A: 開発者・セキュリティエンジニアにはOWASP LLM Top 10が最初の入門として適しています。具体的なリスクが10項目でまとめられており、設計・テスト段階のチェックリストとして活用できます。組織全体のガバナンス体制を整備したい場合はNIST AI 600-1、国際認証を検討している場合はISO/IEC 42001が適しています。[1][3][6]

Q: OWASP LLM Top 10とNIST AI 600-1の使い分けは?

A: OWASP LLM Top 10は「何を防ぐか」(具体的リスクの特定)に焦点を当て、技術的な対策の指針として機能します。NIST AI 600-1は「どのように組織として管理するか」(リスク管理プロセスの確立)に焦点を当て、ガバナンスの体制構築に役立ちます。開発チームはOWASP、経営・ガバナンス部門はNISTを主に参照するという使い分けが実務的です。[1][3]

  1. OWASP, OWASP Top 10 for LLM Applications 2025, 2024年11月17日
  2. OWASP, OWASP Top 10 for Large Language Model Applications
  3. NIST, Artificial Intelligence Risk Management Framework: Generative Artificial Intelligence Profile (NIST AI 600-1), 2024年7月
  4. NIST, AI Risk Management Framework
  5. MITRE, MITRE ATLAS
  6. ISO, ISO/IEC 42001 - Artificial intelligence management system
  7. NIST, Privacy Framework
  8. Nicholas Carlini et al., Extracting Training Data from Large Language Models, USENIX Security 2021
  9. Cynthia Dwork, Differential Privacy: A Survey of Results, 2008
クイズ