株式会社renue
AI導入・DXの悩みをプロに相談してみませんか?
AIやDXに関する悩みがありましたら、お気軽にrenueの無料相談をご利用ください。 renueのAI支援実績、コンサルティングの方針や進め方をご紹介します。
製薬会社のCTDモジュール2をAIで自動生成する方法|ICH準拠のドラフト設計を解説
CTD(Common Technical Document)モジュール2は、新薬の承認申請書類のなかでも最も執筆負荷が高いセクションです。非臨床・臨床データを横断的に要約し、候補薬のベネフィット-リスク評価を包括的に記述する「概要文書」であり、規制当局(PMDA/FDA/EMA)の審査の出発点となります。
本記事では、CTDモジュール2のAIドラフト生成を、ICHガイドラインの構造をプロンプト化するアプローチで解説します。McKinseyはMerck社との協業で、AIを活用した規制文書作成の効率化を実証しています(出典:McKinsey "Rewiring Pharma's Regulatory Submissions with AI")。
CTDモジュール2の構成
CTDはICH(医薬品規制調和国際会議)が定めた国際標準の構成で、5つのモジュールから成ります。モジュール2は以下の6つのサブモジュールで構成されています。
| サブモジュール | 内容 | AI化の適合度 |
|---|---|---|
| 2.2 緒言 | 申請品目の概要(薬効分類、適応症、用法用量) | ★★★★★ 定型的 |
| 2.3 品質に関する概括資料 | 原薬・製剤の品質情報の要約 | ★★★★ データ依存 |
| 2.4 非臨床に関する概括資料 | 薬理・毒性試験結果の要約と評価 | ★★★★ データ→コメント |
| 2.5 臨床に関する概括資料 | 臨床試験結果の要約とベネフィット-リスク評価 | ★★★★★ 最重要セクション |
| 2.6 非臨床試験の概要文書及び概要表 | 非臨床試験の詳細な要約表 | ★★★★ 表形式で構造化 |
| 2.7 臨床概要 | 臨床試験の詳細な要約(生物薬剤学/薬物動態/有効性/安全性) | ★★★★★ 大量データの構造化 |
AI化のアプローチ|3つのステップ
ステップ1:ICHガイドラインの構造をプロンプト化
CTDモジュール2の構成はICH-M4(CTD構成ガイドライン)で国際的に標準化されています。この標準構成がそのまま「プロンプトのテンプレート」として機能します。
プロンプト設計例(モジュール2.5 臨床概括資料)
- 第1層(役割定義):「あなたは製薬会社のメディカルライターです。以下の臨床試験データに基づいて、ICH-M4に準拠したCTDモジュール2.5(臨床に関する概括資料)のドラフトを作成してください」
- 第2層(出力構成):ICH-M4が定める2.5の構成を指定。「2.5.1 製品開発の根拠 / 2.5.2 生物薬剤学に関する概括評価 / 2.5.3 臨床薬理に関する概括評価 / 2.5.4 有効性の概括評価 / 2.5.5 安全性の概括評価 / 2.5.6 ベネフィットとリスクに関する結論」
- 第3層(記述ルール):「臨床試験結果の記述は、主要評価項目→副次評価項目の順に。統計的有意差がある場合はp値を明記。安全性は重篤な有害事象を優先的に記述」
ステップ2:元データの構造化入力
LLMに渡す入力データを以下のように構造化します。
- CSR(治験総括報告書)の主要セクション:試験デザイン、対象患者の特性、有効性の結果、安全性の結果
- 統計解析結果(TLF):主要評価項目の解析結果の表
- 非臨床試験報告書の要約:薬理作用の概要、主要な毒性所見
- 品質データの概要:原薬・製剤の規格、安定性データの要約
ステップ3:セクション別ドラフト生成→メディカルライターのレビュー
各サブモジュールをLLMが個別にドラフト生成し、メディカルライターがレビュー・修正します。
セクション別のAI化適性
| セクション | LLMに任せる部分 | 人間が行う部分 |
|---|---|---|
| 2.5.1 製品開発の根拠 | 疾患の疫学データ、既存治療の整理 | 開発戦略の意思決定の記述 |
| 2.5.4 有効性の概括評価 | 試験結果データの要約、統計表の文章化 | 臨床的意義の解釈 |
| 2.5.5 安全性の概括評価 | 有害事象の頻度表の文章化、既知リスクの整理 | リスク管理計画との関連づけ |
| 2.5.6 ベネフィット-リスク結論 | 有効性・安全性データの要約 | 総合的なベネフィット-リスク判断 |
RAGによる過去申請文書の活用
過去に承認を取得した自社のCTDをRAGシステムに格納することで、LLMのドラフト品質を大幅に向上させることができます。
- 類似品目のCTD参照:「過去に同じ疾患領域で申請したCTDモジュール2.5はどのような構成で書いたか」をLLMが自動参照
- 規制当局の審査報告書の学習:過去の審査報告書(PMDAの審査報告書、FDAのReview等)をRAGに格納し、「当局が重視するポイント」をLLMが学習
- 照会事項の傾向分析:過去に受けた照会事項のパターンを分析し、「このような記述だと照会が来やすい」箇所を事前に強化
導入ステップと注意点
導入の3フェーズ
- Phase 1(1〜2ヶ月):モジュール2.2(緒言)と2.6/2.7の概要表(定型的なセクション)のドラフト生成から開始
- Phase 2(3〜4ヶ月):モジュール2.4(非臨床概括)、2.3(品質概括)にも展開。過去のCTDをRAGに格納
- Phase 3(5ヶ月〜):モジュール2.5(臨床概括)の全セクションドラフト生成。ベネフィット-リスク評価のドラフトにも挑戦
注意点
- 正確性の検証:CTDは規制当局への公式文書であるため、LLMが元データと異なる数値を記載するリスクに対し、入力データとの厳格な照合が必須
- 規制要件への準拠:ICHガイドラインの要件を満たしているかの確認はメディカルライター・薬事専門家が行う
- 機密性の確保:未承認薬のデータは最高レベルの機密情報。閉域環境でのAI処理が必須条件
- 各国規制の差異:日米EU三極で求められるCTDの内容に差異がある場合、各国版の調整は人間が行う
他業種での類似アプローチ
| 業種 | 類似の規制文書 | CTDとの共通点 |
|---|---|---|
| 銀行 | バーゼル規制開示文書(ピラー3) | 国際標準の構成で、データから文書化 |
| 監査 | 監査報告書(ISA準拠) | 規制で構成が定められた公式文書 |
| 医療機器 | 技術文書(IVDRの技術文書) | 規制要件に準拠した構造化文書 |
汎用LLMで実現する|Renue視点
CTDモジュール2のAI化は、「ICHガイドラインという国際標準が存在すること」がAI化を容易にするという好例です。構成が標準化されているため、LLMに「この構成に従ってドラフトを書け」と指示しやすく、出力の品質管理も構成に沿ったチェックリストで実現できます。
日本製薬工業協会は臨床開発DXの現状と可能性について部会資料を公開しており、AI活用が開発効率の改善に資することを示しています(出典:日本製薬工業協会 臨床開発DX部会資料 2024年5月)。CTD作成のAI化は、この業界全体のDXトレンドの中核に位置づけられます。
まとめ
CTDモジュール2のAIドラフト生成は、以下の3ステップで実装できます。
- ICHガイドラインの構造をプロンプト化:ICH-M4の構成をそのままプロンプトテンプレートに変換
- 元データの構造化入力:CSR、TLF、非臨床/品質データを構造化して入力
- セクション別ドラフト→メディカルライターのレビュー:定型部分はLLM、臨床的解釈は人間
McKinsey×Merckの協業(McKinsey公式)が示すように、規制文書作成のAI化は製薬業界で実証済みの技術です。Phase 1は定型セクション(2.2緒言、2.6/2.7概要表)から始められます。
CTD Module 2 AI生成の3大落とし穴と設計観点
本節ではCTD Module 2 AI生成の3大落とし穴を、公開文書・ICHガイドライン・公開研究に基づく設計観点として整理する。ICH M4Q(R1) Step 4 Guideline・EMA M4Q Step 5・ICH M4Q(R2)草案 2025-05-14採択 公開意見募集中を一次情報源とし、Module 2.3 QOS 40ページ原則(Biotech 80ページ)+Module 2.4 Nonclinical Overview+Module 2.5 Clinical Overviewの3本柱+2024-03-01 NMPA全面eCTD電子申報+2024-09-16 FDA eCTD v4.0+2026-04 PMDA v4-only連動の設計観点を示す。
① Module 2.3 QOS 40ページ原則×2025-05-14 ICH M4Q(R2)草案×4章構成(基本情報+Control Strategy+Critical Quality+Development Summary)
CTD Module 2最大の戦略軸はModule 2.3 Quality Overall Summary(QOS)の精密設計。ICH M4Q(R1)規定でQOS 40ページ原則(Biotech/複雑Process 80ページ上限)+Module 3本体データの要約+Module 3外情報禁止+Quality Reviewerへの統合View提供。2025-05-14 ICH M4Q(R2)草案採択+公開意見募集中(正式化2026-2027見込)では、(a)Module 2.3とModule 3を補完的に組織化+Module 2.3を監査評価基盤+Product Lifecycle Management支援、(b)4章構成: 2.3.1 基本情報 General Information+2.3.2 Overall Development/Control Strategy+2.3.3 Critical Quality Information+2.3.4 Development Summary and Justification=ICH Q8(R2) QbD+ICH Q12 Lifecycle Managementと深く連動。
Module 2.3 QOS×M4Q(R2)×AI生成の3大落とし穴:(i)Module 3との整合性検証不足(QOS=Module 3要約のみ、Module 3にない情報混入禁止+LLM生成時に創作的補足発生Risk+Source TraceabilityとDefine-XML連動監査必須)、(ii)M4Q(R1)→M4Q(R2)移行の章構成変化(従来の2.3.S Drug Substance/2.3.P Drug Product/2.3.A Appendices構成→M4Q(R2) 4章構成=Global Submission中の切替えで地域別差異発生、FDA/EMA/PMDA/NMPA採択タイミング差)、(iii)40/80ページ上限への圧縮×Critical Quality Attributeの取捨選択(CQAの優先順位+Control Strategy要約+Development Justification圧縮+AI生成時の情報欠落Risk=Reviewer Push-backで照会事項増加)。設計観点:Module 3 Source Linking+M4Q(R1)/(R2)併用Migration Advisor+40/80ページ Compression Optimizer+QbD/Q12連動Critical Quality Attribute Extractor。
② Module 2.4 Nonclinical Overview×Module 2.5 Clinical Overview×Benefit-Risk統合×ICH E2C PBRER連動
Module 2.4 Nonclinical OverviewはPharmacology+Pharmacokinetics+Toxicology統合評価+非臨床結果から臨床開発安全性・治療用途サポート+Module 4詳細Study Reports参照。Module 2.5 Clinical OverviewはClinical Pharmacology+Safety+Efficacy+Dose Justification+Benefit-Risk Assessmentの統合評価+Module 5詳細データ参照。重要なのは2.4→2.5→Benefit-Risk統合論理展開で、ICH E2C PBRER(Periodic Benefit-Risk Evaluation Report)+ICH E14 QT/QTc+ICH E17 MRCT+ICH E9(R1) Estimand Framework等の他ガイドラインとの整合的参照が必須。
Module 2.4/2.5×Benefit-Risk×統合論理の3大落とし穴:(i)非臨床→臨床Translationギャップ(Module 2.4 Toxicology知見がModule 2.5 Clinical Safetyで明示的対応されない+動物→ヒトPK/PD Scaling根拠不在+LLM生成時の各Module独立記述でTranslation論理欠落)、(ii)Benefit-Risk記述の構造化不足(EMA Benefit-Risk Methodology Project+FDA Benefit-Risk Framework+各地域のBenefit-Risk表記差異+効果量+エビデンス強度+不確実性明示+Patient Perspective統合が不十分)、(iii)Module 5 Integrated Summary(ISS/ISE)との重複/不整合(ISS/ISE詳細統合解析の要約をModule 2.5に反映+CTD M4Eで米国固有ISS/ISEをModule 2.7.3/2.7.4に配置の構造整合)。設計観点:Nonclinical→Clinical Translation Validator+Benefit-Risk Framework Structured Generator+ISS/ISE-Module 2.5 Cross-referencer+PBRER連動監査。
③ 2024-2026 eCTD Multi-regional Migration(2024-03 NMPA全面+2024-09 FDA v4.0+2026-04 PMDA v4-only+2026 EU v4.0 Mandatory)
CTD Module 2 AI生成はeCTD v4.0 HL7 RPS(Regulated Product Submissions)環境での運用が前提。2024-2026年の世界同時的Migration:2024-03-01 NMPA全面eCTD電子申報(CDE運用+旧紙・CD提出廃止)+2024-09-16 FDA eCTD v4.0受付開始(v3.2.2継続併用)+2026-04 PMDA v4-only運用開始(日本v4専用化)+2026 EU Centralised Procedure v4.0 Mandatory(EMA採択)+2027-2028 UK/カナダ段階移行。
Multi-regional Migration×AI CTD生成×2025-05 M4Q(R2)の3大落とし穴:(i)地域別採択タイミング差によるModule 2微調整(FDA/PMDA/EMA/NMPA間でM4Q(R2)採用時期が1-3年ずれる+同一薬剤のMulti-regional SubmissionでModule 2.3構成差異管理+Variant Controlが煩雑)、(ii)Module 1 Regional固有部分との整合(Module 1は地域毎固有=US 1.3 Administrative+EU 1.3+JP 1.0+CN 1.0+Module 2 Global Common+Module 3/4/5 Global部分のCompilation管理+eCTD v4.0 Lifecycle Operators(NEW/REPLACE/APPEND)の正確運用)、(iii)AI生成Assembly Time短縮Trade-offと品質ゲート(公開業界レポート(McKinsey 2024 Clinical Development AI analysis等)でAssembly Time大幅短縮の事例が報告されるが、各Region独自要件+翻訳必要項目+Define-XML v2.1連動+ADRG/SDRG整合+人間最終レビュー+Medical Writing Final Polish階層の維持)。設計観点:Multi-regional M4Q(R2) Migration Advisor+Module 1 Regional vs Module 2 Global Variant Controller+eCTD v4.0 Lifecycle Operator Validator+Assembly Time×Quality Gate Balance Designer+Define-XML v2.1/ADRG/SDRG Conformance Checker。
AI設計観点整理:Claude Opus 4.7等のLLMは、ICH M4(R4) Organisation+ICH M4Q(R1)/(R2) Quality+ICH M4S Safety+ICH M4E Efficacy+ICH Q8(R2)/Q9(R1)/Q10/Q11/Q12+ICH E2C PBRER+ICH E9(R1) Estimand+ICH E14 QT+ICH E17 MRCT+ICH M7(R2) Mutagenic Impurities+JPMA電子化情報部会ハンドブック+eCTD v4.0 HL7 RPS仕様+FDA Technical Specifications+EMA Technical Specifications+PMDA eCTD通知+NMPA 2024-03-01 全面eCTD通知 30+文書を横断参照することで、Module 2.3/2.4/2.5の統合的Draft自動生成+Source Traceability+Multi-regional整合性+M4Q(R2)対応+Benefit-Risk Framework準拠+ISS/ISE Cross-Reference+Assembly Time短縮と品質ゲートの両立を設計する方向性が開ける。

