株式会社renue
AI導入・DXの悩みをプロに相談してみませんか?
AIやDXに関する悩みがありましたら、お気軽にrenueの無料相談をご利用ください。 renueのAI支援実績、コンサルティングの方針や進め方をご紹介します。
Real-World Data(RWD)標準化は、電子カルテ・請求データ・レジストリ・Wearable・ePRO 等の異種医療データを共通 Model で統合し Cross-institutional Analytics・Regulatory Submission・薬剤疫学研究を可能にする基盤。OMOP CDM(Observational Medical Outcomes Partnership Common Data Model)は 2007 年 FDA + PhRMA(Pharmaceutical Research and Manufacturers of America)連携で開始、OHDSI(Observational Health Data Sciences and Informatics)が 2014 年 Columbia University 発で設立され現在 30 か国 3000+ Researcher・600M Patient Record を接続する世界最大の RWD Network(OHDSI 公式)。HL7 FHIR(Fast Healthcare Interoperability Resources)は Real-time 患者ケア・EHR 相互運用の標準、HL7 と OHDSI が 2021 年から OMOP + FHIR Working Group で Bidirectional Transformation 標準化を推進、2026 年 Frontiers in Medicine 掲載の TermX 研究で FHIR Observation → OMOP Measurement の意味・構造保存マッピング確立。FDA Sentinel(2007 立上)は 18 Data Partner 200M+ 患者の Post-market Safety Surveillance システムで OMOP-like CDM 運用。PMDA MID-NET(Medical Information Database Network、2018 運用開始)は日本 10 病院ネットワーク。NMPA は「真实世界数据用于生成真实世界证据的指导原则(试行)」で 6 要素 Governance Framework(Security・Extraction・Cleaning・Transformation・Transmission・Quality Control)整備。CDISC SDTM は臨床試験データ標準で RWD/RWE との Hybrid 運用が課題。本記事では、OMOP CDM・FHIR・RWD 標準化の AI 支援を、6 Domain Data Model・Mapping・Network Study・多地域対応の観点で玄人目線で詳述する。
主要データ標準
| 標準 | 用途 | 運営 |
|---|---|---|
| OMOP CDM | 観察研究・薬剤疫学 | OHDSI(Columbia University、2014) |
| HL7 FHIR | Real-time EHR 相互運用 | HL7 International |
| CDISC SDTM | 臨床試験 Data Submission | CDISC |
| CDISC ADaM | Analysis Data Model | CDISC |
| ICH E2B(R3) | PV ICSR | ICH |
| SNOMED CT | 臨床用語コード | SNOMED International |
| RxNorm | 医薬品コード | NLM(NIH) |
| LOINC | 検査・観察コード | Regenstrief Institute |
| ICD-10/11 | 疾患コード | WHO |
OMOP CDM の構造
- Person Domain(人口統計)
- Observation Period Domain
- Visit Occurrence Domain
- Condition Occurrence Domain(診断)
- Drug Exposure Domain(投薬)
- Procedure Occurrence Domain(処置)
- Measurement Domain(検査値)
- Observation Domain(その他観察)
- Death Domain
- Standardized Vocabularies(SNOMED CT・RxNorm・LOINC 等への正規化)
地域別 RWD Infrastructure
| 地域 | Network / System |
|---|---|
| FDA | Sentinel Initiative(2007)・BEST Initiative・CBER Sentinel |
| EMA | DARWIN EU(Data Analysis and Real World Interrogation Network) |
| PMDA | MID-NET(2018 運用、10 病院ネットワーク) |
| NMPA | 海南博鰲楽城 RWE 試験区・CDE RWE Guidance |
| UK | CPRD(Clinical Practice Research Datalink) |
| Canada | ICES・CNODES |
| OHDSI Network | 30 か国 600M 患者データ |
| EHDEN | European Health Data & Evidence Network |
FHIR + OMOP の Bidirectional Transformation
- FHIR:Real-time 患者ケア・EHR 相互運用(リソース指向)
- OMOP:Long-term 観察研究・薬剤疫学(Domain 指向)
- OMOP + FHIR Working Group(OHDSI + HL7 共同)
- FHIR Observation ↔ OMOP Measurement
- FHIR Condition ↔ OMOP Condition Occurrence
- FHIR MedicationStatement ↔ OMOP Drug Exposure
- TermX 2026 Bidirectional Transformation 研究
- CDM Catalog(NIH Data Science)で Harmonization Resource 提供
AI 支援の 8 領域
1. Data Mapping 自動化
EHR・請求データ・レジストリを OMOP CDM に AI 自動マッピング。SNOMED CT・RxNorm・LOINC Vocabulary 適用。
2. Data Quality Check
OHDSI DataQualityDashboard・Achilles を AI 統合で運用。Completeness・Validity・Conformance 評価。
3. FHIR ↔ OMOP Transformation
Real-time FHIR → OMOP への ETL を AI で自動化。逆方向の OMOP → FHIR も実装。
4. Cohort Definition
Complex Phenotype を AI で OHDSI ATLAS Cohort として定義。Inclusion/Exclusion Criteria 自動適用。
5. Network Study 設計
Multi-site OHDSI Network Study を AI で設計。Study Package 自動生成・Site Deployment。
6. Regulatory Submission
FDA Sentinel・EMA DARWIN EU・PMDA MID-NET 対応 Report を AI で構造化。RWE Submission Package。
7. Causal Inference
Propensity Score Matching・Target Trial Emulation を AI で支援。Confounding 自動調整。
8. Privacy-preserving Analytics
Federated Learning・Differential Privacy を OMOP Network で実装。HIPAA・GDPR・APPI 対応。
RWD 6 要素 Governance(NMPA)
- Data Security(個人情報・サイバーセキュリティ)
- Data Extraction(Source System からの抽出)
- Data Cleaning(Missing・Outlier・Duplicate 処理)
- Data Transformation(標準化・コード変換)
- Data Transmission and Storage(暗号化・Audit Trail)
- Quality Control(継続的監視・Anomaly Detection)
AI パイプライン
- Step 1: Research Question 定義
- Step 2: Data Source 特定
- Step 3: OMOP CDM Mapping
- Step 4: Data Quality Check
- Step 5: Cohort Definition(ATLAS)
- Step 6: Characterization Study
- Step 7: Comparative Effectiveness / Safety
- Step 8: Population-level Estimation
- Step 9: Patient-level Prediction
- Step 10: Regulatory Submission
OHDSI Network Study の実例
- LEGEND(Large-scale Evidence Generation and Evaluation in a Network of Databases)
- COVID-19 Phenomics Studies
- Hypertension Comparative Effectiveness
- Depression Treatment Pathways
- Rare Disease Natural History
- Drug Repurposing Opportunities
- Health Equity Studies
- DARWIN EU Pilot Studies
失敗パターンと回避策
落とし穴1:Vocabulary Mapping 不整合
Local Code から Standardized Vocabulary への Mapping 不備で分析不能。AI Mapping + 人手 Review。
落とし穴2:Data Quality 低
Missing・Conflicting Data で Study Result 信頼性低。DataQualityDashboard 自動運用。
落とし穴3:FHIR/OMOP 片方のみ
Real-time vs Retrospective で Bidirectional 必要。OMOP + FHIR WG 成果活用。
落とし穴4:Network Study の Confounding
Site 間 Heterogeneity で Spurious Association。Propensity Score・Target Trial Emulation。
落とし穴5:Privacy 不備
HIPAA・GDPR・APPI 違反は重大。Federated Learning・De-identification。
KPI 設計の観点
- OMOP Mapping 完了率
- Data Quality Score
- Cohort Definition 精度
- Network Study 参加 Site 数
- Causal Inference 妥当性
- Regulatory Acceptance
- Privacy Incident ゼロ
まとめ:OMOP CDM・FHIR・RWD 標準化 AI 支援の設計指針
- OMOP CDM 6 Domain Data Model + Standardized Vocabularies(SNOMED CT・RxNorm・LOINC)
- HL7 FHIR との Bidirectional Transformation(OMOP + FHIR WG)
- FDA Sentinel・EMA DARWIN EU・PMDA MID-NET・NMPA RWE 試験区の多地域 Infrastructure
- OHDSI Network 30 か国 3000+ Researcher・600M Patient
- OHDSI ATLAS で Cohort Definition 標準化
- DataQualityDashboard・Achilles で Quality Monitoring
- NMPA 6 要素 Governance(Security・Extraction・Cleaning・Transformation・Transmission・Quality)
- CDISC SDTM との Hybrid 運用
- Privacy-preserving Analytics(Federated Learning・Differential Privacy)
- AI は Mapping・Cohort・Network Study・Causal Inference・Submission、最終判断は Epidemiologist・Biostatistician・Medical・Regulatory
OMOP CDM + HL7 FHIR + OHDSI Network は 2007 FDA-PhRMA 開始から現在 30 か国 600M 患者を接続する世界最大の RWD Infrastructure に。FDA Sentinel・EMA DARWIN EU・PMDA MID-NET・NMPA RWE 試験区の多地域展開で Regulatory RWE・薬剤疫学・Health Equity 研究が実装段階へ。判断の人間主導と反復的 Mapping・Quality Check・Network Study・Causal Inference の AI 自動化が、2026 年以降のグローバル医薬品開発・安全監視の競争力を決定づける。
renue独自視点:OMOP CDM・FHIR・RWD標準化 AI支援の3つの落とし穴
renue社はPV/GMP/品質/臨床試験/AI創薬/BMV/Drug Shortage領域で52本超(A088-A139)のシリーズを蓄積し、日本のRWD基盤を「欧米比で研究利用しづらい状況」と捉える医療データ活用基盤整備機構の問題意識と同じ立場に立つ。本稿ではOMOP CDM・FHIR・RWD標準化AI支援で汎用LLMが届かない3落とし穴を、一次資料(日本薬剤疫学会誌 グローバルRWD規格OMOP CDMとOHDSI・OHDSI DARWIN EU Initiative・npj Digital Medicine Cancer OMOP Scoping Review 2025・JPMA HL7 FHIRを軸とした臨床試験連携)を参照し整理する。
落とし穴① Source Vocabulary → Standard Concept Mappingの「文脈欠落Bias」
OMOP CDMはSNOMED CT/RxNorm/LOINC/ICD-10/11等のStandard Vocabularyに変換することで分析共通性を得るが、ETL時のMapping(Source Code → Standard Concept)でNon-exact Match・Multiple Concept・Deprecated Concept・Context-dependent(例:「頭痛」が主訴か副作用か)が大量に発生し、汎用LLMに「このDrugコードをRxNormに変換して」と聞くと一般論で対応するが、個別病院のLocal Dictionary規則・処方実態(内服/外用の区別・日本独自配合剤)・薬価コード体系差との突合はしない(npj Digital Medicine 2025)。日本ではYuimedi・NEC等によるNDB・電子カルテ→OMOP変換実証でも「HL7 FHIR合成データからの高品質変換処理」が技術検証段階であり、PMDA MID-NET 10病院ネットワークでもLocal Mapping Tableのheterogeneity・Drug Exposureの「頓用vs定期」区分・Measurement Valueの単位変換(例:HbA1c JDS/NGSP・BMI kg/m² vs kg/cm²)はUsagi/Athena単独では解決しない。対策は、①LLM+ルールエンジン組合せのMapping Assistant(単一LLM暴走を防ぐ)、②Local Mapping Tableへのrenue独自差分検知(A102/A103のEBR/Annex 11ライクなバージョン管理)、③Mapping Confidence Score表示・低Confidence時はEpidemiologist審査を強制、④OHDSI Usagi・Athena・ATLAS・HADES連携、⑤単位変換は「JDS→NGSP変換式HbA1c(NGSP)=HbA1c(JDS)×1.02+0.25」等の国内固有ルールをrenue社内Knowledge Baseに蓄積。
落とし穴② FHIR ↔ OMOP Bidirectional Transformationの「用途別最適化欠如」
HL7 FHIRはReal-time EHR相互運用・患者ケア向け(Observation/Condition/MedicationRequest/ImmunizationをPoint-in-timeで表現)で、OMOP CDMはPopulation-level分析・Cohort研究向け(Observation Period・Drug Era・Condition Eraで時間軸集約)という根本的設計思想差がある(JPMA HL7 FHIR臨床試験連携)。厚労省標準のHL7 FHIRに準拠した電子カルテが普及してもOMOPへの変換が「Observationレベルで一旦Flatten→再集約」となり、Drug Era構築時に「前回投与から30日以内は継続」「1日処方量>0」等のOMOP独自ロジックが汎用LLMで実装されず、Era集約不正確による解析Biasが頻発。逆にOMOP→FHIRで臨床現場連携する際、Person → Patient変換は容易だがPerson Level Observation → EncounterやCondition EraのRelocationが属人的実装になる。対策は、①FHIR IPS(International Patient Summary)・JAHIS標準書式・HL7 FHIR JP CoreとOMOP CDM Vocabularyの公式マッピングBridgeを活用、②HL7-OHDSI Working Group 2021-以降のBidirectional Transformation Specification(BulkFHIRIO・OMOP-on-FHIR)を適用、③Temporal Granularity違いをETL段階で明示的に設計(FHIR Observation issued→OMOP observation_datetime、DrugExposure start/end算出ルール明文化)、④renue社内実装のデータ標準化Agentで「用途別(Cohort研究/Safety Surveillance/Regulatory Submission)に最適化された3種変換パターン」を分離、⑤CDISC SDTM(治験)との3者Hybrid運用はA111 RWE・A121 Registry Studyと連携。
落とし穴③ Multi-region Network Study・Federated Analytics・Privacy保護のガバナンス整合
FDA Sentinel 200M+・EMA DARWIN EU 180M(59研究実施済、中央値4か月Protocol→結果)・PMDA MID-NET・NMPA「真实世界数据用于生成真实世界证据的指导原则(试行)」6要素(Security・Extraction・Cleaning・Transformation・Transmission・Quality Control)の4極は、データ移転を伴わないFederated Analytics(各Data Partnerで統計集約を実行、Summary Statisticsのみ中央集約)が基本だが、各極のPrivacy規制(GDPR・HIPAA・個人情報保護法・仮名加工情報制度・中国个人信息保护法)・Data Localization要件・IRB要件・Differential Privacyε閾値が異なり、汎用LLMに「Multi-region Network Studyの設計を」と頼んでも一般論以上に踏み込まない(FDA RWE解説)。日本ではOMOP CDMが「仮名加工情報制度との親和性が高い」(岡田 2023)とされる一方、NMPAは個人情報の中国国外持ち出しを厳格制限、EU GDPRはSchrems II判決以降Third Country Transferに追加Safeguardsを要求。対策は、①4極Privacy規制の差分をMetadata化しNetwork Study Protocol作成時にAuto-check、②OHDSI Strategus/HADES/ARACHNE等Federated Executionツールを各極で統一運用、③Differential Privacyε値・K-anonymityの閾値合意をMulti-region Governance Charterに明文化、④FDA Sentinel Common Data Model・EMA DARWIN EU OMOP・PMDA MID-NETのSchema差分をETL Pipelineで吸収、⑤Epidemiologist・Biostatistician・Medical Affairs・Regulatory Affairs・Privacy Officer・Legalの6者合議をNetwork Study Signoffに強制、⑥A111 RWE・A099 PV EudraVigilance・A119 Health Equityとの統合Governance。renue社は「Mapping Assistant+3種変換パターン+4極Privacy Governance Metadata」をProtocol主導で運用し、汎用LLMでは届かないOMOP・FHIR・RWD標準化AI支援の「Mapping Bias・Bidirectional Transformation・Multi-region Governance」3落とし穴を塞ぐ。

