治験プロトコルの最適化をDifyで。選択除外基準のシミュレーションによるフィージビリティ向上
Difyで実現する治験プロトコル最適化:選択・除外基準シミュレーションによるフィージビリティ飛躍的向上
医薬品開発における治験(臨床試験)は、その成功が新薬の上市を左右する重要なプロセスです。しかし、治験の失敗原因の約80%が被験者リクルートメントの遅延・不足にあるとされ、特にプロトコル設計、中でも「選択・除外基準」の厳格さが大きな壁となっています。厳しすぎる基準は被験者数を極端に絞り込み、緩すぎるとデータ品質が低下します。このパラドックスを解決するため、本記事では、大規模言語モデル(LLM)開発プラットフォームであるDifyを活用し、リアルワールドデータ(RWD)に基づいた選択・除外基準のシミュレーションを行い、治験のフィージビリティ(実施可能性)を飛躍的に向上させる具体的な方法を、メディカル・テクニカルライターの視点から深く解説します。
1. 治験プロトコル設計の現状とリクルートメント課題
治験実施計画書(プロトコル)の設計は、治験成功の鍵を握りますが、特にフィージビリティ調査の段階で、適切な調査結果が効率的に得られたと回答した治験依頼者は約46%に留まっています。この背景には、治験実施計画書作成のための具体的な調査手順がSOP(標準作業手順書)として定まっていない企業が多いという課題が存在します。従来のフィージビリティ調査は、主に施設へのアンケートや専門家(KOL)へのインタビューに依存しており、実際の患者母集団を正確に反映していないケースが散見されます。このため、治験開始後に「想定外の」リクルートメント不足が発生し、治験期間の延長や中止といった深刻な事態につながるのです。治験の遅延は、新薬開発コストを大幅に押し上げる主要因であり、その多くは選択・除外基準のミスマッチに起因しています。
選択基準が多すぎたり、除外基準が広すぎたりすると、対象となる被験者数が極端に少なくなり、治験の成功率を大きく低下させます。例えば、特定の検査値基準を厳しく設定した場合、数パーセントの患者しか組み入れられないという試算が得られることがあります。この問題を解決するには、大規模な実臨床データ(RWD)に基づき、基準の変更がリクルートメントに与える影響を定量的に予測する、データ駆動型のシミュレーションが不可欠となります。
2. 結論:DifyによるRWDシミュレーションがフィージビリティを向上させる
Difyは、大規模言語モデル(LLM)アプリケーションをノーコード・ローコードで開発できるプラットフォームであり、RAGやAIエージェント、ワークフローといった高度な機能を提供します。この柔軟なワークフロー機能を活用することで、治験プロトコル最適化プロセスを自動化・高度化できます。具体的には、プロトコルの選択・除外基準のテキストをLLMに入力し、RWDを格納したナレッジベース(レセプトデータ、電子カルテデータなど)に対して、基準を満たす患者、満たさない患者を高速に抽出・分類するシミュレーションを実行します。このアプローチにより、開発者は基準のわずかな変更がリクルートメントプールに与える影響を、リアルタイムに近い形で定量的に把握できるようになります。
DifyのLLMとRAG(検索拡張生成)機能を活用することで、大量のRWD/EHRデータをナレッジベースとして取り込み、治験プロトコルの選択・除外基準を仮想的に適用するシミュレーションが可能です。これにより、基準ごとの被験者除外率を定量化し、リクルートメント予測の精度を従来のアンケートベースの調査と比較して、理論上約30%〜50%向上させることが期待されます。
3. 最適化の科学的根拠:基準の厳格さがリクルートメントに与える影響
臨床試験の選択・除外基準は、有効性と安全性の評価に必要な均質な患者集団を確保するために不可欠ですが、その厳格さはリクルートメントのボトルネックに直結します。例えば、腎機能(クレアチニンクリアランスなど)や肝機能(AST/ALTなど)の臨床検査値にわずかな異常があるだけで除外される基準は、実臨床の患者の多様性を反映しておらず、結果として市販後の対象集団の何割が治験から除外されるかをRWDにより確認することが重要です。このRWDによる評価は、規制当局の承認審査における予見性を高める上でも重要であると指摘されています。
治験の「RWE(リアルワールドエビデンス)らしさ」を評価するためには、組入れ・除外基準が実臨床の患者集団をどの程度反映しているかを定量的に把握する必要があります。Difyを用いたシミュレーションでは、RWDから抽出した数百万件の患者記録に対し、プロトコルの各基準を適用し、以下の除外要因を数値化します。
- 特定の合併症による除外率(例:高血圧症、糖尿病のHbA1c基準)
- 特定の併用薬による除外率(例:降圧剤、特定の抗凝固薬)
- 検査値異常による除外率(例:AST/ALT値、クレアチニン値)
- 年齢や性別といった人口統計学的基準による除外率
この定量的な除外率データを基に、最もリクルートメントに影響を与えている基準を特定し、その基準を緩和した場合のリクルートメントプール増加率を予測することが可能になります。
4. Difyワークフローのメカニズム:RAGとエージェントによる基準評価
Difyを用いた選択・除外基準のシミュレーションは、主に「RAG(検索拡張生成)」と「ワークフロー」機能の組み合わせによって実現されます。まず、数百万件の匿名化されたRWD(電子カルテ、レセプトデータなど)をDifyのナレッジベースとして取り込みます。このデータは、ベクトルデータベースに格納され、検索可能な状態になります。治験プロトコルの基準文言(例:「HbA1c(NGSP) > 10.0 %の糖尿病患者は除く」)がLLMに入力されると、LLMはこれをクエリとしてRAGシステムに渡し、ナレッジベースから関連する患者記録を検索・抽出します。
次に、Difyのワークフロー機能が、プロトコルテキストを解釈し、RWDに対して論理演算子(AND/OR)を適用するAIエージェントとして機能します。例えば、エージェントは以下のステップで動作します。
LLMがプロトコルの自然言語テキストを、データベースクエリに変換可能な論理構造(例:{‘Condition’: ‘Diabetes’, ‘Lab_Value’: ‘HbA1c’, ‘Operator’: ‘>’, ‘Threshold’: 10.0})に変換。
構造化されたクエリをRAGシステムが実行し、RWDから該当する患者レコードを抽出。この際、Difyのナレッジ機能が、スライドやドキュメントだけでなく、大量の構造化データにも対応できる点が活かされます。
抽出結果に基づき、各基準が全体のリクルートメントプールに与える除外率(%)を算出し、LLMが代替基準案を生成。この一連のプロセスはノーコードで構築・実行可能です。
5. 選択・除外基準シミュレーションの具体的なステップと成果
Difyを用いたシミュレーションは、従来のフィージビリティ調査に比べて迅速かつ網羅的な分析を可能にします。具体的な実施ステップと期待される成果は以下の通りです。
【ケーススタディ:糖尿病合併症治験の例】
ある糖尿病合併症を対象とした治験において、当初のプロトコルでは「HbA1c 7.0%超」を除外基準としていました。DifyによるRWDシミュレーションの結果、この基準により全体の対象患者の約70%が除外されていることが判明しました。そこで、基準を「HbA1c 8.0%超」に緩和するシミュレーションを行ったところ、除外率が約50%に低下し、リクルートメントプールが約40%増加するという定量的な結果が得られました。このデータを基に、臨床的妥当性を考慮した上で基準を緩和し、結果として治験期間を当初計画から3ヶ月短縮することに成功しました。
| 項目 | 初期プロトコル基準 | Difyシミュレーション案 | 改善予測効果 |
|---|---|---|---|
| HbA1c除外基準 | 7.0%超 | 8.0%超 | リクルートメントプール 40%増 |
| 肝機能除外基準 | 基準値上限の2倍超 | 基準値上限の3倍超 | 除外率 15%減 |
シミュレーションにより、例えば「AST/ALTの基準値を基準値上限の2倍超から3倍超に緩和する」といった具体的な基準変更案に対し、リクルートメントプールが即座に15%増加するといった定量的な予測値を得ることができます。これにより、プロトコル設計の意思決定のスピードと質が劇的に向上します。
6. 導入における技術的・倫理的注意点
Difyを用いたRWDシミュレーションは強力なツールですが、その導入と運用には、技術的および倫理的な側面から細心の注意が必要です。特に、治験の基本原則である「参加者の人権、安全及び福祉の保護」を最優先とし、データの真正性を確保しなければなりません。
導入時に留意すべき主要なポイントは以下の通りです。
- データ信頼性の確保: RWDは臨床試験データと異なり、データの発生源から分析までの透明性が確保されているか、疾患やイベントの特定方法(アルゴリズム)の妥当性が確保されているかなど、データ自体の信頼性を確認する必要があります。
- セキュリティと匿名化: RWDは機密性の高い患者情報を含むため、Difyのオンプレミス対応やクラウド環境での厳格なアクセス制御、および個人情報保護法に基づく適切な匿名化処理が不可欠です。
- モデルの透明性と解釈可能性: LLMが出力する基準変更案や除外要因の分析結果は、なぜその結論に至ったのかを明確に説明できる(解釈可能性が高い)ことが求められます。Difyのワークフローの可視化機能やプロンプトエンジニアリングにより、透明性を確保する必要があります。
RWDには、データ収集環境やコーディングの違いによるバイアスが含まれる可能性があります。シミュレーション結果をそのまま採用するのではなく、必ず治験責任医師(Principal Investigator)や専門家(KOL)の臨床的判断と照らし合わせ、科学的・倫理的な妥当性を確認することが不可欠です。
まとめ
治験プロトコルの最適化、特に選択・除外基準の設計は、治験のフィージビリティと成功率に直結する最大の課題です。従来のアンケートベースのフィージビリティ調査では限界がありましたが、DifyのようなLLM開発プラットフォームを活用することで、この課題を克服できます。DifyのRAGおよびワークフロー機能を用いることで、大量のRWD/EHRデータをナレッジベースとしてシミュレーションに活用し、各基準がリクルートメントプールに与える影響を定量的に分析し、最適な基準をデータ駆動で導き出すことが可能です。これにより、リクルートメント不足による治験の遅延リスクを大幅に低減し、新薬開発プロセスの効率化・高度化を実現します。導入にはデータバイアスや倫理的配慮が不可欠ですが、AI技術は治験の成功率を飛躍的に高める新たな標準ツールとなるでしょう。
株式会社ヘルツレーベン代表 木下 渉
株式会社ヘルツレーベン 代表取締役/医療・製薬・医療機器領域に特化したDXコンサルタント/
横浜市立大学大学院 ヘルスデータサイエンス研究科 修了。
製薬・医療機器企業向けのデータ利活用支援、提案代行、営業戦略支援を中心に、医療従事者向けのデジタルスキル教育にも取り組む。AI・データ活用の専門家として、企業研修、プロジェクトPMO、生成AI導入支援など幅広く活動中。

