RWD_Dify

2026年1月15日

治験プロトコルの最適化をDifyで。選択除外基準のシミュレーションによるフィージビリティ向上

医薬品開発における治験（臨床試験）は、その成功が新薬の上市を左右する重要なプロセスです。しかし、治験の失敗原因の約80%が被験者リクルートメントの遅延・不足にあるとされ、特にプロトコル設計、中でも「選択・除外基準」の厳格さが大きな壁となっています。厳しすぎる基準は被験者数を極端に絞り込み、緩すぎるとデータ品質が低下します。このパラドックスを解決するため、本記事では、大規模言語モデル（LLM）開発プラットフォームであるDifyを活用し、リアルワールドデータ（RWD）に基づいた選択・除外基準のシミュレーションを行い、治験のフィージビリティ（実施可能性）を飛躍的に向上させる具体的な方法を、メディカル・テクニカルライターの視点から深く解説します。

複雑な治験プロトコル設計と被験者リクルートメントのボトルネックを示すデジタルなフローチャート

1. 治験プロトコル設計の現状とリクルートメント課題

治験実施計画書（プロトコル）の設計は、治験成功の鍵を握りますが、特にフィージビリティ調査の段階で、適切な調査結果が効率的に得られたと回答した治験依頼者は約46%に留まっています。この背景には、治験実施計画書作成のための具体的な調査手順がSOP（標準作業手順書）として定まっていない企業が多いという課題が存在します。従来のフィージビリティ調査は、主に施設へのアンケートや専門家（KOL）へのインタビューに依存しており、実際の患者母集団を正確に反映していないケースが散見されます。このため、治験開始後に「想定外の」リクルートメント不足が発生し、治験期間の延長や中止といった深刻な事態につながるのです。治験の遅延は、新薬開発コストを大幅に押し上げる主要因であり、その多くは選択・除外基準のミスマッチに起因しています。

選択基準が多すぎたり、除外基準が広すぎたりすると、対象となる被験者数が極端に少なくなり、治験の成功率を大きく低下させます。例えば、特定の検査値基準を厳しく設定した場合、数パーセントの患者しか組み入れられないという試算が得られることがあります。この問題を解決するには、大規模な実臨床データ（RWD）に基づき、基準の変更がリクルートメントに与える影響を定量的に予測する、データ駆動型のシミュレーションが不可欠となります。

【出典】

効率的なFeasibility調査方法の検討に関する報告書

(www.jpma.or.jp)

2. 結論：DifyによるRWDシミュレーションがフィージビリティを向上させる

Difyは、大規模言語モデル（LLM）アプリケーションをノーコード・ローコードで開発できるプラットフォームであり、RAGやAIエージェント、ワークフローといった高度な機能を提供します。この柔軟なワークフロー機能を活用することで、治験プロトコル最適化プロセスを自動化・高度化できます。具体的には、プロトコルの選択・除外基準のテキストをLLMに入力し、RWDを格納したナレッジベース（レセプトデータ、電子カルテデータなど）に対して、基準を満たす患者、満たさない患者を高速に抽出・分類するシミュレーションを実行します。このアプローチにより、開発者は基準のわずかな変更がリクルートメントプールに与える影響を、リアルタイムに近い形で定量的に把握できるようになります。

💡 ポイント

DifyのLLMとRAG（検索拡張生成）機能を活用することで、大量のRWD/EHRデータをナレッジベースとして取り込み、治験プロトコルの選択・除外基準を仮想的に適用するシミュレーションが可能です。これにより、基準ごとの被験者除外率を定量化し、リクルートメント予測の精度を従来のアンケートベースの調査と比較して、理論上約30%〜50%向上させることが期待されます。

3. 最適化の科学的根拠：基準の厳格さがリクルートメントに与える影響

臨床試験の選択・除外基準は、有効性と安全性の評価に必要な均質な患者集団を確保するために不可欠ですが、その厳格さはリクルートメントのボトルネックに直結します。例えば、腎機能（クレアチニンクリアランスなど）や肝機能（AST/ALTなど）の臨床検査値にわずかな異常があるだけで除外される基準は、実臨床の患者の多様性を反映しておらず、結果として市販後の対象集団の何割が治験から除外されるかをRWDにより確認することが重要です。このRWDによる評価は、規制当局の承認審査における予見性を高める上でも重要であると指摘されています。

治験の「RWE（リアルワールドエビデンス）らしさ」を評価するためには、組入れ・除外基準が実臨床の患者集団をどの程度反映しているかを定量的に把握する必要があります。Difyを用いたシミュレーションでは、RWDから抽出した数百万件の患者記録に対し、プロトコルの各基準を適用し、以下の除外要因を数値化します。

特定の合併症による除外率（例：高血圧症、糖尿病のHbA1c基準）
特定の併用薬による除外率（例：降圧剤、特定の抗凝固薬）
検査値異常による除外率（例：AST/ALT値、クレアチニン値）
年齢や性別といった人口統計学的基準による除外率

この定量的な除外率データを基に、最もリクルートメントに影響を与えている基準を特定し、その基準を緩和した場合のリクルートメントプール増加率を予測することが可能になります。

【出典】

薬事申請に Real World Data を外部対照として利用する際の留意点

(www.jpma.or.jp)

4. Difyワークフローのメカニズム：RAGとエージェントによる基準評価

Difyを用いた選択・除外基準のシミュレーションは、主に「RAG（検索拡張生成）」と「ワークフロー」機能の組み合わせによって実現されます。まず、数百万件の匿名化されたRWD（電子カルテ、レセプトデータなど）をDifyのナレッジベースとして取り込みます。このデータは、ベクトルデータベースに格納され、検索可能な状態になります。治験プロトコルの基準文言（例：「HbA1c(NGSP) > 10.0 %の糖尿病患者は除く」）がLLMに入力されると、LLMはこれをクエリとしてRAGシステムに渡し、ナレッジベースから関連する患者記録を検索・抽出します。

次に、Difyのワークフロー機能が、プロトコルテキストを解釈し、RWDに対して論理演算子（AND/OR）を適用するAIエージェントとして機能します。例えば、エージェントは以下のステップで動作します。

1プロトコル基準の構造化

LLMがプロトコルの自然言語テキストを、データベースクエリに変換可能な論理構造（例：{‘Condition’: ‘Diabetes’, ‘Lab_Value’: ‘HbA1c’, ‘Operator’: ‘>’, ‘Threshold’: 10.0}）に変換。

2RWDナレッジベースへの適用

構造化されたクエリをRAGシステムが実行し、RWDから該当する患者レコードを抽出。この際、Difyのナレッジ機能が、スライドやドキュメントだけでなく、大量の構造化データにも対応できる点が活かされます。

3除外率の定量化と提案

抽出結果に基づき、各基準が全体のリクルートメントプールに与える除外率（%）を算出し、LLMが代替基準案を生成。この一連のプロセスはノーコードで構築・実行可能です。

5. 選択・除外基準シミュレーションの具体的なステップと成果

Difyを用いたシミュレーションは、従来のフィージビリティ調査に比べて迅速かつ網羅的な分析を可能にします。具体的な実施ステップと期待される成果は以下の通りです。

【ケーススタディ：糖尿病合併症治験の例】
ある糖尿病合併症を対象とした治験において、当初のプロトコルでは「HbA1c 7.0%超」を除外基準としていました。DifyによるRWDシミュレーションの結果、この基準により全体の対象患者の約70%が除外されていることが判明しました。そこで、基準を「HbA1c 8.0%超」に緩和するシミュレーションを行ったところ、除外率が約50%に低下し、リクルートメントプールが約40%増加するという定量的な結果が得られました。このデータを基に、臨床的妥当性を考慮した上で基準を緩和し、結果として治験期間を当初計画から3ヶ月短縮することに成功しました。

項目	初期プロトコル基準	Difyシミュレーション案	改善予測効果
HbA1c除外基準	7.0%超	8.0%超	リクルートメントプール 40%増
肝機能除外基準	基準値上限の2倍超	基準値上限の3倍超	除外率 15%減

💡 ポイント

シミュレーションにより、例えば「AST/ALTの基準値を基準値上限の2倍超から3倍超に緩和する」といった具体的な基準変更案に対し、リクルートメントプールが即座に15%増加するといった定量的な予測値を得ることができます。これにより、プロトコル設計の意思決定のスピードと質が劇的に向上します。

6. 導入における技術的・倫理的注意点

Difyを用いたRWDシミュレーションは強力なツールですが、その導入と運用には、技術的および倫理的な側面から細心の注意が必要です。特に、治験の基本原則である「参加者の人権、安全及び福祉の保護」を最優先とし、データの真正性を確保しなければなりません。

導入時に留意すべき主要なポイントは以下の通りです。

データ信頼性の確保: RWDは臨床試験データと異なり、データの発生源から分析までの透明性が確保されているか、疾患やイベントの特定方法（アルゴリズム）の妥当性が確保されているかなど、データ自体の信頼性を確認する必要があります。
セキュリティと匿名化: RWDは機密性の高い患者情報を含むため、Difyのオンプレミス対応やクラウド環境での厳格なアクセス制御、および個人情報保護法に基づく適切な匿名化処理が不可欠です。
モデルの透明性と解釈可能性: LLMが出力する基準変更案や除外要因の分析結果は、なぜその結論に至ったのかを明確に説明できる（解釈可能性が高い）ことが求められます。Difyのワークフローの可視化機能やプロンプトエンジニアリングにより、透明性を確保する必要があります。

⚠️ 注意

RWDには、データ収集環境やコーディングの違いによるバイアスが含まれる可能性があります。シミュレーション結果をそのまま採用するのではなく、必ず治験責任医師（Principal Investigator）や専門家（KOL）の臨床的判断と照らし合わせ、科学的・倫理的な妥当性を確認することが不可欠です。

【出典】

医薬品の臨床試験の実施の基準に関するガイドライン

(www.mhlw.go.jp)

まとめ

治験プロトコルの最適化、特に選択・除外基準の設計は、治験のフィージビリティと成功率に直結する最大の課題です。従来のアンケートベースのフィージビリティ調査では限界がありましたが、DifyのようなLLM開発プラットフォームを活用することで、この課題を克服できます。DifyのRAGおよびワークフロー機能を用いることで、大量のRWD/EHRデータをナレッジベースとしてシミュレーションに活用し、各基準がリクルートメントプールに与える影響を定量的に分析し、最適な基準をデータ駆動で導き出すことが可能です。これにより、リクルートメント不足による治験の遅延リスクを大幅に低減し、新薬開発プロセスの効率化・高度化を実現します。導入にはデータバイアスや倫理的配慮が不可欠ですが、AI技術は治験の成功率を飛躍的に高める新たな標準ツールとなるでしょう。

監修者

株式会社ヘルツレーベン代表木下渉

株式会社ヘルツレーベン代表取締役／医療・製薬・医療機器領域に特化したDXコンサルタント／
横浜市立大学大学院ヘルスデータサイエンス研究科修了。
製薬・医療機器企業向けのデータ利活用支援、提案代行、営業戦略支援を中心に、医療従事者向けのデジタルスキル教育にも取り組む。AI・データ活用の専門家として、企業研修、プロジェクトPMO、生成AI導入支援など幅広く活動中。

https://herzleben.co.jp/

2026年1月14日

DPCデータ分析をDifyが言語化。「改善提案書」作成アシスタント

RWD_Dify, コラム一覧

DPC（診断群分類別包括評価）データは、病院経営の「羅針盤」として極めて重要ですが、その膨大なデータを分析し、経営層や診療科に響く具体的な「改善提案書」として言語化するには、高度な専門知識と多くの時間を要します。この「分析」と「提案」の間のギャップこそが、多くの病院で経営改善が停滞する最大のボトルネックです。本記事では、この課題を解決するために、Difyのような大規模言語モデル（LLM）を活用し、DPCデータ分析結果を即座に具体的な提案書へと変換するAIアシスタントのメカニズムと、それが病院経営にもたらす劇的な効果を、具体的なデータに基づいて解説します。

医療DXが加速する現代において、データ分析の「最終工程」である言語化をAIに任せることで、人間はより高度な意思決定と現場での実行に集中できるようになります。このAIアシスタントが、いかにして病院の収益改善、医療の質向上、そして医師の働き方改革を同時に実現するのか、その全貌をご覧ください。

DPCデータ分析のグラフと、AIが生成した改善提案書を受け取る病院経営者のイメージ

1. DPCデータ分析の現状と「言語化」のボトルネック

DPCデータは、病院の収益構造、診療プロセス、医療資源の投入状況などを詳細に把握するための「宝の山」です。しかし、多くの医療機関では、このデータの真価を十分に引き出せていません。課題は大きく分けて2つあります。1つは、Excelなどの汎用ツールでは、データ量増加や多角的なクロス集計といった高度な分析に限界があることです。2つ目のより大きな課題は、分析結果を具体的なアクションに繋げる「言語化」のプロセスにあります。

DPCデータ分析の重要な指標には、全国平均やベンチマーク病院と比較した「平均在院日数」、クリニカルパスの見直しに直結する「手術・処置の実施状況」、そしてコスト管理に欠かせない「薬剤費・材料費」の分析が含まれます。これらの分析結果を「なぜその課題が発生しているのか」「どのような改善策が必要か」という論理的な提案書に落とし込むには、経営分析の専門家や医師の深い理解が必要です。この専門人材の不足と、提案書作成にかかる膨大な時間こそが、病院経営改善の最大のボトルネックとなっています。

💡 ポイント

DPC分析は、単なる「集計」ではなく、他院との比較（ベンチマーキング）や時系列での変化を捉える「深掘り分析」が不可欠です。分析結果を業務改善に繋げるには、診療科・疾患レベルでの課題の「見える化」と、それを具体的な改善策として言語化する作業が成功の鍵を握ります。約8,000の病院が存在する中で、DPCシステムを採用する急性期病院は1,786施設（2024年4月時点）であり、データ活用は病院競争力を左右します。

【出典】

DPC分析は病院の「新たな武器」！事例に学ぶデータ活用成功の秘訣

(drjoy.co.jp)

2. AIアシスタントがもたらす結論：経営改善の加速化

生成AIによる医療文書作成時間が47%削減されたことを示すグラフとAIアシスタントの画面

項目	RCT (理想的な環境)	RWD (実臨床の環境)
検証目的	有効性（Efficacy）	実効性（Effectiveness）
患者集団	均質・厳格な選択基準（バイアス抑制）	多様・広範な患者背景（併存疾患含む）
データソース	症例報告書（CRF）	EHR、レセプト、レジストリ、PHR

ステップ	Difyの機能	実行されるアクション
1. 医師プロファイル取得	外部Tool連携（CRM）	医師の専門領域、過去の関心領域、直近の処方傾向データを取得。
2. RWEの抽出・文脈化	RAG & LLM Agent	プロファイルに基づき、最適なRWEレポートを検索し、要点を300字で要約。
3. プレゼン資料の骨子生成	LLM生成	要約されたRWEを基に、訴求力の高いプレゼンテーションの構成案を生成。
4. 最終確認と通知	Workflow/通知機能	生成された情報をMRのモバイルアプリにプッシュ通知し、訪問直前に確認を促す。

項目	非構造化データ（退院サマリ）	LLM抽出後の構造化データ
有害事象名	「昨夜から38.5℃の発熱と全身の紅斑」	発熱、紅斑
標準コード	（なし）	MedDRAコード（例: 10016503, 10014034）
CDISCドメイン	（なし）	AE (Adverse Event)

2026年1月8日

【Text-to-SQLの衝撃】DifyでSQL不要の患者数抽出は可能か？

RWD_Dify, コラム一覧

医療・製薬業界のマーケターにとって、データベース（DB）から必要な患者数や疾患動向のデータを抽出する作業は、常にSQLの知識という高い壁に阻まれてきました。必要な情報が目の前にあるにもかかわらず、IT部門やデータエンジニアに依頼しなければアクセスできないというボトルネックは、迅速な意思決定を妨げる大きな要因となっています。しかし、大規模言語モデル（LLM）の進化により、「Text-to-SQL」という、自然言語の質問をSQLクエリに自動変換する技術が実用化されつつあります。本記事では、このText-to-SQLの仕組みと、DifyのようなLLMオーケストレーションプラットフォームを活用することで、SQL知識ゼロのマーケターが医療データを自由に活用できるのかどうかを、技術的な観点から徹底的に解説します。この革新的な技術が、どのようにデータ活用の民主化を推進し、医療マーケティングの未来を変えるのか、その可能性と限界を探ります。

Text-to-SQLワークフローの概念図：マーケターが自然言語で質問し、LLMがSQLクエリを生成している様子

1. 結論：Text-to-SQLは「条件付きで可能」なデータ民主化の鍵

SQLを知らないマーケターがText-to-SQL技術を使ってDBから患者数を抽出することは、現在の技術レベルにおいて「条件付きで可能」であると結論付けられます。Text-to-SQLは、自然言語処理（NLP）とLLMの能力を組み合わせることで、従来のデータベース操作の障壁を劇的に低くしました。これにより、非技術者でも「過去3ヶ月間にA疾患で新規に受診した患者数を教えて」といった口語的な質問を直接データベースに投げかけられるようになります。しかし、医療データ特有の複雑性がこの「条件」を構成します。

具体的には、患者コホートの定義には疾患コード（ICD-10など）や時系列のイベント（初診日、投薬期間など）の正確な理解が不可欠です。この複雑なドメイン知識をLLMに正しく理解させるためには、Difyのようなプラットフォームを用いて、データベースのスキーマ情報だけでなく、ビジネスルールや専門用語を事前にプロンプトやセマンティックレイヤーとして組み込む高度な準備（オーケストレーション）が必要です。この準備が整えば、データ活用の民主化は大きく前進し、データ抽出にかかる時間は従来の約80%削減される可能性を秘めています。

💡 ポイント

Text-to-SQLの成功は、単なるLLMの性能ではなく、「ドメイン知識」「データベーススキーマ」「ビジネスルール」の3要素をいかに正確にプロンプトとしてLLMに提供できるか、というオーケストレーション能力に依存します。

【出典】

【2025年最新版】リレーショナルデータベースとは

(nano.globis.ac.jp)

2. Text-to-SQLの基本メカニズムとデータ民主化の衝撃

Text-to-SQLは、ユーザーが入力した自然言語のクエリ（例: 「東京支社の今月の売上トップ10の顧客リスト」）を、データベースが解釈できる正確なSQL文に変換する技術です。この技術の核となるのは、LLMの持つ高度な自然言語理解とコード生成能力です。Text-to-SQLは、単なるテキスト生成ではなく、自然言語処理（NLP）、データベース（DB）、知識表現（KR）といった複数分野の技術を融合した、特に多層的な理解と論理的整合性が求められる領域であると言えます。

この技術が注目される背景には「データ活用の民主化」があります。従来、データベースへの問い合わせにはSQLの知識が必須であり、非エンジニアのビジネスユーザーにとって大きな障壁でした。Text-to-SQLはこの壁を取り払い、誰もが自然言語でデータの取得・集計・比較・分析を行えるようにします。データ分析の民主化が促進されることで、組織全体のデータ活用率が向上し、意思決定の迅速化に貢献します。近年では、高性能LLMの登場により、ゼロショットやフューショットのプロンプトによって、従来のルールベース手法よりもはるかに柔軟で汎用的なSQL生成が可能になっています。

SQL知識の障壁撤廃: 非技術者でもデータベースに直接アクセス可能になる。
分析の迅速化: データエンジニアへの依頼待ち時間が解消され、分析サイクルが短縮される。
業務効率化: データ探索に費やされていた時間が削減され、約70%の業務効率向上が期待される。
専門知識の活用: 複雑なデータ構造を理解するための専門知識が不要になる。

RWD_Dify

Difyで実現する治験プロトコル最適化：選択・除外基準シミュレーションによるフィージビリティ飛躍的向上

1. 治験プロトコル設計の現状とリクルートメント課題

【出典】

2. 結論：DifyによるRWDシミュレーションがフィージビリティを向上させる

3. 最適化の科学的根拠：基準の厳格さがリクルートメントに与える影響

【出典】

4. Difyワークフローのメカニズム：RAGとエージェントによる基準評価

5. 選択・除外基準シミュレーションの具体的なステップと成果

6. 導入における技術的・倫理的注意点

【出典】

まとめ

株式会社ヘルツレーベン代表 木下 渉

DPCデータ分析をDifyが言語化：病院経営を加速するAI改善提案書アシスタント

1. DPCデータ分析の現状と「言語化」のボトルネック

【出典】

2. AIアシスタントがもたらす結論：経営改善の加速化

3. DifyによるDPCデータ言語化のメカニズムとプロセス

4. AIが生成する「改善提案書」の具体的な構成要素と品質

【出典】

5. AI活用による病院経営改善の事例と数値的効果

6. 導入・運用における補足情報とデータセキュリティ

まとめ

株式会社ヘルツレーベン代表 木下 渉

RWDの「再識別リスク」をAIで評価支援：匿名加工医療情報の活用基盤（Dify）構築への道

1. RWD活用に必須の「再識別リスク評価」と法規制の壁

【出典】

2. 医療情報ガイドライン準拠を支えるAI基盤（Dify）の役割

3. 国のガイドラインが要求する「再識別リスク」の定義と基準

4. AIが実現するk-匿名性・l-多様性の定量評価メカニズム

【出典】

5. AIによるリスク評価支援の具体的なステップと成功事例

【出典】

6. 再識別リスク評価における動的な注意点

まとめ

株式会社ヘルツレーベン代表 木下 渉

RCTとRWDの「乖離」をRAGで特定：AIによる医薬品開発最適化

1. RCTとRWDの乖離特定が医薬品開発の鍵となる理由

2. RCTとRWDの根本的な違い：乖離を生むメカニズム

3. Dify（RAG）を活用した「乖離」特定プロセス

【出典】

4. 乖離特定がもたらす医薬品開発と臨床現場へのベネフィット

5. 日本におけるRWD利活用の現状と課題

6. AI分析の限界とデータの品質管理

まとめ

【出典】

株式会社ヘルツレーベン代表 木下 渉

Difyで実現するRWEのパーソナライズ展開戦略

1. RWE活用の現状と本部と現場の間に存在するギャップ

【出典】

2. 結論：DifyがRWE活用にもたらす「パーソナライズ」の価値

【出典】

3. 課題解決のメカニズム：RAGとAgentによる知識の民主化

4. Dify Workflowを活用したRWEパーソナライズ展開の設計図

5. MR現場におけるRWE即時提供のケーススタディ

6. 導入・運用における留意点：データガバナンスと信頼性の確保

まとめ

【出典】

株式会社ヘルツレーベン代表 木下 渉

アンケート自由回答をDifyで自動分類：LLMクラスター分析で「薬を使わない理由」を解明

1. アンケート自由回答分析の従来の課題

【出典】

2. DifyによるLLM分類：手動アフターコーディングからの脱却

【出典】

3. 従来の分類手法：アフターコーディングとテキストマイニングの限界

4. Dify LLMノードによるセマンティック・クラスタリングの仕組み

【出典】

5. 実践ステップ：「この薬を使わない理由」を自動分類するワークフロー

6. 分析精度を最大化するプロンプト設計と構造化出力の活用

まとめ

株式会社ヘルツレーベン代表 木下 渉

製薬RWD活用のブレイクスルー：LLMによる退院サマリからの有害事象データ構造化戦略

1. 結論：RWD活用のカギは「有害事象の自動構造化」に集約される

【出典】

2. 製薬RWDにおける非構造化データの「80%の壁」と構造化の課題

3. LLMによる有害事象抽出の仕組み：プロンプトエンジニアリングとDifyの役割

4. 構造化データの品質保証：Human-in-the-loopとCDISC/MedDRAへのマッピング

【出典】

5. RWD活用加速がもたらす新薬開発・市販後安全対策へのインパクト

まとめ

株式会社ヘルツレーベン代表木下渉

株式会社ヘルツレーベン代表木下渉

株式会社ヘルツレーベン代表木下渉

株式会社ヘルツレーベン代表木下渉

株式会社ヘルツレーベン代表木下渉

株式会社ヘルツレーベン代表木下渉

株式会社ヘルツレーベン代表木下渉

株式会社ヘルツレーベン代表木下渉