コラム一覧

2026年1月5日

Difyで実現する製薬DI自動化：回答不能質問を知識に変える学習サイクル

製薬業界のDI（医薬品情報）業務は、製品の安全性と有効性を保証する上で極めて重要です。しかし、日々増大する規制文書、臨床データ、副作用報告などの膨大な情報の中から、医師や薬剤師からの専門的な質問に対し、迅速かつ正確に回答することは、担当者の大きな負担となっています。この「情報過多」と「正確性担保」という二律背反の課題を解決するブレイクスルーとして、LLMアプリケーション開発プラットフォーム「Dify」を用いたDI自動化と、その核となる学習サイクル構築が注目されています。

本記事では、DifyのRAG（検索拡張生成）機能でいかに回答の正確性を担保し、さらに回答できなかった質問データを自動で蓄積・学習させることで、AIアシスタントの知見を継続的に深化させる具体的な手法について、プロフェッショナルのメディカル・テクニカルライターが徹底的に解説します。この自律的な改善サイクルは、DI業務の効率を飛躍的に向上させ、医薬品の適正使用と安全管理体制を強化するための鍵となります。

1. 結論：Difyで実現する「自律型DIアシスタント」の全体像

Difyを用いた製薬DI業務の自動化は、単なるチャットボット導入に留まらず、RAG（検索拡張生成）とワークフロー機能を組み合わせた「自律型DIアシスタント」の構築を意味します。このシステムは、まずユーザー（医師、MRなど）からの質問をDifyのワークフローで受け付けます。次に、RAGコンポーネントが、医薬品の添付文書、社内SOP（標準作業手順書）、規制当局のガイドラインなどの社内ナレッジベースから関連性の高い情報を検索します。最後に、LLMが検索結果と質問内容を統合し、根拠に基づいた正確な回答を生成します。これにより、DI担当者の業務負荷の約70%を占めるとされる定型的な問い合わせ対応を自動化することが可能になります。

この自動化の最大のメリットは、回答の迅速化（数日かかっていた調査が数秒に短縮）と、LLMの弱点である「ハルシネーション（嘘の生成）」をRAGによって抑制し、医薬品情報に必須の「正確性」を担保できる点にあります。Difyのノーコード/ローコード環境は、専門知識を持つDI担当者自身が、プロンプトやワークフローを柔軟に改善できる開発文化の醸成にも寄与します。

【出典】

データインテグリティ（DI）とは？対応が必要な理由と対策を分かりやすく解説！

(robotics.kowa-opt.co.jp)

2. コア技術：RAGによる正確性・最新性の担保メカニズム

製薬DIの自動化において、RAG（Retrieval-Augmented Generation）は、LLMの「黒箱」問題を解決し、回答の信頼性を飛躍的に高めるための核となる技術です。RAGのプロセスは、LLMが回答を生成する前に、質問内容に関連する「信頼できる情報源」をデータベースから検索・抽出することを強制します。この信頼できる情報源には、以下のものが含まれます。

医薬品の添付文書、インタビューフォーム
社内標準作業手順書（SOP）や品質記録
PMDA（医薬品医療機器総合機構）やFDAなどの規制当局のガイドライン
査読済み医学論文、臨床試験データ

例えば、国内大手製薬会社である中外製薬では、RAGを活用した対話型AIアシスタント「Chugai AI Assistant」を開発し、社内文書の検索効率化を実現しています。これにより、副作用の分析に必要な多岐にわたる資料の準備に1週間以上かかっていた課題を解決し、メディカルライティング支援環境の構築を進めています。RAGを導入することで、LLMは常に最新かつファクトチェック済みの情報（ベクトルデータベースに格納されたナレッジ）を参照するため、回答の約90%以上の精度で根拠情報（引用元）を提示できるようになります。

💡 ポイント：RAGが防ぐ「ハルシネーション」

RAGは、AIが事実に基づかない情報を生成する現象（ハルシネーション）を抑制する最も有効な手段です。製薬分野では、誤情報が患者の安全性に直結するため、RAGによる「回答の根拠提示」は、AIシステム導入の絶対条件となります。

【出典】

医療DXについて｜厚生労働省 – mhlw.go.jp

(www.mhlw.go.jp)

3. 継続的な改善を可能にする「回答不能質問の学習サイクル」

2026年1月4日

Difyで作る論⽂仕分けアプリ Part1　　　　　　　　　　　　　　　　　　　　　　　質問から論⽂リストを取得

AI_Dify, コラム一覧

1. はじめに
2. ワークフローの全体像
3. 各ノードの詳細解説
4. まとめ

1. はじめに

本記事は、Difyのチャットワークフローを使って、PubMed論⽂の検索‧翻訳‧要約を⾃動化するシステムを構築するシリーズのPart 1です。

このシリーズでは、⾃然⾔語で検索クエリを⼊⼒して「論⽂検索→各論⽂のタイトルを⽇本語に翻訳→アブストラクト要約→Googleスプレッドシートに保存」という処理を一気に実現するワークフローについて解説します。

本記事（Part 1）では、ユーザー⼊⼒➔パラメータ抽出➔E-Search➔PMIDリスト整形までの処理を詳しく解説します。ここで整えたデータが後続のE-Fetch処理の⼟台になります。

このワークフローは、医学研究や⽂献調査の効率化に役⽴ち、特に⼤量の論⽂を扱う際の時間短縮に貢献します。

PubMed APIの基礎知識については、Part 0で詳しく解説していますので、本記事では各ノードの実装詳細に焦点を当てます。

シリーズ構成

Part0: 全体像とPubMed API基礎
Part 1（本記事）: パラメータ抽出とE-Search編
Part 2: E-Fetch とデータパース編
Part 3: AI処理‧データ整形編
Part4: データ保存とGAS連携編

2. ワークフローの全体像

このワークフローは、以下のような処理の流れで構成されています。

ユーザー⼊⼒: ⾃然⾔語での検索クエリ
現在年の取得: 年次フィルタリングに使⽤
パラメータ抽出: LLMが⾃然⾔語からPubMed検索パラメータを抽出
APIリクエスト整形: 抽出したパラメータをPubMed API形式に変換
E-Search: PubMedで論⽂ID（PMID）を検索
E-Fetch: 論⽂の詳細データ（XML）を取得
パース処理: XMLを構造化データに変換
イテレーション: 各論⽂に対してLLMで翻訳‧要約‧優先度判定
CSV⽣成: 論⽂データとAI分析結果をマージしてCSV形式に変換
GAS連携: Google Apps Scriptに送信してスプレッドシートに保存
結果返却: スプレッドシートのURLをユーザーに返却

本記事では、ステップ1〜5（E-SearchとPMID取得）までを詳しく解説します。E-Fetchとパース処理はPart 2で取り上げます。

3. 各ノードの詳細解説

3-1. ユーザー⼊⼒ノード（Start）

ワークフローの開始点となるノードです。ユーザーからの⾃然⾔語クエリを受け取ります。

設定内容

今回のワークフローでは、特に追加の設定不要です。

項⽬	設定値
ノードタイプ	Start
変数	なし

3-2.Current Time（Tool）

現在の年を取得するためのビルトインツールです。パラメータ抽出ノードで、ユーザーが「直近5年間の論⽂」のような相対的な期間指定をした際に、現在年を基準に min_year を計算するために使⽤されます。⽣成AIは基本的に「今、何⽇か？」といったデータを持っていません。そのため`CURRENT_TIME`のようなノードを使って、明⽰的に理解させる必要があります。

設定内容

項⽬	設定値
ツール名	Current Time
Format	%Y (年のみ)
Timezone	Asia/Tokyo

出⼒

text : 現在の年が出力されます（例: “2025”）

3-3.パラメータ抽出ノード（Parameter Extractor）

ユーザーの⾃然⾔語クエリ（主に⽇本語）から、PubMed APIで使⽤する検索パラメータを抽出するノードです。LLMを使⽤して構造化されたパラメータを⽣成します。このパラメータ抽出ノードがこの論⽂仕分けアプリにおいて最も重要なノードの⼀つです。

モデル設定

モデルはお好きなモデルをお使いください。

項⽬	設定値
モデル	gpt-4o-mini
プロバイダー	openai
Temperature	0.1

抽出パラメータ

パラメータ抽出ノードの [ + ]ボタンを押してパラメータを追加します。以下をそれぞれコピペして設定していくだけで⼤丈夫です。

パラメータ名	型	必須	説明（Description）
main_query	string	✅	The Search Term<br>Core topic, disease, drug, or therapy.<br><br>• Combine core concepts (e.g., “Relationship between A and B” → “A AND B”).<br>• Rule: Do NOT apply a [Title] tag here. Just provide the translated English term/MeSH.
title_filter	string	–	Strict Constraint<br>Drastically narrows results to highly relevant papers.<br><br>• Use ONLY when user explicitly says “Title must include…”, “Title search”, “タイトル検索”, or “タイトルに含まれる”.
author_filter	string	–	• Extract names<br>• Rule: Remove Japanese honorifics (e.g., “さん”, “⽒”, “先⽣”).
journal_filter	string	–	• Extract journals.
pub_type_filter	string	–	Identify implied study designs.<br><br>• “RCT”, “無作為化” → “Randomized Controlled Trial”<br>• “Review”, “まとめ” → “Review”<br>• “Meta- analysis” → “Meta-Analysis”<br>• “Case report”, “症例” → “Case Reports”
min_year	string	–	Start Date<br>The oldest year to include.<br><br>• “2023年以降”, “Since 2023″→”2023”
max_year	string	–	End Date<br>The newest year to include.
retmax	string	✅	Result Count<br>Number of papers to retrieve.<br> <br>• Extract explicit numbers: “10件”, “Top 5” → Integer (e.g., 10, 5).<br>• Default: 20 (if not specified).

プロンプト

LLMに与えるプロンプトは上記です。

※ 2ステップ⽬で作成した「CURRENT_NODE 」の出⼒を #current_yearの箇所に加えてあげることで、⽣成AIが「今、⻄暦何年か」を理解することができます。

## Role
You are an expert Medical Librarian and a PubMed Search API Specialist. Your goal is to extract search param eters from the user's natural language query (which is mostly in Japanese) and format them into a structured JSON object for the PubMed `esearch` API.

## Instructions
1.	**Translate to English**: The user input will be in Japanese. You must translate all search terms (Diseases, Drugs, Concepts) into **English** (specifically MeSH headings where applicable).
2.	**Extract Parameters**: Identify specific constraints based on the "Parameter Definition Table" below.
3.	**Determine Fetch Necessity**: Decide if the user needs `efetch` (detailed data like Abstract) or if `esumm ary` (metadata only) is sufficient.

## current_year
<year>{{/ ⟵ スラッシュボタンを押すとウィンドウが開くので、CURRENT_TIMEの出⼒を選択}}</year>
* use this year to extract `min_year` or `max_year`. if user needs 「直近5年間の〜」 it means that current_year
- 5 = min_year.

プロンプトには以下の重要な指⽰が含まれています。

翻訳ルール: ⽇本語の検索語を英語（特にMeSH⽤語）に翻訳
現在年の活⽤: Current Timeノードから現在年を取得し、「直近5年間」のような相対指定を絶対年へ変換
タイトルフィルタの厳格化: ユーザーが明⽰的に「タイトル検索」と⾔及した場合のみ title_filter を使⽤

3-4. API⽤リクエストデータ整形（Codeノード）

パラメータ抽出ノードで取得したパラメータを、PubMed APIの esearch エンドポイントで使⽤できる形式に整形するPythonコードノードです。

⼊⼒変数

変数名	ソース	型
main_query	パラメータ抽出ノード	string
title_filter	パラメータ抽出ノード	string
author_filter	パラメータ抽出ノード	string
author_filter	パラメータ抽出ノード	string
pub_type_filter	パラメータ抽出ノード	string
min_year	パラメータ抽出ノード	string
max_year	パラメータ抽出ノード	string
retmax	パラメータ抽出ノード	string

コードの処理内容

def main( 
  main_query: str, 
  title_filter: str, 
  author_filter: str, 
  journal_filter: str, 
  pub_type_filter: str, 
  min_year: str, 
  max_year: str, 
  retmax: str): 

# PubMedAPIへのクエリを格納する箱 
query_parts = [] 

# Main Query (主題) 
if main_query: 
  query_parts.append(f"({main_query})") 

# Title Filter (タイトル限定) 
if title_filter: 
  query_parts.append(f'"{title_filter}"[Title]') 

# Journal Filter (雑誌名) 
if journal_filter: 
  query_parts.append(f'"{journal_filter}"[Journal]') 

# Author Filter (著者名) 
if author_filter: 
  query_parts.append(f'"{author_filter}"[Author]') 

# Publication Type (研究デザイン) 
if pub_type_filter: 
  query_parts.append(f'"{pub_type_filter}"[Publication Type]') 

# 全てを AND で結合 
full_term = " AND ".join(query_parts) 

# フォールバック: 全て空の場合は全件検索 
if not full_term: 
  full_term = "all[sb]" 

# その他のパラメータ処理
final_retmax = retmax if retmax else "20" 
final_min_year = min_year if min_year else "" 
final_max_year = max_year if max_year else "" 

# 結果を返す 
return { 
  "search_term": full_term, 
  "retmax": final_retmax, 
  "mindate": final_min_year, 
  "maxdate": final_max_year, 
  "datetype": "pdat" 
}

処理の流れ

クエリパーツの構築: 各フィルタが存在する場合、PubMedの検索構⽂（ [Title] 、 [Journal] 、 [Author] 、 [Publication Type] ）を付与して配列に追加
AND結合:” AND “.join(query_parts)で全ての条件をANDで結合
デフォルト値処理:
- retmax が空の場合は”20″を設定
- ⽇付パラメータは空⽂字列のまま（API側で無視される）
フォールバック: 全てのクエリが空の場合は “all[sb]” （全件検索）を設定

出力

出⼒名	型	説明
search_term	string	PubMed検索クエリ（例: “(diabetes) AND \”insulin\”[Title]”）
retmax	string	取得件数
mindate	string	開始年
maxdate	string	終了年
datetype	string	⽇付タイプ（”pdat” = 公開⽇）

3-5. E-Search（HTTP Requestノード）

PubMedの E-search APIを呼び出して、検索条件に⼀致する論⽂のPMID（PubMed ID）リストを取得するノードです。

設定内容

上記の画像を参考にしながら、以下の項⽬を設定してください。

項⽬	設定値
メソッド	ヘッダー
URL	https://eutils.ncbi.nlm.nih.gov/entrez/eutils/esearch.fcgi
認証	今回はなし（API_KEYによる認証を⾏うと⾼頻度‧⼤量にデータを取得可能）
ヘッダー	Content-Type:application/json

設定内容

パラメータ名	値	説明
db	pubmed	データベース（PubMed）
term	{{#search_term#}}	検索クエリ
retmax	{{#retmax#}}	取得件数
retmode	json	レスポンス形式
mindate	{{#mindate#}}	開始年
maxdate	{{#maxdate#}}	終了年

レスポンス例

{ 
  "esearchresult": { 
    "idlist": ["12345678", "23456789", "34567890"] 
  }
}

3-6. 配列を⽂字列に変換（Codeノード）

E-Searchのレスポンス（JSON形式）からPMIDの配列を抽出し、カンマ区切りの⽂字列に変換するノードです。次のE- Fetchノードで使⽤するため、PMIDを⽂字列形式に整形します。

⼊⼒変数

変数名	ソース	型
body	E-Searchノード	string

コード

import json

def main(body) -> dict:
# 値が空（想定外のエラー）の時はエラー 
if not body: 
  raise Exception("Invalid parameter") 

# pmidの配列を読み込み 
id_list = json.loads(body) 

# 配列をカンマ区切りで展開して返却 
return {
  "result": ",".join(id_list["esearchresult"]["idlist"]) 
}

処理の流れ

JSONパース: E-SearchのレスポンスをJSONとして解析
PMID抽出: esearchresult.idlist からPMIDの配列を取得
⽂字列変換: “,”.join() でカンマ区切りの⽂字列に変換（例: “12345678,23456789,34567890”）

出力

出⼒名	型	説明
result	string	string

4. まとめ

本記事（Part 1）では、DifyのチャットワークフローでPubMed検索を開始するための「前半戦」を解説しました。

本記事で実現したこと

⾃然⾔語クエリからPubMed検索パラメータへの変換
PubMed API（E-Search）での論⽂ID（PMID）検索
後続処理に渡すためのPMID⽂字列整形

次のステップ

次回のPart 2では、ここで取得したPMIDを⽤いてE-Fetchを呼び出し、論⽂の詳細データ（XML）を取得‧パースする処理を解説します。XMLから必要項⽬を抽出する実装を中⼼に取り上げます。

シリーズ記事

Part0: 全体像とPubMed API基礎
Part 1: パラメータ抽出とE-Search編
Part 2（次回記事）: E-Fetchとデータパース編
Part 3: AI処理‧データ整形編
Part4: データ保存とGAS連携編

ヘルツレーベンでは、ライフサイエンス業界に特化したDX・自動化支援を提供しています。
PubMedや学術情報の自動収集をはじめ、Slack・Gmailなどを活用したナレッジ共有の仕組みまで、実務に直結するワークフローを設計・導入いたします。

提供サービスの例

製薬・医療機器業界での提案活動や調査業務の自動化支援
アカデミアや研究者向けの文献レビュー・情報共有フローの最適化
医療従事者のキャリア開発を支援するリスキリングプログラム

👉 ご興味をお持ちの方はぜひお気軽にお問い合わせください。
お問い合わせフォームはこちら

監修者　株式会社ヘルツレーベン代表木下渉

株式会社ヘルツレーベン代表取締役／医療・製薬・医療機器領域に特化したDXコンサルタント／
横浜市立大学大学院ヘルスデータサイエンス研究科修了

製薬・医療機器企業向けのデータ利活用支援、提案代行、営業戦略支援を中心に、医療従事者向けのデジタルスキル教育にも取り組む。AI・データ活用の専門家として、企業研修、プロジェクトPMO、生成AI導入支援など幅広く活動中

2026年1月4日

MSLの知識武装を加速するDify×RAG活用法

メディカルアフェアーズ x Dify, コラム一覧

メディカル・サイエンス・リエゾン（MSL）の皆様は、常に最新の医学・薬学情報を収集し、専門家（KOL/TL）との質の高い科学的議論に備えるという、極めて重要な責務を担っています。しかし、年間数万報に及ぶ膨大な論文や臨床試験データを、限られた時間で網羅的に学習し、即座に想定問答を作成する作業は、非効率的で大きな負担となっています。本記事では、この課題を解決するデジタルトランスフォーメーション（DX）の手法として、LLMアプリケーション開発プラットフォーム「Dify」と、そのコア技術である「RAG（検索拡張生成）」を組み合わせた、MSL向け論文学習・想定問答自動生成システムの構築方法を、具体的なステップとコンプライアンス上の留意点を含めて、プロフェッショナルな視点から徹底解説します。

1. MSLの抱える課題：膨大な論文学習と即時対応のジレンマ

メディカル・サイエンス・リエゾン（MSL）は、高度な専門知識を基盤とし、社外の医科学専門家（KOL/TL）と科学的中立な立場で医学的・科学的な交流を行う役割を担っています。この役割を果たすため、最新の論文、ガイドライン改訂情報、学会発表データなど、担当領域に関する最新情報を常に収集・理解することが不可欠です。しかし、特にがんや希少疾患といった高度な専門性が求められる領域において、情報量は年々増加の一途を辿っており、従来の属人的な学習方法では限界に達しています。例えば、ある特定の治療領域における年間新規論文数は数千報に上ることも稀ではありません。この膨大な情報を網羅的に読み込み、KOLからの予期せぬ質問（想定問答）に対して即座に科学的根拠（エビデンス）を提示できるよう準備することは、MSLの日常業務における最大のボトルネックの一つです。

この課題を解決するためには、単なる情報検索ではなく、情報を文脈に応じて整理・統合し、対話形式で知識を引き出すAI技術、すなわちDXの導入が必須となっています。特に、KOLとの議論の場で、質問に対して即座に正確な論文の出典と要点を提示できる能力は、MSLの信頼性を高め、企業の科学的ブランド価値を向上させる上で極めて重要です。

【出典】

「MSL活動の現状」グローバルな視点から求められる

(www.pwc.com)

2. 結論：DifyとRAGが実現する学習効率の劇的向上

2025年12月28日

Difyで作る医学論⽂仕分けアプリ: 全体像とPubMedAPI基礎

AI_Dify, コラム一覧

1. はじめに
2. ワークフローの全体像
3. PubMed API基礎知識
4. このワークフローで実現すること
5. シリーズ構成
6. まとめ

1. はじめに

本シリーズでは、Difyのチャットワークフローを使⽤して、PubMed論⽂の検索‧翻訳‧要約を⾃動化するシステムの構築⽅法を解説します。

⾃然⾔語で検索クエリを⼊⼒すると、論⽂を検索し、各論⽂のタイトルを⽇本語に翻訳、アブストラクトを要約し、優先度を判定した上で、Googleスプレッドシートに保存するまでの⼀連の流れを実現します。

このワークフローは、医学研究や⽂献調査の効率化に役⽴ち、特に⼤量の論⽂を扱う際の時間短縮に貢献します。

1-1. 完成イメージ

完成イメージ（スプレッドシート） — スプレッドシートを⾒ると条件に⼀致する論⽂を保存してくれる（今回はテスト⽤に2件のみ）

本記事（Part 0）では、ワークフローの全体像とPubMed APIの基礎知識を解説します。これらを理解することで、以降のPart 1〜Part 4で解説する各ノードの実装がより深く理解できるようになります。

シリーズ構成

Part0（本記事）: 全体像とPubMed API基礎
Part 1: パラメータ抽出とE-Search編
Part 2: E-Fetchとデータパース編
Part 3: AI処理‧データ整形編
Part4: データ保存とGAS連携編

2. ワークフローの全体像

このワークフローは、以下の5つの主要なステップで構成されています。

2-1. ステップ1: 検索パラメータの抽出（Part 1）

ユーザーが⾃然⾔語で⼊⼒した検索クエリ（例: 「糖尿病のインスリン療法に関する2020年以降のRCT」）を、PubMed APIで使⽤できる検索パラメータに変換します。

⼊⼒: ⾃然⾔語クエリ（⽇本語）
処理: LLMによるパラメータ抽出
出⼒: 構造化された検索パラメータ（ main_query , title_filter , author_filter 等）

2-2. ステップ2: E-Fetchとデータパース（Part 2）

Part 1で⽣成したPMIDリストをもとに、⽤途に応じてE-Fetchまで論⽂詳細データを取得します。

論⽂詳細取得: E-Fetchによるデータ取得
E-Fetch: XMLレスポンスを取得
XML/JSONパース: LLMが扱いやすいPython dict/listへ整形

2-3. ステップ3: AIによる要約⽣成（Part 3）

取得した論⽂データに対して、LLMを使⽤して以下の処理を⾏います。

タイトル翻訳: 英語のタイトルを⾃然な⽇本語に翻訳
要約⽣成: アブストラクトを100〜200⽂字の⽇本語で要約
優先度判定: ユーザーの検索意図に基づいて、各論⽂の重要度をHIGH/MID/LOWで判定
データマージ: 元データとAI分析結果を統合
CSV⽣成: スプレッドシート保存⽤のCSV形式に変換

2-4. ステップ4: スプレッドシートへの保存（Part 4）

⽣成したCSVデータをGoogle Apps Script（GAS）経由でGoogleスプレッドシートに保存します。

GAS連携: CSVデータをGASのWebhookエンドポイントに送信
スプレッドシート保存: GASがCSVをパースしてスプレッドシートに追記
結果返却: スプレッドシートのURLをユーザーに返却

2-5.全体のデータフロー

ユーザー⼊⼒（⾃然⾔語）
↓
パラメータ抽出（LLM）
↓
E-Search（PMIDリスト取得）
↓
E-Fetch（詳細データ取得）
↓
XML/JSONパース
↓
イテレーション + LLM（翻訳‧要約‧優先度判定）
↓
CSV⽣成
↓
GAS連携（スプレッドシート保存）
↓
結果返却（URL）

3. PubMed API基礎知識

ワークフローの解説に映る前に、part0となる本記事では、PubMed APIについて解説します。

3-1. PubMed APIとは

PubMed APIは、⽶国国⽴医学図書館（NLM）が提供する⽣物医学分野の⽂献データベース「PubMed」にプログラムからアクセスするためのインターフェースです。正式名称は「Entrez Programming Utilities（E-utilities）」または「E-Utils」と呼ばれます。

このAPIを使⽤することで、プログラムからPubMedのデータを検索し、論⽂情報を⾃動的に取得‧処理することが可能になります。

3-2. 基本的な使⽤フロー

PubMed APIを使⽤する際は、以下の3つのステップを順番に実⾏する必要があります。

ステップ1: E-Search – 論⽂のリスト（PMID）を取得

まず、E-Searchを使⽤して、特定のキーワードや検索条件に合致する論⽂のPubMed ID（PMID）のリストを取得します。

重要なポイント: E-Searchは論⽂の詳細情報を返すのではなく、検索結果に該当する論⽂のPMID（識別番号）のリストのみを返します。このリストを取得することが、後続の処理の第⼀歩となります。

使用例:

https://eutils.ncbi.nlm.nih.gov/entrez/eutils/esearch.fcgi?db=pubmed&term=cancer

このリクエストにより、キーワード「cancer」に該当する論⽂のPMIDリストを取得できます。

ステップ2: E-SummaryまたはE-Fetch – 詳細情報を取得

E-Searchで取得したPMIDリストを基に、E-SummaryまたはE-Fetchを使⽤して各論⽂の詳細情報を取得します。

3-3. E-SummaryとE-Fetchの使い分け

E-Summary: 軽量な概要情報の取得

取得できる情報:

タイトル
著者名
掲載誌名
出版年
基本的なメタデータ

特徴:

データ量が少なく、処理が⾼速
多数の論⽂の概要を⼀括で把握するのに適している
アブストラクト（要旨）は含まれない

使⽤例:

https://eutils.ncbi.nlm.nih.gov/entrez/eutils/esummary.fcgi?db=pubmed&id=12345678

E-Fetch: 詳細情報の取得

E-Fetchの⽅が詳細取得が可能なため、今回のワークフローではこちらをメインに使⽤します。

取得できる情報:

E-Summaryで取得できるすべての情報
アブストラクト（要旨）
MeSH⽤語（医学主題⾒出し）より詳細なメタデータ
全⽂へのリンク（利⽤可能な場合）

特徴:

アブストラクトや詳細な情報が必要な場合に使⽤
データが多いので必要最⼩限の論⽂に対して使⽤すると効率的

使⽤例:

<https://eutils.ncbi.nlm.nih.gov/entrez/eutils/efetch.fcgi?db=pubmed&id=12345678&retmode=xml>

使い分けの指針

まずE-Summaryで概要を確認: 多数の論⽂を処理する場合や、タイトルや著者などの基本情報だけで⼗分な場合は、E-Summaryを使⽤します。これにより、処理速度を向上させることができます。
必要に応じてE-Fetchで詳細を取得: アブストラクトやMeSH⽤語など、より詳細な情報が必要な場合のみ、E-Fetchを使⽤します。E- Fetchはデータ量が多いため、必要な論⽂に対してのみ使⽤することを推奨します。
効率的な処理フロー:
- E-SearchでPMIDリストを取得
- E-Summaryで全論⽂の概要を確認
- 必要な論⽂のみを選別
- 選別した論⽂に対してE-Fetchで詳細情報を取得

今回作成した論⽂仕分けアプリは、最終的にスプレッドシートに論⽂を蓄積していくことも⽬標の⼀つです。そのため、E-Summaryは使わずにE-Fetchを活⽤したフローとなっています。ただE-Summaryも使えるようなフローを作成したので興味がある⽅は、後続の記事を読んで試してみてください。

3-4. 注意点

レート制限

1秒間に3回以上のリクエストを⾏わないようにする必要があります
過度なリクエストを⾏うと、アクセスが制限される可能性があります
⼤量のデータを取得する場合は、適切な間隔を設けてリクエストを⾏います

APIキー

APIキーを取得することで、秒あたりのアクセス上限を増やすことが可能です
APIキーはNCBIのアカウントから取得できます

利⽤規約

NCBIの利⽤規約を遵守する必要があります
商⽤利⽤や⼤量のデータ取得を⾏う場合は、特に注意が必要です

3-5. PubMed APIのまとめ

PubMed APIを使⽤する際の基本的な流れは以下の通りです：

E-Search: 検索条件に基づいてPMIDリストを取得（必須の第⼀歩）
E-Summary: 基本的な情報を⾼速に取得（概要把握に適している）
E-Fetch: 詳細な情報を取得（アブストラクトなどが必要な場合のみ）

この3つのAPIを適切に組み合わせることで、効率的にPubMedから論⽂情報を取得し、研究や業務の効率化を図ることができます。

本ブログシリーズで解説するワークフローでは、E-Summaryは使⽤しませんが、E-Fetchと同様の⽅法で情報が取得できるため、興味のある⽅は試してみて下さい。

4. このワークフローで実現すること

このワークフローを構築することで、以下のようなことが実現できます。

4-1. ⾃然⾔語での論⽂検索

ユーザーは、複雑なPubMed検索構⽂を覚える必要がなく、⾃然⾔語で検索クエリを⼊⼒するだけで、適切な検索が実⾏されます。

例:

「糖尿病のインスリン療法に関する2020年以降のRCT」
「タイトルにCOVID-19を含むレビュー論⽂」
「⼭⽥太郎⽒が著者の2023年の論⽂」

4-2. ⾃動的な翻訳と要約

取得した論⽂のタイトルを⾃動的に⽇本語に翻訳し、アブストラクトを要約します。

これにより、英語が苦⼿な研究者でも、論⽂の内容を素早く把握できます。

4-3. 検索意図に基づく優先度判定

ユーザーの検索意図を考慮して、各論⽂の重要度を⾃動的に判定します。

これにより、⼤量の論⽂の中から、特に重要な論⽂を優先的に確認できます。

4-4. スプレッドシートへの⾃動保存

処理結果をGoogleスプレッドシートに⾃動保存することで、以下のメリットがあります。

共有が容易: チームメンバーと簡単に共有できる
分析が容易: スプレッドシートの機能を使って、データの分析や可視化が可能
履歴管理: 過去の検索結果を蓄積し、後から参照できる

5. シリーズ構成

本シリーズは、以下の5つの記事で構成されています。

パート	主な内容
Part 0（本記事）: 全体像とPubMed API基礎	・ワークフローの全体像・PubMed APIの基礎知識・このワークフローで実現すること
Part 1: パラメータ抽出とE-Search編	・ユーザー⼊⼒ノード・Current Time / パラメータ抽出ノード・E-SearchとPMID整形
Part 2: E-Fetch / E-Summaryとデータパース編	・E-Fetchによる論⽂情報取得・変数集約器とXML/JSONパース
Part 3: AI処理‧データ整形編	・イテレーション処理（並列）・LLMによる翻訳‧要約‧優先度判定・CSV⽣成処理
Part 4: データ保存とGAS連携編	・CSV統合とGASへのPOST送信・GASコードの詳細解説

6. まとめ

本記事（Part 0）では、Difyを使⽤した論⽂検索‧翻訳‧要約ワークフローの全体像と、PubMed APIの基礎知識を解説しました。

次のステップ

次回のPart 1では、⾃然⾔語クエリをPubMed検索パラメータへ落とし込み、E-SearchでPMIDリストを取得するところまでを詳しく解説します。具体的には、以下のノードを実装していきます。

開始ノード
Current Time取得（⽇付確認⽤）
⽂章からパラメーター取得（パラメータ抽出ノード）
API⽤リクエストデータ整形（Codeノード） E-Search（HTTP Requestノード）
PMID配列→⽂字列変換（Codeノード）

これらのノードを実装することで、⾃然⾔語での論⽂検索から詳細データの取得までが⾃動化されます。

シリーズ記事

Part0（本記事）: 全体像とPubMed API基礎
Part 1: パラメータ抽出とE-Search編
Part 2: E-Fetchとデータパース編
Part 3: AI処理‧データ整形編
Part4: データ保存とGAS連携編

提供サービスの例

製薬・医療機器業界での提案活動や調査業務の自動化支援
アカデミアや研究者向けの文献レビュー・情報共有フローの最適化
医療従事者のキャリア開発を支援するリスキリングプログラム

👉 ご興味をお持ちの方はぜひお気軽にお問い合わせください。
お問い合わせフォームはこちら

監修者　株式会社ヘルツレーベン代表木下渉

コラム一覧

Difyで実現する製薬DI自動化：回答不能質問を知識に変える学習サイクル

1. 結論：Difyで実現する「自律型DIアシスタント」の全体像

【出典】

2. コア技術：RAGによる正確性・最新性の担保メカニズム

【出典】

3. 継続的な改善を可能にする「回答不能質問の学習サイクル」

4. DI自動化のための具体的な構築ステップとデータ準備

【出典】

5. 法規制（GVP/GCP）遵守のためのAI活用における留意点

まとめ

【出典】

株式会社ヘルツレーベン代表 木下 渉

1. はじめに

2. ワークフローの全体像

3. 各ノードの詳細解説

3-1. ユーザー⼊⼒ノード（Start）

3-2.Current Time（Tool）

3-3.パラメータ抽出ノード（Parameter Extractor）

3-4. API⽤リクエストデータ整形（Codeノード）

3-5. E-Search（HTTP Requestノード）

3-6. 配列を⽂字列に変換（Codeノード）

4. まとめ

本記事で実現したこと

次のステップ

MSLの知識武装を加速するDify×RAG活用法

1. MSLの抱える課題：膨大な論文学習と即時対応のジレンマ

【出典】

2. 結論：DifyとRAGが実現する学習効率の劇的向上

3. RAGの技術的メカニズム：製薬業界の課題を解決する仕組み

【出典】

4. Difyによる想定問答自動生成の具体的なステップ

【出典】

5. DX効果：MSLの活動時間創出と科学的ブランド価値の向上

6. コンプライアンスと倫理的配慮：AI導入における最重要課題

まとめ

【出典】

株式会社ヘルツレーベン代表 木下 渉

AIが瞬時に指摘！新旧医療ガイドライン比較で見つける「治療方針の重要変化」

1. 結論：AIによる差分指摘は治療の質と安全性を高める

2. AIによるガイドライン差分検出の技術的メカニズム

【出典】

3. 【具体例】AIが発見する治療方針の3大変化

【出典】

4. AIがもたらす業務効率化と臨床的ベネフィット

5. AI導入における課題とヒューマンチェックの重要性

6. AI時代に求められる医療従事者のスキルセット

【出典】

まとめ

株式会社ヘルツレーベン代表 木下 渉

「先生、それどういう意味？」Difyで医学用語を平易に変換する「逆翻訳」プロンプト術

1. 逆翻訳プロンプトの基本構造と導入のメリット

【出典】

2. AIに「共感力」を持たせるペルソナ指定術

【出典】

3. 難解な専門用語を「短い単文」に変換する技術

4. Difyで実現する「逆翻訳」

5. 情報の正確性担保と倫理的配慮：AI時代の責任

まとめ

株式会社ヘルツレーベン代表 木下 渉

患者の潜在ニーズを可視化：Difyを活用したWeb/SNSリアルタイムトレンド分析戦略

1. 潜在ニーズ可視化の結論：鍵はDifyによる非構造化データの統合分析

【出典】

2. 従来型分析の限界とWeb・SNS情報の圧倒的優位性

3. Difyワークフローを活用したデータ収集とRAGメカニズム

【出典】

4. ケーススタディ：慢性疾患領域における潜在ニーズ特定と製品改善

5. 分析レポート作成のポイントと厳守すべき倫理的配慮

まとめ

株式会社ヘルツレーベン代表 木下 渉

Difyで実現する学会抄録「3行要約」ボット構築ノウハウ

1. 結論：DifyのRAGとプロンプト制御が「3行要約」を実現する

2. なぜ今、学会抄録の「超要約」が必要なのか

【出典】

3. Difyで構築する「学会専用」RAGシステムの基本構造

【出典】

4. 精度を担保する！3行要約プロンプト設計の3要素

5. 超要約ボット運用における注意点と精度向上の鍵

まとめ

株式会社ヘルツレーベン代表 木下 渉

株式会社ヘルツレーベン代表木下渉

株式会社ヘルツレーベン代表木下渉

株式会社ヘルツレーベン代表木下渉

株式会社ヘルツレーベン代表木下渉

株式会社ヘルツレーベン代表木下渉

株式会社ヘルツレーベン代表木下渉

株式会社ヘルツレーベン代表木下渉

株式会社ヘルツレーベン代表木下渉