AI_Dify

項目	従来の課題	Difyによる解決
問い合わせ分類	手動による緊急度・カテゴリ分類に時間がかかり、対応遅延が発生。	AIが問い合わせ内容を即座に解析し、緊急度（高・中・低）とカテゴリ（バグ、機能要望など）を自動分類。
傾向抽出	大量のレビューから改善点を特定するのに数週間を要していた。	トピックモデリング機能で、特定の機能に関するネガティブな言及が前月比で約20%増加している傾向を自動抽出。
レポート生成	分析結果をまとめるためのデータ集計とレポート作成に工数がかかっていた。	解析結果を基に、マーケティングレポートや製品改善提案書をAIが自動生成。

2026年2月7日

Difyで構築した医療AIの「暴走」をどう防ぐ？安全設計を実現する3つの運用ポイント

大規模言語モデル（LLM）の進化は、Difyのようなノーコードプラットフォームを通じ、医療現場のDXを加速させています。しかし、その利便性の裏側には、AIが事実と異なる情報を自信満々に生成する「ハルシネーション」（暴走）という、特に医療分野では致命的なリスクが潜んでいます。誤った診断や治療方針につながる情報は、患者の安全に直結するため、AIの安全設計は最優先事項です。

本記事は、Difyを用いて医療AIを構築・運用する担当者向けに、ハルシネーションや不適切な応答といった「暴走」を未然に防ぎ、信頼性を確保するための、実践的な3つの運用ポイントを解説します。これらの対策を徹底することで、医療AIを安全な「臨床支援ツール」へと進化させることができます。

医療AIの安全設計を表す、RAG、ガードレール、人によるチェックの3層構造の概念図

1. 医療AIの暴走を防ぐ3つの運用ポイント

医療AIにおける「暴走」とは、単なる誤答ではなく、患者の安全や治療方針に影響を及ぼす誤情報を生成することです。これを防ぐためには、技術的な対策と、それを支える運用体制の確立が不可欠です。DifyのようなLLMプラットフォームを活用する上で、特に重要な運用ポイントは以下の3点に集約されます。

厳格なRAG設計と信頼できる知識ベースの構築: LLMの弱点である知識不足を、正確な医療データで補完するファクトベースの徹底。
AIガードレールとプロンプトエンジニアリングの徹底: 不適切な質問や出力そのものをシステムレベルで制御し、倫理的な逸脱を防ぐ。
LLMOpsとHuman-in-the-Loop（HITL）による継続的改善: 人間による最終確認と、利用状況に基づいたシステムの継続的な精度向上。

これら3つのポイントは、単独ではなく多層防御（Defense in Depth）として機能させることで、ハルシネーションの発生率を実務に支障がないレベルまで大幅に抑制することが可能です。特に医療・金融・法務といったクリティカルな領域では、ハルシネーションが「致命的な問題」につながるため、これらの運用体制の確立は不可欠です。

2. 運用ポイント1: 厳格なRAG設計と信頼できる知識ベースの構築

Difyで医療AIを構築する際の最も有効な暴走対策が、RAG（Retrieval-Augmented Generation：検索拡張生成）の厳格な設計です。LLMは確率に基づいて次の単語を予測するため、学習データにない情報や古い情報に対して「もっともらしい嘘」（ハルシネーション）をつく傾向があります。RAGはこの問題を解決し、LLMが回答を生成する前に、外部の信頼できる情報源（電子カルテ、最新の臨床ガイドライン、院内マニュアルなど）から関連データを検索・参照することを強制します。

このRAGを機能させる上で重要なのは、単にデータを登録するだけでなく、「知識ベース」の品質を厳格に管理することです。RAGの導入効果は、検索エンジンの性能によって大きく左右され、検証データではツールによって回答の正答率に約40%もの開きが出たというデータもあります。 Difyでは、知識ベースのチャンキング（分割）方法や埋め込みモデルの選定を最適化し、LLMに「わからない場合は根拠を示さない」または「わからないと答える」よう明確に指示することが、正確性を約70%向上させる鍵となります。

💡 ポイント: RAGのファクトチェック機構

RAGによって回答の根拠となった情報（ソースドキュメント）を必ず提示させ、ユーザー（医療従事者）が情報の正確性を確認できる「透明性」を確保することが、医療AIの信頼性を高める上で最も重要です。

【出典】

AIの設計・開発・運用をガイドラインでサポート

(www.aist.go.jp)

3. 運用ポイント2: AIガードレールとプロンプトエンジニアリングの徹底

項目	セルフホスト（推奨）	クラウドホスト（要検討）
データ機密性	院内閉域網で完結。最高レベルの機密性を確保。	データ転送・保存時にセキュリティ対策が必須。
コンプライアンス	厚労省ガイドライン準拠が容易。	外部サービスのセキュリティ監査が必須。
カスタマイズ性	LLMやRAGの構成を自由に調整可能。	サービス提供者の制約を受ける。

2026年2月6日

Difyエージェントの出力制御：医療現場で信頼されるAI運用のための安全設計ロードマップ

AI_Dify, コラム一覧

大規模言語モデル（LLM）を活用したAIエージェントは、医療現場における業務効率化や診断支援の可能性を秘めています。しかし、その「ハルシネーション」（もっともらしい誤情報生成）のリスクは、患者の命に関わる医療分野において最大の課題です。特に、Difyのようなローコードプラットフォームでエージェントを構築する際、いかにしてAIの出力を厳格に制御し、信頼性を担保するかが、実運用への鍵となります。本記事では、プロフェッショナルなメディカル・テクニカルライターの視点から、Difyエージェントを医療現場で安全に運用するための「出力制御ロードマップ」を、具体的な技術ステップと法的・倫理的課題への対応を含めて解説します。このロードマップに従うことで、生成AIの恩恵を最大限に享受しつつ、医療安全基準を満たすAIシステムの設計が可能になります。

1. 医療AIにおける「ハルシネーション」の深刻なリスク

LLMが生成する誤情報、すなわちハルシネーションは、医療分野において致命的な結果を招く可能性があります。例えば、LLMが医療指示の要約を作成する際、元の文書では「5mg錠剤を1日1回摂取」とされていたにもかかわらず、「50mg錠剤を1日3回摂取」という誤った指示を生成する事例が報告されています。これは、患者に本来の用量の30倍の薬品を摂取させることになる、極めて高リスクなハルシネーションです。

また、AIが生成する情報は一見すると流暢で自信ありげに見えるため、専門家でも見抜くことが困難な場合があります。ある研究では、ChatGPT-3.5が精神医学関連の論文を引用した際、約55%が架空の論文であったことが判明しており、著者名や掲載誌まで「それらしく」捏造されていました。このようなリスクを回避するためには、単一の対策ではなく、Difyエージェントの設計段階から多層的な出力制御を組み込むことが不可欠です。この高いリスクを背景に、医療AIの導入においては、最終的な判断を必ず人間が行う「Human-in-the-Loop」の原則が必須とされています。

【出典】

令和6年版情報通信白書｜生成AIが抱える課題

(www.soumu.go.jp)

2. 結論：信頼されるAI運用のための多層的出力制御ロードマップ

医療現場でDifyエージェントを安全に運用するには、単なるプロンプト調整だけでは不十分であり、「入力→処理→出力」の各段階で厳格な制御をかける多層防御の仕組みが必要です。これは、厚生労働省が定める「医療デジタルデータのAI研究開発等への利活用に係るガイドライン」など、日本の医療AI規制環境に準拠するための基本戦略となります。

このロードマップは、以下の3つのフェーズで構成されます。各フェーズは前のフェーズのリスクを補完し、最終的な出力の信頼性を飛躍的に高めることを目的としています。約90%の医療リスクは、このロードマップの「情報源の限定」と「最終検証」のフェーズで効果的に低減可能となります。

フェーズ	Dify機能	制御の目的	リスク低減率（目標）
初期安全性の確保	プロンプトエンジニアリング	役割と制約の明確化	約30%
情報源とアクションの限定	RAG / Tool Calling	ハルシネーションの構造的排除	約60%
最終出力の検証	後処理 / 外部フィルタ	ガイドライン・倫理的適合性の確認	約90%以上

💡 ポイント

医療AIの安全設計は「多層防御」が大原則です。Difyのプロンプト、RAG、Tool Callingを組み合わせ、さらに外部の検証機構を最終フィルタとして機能させることで、単一の技術に依存するリスクを回避します。

3. ステップ1: プロンプトエンジニアリングによる初期安全性の確保

2026年1月25日

Difyでつくる論⽂仕分けアプリ part4: Difyと GASの連携

AI_Dify, コラム一覧

1. はじめに
2. Part 3からの流れ
3. Dify側の保存フロー
4. Google Apps Scriptとは？
5. GASの作り⽅とデプロイ⼿順
6. 動作確認とプレビュー
7. まとめ

1. はじめに

本記事は、Difyのチャットワークフローを使ってPubMed論⽂の検索‧翻訳‧要約を⾃動化するシリーズのPart 4です。

これまでの復習:

Part 0: ワークフローの全体像とPubMed APIの基礎
Part 1: ⾃然⾔語クエリからE-SearchでPMIDを取得
Part 2: E-Fetch / E-Summaryで詳細データを取得し、XML/JSONをパース
Part 3: LLMでタイトル翻訳‧要約‧優先度判定を⾏い、CSVを⽣成

Part 4（本記事）では、⽣成したCSVデータをGoogle Apps Script（GAS）に送信してスプレッドシートへ保存する処理を解説します。GASの基礎知識から実装⼿順、コードの詳細解説まで、⼀通り理解できるように構成しています。これにより、ユーザーはスプレッドシートのURLを受け取り、結果を即座に確認できるようになります。

シリーズ構成

Part0: 全体像とPubMed API基礎
Part 1: パラメータ抽出とE-Search編
Part 2: E-Fetchとデータパース編
Part 3: AI処理‧データ整形編
Part4（本記事）: データ保存とGAS連携編

2. Part 3からの流れ

Part 3で⽣成したCSVは以下の形式でした。

"PMID","Priority","Title_JP","Summary","Title_EN","Authors","Journal","Year","DOI","MeSH_Keywords","URL","m ain_author_affiliation","research_area","publication_types","population"
"12345678","HIGH","糖尿病におけるインスリン療法の効果","本研究は、2型糖尿病患者におけるインスリン療法の
有効性を検証した。...","Effect of Insulin Therapy in Type 2 Diabetes","John Smith, Jane Doe","Diabetes Resear ch","2024","10.1234/example","diabetes, insulin, therapy","<https://pubmed.ncbi.nlm.nih.gov/12345678/","Uni
versity> of Tokyo","内分泌","Randomized Controlled Trial","2型糖尿病患者（成⼈）"

このCSV⽂字列をGASに送信してスプレッドシートに保存します。

3. Dify側の保存フロー

3-1. GASに追記（HTTP Request）

以下の画像ではURL保護のためにグレーアウトさせていますが、本記事の後半で設定方法を解説していますので順に読み進めて問題ありません。

項⽬	設定値
メソッド	POST
URL	URLは後ほどGAS側の設定をした後に発⾏されるものをコピーして使います。ここでは⼀旦スキップで⼤丈夫です。
ヘッダー	Content-Type:application/json

このノードでは、DifyからGoogle Apps Script（GAS）のWebアプリを呼び出して、CSVデータをスプレッドシートに保存します。

リクエスト例

{ 
  "csv_string": "{{#csv_string#}}"
}

Part3で作成したCSV⽣成ノードからの csv_string を、JSON形式でGASに送信します。

レスポンス例

{ 
  "status": "success", 
  "message": "Data appended successfully", 
  "spreadsheet_url": "<https://docs.google.com/spreadsheets/d/>..."
}

GASからは、処理結果とスプレッドシートのURLが返されます。

3-2.スプレッドシートURLを抽出

import json

def main(body: str): 
  if not body: 
    raise ValueError("invalid parameter") 
  result = json.loads(body) 
  return {"spreadsheet_url": result["spreadsheet_url"]}

GASからのレスポンスから、スプレッドシートのURLを抽出します。

3-3. Answerノード

応答：{{#spreadsheet_url#}}
出⼒: スプレッドシートへのリンクのみをシンプルに表⽰

ここまででDify側のフローは完成しますが、実際に動作させるためには、GASのWebアプリを作成‧デプロイする必要があります。以下、GASの基礎から実装⼿順まで順を追って解説します。

4. Google Apps Scriptとは？

4-1. Google Apps Scriptの概要

Google Apps Script（GAS）はGoogleが提供するクラウドベースのJavaScript実⾏環境で、Google Workspace（スプレッドシート、ドライブ、メール、カレンダーなど）を⾃動化‧拡張するために設計されたプラットフォームです。ブラウザ上のエディタだけで完結し、インフラ構築やサーバ管理なしでスクリプトを動かせるため、「ちょっとした業務⾃動化」から「⼩さな業務システム」までを素早く⽴ち上げられる点が特徴です。

4-2. Google Apps Scriptの主な特徴

特徴	説明
無料で利⽤可能	Googleアカウントさえあれば、追加費⽤なしで利⽤できます。Google Workspace有償プランでも追加課⾦なく使えます。
Google Workspaceとの親和性	スプレッドシート、ドライブ、メール、カレンダーなどとネイティブに連携でき、専⽤のAPIが多数⽤意されています。
Webアプリとして公開可能	HTTPリクエストで呼び出せるWebエンドポイントを数クリックで公開でき、今回のようにDifyから直接叩くことができます。
定期実⾏が可能	「毎⽇9時」「毎週⽉曜」のような時間ベースのトリガーや、フォーム送信などイベントベースのトリガーを簡単に設定できます。

GASがあると何が嬉しい？

GASは⾯倒な⼿作業を⾃動化するために⽤いられることが多いです。

例えば、本記事シリーズで解説している論⽂仕分けアプリでは、Difyが作成するcsvデータをSpreadsheet上に転記する作業をGASに任せます。そうすることで、Dify上で知りたいことを⼊⼒するだけで、Spreadsheet上にどんどん論⽂のリストが溜まっていく仕組みを構築することができます。

GASとDify連携で広がる可能性

Dify単体でも様々な外部ツールと連携して「⽣成AIによる要約や分類」「業務の⾃動化」を⾏うことができます。しかし、GASを⽤いてGmailやSpreadsheetと連携させることで、使い慣れたサービス上でDifyのパワーを発揮することが可能です。

例えば、

アポ⾒込みのある顧客についてのシートに対して、DifyとGASを⽤いて顧客情報をネットから付与していく
安全性情報のスクリーニングを⾃動化して、スプレッドシートに結果をまとめる。
製薬企業が出した最新のニュースをDifyで要約しながらGmailでまとめてメルマガのように運⽤する

など、様々な使い⽅が可能になります

5. GASの作り⽅とデプロイ⼿順

ここからは、実際にGASを作成してデプロイする⼿順を、ステップバイステップで解説します。

5-1. Google Apps Scriptエディタの開き⽅

Googleスプレッドシートを開く
- 新しいスプレッドシートを作成するか、既存のスプレッドシートを開きます
- このスプレッドシートに、論⽂データが保存されます
スクリプトエディタを開く
- メニューから「拡張機能」→「Apps Script」を選択します

スクリプトエディタが開くと、ブラウザ上にコードエディタが表⽰され、ここにコードを書き込んでいきます。

5-2. コードの記述

スクリプトエディタに、以下のコードをコピー&ペーストします。

function doPost(e){
  var result = {status:'success',message:'Data appended successfully'};

  try{
  var csvString = "";
  try{
    var postData = JSON.parse(e.postData.contents);
    csvString=postData.csv_string||postData.csv_output||postData.output;
  }catch(jsonError){
    csvString=e.postData.contents;
  }

  if (!csvString) {
    throw new Error("No CSV data found.");
  }

  var csvData = Utilities.parseCsv(csvString); 
  if (csvData.length < 2) {
    return createJsonResponse({ status: 'skipped', message: 'No content rows found in CSV' });
  }

  var csvHeaders = csvData.shift(); 
  var csvBody = csvData;

  var ss = SpreadsheetApp.getActiveSpreadsheet(); 
  var sheet = ss.getActiveSheet(); 
  result.spreadsheet_url = ss.getUrl();

  var lastRow = sheet.getLastRow();

  if (lastRow === 0) {
    sheet.appendRow(csvHeaders);   
    if (csvBody.length > 0) {
      sheet.getRange(2, 1, csvBody.length, csvBody[0].length).setValues(csvBody);
    }
  } else {
    var sheetHeaders = sheet.getRange(1, 1, 1, sheet.getLastColumn()).getValues()[0]; 
    var csvHeaderMap = {};
    csvHeaders.forEach(function(header, index) { 
      csvHeaderMap[header] = index;
    });

    var outputRows = csvBody.map(function(row) { 
      return sheetHeaders.map(function(sheetColName) { 
        var csvColIndex = csvHeaderMap[sheetColName];  
        return csvColIndex !== undefined?row[csvColIndex]:"";
      });
    });

    if (outputRows.length > 0) {
      sheet.getRange(lastRow + 1, 1, outputRows.length, outputRows[0].length).setValues(outputRows);
    }
  }

  } catch (error) { 
    result.status = 'error';
    result.message = error.toString();
  }

  return createJsonResponse(result);
}

function createJsonResponse(data) {
  return ContentService.createTextOutput(JSON.stringify(data))
  .setMimeType(ContentService.MimeType.JSON);
}

5-3. Webアプリとしてデプロイする⽅法

ステップ1: デプロイメニューを開く

コードを記述したら、次はWebアプリとしてデプロイします。

スクリプトエディタの右上にある「デプロイ」ボタンをクリック
「新しいデプロイ」を選択

ステップ2: デプロイ設定

項⽬	設定値
種類の選択	ウェブアプリ
説明	任意（例：PubMed論⽂取り込みAPI）
次のユーザーとして実⾏	⾃分
アクセスできるユーザー	全員（外部から呼び出すため）

重要: 「アクセスできるユーザー」を「全員」に設定しないと、Difyから呼び出せません。

本ブログシリーズでは、簡易化のために「アクセスできるユーザー = 全員」にしました。しかし社内で実運用を行う場合には、全員がアクセスできる状態は許容できません。
簡易的な仕組みでは、呼び出し側（今回の場合Dify）と受け取り側（GAS）にのみ認証用の鍵をセットしておき、簡単な認証を行う方法があります。検証のために作成および公開したGASアプリなどはURLが外部に漏れないように注意しましょう。

ステップ3: デプロイ実⾏

「デプロイ」をクリック
初回実⾏時は、Googleアカウントでの承認フローが表⽰されます

「アクセスを承認」をクリック
必要に応じて、Googleアカウントの認証を完了

ステップ4: WebアプリのURLを取得

デプロイが完了すると、WebアプリのURLが表⽰されます。

<https://script.google.com/macros/s/xxxxxxxxxxxx/exec>

このURLをコピーしておきます。このURLが、DifyワークフローからPOSTする際のエンドポイントになります。

5-4. DifyでURLを設定

セクション3-2で解説した「GASに追記」ノード（HTTPリクエストノード）のURLに、取得したWebアプリのURLを設定します。

これで、Dify → GAS → スプレッドシートというパイプラインが完成します。

5-5. デプロイ時の注意点

項⽬	注意点
アクセス権限	外部から呼び出す場合は「全員」に設定。初回実⾏時、Googleアカウントの認証が必要な場合あり
コードの更新	コードを更新した場合は、新しいバージョンとしてデプロイが必要。「デプロイを管理」から新しいバージョンをデプロイ

6. 動作確認とプレビュー

GASのデプロイとDifyでのURL設定が完了したら、ワークフロー全体を動作確認してみましょう。

6-1. ワークフロー全体の動作確認

Difyのチャット画⾯で、⾃然⾔語で論⽂検索クエリを⼊⼒
- 例：「糖尿病のインスリン療法に関する2020年以降のRCT」
ワークフローが実⾏され、以下の流れで処理が進みます
- パラメータ抽出 → E-Search → E-Fetch → LLM処理 → CSV⽣成 → GAS送信 → スプレッドシート保存
結果として、スプレッドシートのURLが返されます

7. まとめ

本記事（Part 4）では、Difyで⽣成したCSVデータをGoogle Apps Script（GAS）に送信してスプレッドシートへ保存する処理を、GASの基礎から実装⼿順、コード解説まで⼀通り解説しました。

本記事で実現したこと

Dify側の保存フロー: CSV⽣成ノードから直接GASに送信
GASの基礎知識: GASとは何か、その特徴とライフサイエンス業界での活⽤メリット
GASの実装⼿順: エディタの開き⽅からWebアプリのデプロイまで
GASコードの詳細解説: リクエスト受信からスプレッドシート保存までの処理フロー

Dify×GAS連携のポイント

ポイント	説明
シンプルな連携	DifyからHTTP POSTでGASを呼び出すだけで、データの永続化が実現できる
直接的なデータフロー	CSV⽣成ノードから直接GASに送信する単⼀経路のため、シンプルで理解しやすい
柔軟な拡張	GAS側で通知‧定期実⾏‧データ分析などの機能を追加できる
コスト効率	既存のGoogle Workspace環境を活⽤し、追加コストを抑えられる

次のステップ

基本的な連携が完成したら、以下のような拡張も可能です。

メール通知: 重要な論⽂が追加されたら、関係者にメール通知
定期実⾏: 毎⽇‧毎週など、定期的に論⽂を⾃動収集
複数シートへの振り分け: 研究テーマ別にシートを分けて管理
データ分析‧可視化: グラフ作成やレポート⾃動⽣成

DifyとGASを組み合わせることで、ライフサイエンス‧製薬業界の多様な課題に対応し、業務効率化とデータ管理の強化が期待できます。

シリーズ構成

Part0: 全体像とPubMed API基礎
Part 1: パラメータ抽出とE-Search編
Part 2: E-Fetchとデータパース編
Part 3: AI処理‧データ整形編
Part4（本記事）: データ保存とGAS連携編

ヘルツレーベンでは、ライフサイエンス業界に特化したDX・自動化支援を提供しています。
PubMedや学術情報の自動収集をはじめ、Slack・Gmailなどを活用したナレッジ共有の仕組みまで、実務に直結するワークフローを設計・導入いたします。

提供サービスの例

製薬・医療機器業界での提案活動や調査業務の自動化支援
アカデミアや研究者向けの文献レビュー・情報共有フローの最適化
医療従事者のキャリア開発を支援するリスキリングプログラム

👉 ご興味をお持ちの方はぜひお気軽にお問い合わせください。
お問い合わせフォームはこちら

監修者　株式会社ヘルツレーベン代表木下渉

株式会社ヘルツレーベン代表取締役／医療・製薬・医療機器領域に特化したDXコンサルタント／
横浜市立大学大学院ヘルスデータサイエンス研究科修了

製薬・医療機器企業向けのデータ利活用支援、提案代行、営業戦略支援を中心に、医療従事者向けのデジタルスキル教育にも取り組む。AI・データ活用の専門家として、企業研修、プロジェクトPMO、生成AI導入支援など幅広く活動中

2026年1月17日

Difyでつくる論⽂仕分けアプリ　　　　　　　　　　　　　　　　　　　　　　　　Part3: LLM処理‧データ保存編

AI_Dify, コラム一覧

1. はじめに
2. Part 2からの流れ
3. 各ノードの詳細解説
4. まとめ

1. はじめに

本記事は、Difyのチャットワークフローを使って、PubMed論⽂の検索‧翻訳‧要約を⾃動化するシステムを構築するシリーズのPart 3です。

Part 2の復習: 前回の記事では、E-Fetchで論⽂詳細データを取得し、XMLをパースして構造化データを作るところまで解説しました。具体的には、以下のノードを実装しました。

E-Fetch（XML形式で論⽂詳細データを取得）
XMLパース（PythonでXMLを解析し、構造化データに変換）

本記事（Part 3）では、取得した論⽂データに対してLLMで翻訳‧要約‧優先度判定を⾏い、CSV形式に整形する処理を詳しく解説します。この部分は、ワークフローの核⼼となるAI処理部分です。

シリーズ構成

Part0: 全体像とPubMed API基礎
Part 1: 検索・データ取得編
Part 2: AI処理・データ整形編
Part 3（本記事）: LLM処理・データ保存編
Part4: DifyとGAS連携で実現する可能性

2. ワークフローの位置付け

Part 2で取得したデータは、以下のような構造になっています。

E-Fetchを使った場合

{ 
  "parsed_result": [ 
  { 
    "pmid": "12345678", 
    "title": "Effect of Insulin Therapy in Type 2 Diabetes",
    "abstract": "[Background] Type 2 diabetes...", 
    "author": ["John Smith", "Jane Doe"], 
    "journal": "Diabetes Research", 
    "year": "2024", 
    "doi": "10.1234/example", 
    "keywords": ["diabetes", "insulin", "therapy"] 
  } 
  ]
}

本記事では、E-Fetchで取得した論⽂データに対して、以下の処理を⾏います。

イテレーションで各論⽂を一つずつ処理
LLMで各論⽂のタイトル翻訳・要約・優先度判定・研究領域抽出・対象抽出
元データとAI分析結果をマージしてCSV⽣成

3. 各ノードの詳細解説

3-1. イテレーション（Iteration）

パースされた論⽂データの配列をループ処理し、各論⽂に対してLLMによる翻訳‧要約‧優先度判定を⾏うノードです。

イテレーションとは？

DifyのIterationノードは、リストの要素に対して同じ処理を繰り返すために使います。

たとえば、URLリストや論⽂リスト（論⽂1,論⽂2,論⽂3…）の⼀つ⼀つに同じAI処理を適⽤したいときに便利です。このノードは、プログラミングのfor⽂のように、リストのすべての項⽬を順に処理し、結果をまとめて出⼒します。

設定内容

項⽬	設定値
入力変数	{{parsed_result}}
出力変数	{{text}} （後で説明するLLMノードを先に配置すると選択できるようになります）
エラーハンドリング	エラー時は終了
出力をフラット化	true

処理の流れ

⼊⼒: XMLパースノードから parsed_result （論⽂データの配列）を受け取る
ループ: 各論⽂データを1件ずつ処理
出⼒: LLMの出⼒を配列として集約

3-2.LLM（イテレーション内側のノードです）

各論⽂に対して、タイトルの⽇本語翻訳、アブストラクトの要約、優先度判定を⾏うLLMノードです。イテレーション内に配置されており、各論⽂ごとに個別に処理されます。
イテレーションの中で、LLMノードを配置することで、実行するたびに各論文データに対して、一つずつLLMが実行されます。

プロンプトテンプレート

あなたは医学論文の分析と翻訳を行う専門AIアシスタントです。
ユーザーから提供された「論文リスト」と「検索意図（質問）」に基づき、各論文の情報を日本語で構造化して抽出してください。

### ユーザーの検索意図（質問）
{{#sys.query#}}

### タスク
提供された論文について、以下の処理を行ってください。

Title Translation
論文タイトルを自然で簡潔な日本語に翻訳してください。

Summarization
アブストラクトの内容を100文字以上200文字以内の日本語で要約してください。
「目的」「方法」「結果」「結論」の流れを意識して記述してください。
ユーザーの質問に対する「答え」や示唆が含まれているかに注意してください。

Priority Assessment
ユーザーの質問に対するその論文の重要度を3段階で判定してください。
HIGH: 質問の意図と高いレベルで一致し、かつRCT、メタアナリシス、システマティックレビューなど高いエビデンスレベル、または重要な新知見を含む。
MID: 質問と関連はあるが一部が周辺的、または観察研究・症例報告などエビデンスレベルが限定的。
LOW: 質問の意図と大きく異なる、対象が全く異なる（例：動物実験のみ）、または臨床的意義が小さい。

Research Area（研究領域）の抽出
論文のタイトル・アブストラクト・MeSH用語などから、主要な疾患領域・診療科・トピックを1〜3個程度、日本語で要約してください。
例：Oncology, Cardiovascular, Endocrinology, Psychiatry, Neurology, Infectious disease などを、日本語で「腫瘍学」「循環器」「内分泌」「精神科」「神経内科」「感染症」などと表現する。できるだけ専門領域名として通用する粒度で簡潔に記述してください。

Population（対象）の抽出
研究の対象となっている集団を日本語で要約してください。
年齢層（成人/高齢者/小児/新生児 など）
患者群（例：2型糖尿病患者、心不全患者、健常成人 など）
動物実験・細胞実験のみの場合はその旨を明記してください（例：「マウスモデル」「培養細胞」など）。

### 入力データ（論文リスト）
{{#item#}}

プロンプト設計のポイント

検索意図の活⽤: {{#sys.query#}} でユーザーの検索クエリを参照し、要約や優先度判定の基準として使⽤
構造化されたタスク: 5つの明確なタスク（翻訳、要約、優先度判定、研究領域抽出、対象抽出）を定義
優先度判定の基準: HIGH/MID/LOWの判定基準を明確に定義し、⼀貫性のある判定を実現
研究領域と対象の抽出: 論⽂の分類と検索に役⽴つ追加情報を抽出

構造化出⼒（Structured Output）

LLMの出⼒を構造化するため「構造化出⼒」機能を使⽤しています。
※構造化出力はAIのモデルによってサポートされていない場合があります。うまくいかない場合はバージョンを変えて試してみてください（gpt-4o-miniでは動作確認済み）。

フィールド名	型	説明
title_jp	string	論⽂の⽇本語タイトル
summary	string	要約（100〜200⽂字程度）
priority	string	重要度（HIGH, MID, LOW）
research_area	array[string]	研究領域（1〜3個程度、⽇本語）
population	string	対象（年齢層‧患者群‧実験モデルなど）

LLMによってこれらのラベルが自動的に付与されます。

出⼒例

各論⽂に対して以下のJSON形式で出⼒されます。

{ 
  "title_jp": "糖尿病におけるインスリン療法の効果", 
  "summary": "本研究は、2型糖尿病患者におけるインスリン療法の有効性を検証した。無作為化比較試験により、インスリン療法群では血糖コントロールが有意に改善し、HbA1cが平均1.2%低下した。結論として、インスリン療法は2型糖尿病の効果的な治療選択肢であることが示された。", 
  "priority": "HIGH", 
  "research_area": ["内分泌", "糖尿病"], 
  "population": "2型糖尿病患者（成人）"
}

3-3. DB登録⽤データの作成（Codeノード）

元の論⽂データ（XMLパース結果）とAI分析結果（LLM出⼒）をマージし、CSV形式に変換するノードです。

先ほど作成したLLMによる追加データとPubMed APIから取得したデータを統合して、一つの行データとして扱えるようにします。

⼊⼒変数

変数名	ソース	型
original_list	XMLパースノード	array[object]
ai_results_list	イテレーションノード	array[string]

CSVカラム構成

カラム名	説明	データソース
PMID	PubMed ID	元データ
Priority	重要度	AI分析結果
Title_JP	⽇本語タイトル	AI分析結果
Summary	要約	AI分析結果
Title_EN	英語タイトル	元データ
Authors	著者リスト	元データ
Journal	雑誌名	元データ
Year	公開年	元データ
DOI	DOI	元データ
MeSH_Keywords	MeSH⽤語とキーワード	元データ
URL	PubMed URL	⽣成（ https://pubmed.ncbi.nlm.nih.gov/{pmid}/ ）
main_author_affiliation	第⼀著者の所属機関	元データ
research_area	研究領域	AI分析結果
publication_types	論⽂タイプ	元データ
population	対象	AI分析結果

コード詳細

以下はコピペでコードノードに貼り付けるだけで大丈夫です。
コードが動かない時には、「入力変数」「出力変数」の名前やデータ型が正しいかを確認してください。

import json

def main(original_list: list, ai_results_list: list): 
  headers = [ 
    "PMID", 
    "Priority", 
    "Title_JP", 
    "Summary", 
    "Title_EN", 
    "Authors", 
    "Journal", 
    "Year", 
    "DOI", 
    "MeSH_Keywords", 
    "URL", 
    "main_author_affiliation", 
    "research_area", 
    "publication_types", 
    "population" 
  ] 

  csv_rows = [",".join(['"' + h + '"' for h in headers])] 

  for i, original in enumerate(original_list): 
    ai_item = ai_results_list[i] if i < len(ai_results_list) else "{}"

    ai_data = {} 
    try: 
      if isinstance(ai_item, dict): 
        ai_data = ai_item 
      else: 
        clean_json = str(ai_item).replace('```json', '').replace('```', '').strip() 
        ai_data = json.loads(clean_json) 
    except: 
      ai_data = {} 

    row_data = {} 

    pmid = original.get('pmid', '') 
    row_data["PMID"] = pmid 
    row_data["Title_EN"] = original.get('title', '') 
    auths = original.get('authors', original.get('author', [])) 
    row_data["Authors"] = ", ".join(auths) if isinstance(auths, list) else str(auths) 
    row_data["Journal"] = original.get('journal', '')
    row_data["Year"] = original.get('year', '') 
    row_data["DOI"] = original.get('doi', '') 
    row_data["main_author_affiliation"] = original.get('main_author_affiliation','') 
    row_data["publication_types"] = original.get('publication_types','')[0].replace('[','').replace(']','') if original.get('publication_types') else '' 

    kws = original.get('MeSH_Keywords', original.get('keyword', [])) 
    row_data["MeSH_Keywords"] = ", ".join(kws) if isinstance(kws, list) else str(kws) 

    if pmid: 
      row_data["URL"] = f"<https://pubmed.ncbi.nlm.nih.gov/{pmid}/>" 
    else: 
      row_data["URL"] = "" 

    # LLM generated columns 
    row_data["Title_JP"] = ai_data.get('title_jp', '') 
    row_data["Summary"] = ai_data.get('summary', '') 
    row_data["Priority"] = ai_data.get('priority','') 
    research_area_list = ai_data.get('research_area', []) 
    if research_area_list and len(research_area_list) > 0: 
      row_data["research_area"] = research_area_list[0].replace('[','').replace(']','') if isinstance(research_area_list[0], str) else str(research_area_list[0]) 
    else: 
      row_data["research_area"] = '' 
    row_data["population"] = ai_data.get('population','')

    csv_row = [] 
    for col in headers: 
      val = row_data.get(col, "") 
      val_escaped = str(val).replace('"', '""') 
      csv_row.append(f'"{val_escaped}"') 

    csv_rows.append(",".join(csv_row)) 

  final_csv = "\\n".join(csv_rows) 

  return { 
    "csv_string": final_csv
  }

処理の流れ

ヘッダー⾏の⽣成: CSVのヘッダー⾏を作成
ループ処理: 元データとAI分析結果を1件ずつ処理
AI分析結果のパース: LLMの出⼒をJSONとして解析（エラーハンドリング付き）
データマージ: 元データとAI分析結果を統合
CSV⾏の⽣成: 各フィールドをエスケープ処理してCSV形式に変換
URL⽣成: PMIDからPubMedのURLを⾃動⽣成

エスケープ処理の重要性

CSV形式では、フィールド内にカンマやダブルクォートが含まれる場合、適切にエスケープする必要があります。このコードでは、ダブルクォートを “” に変換することで、正しいCSV形式を保証しています。

出⼒

出⼒名	型	説明
csv_string	string	CSV形式の⽂字列

出⼒例

以下のように出⼒することで、SpreadsheetやExcelで扱いやすいcsvの形式にしています。これによってSpreadsheetやExcelに連携する時のデータ変換処理が容易になります。

"PMID","Priority","Title_JP","Summary","Title_EN","Authors","Journal","Year","DOI","MeSH_Keywords","URL","main_author_affiliation","research_area","publication_types","population""12345678","HIGH","糖尿病におけるインスリン療法の効果","本研究は、2型糖尿病患者におけるインスリン療法の有効性を検証した。...","Effect of Insulin Therapy in Type 2 Diabetes","John Smith, Jane Doe","Diabetes Research","2024","10.1234/example","diabetes, insulin, therapy","<https://pubmed.ncbi.nlm.nih.gov/12345678/","University> of Tokyo","内分泌","Randomized Controlled Trial","2型糖尿病患者（成人）"

4. まとめ

本記事では、取得した論⽂データに対してLLMで翻訳‧要約‧優先度判定を⾏い、CSV形式に整形する処理を詳しく解説しました。

本記事で実現したこと

イテレーションによる論⽂データのループ処理
LLMによる各論⽂の翻訳‧要約‧優先度判定
元データとAI分析結果のマージ
CSV形式への変換（エスケープ処理付き）

処理の流れの確認

イテレーション: 論⽂データをループ処理
LLM: 各論⽂に対して翻訳‧要約‧優先度判定‧研究領域抽出‧対象抽出
DB登録⽤データの作成: 元データとAI分析結果をマージしてCSV⽣成

次のステップ

次回のPart 4では、⽣成したCSVデータをGoogle Apps Script（GAS）へ送信してスプレッドシートに保存する処理と、GAS連携で実現できる応⽤例を解説します。具体的には以下のテーマを扱います。

CSV統合⽤の変数集約器
GAS WebhookへのPOST送信
レスポンスからスプレッドシートURLを取得するコード
Dify × GAS連携の応⽤（通知、定期実⾏、他システムとの統合等）

これらの処理により、ワークフローが完成し、ユーザーはスプレッドシートのURLを受け取って、保存された論⽂データを確認できるようになります。

シリーズ記事

Part0: 全体像とPubMed API基礎
Part 1: 検索・データ取得編
Part 2: AI処理・データ整形編
Part 3: LLM処理・データ保存編
Part4（次回記事）: DifyとGAS連携で実現する可能性

ヘルツレーベンでは、ライフサイエンス業界に特化したDX・自動化支援を提供しています。
PubMedや学術情報の自動収集をはじめ、Slack・Gmailなどを活用したナレッジ共有の仕組みまで、実務に直結するワークフローを設計・導入いたします。

提供サービスの例

製薬・医療機器業界での提案活動や調査業務の自動化支援
アカデミアや研究者向けの文献レビュー・情報共有フローの最適化
医療従事者のキャリア開発を支援するリスキリングプログラム

👉 ご興味をお持ちの方はぜひお気軽にお問い合わせください。
お問い合わせフォームはこちら

監修者　株式会社ヘルツレーベン代表木下渉

株式会社ヘルツレーベン代表取締役／医療・製薬・医療機器領域に特化したDXコンサルタント／
横浜市立大学大学院ヘルスデータサイエンス研究科修了

製薬・医療機器企業向けのデータ利活用支援、提案代行、営業戦略支援を中心に、医療従事者向けのデジタルスキル教育にも取り組む。AI・データ活用の専門家として、企業研修、プロジェクトPMO、生成AI導入支援など幅広く活動中

Difyで実現する効率的な言語解析：膨大なテキストデータから傾向を自動抽出するアプローチ

1. Difyが実現する言語解析の全体像：ノーコードRAGとワークフローの統合

【出典】

2. コア技術1：RAGとワークフローによる「正確性」と「安定性」の確保

【出典】

3. コア技術2：自動傾向抽出を可能にするNLP分析機能

【出典】

4. 実践的なワークフロー：テキストからインサイトを抽出する5ステップ

5. 活用事例：顧客フィードバック分析による製品改善への応用

6. 導入時の留意点：大規模データ処理とセキュリティ対策

まとめ

株式会社ヘルツレーベン代表 木下 渉

文献の海から「宝」を発掘：Dify NLPが拓くライフサイエンス研究の未来

1. 情報過多の時代：ライフサイエンス研究の深刻な課題

【出典】

2. 結論：Dify RAGは「知識グラフ」を構築するAIアシスタント

3. 「宝」を見つけるメカニズム：高度な情報抽出と要約の技術

【出典】

4. 研究効率を劇的に向上させる具体的な活用事例

5. Dify導入・活用のためのステップとセキュリティ上の注意点

まとめ

【出典】

株式会社ヘルツレーベン代表 木下 渉

Difyで実現するライフサイエンス高精度テキスト分析ワークフロー

1. Difyによる高精度分析ワークフローの全体像

【出典】

2. 専門用語克服のためのDify RAG活用戦略

3. プロンプトエンジニアリングによる精度向上テクニック

【出典】

4. 実践ケーススタディ：論文からの疾患関連情報抽出

【出典】

5. ワークフロー導入の注意点と今後の展望

まとめ

【出典】

株式会社ヘルツレーベン代表 木下 渉

Difyで医療データの「意味」を解き明かす次世代BI活用法

1. 次世代BIの定義：可視化（BI）と解釈（AI）の融合

【出典】

2. 従来の医療BIの限界とAIが担う「解釈の壁」の突破

3. Difyを活用したLLM統合アーキテクチャとRAGの役割

【出典】

4. 臨床データ分析におけるAugmented BIの具体的な活用事例

5. 導入成功のための重要ポイントと医療データセキュリティ

まとめ

【出典】

株式会社ヘルツレーベン代表 木下 渉

セルフサービスBIをDifyで加速：医療従事者が行うデータ分析環境構築

1. Difyが実現する「現場主導型分析」の全体像

【出典】

2. 医療現場の課題とセルフサービスBIの導入メリット

【出典】

3. Difyを活用した「自然言語クエリ生成」の具体的手順

4. ケーススタディ：Dify導入による分析時間の劇的短縮

5. 最重要課題：医療データ分析におけるセキュリティとガバナンス

まとめ

【出典】

株式会社ヘルツレーベン代表 木下 渉

医療機関向けAI利用ガイドラインをDifyに組み込む自動コンプライアンスチェック構築法

1. 結論：Difyによるコンプライアンス自動チェックの全体像

2. 医療AIのコンプライアンスリスクと公的ガイドラインの必要性

【出典】

3. Difyにおけるガイドライン組み込みの具体的な手法（RAGとプロンプト）

【出典】

4. コンプライアンス自動チェックのステップと検証プロセス

5. 運用上の課題：ハルシネーションと説明責任の明確化

まとめ

【出典】

株式会社ヘルツレーベン代表 木下 渉

Difyで構築した医療AIの「暴走」を防ぐ！安全設計を実現する3つの運用ポイント

1. 医療AIの暴走を防ぐ3つの運用ポイント

2. 運用ポイント1: 厳格なRAG設計と信頼できる知識ベースの構築

【出典】

3. 運用ポイント2: AIガードレールとプロンプトエンジニアリングの徹底

4. 運用ポイント3: LLMOpsとHuman-in-the-Loopによる継続的改善

5. 補足情報・注意点：医療分野特有のコンプライアンスとセキュリティ対策

まとめ

【出典】

株式会社ヘルツレーベン代表 木下 渉

Difyエージェントの安全設計ロードマップ：医療AIの信頼性を高める出力制御

株式会社ヘルツレーベン代表木下渉

株式会社ヘルツレーベン代表木下渉

株式会社ヘルツレーベン代表木下渉

株式会社ヘルツレーベン代表木下渉

株式会社ヘルツレーベン代表木下渉

株式会社ヘルツレーベン代表木下渉

株式会社ヘルツレーベン代表木下渉

株式会社ヘルツレーベン代表木下渉