Power Automate × Power Apps × LDX hub で特許・論文データ18件を戦略ダッシュボードに変える

概要

指標	値
処理文献数	18件
Power Apps 画面数	4画面
Power Automate フロー数	2フロー
StructFlow 抽出フィールド数	8フィールド

LDX hub StructFlow で構造化抽出した技術文献データを、Power Automate で自動更新し、Power Apps と HTML ダッシュボードの2層で可視化するシステム「TechLit Viewer」の構築記録。

背景と目的

多様な分野の技術文献を継続的に収集・評価したいというニーズを多くの顧客が要望している。従来はPDFや特許文書をフォルダで管理するだけで、「どの技術がどの成熟度か」「関連度が高い文献はどれか」といった横断的な把握が困難だった。

そこで LDX hub StructFlow を使ってPDF・特許文書から構造化データを自動抽出し、SharePoint をデータ基盤に、Power Automate で更新を自動化、Power Apps と HTML ダッシュボードで可視化する一気通貫のシステム「TechLit Viewer」を構築した。

システム設計：4つのレイヤーで構成するアーキテクチャ

// TechLit Viewer システム構成

[1] 入力層       文献ファイル（PDF・特許・報告書）
                 └─ SharePoint ドキュメントライブラリに格納。18件の技術文献が対象。

[2] AI抽出層     LDX hub StructFlow
                 └─ Title / DocType / Authors / Year / FieldMajor /
                    TRL / RelevanceScore / Summary の8フィールドを自動構造化抽出。

[3] データ層     SharePoint リスト（TechLit_Master / TechLit_Metrics）
                 └─ Power Automate が書き込み、Power Apps と HTML ダッシュボードが読み取る。

[4] 自動化層     Power Automate（2フロー）
                 └─ ① アイテム更新トリガーで自動抽出（TechLit_パイプラインUPDATE）
                    ② 手動で全件一括処理（TechLit_一括更新）

[5] 表示層       Power Apps（TechLit_Viewer）+ HTML ダッシュボード
                 └─ Power Apps 4画面 ＋ スタンドアロン HTML ダッシュボードの2層構成。

フロー設計：2つのフローで「自動」と「一括」を使い分ける

更新のトリガーを2パターンに分けることで、日常運用の自動化と初期データ投入・再処理の両方に対応している。

① TechLit_パイプラインUPDATE（常時稼働）

SharePoint リストのアイテム更新をトリガーに自動発火。新規文献の登録や既存レコードの変更を検知し、対象ファイルを StructFlow に送信して抽出結果を即時書き戻す。日常的な文献追加はこのフローで完全自動化。

② TechLit_一括更新（手動実行）

全18件を一括処理する手動トリガーフロー。スキーマ変更やプロンプト改修後の再抽出、初期データ投入に使用。foreach ループで全アイテムを順次処理し、StructFlow のポーリングを待機しながら結果をリストに書き込む。

抽出スキーマ：StructFlow に定義した8フィールド

技術文献から価値ある情報を引き出すため、戦略的評価に必要な8つのフィールドをスキーマとして定義した。

フィールド名	内容	型
Title	文献タイトル	string
DocType	文書種別（patent / paper / report / other）	string
Authors	著者・出願人	string
Year	発行年・出願年	integer
FieldMajor	主要技術領域（Materials Science / Energy Engineering 等）	string
TRL	技術成熟度レベル（1〜9）	integer
RelevanceScore	自社事業との関連度（high / medium / low）	string
Summary	技術概要（2〜3文）	string

Power Apps 構成：4画面で用途を分けた閲覧インターフェース

画面	機能
Screen 1：文献検索	タイトル・著者・技術領域でのフリーテキスト検索。DocType・TRL・RelevanceScore によるフィルタリング。SharePoint リストへのリアルタイムクエリ。
Screen 2：詳細表示	個別文献の全フィールド表示。StructFlow が抽出した Summary の確認。TRL・関連度のビジュアルインジケーター付き。
Screen 3：指標比較	技術領域ごとの TRL 分布比較。関連度別の文献数集計。年別トレンドのグラフ表示。
Screen 4：技術ダッシュボード	HTML コンポーネントを埋め込んだ高度な可視化画面。Chart.js による動的グラフ。全18件の一覧テーブルと検索機能を統合。

HTML ダッシュボード：スタンドアロンで動く技術戦略ビュー

Power Apps とは別に、ブラウザ単体で動作するスタンドアロン HTML ダッシュボード（

techlit_dashboard.html

）も並行して整備した。Power Apps への依存なく経営層・外部ステークホルダーへの共有が可能な点が最大のメリットだ。

// StructFlow 抽出結果をそのままデータ配列に格納
const data = [
  {
    id: 17,
    title: '固定化光触媒含有紙',
    docType: 'patent',
    authors: '東谷 智子、山本 康義（昭和化学工業）',
    year: 2002,
    fieldMajor: 'Chemistry',
    trl: 4,
    relevance: 'high',
    url: ''  // SourceFileUrl — 整備次第で原典リンクに
  },
  // ... 18件分
];

4種のチャート（技術領域分布・TRL分布・年別トレンド・文書種別比率）と全件検索可能な文献一覧テーブルで構成。StructFlow から得た構造化データを Chart.js に渡すだけで、分析グラフが自動生成される。

検証結果：18件の技術文献を構造化データとして活用可能に

StructFlow 抽出精度

18件中、全フィールドが正常に抽出されたのは15件（83%）。残り3件は FieldMajor の言語表記ゆれ（英語・日本語混在）が発生したが、データとしての活用に支障はなし。

Power Automate 自動化

一括更新フローの1件あたり平均処理時間は約67秒（StructFlow ポーリング含む）。18件の全件処理は約20分で完了。定期実行・トリガー実行ともに安定稼働を確認。

技術領域の可視化

Environmental Science 系が最多（6件）、Materials Science が続く（4件）。TRL 分布では基礎研究（1〜3）が8件と最多、実用化段階（7〜9）は3件。ポートフォリオの全体像が初めて定量的に把握できた。

今回の学び

SharePoint 列の型はプロジェクト開始前に決定する

列の型（ハイパーリンク型 vs 1行テキスト型）は後から変更できない。Power Automate から書き込む値の形式を先に確認し、列設計を固めてから構築に入ることが必須。

StructFlow のスキーマは「評価軸」から設計する

フィールド設計は「何を抽出できるか」ではなく「何で意思決定したいか」から逆算する。TRL・RelevanceScore のような評価軸フィールドを最初から入れることで、ダッシュボードの価値が大きく変わった。

Power Apps と HTML ダッシュボードの役割を分ける

Power Apps は日常的な検索・更新操作に向き、HTML ダッシュボードは共有・プレゼンに向く。同じデータソースを2つの UI で使い分けることで、利用者層と用途を広げられる。

FieldMajor の表記統一はプロンプトで制御する

「Materials Science」と「材料科学」が混在すると集計が割れる。StructFlow のシステムプロンプトに「技術領域は必ず英語表記で出力すること」と明示することで、表記ゆれを防止できる。

今後の展開

項目	内容
SourceFileUrl の整備	各文献の原典URLを SharePoint リストに追加し、ダッシュボードからワンクリックで原文にアクセスできるようにする
スケジュールトリガー化	定期的な文献収集・更新を完全自動化。月次レポートとして経営層に自動配信する仕組みへ
FieldMajor 正規化	StructFlow プロンプトに英語統一指示を追加し、既存18件を再処理して集計精度を向上させる
文献数の拡張	18件から100件規模へ。ExtractDoc による PDF テキスト抽出を前段に追加し、スキャン文書にも対応する
RefineLoop との連携	外国語文献（英語・中国語）の Summary を日本語に自動翻訳・改善する機能を統合する

川村インターナショナルでは、構造化データ基盤の構築や、翻訳・ローカライズ業務へのAI活用を現在進行形で検証しています。LDX hubの StructFlow・RefineLoop・RenderOCRを活用した事例を順次公開予定です。

Power Automate × Power Apps × LDX hub で特許・論文データ18件を戦略ダッシュボードに変える

추출된 키워드

원문

Power Automate × Power Apps × LDX hub で特許・論文データ18件を戦略ダッシュボードに変える

概要

背景と目的

システム設計：4つのレイヤーで構成するアーキテクチャ

フロー設計：2つのフローで「自動」と「一括」を使い分ける

① TechLit_パイプラインUPDATE（常時稼働）

② TechLit_一括更新（手動実行）

抽出スキーマ：StructFlow に定義した8フィールド

Power Apps 構成：4画面で用途を分けた閲覧インターフェース

HTML ダッシュボード：スタンドアロンで動く技術戦略ビュー

検証結果：18件の技術文献を構造化データとして活用可能に

StructFlow 抽出精度

Power Automate 自動化

技術領域の可視化

関連度評価

今回の学び

SharePoint 列の型はプロジェクト開始前に決定する

StructFlow のスキーマは「評価軸」から設計する

Power Apps と HTML ダッシュボードの役割を分ける

FieldMajor の表記統一はプロンプトで制御する

今後の展開