Power Automate × Power Apps × LDX hub で特許・論文データ18件を戦略ダッシュボードに変える
概要
| 指標 | 値 |
|---|---|
| 処理文献数 | 18件 |
| Power Apps 画面数 | 4画面 |
| Power Automate フロー数 | 2フロー |
| StructFlow 抽出フィールド数 | 8フィールド |
LDX hub StructFlow で構造化抽出した技術文献データを、Power Automate で自動更新し、Power Apps と HTML ダッシュボードの2層で可視化するシステム「TechLit Viewer」の構築記録。
背景と目的
多様な分野の技術文献を継続的に収集・評価したいというニーズを多くの顧客が要望している。従来はPDFや特許文書をフォルダで管理するだけで、「どの技術がどの成熟度か」「関連度が高い文献はどれか」といった横断的な把握が困難だった。
そこで LDX hub StructFlow を使ってPDF・特許文書から構造化データを自動抽出し、SharePoint をデータ基盤に、Power Automate で更新を自動化、Power Apps と HTML ダッシュボードで可視化する一気通貫のシステム「TechLit Viewer」を構築した。
システム設計:4つのレイヤーで構成するアーキテクチャ
// TechLit Viewer システム構成
[1] 入力層 文献ファイル(PDF・特許・報告書)
└─ SharePoint ドキュメントライブラリに格納。18件の技術文献が対象。
[2] AI抽出層 LDX hub StructFlow
└─ Title / DocType / Authors / Year / FieldMajor /
TRL / RelevanceScore / Summary の8フィールドを自動構造化抽出。
[3] データ層 SharePoint リスト(TechLit_Master / TechLit_Metrics)
└─ Power Automate が書き込み、Power Apps と HTML ダッシュボードが読み取る。
[4] 自動化層 Power Automate(2フロー)
└─ ① アイテム更新トリガーで自動抽出(TechLit_パイプラインUPDATE)
② 手動で全件一括処理(TechLit_一括更新)
[5] 表示層 Power Apps(TechLit_Viewer)+ HTML ダッシュボード
└─ Power Apps 4画面 + スタンドアロン HTML ダッシュボードの2層構成。
フロー設計:2つのフローで「自動」と「一括」を使い分ける
更新のトリガーを2パターンに分けることで、日常運用の自動化と初期データ投入・再処理の両方に対応している。
① TechLit_パイプラインUPDATE(常時稼働)
SharePoint リストのアイテム更新をトリガーに自動発火。新規文献の登録や既存レコードの変更を検知し、対象ファイルを StructFlow に送信して抽出結果を即時書き戻す。日常的な文献追加はこのフローで完全自動化。
② TechLit_一括更新(手動実行)
全18件を一括処理する手動トリガーフロー。スキーマ変更やプロンプト改修後の再抽出、初期データ投入に使用。foreach ループで全アイテムを順次処理し、StructFlow のポーリングを待機しながら結果をリストに書き込む。
抽出スキーマ:StructFlow に定義した8フィールド
技術文献から価値ある情報を引き出すため、戦略的評価に必要な8つのフィールドをスキーマとして定義した。
| フィールド名 | 内容 | 型 |
|---|---|---|
| Title | 文献タイトル | string |
| DocType | 文書種別(patent / paper / report / other) | string |
| Authors | 著者・出願人 | string |
| Year | 発行年・出願年 | integer |
| FieldMajor | 主要技術領域(Materials Science / Energy Engineering 等) | string |
| TRL | 技術成熟度レベル(1〜9) | integer |
| RelevanceScore | 自社事業との関連度(high / medium / low) | string |
| Summary | 技術概要(2〜3文) | string |
Power Apps 構成:4画面で用途を分けた閲覧インターフェース
| 画面 | 機能 |
|---|---|
| Screen 1:文献検索 | タイトル・著者・技術領域でのフリーテキスト検索。DocType・TRL・RelevanceScore によるフィルタリング。SharePoint リストへのリアルタイムクエリ。 |
| Screen 2:詳細表示 | 個別文献の全フィールド表示。StructFlow が抽出した Summary の確認。TRL・関連度のビジュアルインジケーター付き。 |
| Screen 3:指標比較 | 技術領域ごとの TRL 分布比較。関連度別の文献数集計。年別トレンドのグラフ表示。 |
| Screen 4:技術ダッシュボード | HTML コンポーネントを埋め込んだ高度な可視化画面。Chart.js による動的グラフ。全18件の一覧テーブルと検索機能を統合。 |
HTML ダッシュボード:スタンドアロンで動く技術戦略ビュー
Power Apps とは別に、ブラウザ単体で動作するスタンドアロン HTML ダッシュボード(
techlit_dashboard.html)も並行して整備した。Power Apps への依存なく経営層・外部ステークホルダーへの共有が可能な点が最大のメリットだ。
// StructFlow 抽出結果をそのままデータ配列に格納
const data = [
{
id: 17,
title: '固定化光触媒含有紙',
docType: 'patent',
authors: '東谷 智子、山本 康義(昭和化学工業)',
year: 2002,
fieldMajor: 'Chemistry',
trl: 4,
relevance: 'high',
url: '' // SourceFileUrl — 整備次第で原典リンクに
},
// ... 18件分
];
4種のチャート(技術領域分布・TRL分布・年別トレンド・文書種別比率)と全件検索可能な文献一覧テーブルで構成。StructFlow から得た構造化データを Chart.js に渡すだけで、分析グラフが自動生成される。
検証結果:18件の技術文献を構造化データとして活用可能に
StructFlow 抽出精度
18件中、全フィールドが正常に抽出されたのは15件(83%)。残り3件は FieldMajor の言語表記ゆれ(英語・日本語混在)が発生したが、データとしての活用に支障はなし。
Power Automate 自動化
一括更新フローの1件あたり平均処理時間は約67秒(StructFlow ポーリング含む)。18件の全件処理は約20分で完了。定期実行・トリガー実行ともに安定稼働を確認。
技術領域の可視化
Environmental Science 系が最多(6件)、Materials Science が続く(4件)。TRL 分布では基礎研究(1〜3)が8件と最多、実用化段階(7〜9)は3件。ポートフォリオの全体像が初めて定量的に把握できた。
関連度評価
18件中15件が RelevanceScore = High と判定。StructFlow のプロンプトに自社事業文脈(翻訳・ローカライゼーション)を組み込むことで、業務直結の評価軸での自動スクリーニングが実現した。
今回の学び
SharePoint 列の型はプロジェクト開始前に決定する
列の型(ハイパーリンク型 vs 1行テキスト型)は後から変更できない。Power Automate から書き込む値の形式を先に確認し、列設計を固めてから構築に入ることが必須。
StructFlow のスキーマは「評価軸」から設計する
フィールド設計は「何を抽出できるか」ではなく「何で意思決定したいか」から逆算する。TRL・RelevanceScore のような評価軸フィールドを最初から入れることで、ダッシュボードの価値が大きく変わった。
Power Apps と HTML ダッシュボードの役割を分ける
Power Apps は日常的な検索・更新操作に向き、HTML ダッシュボードは共有・プレゼンに向く。同じデータソースを2つの UI で使い分けることで、利用者層と用途を広げられる。
FieldMajor の表記統一はプロンプトで制御する
「Materials Science」と「材料科学」が混在すると集計が割れる。StructFlow のシステムプロンプトに「技術領域は必ず英語表記で出力すること」と明示することで、表記ゆれを防止できる。
今後の展開
| 項目 | 内容 |
|---|---|
| SourceFileUrl の整備 | 各文献の原典URLを SharePoint リストに追加し、ダッシュボードからワンクリックで原文にアクセスできるようにする |
| スケジュールトリガー化 | 定期的な文献収集・更新を完全自動化。月次レポートとして経営層に自動配信する仕組みへ |
| FieldMajor 正規化 | StructFlow プロンプトに英語統一指示を追加し、既存18件を再処理して集計精度を向上させる |
| 文献数の拡張 | 18件から100件規模へ。ExtractDoc による PDF テキスト抽出を前段に追加し、スキャン文書にも対応する |
| RefineLoop との連携 | 外国語文献(英語・中国語)の Summary を日本語に自動翻訳・改善する機能を統合する |
川村インターナショナルでは、構造化データ基盤の構築や、翻訳・ローカライズ業務へのAI活用を現在進行形で検証しています。LDX hubの StructFlow・RefineLoop・RenderOCRを活用した事例を順次公開予定です。