← 기사 목록
日本語https://zenn.dev/topics/ai/feed

Power Automate × Power Apps × LDX hub で特許・論文データ18件を戦略ダッシュボードに変える

추출된 키워드

37
Power Apps·5LDX hub·5StructFlow·5TechLit Viewer·5Power Automate·5HTML ダッシュボード·4構造化抽出·4SharePoint·4戦略ダッシュボード·4特許・論文データ·4技術成熟度レベル·3RenderOCR·3RefineLoop·3川村インターナショナル·3スキーマ·3FieldMajor·3プロンプト·3特許文書·3PDF·3Chart.js·3RelevanceScore·3TRL·3ハイパーリンク型·2foreach ループ·21行テキスト型·2ポーリング·2ドキュメントライブラリ·2翻訳・ローカライゼーション·2ExtractDoc·2Environmental Science·2Energy Engineering·2Materials Science·2TechLit_Viewer·2TechLit_一括更新·2TechLit_パイプラインUPDATE·2TechLit_Metrics·2TechLit_Master·2

원문

8,726
Power Automate × Power Apps × LDX hub で特許・論文データ18件を戦略ダッシュボードに変える

Power Automate × Power Apps × LDX hub で特許・論文データ18件を戦略ダッシュボードに変える

概要

指標
処理文献数18件
Power Apps 画面数4画面
Power Automate フロー数2フロー
StructFlow 抽出フィールド数8フィールド

LDX hub StructFlow で構造化抽出した技術文献データを、Power Automate で自動更新し、Power Apps と HTML ダッシュボードの2層で可視化するシステム「TechLit Viewer」の構築記録。

背景と目的

多様な分野の技術文献を継続的に収集・評価したいというニーズを多くの顧客が要望している。従来はPDFや特許文書をフォルダで管理するだけで、「どの技術がどの成熟度か」「関連度が高い文献はどれか」といった横断的な把握が困難だった。

そこで LDX hub StructFlow を使ってPDF・特許文書から構造化データを自動抽出し、SharePoint をデータ基盤に、Power Automate で更新を自動化、Power Apps と HTML ダッシュボードで可視化する一気通貫のシステム「TechLit Viewer」を構築した。

システム設計:4つのレイヤーで構成するアーキテクチャ

// TechLit Viewer システム構成

[1] 入力層       文献ファイル(PDF・特許・報告書)
                 └─ SharePoint ドキュメントライブラリに格納。18件の技術文献が対象。

[2] AI抽出層     LDX hub StructFlow
                 └─ Title / DocType / Authors / Year / FieldMajor /
                    TRL / RelevanceScore / Summary の8フィールドを自動構造化抽出。

[3] データ層     SharePoint リスト(TechLit_Master / TechLit_Metrics)
                 └─ Power Automate が書き込み、Power Apps と HTML ダッシュボードが読み取る。

[4] 自動化層     Power Automate(2フロー)
                 └─ ① アイテム更新トリガーで自動抽出(TechLit_パイプラインUPDATE)
                    ② 手動で全件一括処理(TechLit_一括更新)

[5] 表示層       Power Apps(TechLit_Viewer)+ HTML ダッシュボード
                 └─ Power Apps 4画面 + スタンドアロン HTML ダッシュボードの2層構成。

フロー設計:2つのフローで「自動」と「一括」を使い分ける

更新のトリガーを2パターンに分けることで、日常運用の自動化と初期データ投入・再処理の両方に対応している。

① TechLit_パイプラインUPDATE(常時稼働)

SharePoint リストのアイテム更新をトリガーに自動発火。新規文献の登録や既存レコードの変更を検知し、対象ファイルを StructFlow に送信して抽出結果を即時書き戻す。日常的な文献追加はこのフローで完全自動化。

② TechLit_一括更新(手動実行)

全18件を一括処理する手動トリガーフロー。スキーマ変更やプロンプト改修後の再抽出、初期データ投入に使用。foreach ループで全アイテムを順次処理し、StructFlow のポーリングを待機しながら結果をリストに書き込む。

抽出スキーマ:StructFlow に定義した8フィールド

技術文献から価値ある情報を引き出すため、戦略的評価に必要な8つのフィールドをスキーマとして定義した。

フィールド名内容
Title文献タイトルstring
DocType文書種別(patent / paper / report / other)string
Authors著者・出願人string
Year発行年・出願年integer
FieldMajor主要技術領域(Materials Science / Energy Engineering 等)string
TRL技術成熟度レベル(1〜9)integer
RelevanceScore自社事業との関連度(high / medium / low)string
Summary技術概要(2〜3文)string

Power Apps 構成:4画面で用途を分けた閲覧インターフェース

画面機能
Screen 1:文献検索タイトル・著者・技術領域でのフリーテキスト検索。DocType・TRL・RelevanceScore によるフィルタリング。SharePoint リストへのリアルタイムクエリ。
Screen 2:詳細表示個別文献の全フィールド表示。StructFlow が抽出した Summary の確認。TRL・関連度のビジュアルインジケーター付き。
Screen 3:指標比較技術領域ごとの TRL 分布比較。関連度別の文献数集計。年別トレンドのグラフ表示。
Screen 4:技術ダッシュボードHTML コンポーネントを埋め込んだ高度な可視化画面。Chart.js による動的グラフ。全18件の一覧テーブルと検索機能を統合。

HTML ダッシュボード:スタンドアロンで動く技術戦略ビュー

Power Apps とは別に、ブラウザ単体で動作するスタンドアロン HTML ダッシュボード(

techlit_dashboard.html
)も並行して整備した。Power Apps への依存なく経営層・外部ステークホルダーへの共有が可能な点が最大のメリットだ。
// StructFlow 抽出結果をそのままデータ配列に格納
const data = [
  {
    id: 17,
    title: '固定化光触媒含有紙',
    docType: 'patent',
    authors: '東谷 智子、山本 康義(昭和化学工業)',
    year: 2002,
    fieldMajor: 'Chemistry',
    trl: 4,
    relevance: 'high',
    url: ''  // SourceFileUrl — 整備次第で原典リンクに
  },
  // ... 18件分
];

4種のチャート(技術領域分布・TRL分布・年別トレンド・文書種別比率)と全件検索可能な文献一覧テーブルで構成。StructFlow から得た構造化データを Chart.js に渡すだけで、分析グラフが自動生成される。

検証結果:18件の技術文献を構造化データとして活用可能に

StructFlow 抽出精度

18件中、全フィールドが正常に抽出されたのは15件(83%)。残り3件は FieldMajor の言語表記ゆれ(英語・日本語混在)が発生したが、データとしての活用に支障はなし。

Power Automate 自動化

一括更新フローの1件あたり平均処理時間は約67秒(StructFlow ポーリング含む)。18件の全件処理は約20分で完了。定期実行・トリガー実行ともに安定稼働を確認。

技術領域の可視化

Environmental Science 系が最多(6件)、Materials Science が続く(4件)。TRL 分布では基礎研究(1〜3)が8件と最多、実用化段階(7〜9)は3件。ポートフォリオの全体像が初めて定量的に把握できた。

関連度評価

18件中15件が RelevanceScore = High と判定。StructFlow のプロンプトに自社事業文脈(翻訳・ローカライゼーション)を組み込むことで、業務直結の評価軸での自動スクリーニングが実現した。

今回の学び

SharePoint 列の型はプロジェクト開始前に決定する

列の型(ハイパーリンク型 vs 1行テキスト型)は後から変更できない。Power Automate から書き込む値の形式を先に確認し、列設計を固めてから構築に入ることが必須。

StructFlow のスキーマは「評価軸」から設計する

フィールド設計は「何を抽出できるか」ではなく「何で意思決定したいか」から逆算する。TRL・RelevanceScore のような評価軸フィールドを最初から入れることで、ダッシュボードの価値が大きく変わった。

Power Apps と HTML ダッシュボードの役割を分ける

Power Apps は日常的な検索・更新操作に向き、HTML ダッシュボードは共有・プレゼンに向く。同じデータソースを2つの UI で使い分けることで、利用者層と用途を広げられる。

FieldMajor の表記統一はプロンプトで制御する

「Materials Science」と「材料科学」が混在すると集計が割れる。StructFlow のシステムプロンプトに「技術領域は必ず英語表記で出力すること」と明示することで、表記ゆれを防止できる。

今後の展開

項目内容
SourceFileUrl の整備各文献の原典URLを SharePoint リストに追加し、ダッシュボードからワンクリックで原文にアクセスできるようにする
スケジュールトリガー化定期的な文献収集・更新を完全自動化。月次レポートとして経営層に自動配信する仕組みへ
FieldMajor 正規化StructFlow プロンプトに英語統一指示を追加し、既存18件を再処理して集計精度を向上させる
文献数の拡張18件から100件規模へ。ExtractDoc による PDF テキスト抽出を前段に追加し、スキャン文書にも対応する
RefineLoop との連携外国語文献(英語・中国語)の Summary を日本語に自動翻訳・改善する機能を統合する

川村インターナショナルでは、構造化データ基盤の構築や、翻訳・ローカライズ業務へのAI活用を現在進行形で検証しています。LDX hubの StructFlow・RefineLoop・RenderOCRを活用した事例を順次公開予定です。