検証事例レポート #005

生成AIに議事録を丸投げしたら、
経営判断に必要な情報の
70%が消えた

Microsoft Copilot vs LDX hub StructFlow。同じ20部門の議事録データを投入し、経営ダッシュボードとしての情報抽出精度を定量・定性の両面から比較検証した。

著者 — 森口功造(川村インターナショナル) 公開日 — 2026.05 比較対象 — Microsoft Copilot × LDX hub StructFlow
5.5×
タスク抽出数の差
100件 vs 18件
4.9×
部門間依頼の差
83件 vs 17件
2.6×
リスク抽出数の差
45件 vs 約16件
3.5×
高リスク検出の差
21件 vs 6件
背景と目的

なぜCopilotと比較したのか

多くの企業では、セキュリティポリシーや契約の関係で、使える生成AIがMicrosoft Copilotに限定されているケースが少なくない。ClaudeもChatGPTも「社外サービスへのデータ送信不可」という判断で禁止され、Copilotだけ許可——そういう企業環境を複数見てきた。

だからこそこの検証をやった。「Copilotだけで経営ダッシュボードを作ったらどうなるか。LDX hub StructFlowで構造化出力した場合と、何がどれだけ違うのか」を、20部門分の議事録データを使って比較した。

検証の前提 生成AIを使って議事録から経営ダッシュボードを作ること自体は技術的に難しくない。問題は「何をどれだけ正確に抽出できるか」だ。この検証はその抽出精度を測るものである。
検証設計

同じデータ、2つのアプローチ

Copilot版

議事録テキストをCopilotに渡し「HTML形式でまとめて」とプロンプト。構造化の指示なし・スキーマ定義なし。Copilotの判断に委ねる。

StructFlow版

タスク・リスク・部門間依頼のスキーマを事前定義。StructFlow APIで構造化JSON出力。Power AutomateでHTMLを動的生成しSharePointに保存。

定量比較

数字で見る情報の欠落

指標 StructFlow版 Copilot版
タスク抽出数 100件 18件 −82件
リスク抽出数 45件 高6件・中10件程度 大幅少ない
部門間依頼数 83件 17件程度 −66件
高リスク件数 21件 6件 −15件
処理部門数 20 / 20 20 / 20 同等

Copilotが「読んでいない」わけではない。ちゃんと読んで、整理して、きれいなHTMLを出力している。だが要約の過程で大量の情報が落ちている。そして最も危険なのは、その欠落に気づけないことだ。

定性比較

Copilotが落とした情報の中身

定量的な差よりも深刻なのは何が落ちたかだ。以下はCopilot版で欠落または過度に要約されていることを確認した5項目。

オペレーション部の過負荷3案件(離職リスク高)

StructFlow版:担当者3名が同時期に過負荷状態、離職リスクあり、と構造化
Copilot版:「リソース調整が必要」の一行に圧縮

財務部のM&A会計処理・監査対応

StructFlow版:具体的なタスクと期限を抽出
Copilot版:言及なし

パートナー部の上位3社依存70%リスク

StructFlow版:事業継続リスクとして独立抽出
Copilot版:記載なし

品質保証部のセキュリティ脆弱性2件

StructFlow版:独立したリスク項目として抽出
Copilot版:他部門記述に埋もれて判別不能

総務部の月額賃料3,200万円という具体的コスト情報

StructFlow版:budgetフィールドに構造化
Copilot版:欠落
経営判断への影響 Copilotの情報網羅率はStructFlowの約20〜30%にとどまる。タスク・リスクの「見落とし」は気づかないまま意思決定に使われる可能性がある。きれいなサマリーが「完全に見える」ことが最大のリスク。
構造的問題

なぜ「丸投げ」だと情報が落ちるのか

01 — 要約圧力

生成AIは「読みやすいサマリーを出力する」方向に最適化されている。重要度の判断をモデルが行うため、自社の優先順位とは一致しない。

02 — 構造の不一致

Copilot版の出力は毎回フォーマットが変わる。先月と今月でカラム構成が異なれば、トレンド分析が不可能。ダッシュボードには毎回同じ構造が必須。

03 — 欠落に気づけない

最も危険な失敗モード。きれいなサマリーを見ても何が落ちたかはわからない。両者を比較して初めて欠落が可視化される。

04 — スケールしない

20部門→30部門になっても、StructFlowのコストはほぼ変わらない。Copilotに丸投げする場合、部門数が増えるほど品質が低下する。

公平な評価

Copilotが優れている点

Copilotを全否定するのは正確ではない。KPIスナップショットの整理が得意で、サイドバー10ページ・バブルチャートなど経営層向けの見栄えが高い。文脈のある読み方ができ、案件の流れを自然な文章で整理する。経営会議前の「さっと把握」には十分な品質だ。

最適な用途
Copilot
経営会議前の「さっと把握」。デザインされたサマリーが必要なとき。KPI数値の一覧確認。
最適な用途
StructFlow
全社横断の「漏れなく管理」。タスク・リスクの網羅的抽出。自動配信・継続運用が必要なとき。
総合評価

項目別スコア比較

評価項目StructFlow版Copilot版
データ正確性
★★★★★
実議事録から直接抽出
★★★★★
AIが推測・生成
情報網羅率
★★★★★
タスク100件・リスク45件
★★★★★
Copilot版の約20〜30%
更新・保守性
★★★★★
フロー再実行のみ
★★★★
毎月フル再生成が必要
配信自動化
★★★★★
SharePoint→URL自動返却
★★★★
手動アップロード・共有
ビジュアル品質
★★★★★
ダーク×ペーパーハイブリッド
★★★★★
SaaSプロダクト水準
スケーラビリティ
★★★★★
200部門でも同コスト
★★★★★
部門増で品質低下
総合スコア
9.0/10経営判断用途として実用レベルに到達
6.5/10UI品質・ページ数で優位、データは架空
システム構成

StructFlow版のパイプライン

// Power Automate × LDX hub StructFlow フロー構成
1
議事録ファイルの取得 SharePoint
SharePoint に保存された各部門の議事録テキストを取得
2
StructFlow ジョブ作成 LDX hub
タスク・リスク・部門間依頼のスキーマを指定してPOST
3
ポーリング待機 Do Until
status = completed まで3秒間隔でポーリング
4
HTML ダッシュボード生成
Chart.js 3種(棒・ドーナツ・積み上げ棒)込みの動的HTMLをComposeアクションで組み立て
5
SharePoint 保存 → URL 返却 Copilot Studio
「ファイルの作成」アクションで保存し、共有URLをCopilot Studioに返却
次のステップ

今後の展開

🌐
多言語ダッシュボード(RefineLoop)
LDX hubのRefineLoopを使い、英語・日本語・スペイン語などの混在データを統一言語で構造化。グローバル拠点の統合ダッシュボードを構築する。
⚙️
n8n / Difyでの同内容検証
Power AutomateはMicrosoft環境に閉じた構成。n8n(セルフホスト可能)とDify(LLMアプリ開発)で同じStructFlowを使い、何が変わるかを検証する。
技術サマリー
項目内容
使用サービスLDX hub — StructFlow(JSONL Batch Structuring Engine)
比較対象Microsoft Copilot(単体・非構造化プロンプト)
オーケストレーションPower Automate + Copilot Studio
処理部門数20部門(同一データを両環境に投入)
配信先SharePoint → GitHub Pages(デモ公開)

実際のダッシュボードを見る

同じ20部門のデータから生成された2つのダッシュボードを公開しています。
情報の「密度」の差を実際に体感してください。