なぜCopilotと比較したのか
多くの企業では、セキュリティポリシーや契約の関係で、使える生成AIがMicrosoft Copilotに限定されているケースが少なくない。ClaudeもChatGPTも「社外サービスへのデータ送信不可」という判断で禁止され、Copilotだけ許可——そういう企業環境を複数見てきた。
だからこそこの検証をやった。「Copilotだけで経営ダッシュボードを作ったらどうなるか。LDX hub StructFlowで構造化出力した場合と、何がどれだけ違うのか」を、20部門分の議事録データを使って比較した。
同じデータ、2つのアプローチ
議事録テキストをCopilotに渡し「HTML形式でまとめて」とプロンプト。構造化の指示なし・スキーマ定義なし。Copilotの判断に委ねる。
タスク・リスク・部門間依頼のスキーマを事前定義。StructFlow APIで構造化JSON出力。Power AutomateでHTMLを動的生成しSharePointに保存。
数字で見る情報の欠落
| 指標 | StructFlow版 | Copilot版 | 差 |
|---|---|---|---|
| タスク抽出数 | 100件 | 18件 | −82件 |
| リスク抽出数 | 45件 | 高6件・中10件程度 | 大幅少ない |
| 部門間依頼数 | 83件 | 17件程度 | −66件 |
| 高リスク件数 | 21件 | 6件 | −15件 |
| 処理部門数 | 20 / 20 | 20 / 20 | 同等 |
Copilotが「読んでいない」わけではない。ちゃんと読んで、整理して、きれいなHTMLを出力している。だが要約の過程で大量の情報が落ちている。そして最も危険なのは、その欠落に気づけないことだ。
Copilotが落とした情報の中身
定量的な差よりも深刻なのは何が落ちたかだ。以下はCopilot版で欠落または過度に要約されていることを確認した5項目。
オペレーション部の過負荷3案件(離職リスク高)
財務部のM&A会計処理・監査対応
パートナー部の上位3社依存70%リスク
品質保証部のセキュリティ脆弱性2件
総務部の月額賃料3,200万円という具体的コスト情報
なぜ「丸投げ」だと情報が落ちるのか
生成AIは「読みやすいサマリーを出力する」方向に最適化されている。重要度の判断をモデルが行うため、自社の優先順位とは一致しない。
Copilot版の出力は毎回フォーマットが変わる。先月と今月でカラム構成が異なれば、トレンド分析が不可能。ダッシュボードには毎回同じ構造が必須。
最も危険な失敗モード。きれいなサマリーを見ても何が落ちたかはわからない。両者を比較して初めて欠落が可視化される。
20部門→30部門になっても、StructFlowのコストはほぼ変わらない。Copilotに丸投げする場合、部門数が増えるほど品質が低下する。
Copilotが優れている点
Copilotを全否定するのは正確ではない。KPIスナップショットの整理が得意で、サイドバー10ページ・バブルチャートなど経営層向けの見栄えが高い。文脈のある読み方ができ、案件の流れを自然な文章で整理する。経営会議前の「さっと把握」には十分な品質だ。
項目別スコア比較
StructFlow版のパイプライン
今後の展開
| 項目 | 内容 |
|---|---|
| 使用サービス | LDX hub — StructFlow(JSONL Batch Structuring Engine) |
| 比較対象 | Microsoft Copilot(単体・非構造化プロンプト) |
| オーケストレーション | Power Automate + Copilot Studio |
| 処理部門数 | 20部門(同一データを両環境に投入) |
| 配信先 | SharePoint → GitHub Pages(デモ公開) |
実際のダッシュボードを見る
同じ20部門のデータから生成された2つのダッシュボードを公開しています。
情報の「密度」の差を実際に体感してください。