品質評価 — 汎用MTエンジン vs 汎用MT+RefineLoop(GPT-5.4)

汎用MTエンジンにRefineLoopをかけると
何が変わるか

同一の日本語XLIFFファイルを、汎用MTエンジンのみで処理したバージョンと、その訳文をRefineLoop(GPT-5.4)で改善したバージョンを、MQM風の定性評価で比較しました。XLIFFフォーマットを入力・出力として使用することで、書式保持の観点も含めた公平な比較が可能になります。

📅 2026年4月30日 📄 53セグメント 🔠 汎用MTエンジン 🔧 RefineLoop × GPT-5.4(LDX hub)
92.5%
変更率(49/53)
0件
フォーマット崩れ(両者)
3件
汎用MTの明確な誤訳
変更パターン分析

49件の変更はどう分類されるか

変更の種類(定性分類)
語彙・表現の置換
32件(65.3%)
軽微な調整
13件(26.5%)
文構造の変更
4件(8.2%)
MQM風定性評価

主要な差分の評価

Accuracy(正確さ)・Style(文体)・Fluency(流暢さ)・Terminology(用語)・Format(書式)の5軸で評価しました。

① Accuracy(正確さ)

seg-005 — MTを「machine learning system」と誤訳(汎用MT側の問題) ACCURACY
Source (JA)
IR文書や法務文書を汎用MTに通すと、数字のフォーマットが崩れる…
汎用MTエンジン
When IR documents and legal documents are processed through a general-purpose machine learning system
RefineLoop(GPT-5.4)
When IR or legal documents are run through a general-purpose MT system
✓ RefineLoop優位 — 翻訳業界の専門用語「MT(Machine Translation)」を汎用MTが「machine learning system」と誤訳。RefineLoopが正しく修正。
seg-052 — 「Claude が動く」の意味変化 ACCURACY
Source (JA)
でもつながれば、あとはClaudeが動く。
汎用MTエンジン
but once it's connected, Claude runs smoothly.
RefineLoop(GPT-5.4)
But once it's connected, Claude takes over.
✓ RefineLoop優位 — 「動く」は「動作する」の意。汎用MTの「runs smoothly(スムーズに動く)」は原文にない評価的ニュアンスを付加。「takes over(引き継ぐ)」の方が原文の意図に近い。

② Style(文体)

seg-001 — タイトルの文体 STYLE
Source (JA)
# 「社長がMCPでこれ書いた」——翻訳業界の痛みをAIエージェントで検証した話
汎用MTエンジン
# "The CEO wrote this using MCP" - A story about using an AI agent to examine the pain points of the translation industry
RefineLoop(GPT-5.4)
# "The CEO Wrote This with MCP" — How I Used an AI Agent to Examine the Translation Industry's Pain Points
✓ RefineLoop優位 — タイトルケース(各単語の先頭大文字)に統一。ダッシュを「-」から「—」(emダッシュ)に修正。「A story about…」という冗長な構文を「How I…」とシンプルに。
seg-037 — 一人称の維持 STYLE
Source (JA)
集計してみると、推奨者(NPS 9-10)が37%、批判者(0-6)も37%という二極化が見えてきた。
汎用MTエンジン
The analysis revealed a polarization: 37% were promoters (NPS 9-10) and 37% were detractors (0-6).
RefineLoop(GPT-5.4)
When I aggregated the data, a polarization emerged: 37% were promoters (NPS 9-10), and 37% were detractors (0-6).
✓ RefineLoop優位 — 原文は「集計してみると」と一人称の体験記的表現。汎用MTは受動的・論文的な「The analysis revealed」に変換。RefineLoopが「When I aggregated」と一人称を回復し、ブログらしいトーンを維持。

③ Fluency(流暢さ)

seg-004 — 「地味に厄介」の訳 FLUENCY
Source (JA)
翻訳の現場には、地味に厄介な問題がある。
汎用MTエンジン
There are some subtly troublesome problems in the field of translation.
RefineLoop(GPT-5.4)
There are some quietly troublesome problems in the translation field.
✓ RefineLoop優位 — 「subtly troublesome」は直訳的で英語として少し不自然。「quietly troublesome」はより慣用的。また「in the field of translation」→「in the translation field」と自然な語順に。
seg-052 — 「The MCP」の不自然な冠詞 FLUENCY
Source (JA)
MCPは「つなぐまで」が少し大変だ。
汎用MTエンジン
The MCP is a bit tricky to set up…
RefineLoop(GPT-5.4)
MCP is a bit difficult until you get it connected…
✓ RefineLoop優位 — 固有名詞・略語の「MCP」に定冠詞「The」は不要。RefineLoopが正しく削除。

④ Terminology(用語)

seg-019 — 「詰まった」の訳 TERMINOLOGY
Source (JA)
簡単に見えるが、**ステップ1で詰まった。**
汎用MTエンジン
It looks easy, but I got stuck at **Step 1.**
RefineLoop(GPT-5.4)
It looked simple, but **I got stuck at step 1.**
✓ RefineLoop優位 — 「easy」より「simple」の方が原文「簡単に見えるが」のニュアンスに近い。また**bold**の位置が汎用MTでは文の後半のみに付いている点をRefineLoopが修正。

⑤ Format(書式保持)

両者ともXLIFFフォーマットを完全保持 Markdownの**bold**マークアップ(0件の崩れ)、##ヘッダー(0件の崩れ)ともに、汎用MTもRefineLoopも書式を維持しました。これはXLIFFを入出力形式として使ったことの効果です。プレーンテキストで処理した場合は書式崩れが発生するケースがあります。
総合評価

何が改善され、何が変わらなかったか

✅ RefineLoopで改善された点

  • 専門用語の誤訳修正(MT → machine learning system)
  • 意味変化の修正(runs smoothly → takes over)
  • 不要な冠詞の削除(The MCP → MCP)
  • タイトルケースの統一・ダッシュ記号の修正
  • 一人称トーンの回復(The analysis revealed → When I aggregated)
  • 英語として不自然な表現の改善

△ 変化がなかった・課題が残った点

  • XLIFFフォーマット保持は両者とも問題なし(差なし)
  • 数値・固有名詞の保護は両者とも正確(差なし)
  • 一部セグメントで軽微な調整のみ(大きな改善なし)
  • 今回はネイティブ英語話者による評価を含まない
結論:RefineLoopによる改善効果は明確 92.5%のセグメントで何らかの変更が加えられ、特に専門用語の誤訳・意味変化・文体の不自然さという「汎用MTエンジンが苦手とする領域」で顕著な改善が見られました。XLIFFを入出力形式として使うことで書式保持を担保しつつ、翻訳品質を向上させるというRefineLoopの本来の用途が確認できた検証です。
サマリー
評価軸 汎用MTエンジン 汎用MT+RefineLoop 判定
変更率 — (基準) 92.5%(49/53) 大幅改善
Accuracy(正確さ) 誤訳3件(MT・冠詞・意味変化) すべて修正済み RefineLoop優位
Style(文体) 論文的・一人称欠落 ブログらしい一人称を維持 RefineLoop優位
Fluency(流暢さ) 直訳的・不自然な表現あり 慣用表現に改善 RefineLoop優位
Terminology(用語) MT誤訳・easy/simple等 適切な用語に修正 RefineLoop優位
Format(書式保持) 完全保持(XLIFFの効果) 完全保持(XLIFFの効果) 両者同等
この検証の限界 評価者が著者1名(日本語母語・英語非母語)であり、ネイティブ英語話者による独立した評価を含みません。また今回の原稿はブログ記事であり、法律文書・技術文書など異なる文書種別では結果が異なる可能性があります。