生成AIと機械翻訳、翻訳性能の違いは？ChatGPTと機械翻訳の意外な関係その3

2025-12-10 14:00 （更新：2026-01-23 15:47） KIマーケティングチーム

ChatGPTと機械翻訳の意外な関係その1で述べたように、今日の高性能な生成AI（Generative Artificial Intelligence）を可能にした主要な技術は、機械翻訳の発展の中で生まれました。技術的に言えば、ニューラル機械翻訳（Neural Machine Translation: NMT）が大きくエンコーダーとデコーダーに分けられるうち、デコーダー部分を取り出したものがGPT（Generative Pre-trained Transformer）です。

生成AIは、言ってみれば機械翻訳の一部分なのですが、それでも翻訳が可能です。その理由は、今日の生成AIが膨大な量の文章を事前学習（pre-train）しており（そのため、大規模言語モデル（Large Language Model: LLM）と呼ばれます）、その学習データの中に多様な言語の文章が含まれているからです。

LLMとNMTの翻訳能力：流暢性と正確性の違い

NMTが翻訳できるのは、翻訳の訓練をした結果であり、驚くことではありません。一方、翻訳用の学習をしていないLLMが翻訳できているのは「たまたま」と言えるでしょう。しかし、偶発的に獲得した能力だからといって、直ちにその能力が劣っていると決めつけることはできません。では、LLMの翻訳能力は、NMTと比べて、どのように評価できるでしょうか。 ai_vs_ai_fight

ChatGPTが注目を集めた2023年に、LLMとNMTの翻訳性能を比較する研究がいくつか実施されました。それらを見ると、LLMが流暢性において優れている一方、NMTが正確性において優位であることがわかります。つまり、生成AIによる訳文は、訳文だけを読むともっともらしいのですが、機械翻訳の訳文と比べて誤りが多いのです。

NMTは原文と訳文のペアを学習していますが、そのような対訳データには、少なからずノイズが含まれます。誤訳や誤字脱字が紛れ込むこともありますし、文の区切り方が原文と訳文で異なっていたり、内容に意図的な過不足があったりすることもあります。これらのノイズは、NMTで不自然な訳文が生成される原因となります。

それに対し、LLMは単言語の文を学習しているため、学習データには、誤字脱字はあるとしても、翻訳に起因するノイズはありません。そのため、NMTに比べて不自然な訳文が生成される可能性が低く、訳文の流暢性が全体として高くなると考えられます。

一方で、LLMは翻訳タスクを学習していません。言い換えると、原文の内容を忠実に訳文に反映する訓練を受けていません。そのため、原文と訳文の内容が変わってしまう「誤訳」や、原文の内容が訳文から欠落する「訳抜け」、原文にない内容が訳文に付加される「湧き出し」が、NMTより頻繁に起こります。その結果、正確性が低下するのです。

LLMの「弱点」は強みにもなる

もっとも、現在のLLMは2023年のものと比べて性能が向上しています。それでも、翻訳の忠実度の向上は必ずしも期待できないどころか、逆に低下している可能性もあります。翻訳ではなく要約に関する研究でもLLMは正確性に欠けると指摘されているのですが、その問題は新しいモデルほど悪化する傾向があると報告されているのです。

ai_shigoto ただし、忠実度が低いというLLMの特性は、場合によっては長所にもなります。原文に比喩表現や口語表現が使われている場合、誤字脱字や文法誤りがある場合、原文が途中で途切れていたり内容が省略されていたりする場合などでは、NMTでは文字通りに翻訳しようとしてうまく翻訳できませんが、LLMは書き手の意図を汲み取って翻訳する能力が高いことがわかっています。

そのため、ゲーム・マンガ・アニメといったエンターテインメント分野や、ユーザーが生成したコンテンツ、音声から文字起こししたテキストなどの翻訳には、LLMが適していると考えられます。一方、流暢性より正確性が求められる場面では、生成AIより従来型の機械翻訳の方が信頼できると言えるでしょう。

また、翻訳速度が重視される場合も、NMTが優位です。NMTと同等の翻訳能力を持つLLMは、翻訳速度においてNMTに大きく水をあけられるのが通例です。さらに、LLMによる翻訳には、学習データに言語間の偏りがあることに起因する問題もあります。それについては稿を改めて論じたいと思います。

ブログまとめ ChatGPTと機械翻訳の意外な関係

ChatGPTに代表される生成AIが機械翻訳の分野で培われた技術に基づいていることはご存じでしょうか？
生成AIの成り立ちから、生成AIと機械翻訳との性能の違い、翻訳で利用する際の注意点などについて…

まとめ

さて、NMTは正確性に優れ、LLMは流暢性に優れているとするならば、両者を組み合わせれば高性能な翻訳システムができるのではないでしょうか。まさにそのようなシステムとして、弊社はAI翻訳ツールXMATに「AIポストエディット機能」を搭載いたしました。機械翻訳（NMT）の結果を生成AI（LLM）が修正するAIポストエディット機能について詳しくはこちらをご参照ください。