ChatGPTと機械翻訳の意外な関係 その1で述べたように、今日の高性能な生成AI(Generative Artificial Intelligence)を可能にした主要な技術は、機械翻訳の発展の中で生まれました。技術的に言えば、ニューラル機械翻訳(Neural Machine Translation: NMT)が大きくエンコーダーとデコーダーに分けられるうち、デコーダー部分を取り出したものがGPT(Generative Pre-trained Transformer)です。
生成AIは、言ってみれば機械翻訳の一部分なのですが、それでも翻訳が可能です。その理由は、今日の生成AIが膨大な量の文章を事前学習(pre-train)しており(そのため、大規模言語モデル(Large Language Model: LLM)と呼ばれます)、その学習データの中に多様な言語の文章が含まれているからです。
もっとも、現在のLLMは2023年のものと比べて性能が向上しています。それでも、翻訳の忠実度の向上は必ずしも期待できないどころか、逆に低下している可能性もあります。翻訳ではなく要約に関する研究でもLLMは正確性に欠けると指摘されているのですが、その問題は新しいモデルほど悪化する傾向があると報告されているのです。
そのため、ゲーム・マンガ・アニメといったエンターテインメント分野や、ユーザーが生成したコンテンツ、音声から文字起こししたテキストなどの翻訳には、LLMが適していると考えられます。一方、流暢性より正確性が求められる場面では、生成AIより従来型の機械翻訳の方が信頼できると言えるでしょう。
また、翻訳速度が重視される場合も、NMTが優位です。NMTと同等の翻訳能力を持つLLMは、翻訳速度においてNMTに大きく水をあけられるのが通例です。さらに、LLMによる翻訳には、学習データに言語間の偏りがあることに起因する問題もあります。それについては稿を改めて論じたいと思います。
|
|
ブログまとめ ChatGPTと機械翻訳の意外な関係ChatGPTに代表される生成AIが機械翻訳の分野で培われた技術に基づいていることはご存じでしょうか? |
さて、NMTは正確性に優れ、LLMは流暢性に優れているとするならば、両者を組み合わせれば高性能な翻訳システムができるのではないでしょうか。まさにそのようなシステムとして、弊社はAI翻訳ツールXMATに「AIポストエディット機能」を搭載いたしました。機械翻訳(NMT)の結果を生成AI(LLM)が修正するAIポストエディット機能について詳しくはこちらをご参照ください。
XMATでは翻訳文字数を気にせず、高品質かつ安全な機械翻訳を提供することができます。テキスト・ドキュメント翻訳に加え、翻訳エディター機能や生成AI(LLM)による修正機能もご利用いただけます。
川村インターナショナルでは機械翻訳サービスの提供だけではなく、より円滑な翻訳業務ができるよう、様々なご提案をさせて頂いています。翻訳の課題をお持ちの法人・個人のお客様はお気軽にお問い合わせください。
関連記事
・ChatGPTと機械翻訳の意外な関係
・ChatGPTと機械翻訳の意外な関係 その2
・徹底解説!自動翻訳と機械翻訳の違いとは