ブログ

各ソリューションの詳しい資料はこちら
ChatGPTと機械翻訳の意外な関係:LDX lab翻訳ソリューションブログ

ChatGPTと機械翻訳の意外な関係 その2

ChatGPTに代表される生成AI(画像、文章、音楽などを生成することのできる人工知能)が高性能になったことで、「生成AIで社会はどう変わるか」や「生成AIに仕事が奪われるのでは」といった議論を耳にすることが増えています。

前回の記事「ChatGPTと機械翻訳の意外な関係」で述べたように、生成AIの進歩は機械翻訳からもたらされました。なかでも中核的な技術である「Transformerモデル」が翻訳に使われるようになったのは、2017年です。ということは、ChatGPTと同規模の衝撃を、翻訳業界は数年前に受けているのです。 

そのため、ここ数年の翻訳業界の変化を見ることが、冒頭に挙げた疑問を考える手がかりになるのではないでしょうか。

目次[非表示]

  1. 1.機械翻訳と生成AIの現在位置
  2. 2.機械翻訳は翻訳者の仕事を奪ったか
  3. 3.生成AIの使い方
  4. 4.まとめ



機械翻訳と生成AIの現在位置

まずは「敵」を知ることから始めましょう。現在の機械翻訳や生成AIの実力は、人間と比較してどの程度でしょう。 

翻訳の品質を測る指標はいくつかありますが、流暢性正確性整合性の3つの観点から評価することがあります。この評価基準は生成AIにも適用できるでしょう。 

「流暢性」とは、出力された文が自然な文になっているかどうかです。この点については、ChatGPTがしばしば「人間と会話しているよう」と言われるように、機械翻訳も生成AIも人間並みになっていると言ってよいでしょう。 

「正確性」とは、翻訳で言えば、原文の内容が正しく訳出されているかどうかです。生成AIなら、質問(プロンプト)の意味を正しく捉え、過不足なく答えられるかということになるでしょう。この点では、AIはまだ人間に及びません。 

Transformerモデルに基づく機械翻訳では、原文の意味を取り違える「誤訳」は少なくなりましたが、まだなくなってはいません。一方、ルールベースの機械翻訳であまり起こらなかった「訳抜け」(原文にある情報が訳文にない)や「湧き出し」(原文にない情報が訳文にある)がしばしば見られます。 

生成AIでも、込み入った質問では意味を取り違えることがありますし、聞かれていないことまで答えることはよくあります。また、現在の生成AIの仕組み(サブワード分割+Transformerモデル)では、その動作原理上、論理推論や数値計算ができません。そのため、これらを含む質問に正しく答える保証はありません。 

「整合性」には、前後の文との整合性と、言語外の事実との整合性があります。前者は文章全体で文体や用語が一貫しているか、後者は背景となる事実に反したことを言っていないかという評価です。実は、この点については、AIは人間にまったく歯が立ちません。 

機械翻訳でも生成AIでも、一度に処理できる情報量に制約があるので、数十ページの文章で整合性を保つのは無理な相談です。また、Transformerモデルには、言語外の事実を参照する手段がありません。特に生成AIでは、事実に反する内容が生成されるということが知られていて、そのような現象にハルシネーション(Hallucination: 幻覚)という名前がついています。 


機械翻訳は翻訳者の仕事を奪ったか

このように、機械翻訳の能力はまだまだ人間には敵いません。機械翻訳の訳文は流暢性が高いので、訳文だけ読むとちゃんと訳せているように見えますが、どこに誤訳が潜んでいるかわかりません。また、訳としては正しくても、対象となる国の法律に反しているかもしれませんし、宗教的・文化的禁忌を侵しているかもしれません。 

そのため、人に読んでもらうため、つまり発信目的では、機械翻訳は人手翻訳の代わりにはなりません。特に、文芸翻訳や映画の字幕翻訳、あるいは産業翻訳の中でもマーケティングなど、人の心を動かそうとする文章では、機械翻訳が出る幕はほとんどありません。このような「職人技」には、今後も人間による翻訳が必要でしょう。 

その反対として、自分で読むための、受信目的の翻訳があります。ここでは、機械が人間を駆逐しています。機械翻訳は、発信目的には使えない、いわば「ジャンク翻訳」ですが、その程度の品質でよいとなれば、速度と費用では人間の翻訳者に勝ち目はありません。 

もっとも、ジャンク翻訳では、機械が人間の仕事を奪ったというより、機械によって新たな需要が創出されたといったほうが正確かもしれません。これまでは料金と時間をかけて翻訳することがためらわれていた文章が、機械翻訳のコストであれば翻訳しようとなって、翻訳の量自体が増えていると考えられます。 

さて、産業翻訳の多くは、職人技とジャンク翻訳の中間に位置します。つまり、誤訳があっては困るけれど、人の心を動かさなくてもよくて、事実が伝わればよいという翻訳です。この領域では、機械翻訳(MT)の訳文を人間の翻訳者が修正(ポストエディット: PE)するMTPEという翻訳形態が増えています。 

職人技の翻訳では、機械翻訳の訳文は使い物にならないことが多いので、MTPEより人が一から訳したほうが早いのですが、操作手順書など定型文が多い文章であれば、MTPEによって人手翻訳と同等の訳文を効率的に仕上げることができます。ここでは、機械翻訳は翻訳者と競合するのではなく、翻訳者の生産性を向上するツールとなっています。


生成AIの使い方

生成AIも、機械翻訳と同様、正確性と整合性に難があります。そのため、ビジネスのアウトプットの場面でAIが生成した文章をそのまま使うのは、決して勧められません。その文章には、虚偽の情報や人を不快にさせる表現があるかもしれず、それを発信したとなれば、ビジネスに対する悪影響は計り知れません。また、Transformerモデルは学習した表現を丸写しすることがあり、生成AIの出力を発信することが著作権を侵害する可能性が指摘されています。 

AIで生成した文章を発信する場合、人手によるファクトチェックは欠かせません。そのため、生成AIによって人間の仕事がなくなるということはないでしょう。翻訳では、本来人手翻訳やMTPEを使うべきところで機械翻訳の訳文をそのまま使ってしまい、間違いが見つかって新聞沙汰になるということが何度も繰り返されています。
生成AIでも、単純に人を機械に置き換えれば、同じことが起きるに違いありません。


一方、インプットの場面では、生成AIを使うことで業務の効率を上げることができます。さまざまな使い方が可能ですが、ここでは翻訳に関連した使い方を2つ紹介します。 

まず、「次の英文の内容を日本語で簡潔にまとめてください」のように指示することで、翻訳と要約を同時に行わせることができます。生成AIの翻訳も、機械翻訳である以上ジャンク翻訳なので、全文を訳したところで要点を知る程度にしか使えないことが多いです。それならば、はじめから要点だけを出力してもらえば、人間が読む時間を節約できます。 

次に、「次のドイツ語の文章を文ごとに英語と日本語の対訳にしてください」のように指示すれば、ドイツ語を英語と日本語の両方に翻訳してくれます。多くの機械翻訳では、学習データは英語が圧倒的に多いので、日本語訳より英語訳のほうが翻訳精度が高い傾向があります。そこで、英語訳と日本語訳とのあいだに齟齬があれば、日本語訳が間違っているかもしれないと気づくことができます。 

もちろん、英語訳が間違っている可能性もありますし、齟齬がなくても、英語訳も日本語訳も同じ間違いをしているかもしれません。それでも、ドイツ語から日本語への単純な機械翻訳に比べれば、翻訳の信頼性を高めることができます。 


なお、「次の英日対訳で日本語に誤りがあれば指摘してください」というプロンプトで機械翻訳や人手翻訳の訳文をチェックできるかと思って試してみましたが、誤訳でないものを誤訳だと言って改悪したり、逆に誤訳や訳抜け、訳文の誤字脱字を見逃したりということがよくありました。機械翻訳が人間の翻訳者に及ばないように、生成AIは人間の翻訳チェッカーに及びません。 

生成AIを使用する場合の注意点として、サービスによっては入力したプロンプトを学習データとして収集することがあるので、利用規約や設定を十分に確認してください。これは機械翻訳サービスでも同様です。 

たとえばChatGPTの無料ウェブインターフェースの場合、この記事の執筆時点で、デフォルトの設定ではユーザーとの会話が保存されモデルの学習に使用されます。日本で個人情報を入力すれば、目的外利用として違法になる場合があります。また、機密情報を入力したら、それが別の人の質問に対する答えに使われて、深刻な事態が引き起こされるかもしれません。 


まとめ

機械翻訳も生成AIも、人間に並ぶ能力は備えておらず、人間に取って替わる物ではありません。むしろ、それらは人間が使う道具であり、上手く使えば役に立ちますが、使い方を間違えれば痛い目に遭います。 

機械翻訳や生成AIの出力は、表面上はもっともらしいですが、誤っている可能性があるという事実を常に心に留めておいてください。発信する情報の正しさを保証できるのは、人間だけです。機械にできることは機械に任せ、機械にできないことを人間がすることで、業務の効率化が図れるのではないでしょうか。 

  ソリューション一覧|機械翻訳・AIの有効活用 言語データのデジタル変革を実現【LDX lab】 LDX labでは、機械翻訳やAIを活用したマシンラーニングなど、貴社の翻訳業務効率化に役立つソリューションを多数取り揃えております。翻訳とコトバにまつわるデジタル変革の実現は、川村インターナショナルのLDX labをご用命ください。 LDX lab


関連記事

KIマーケティングチーム
KIマーケティングチーム
川村インターナショナルWebマーケティングチームです。開催予定セミナーやイベントの告知、ブログ運営などを担当しています。

翻訳業務の効率化でお悩みの方は
お気軽にご相談ください

ご不明な点はお気軽に
お問い合わせください。
各ソリューション資料はこちらから
ご請求ください。

人気記事ランキング

カテゴリ一覧

タグ一覧

ページトップへ戻る