ポストエディットと機械翻訳カスタマイズ~翻訳会社についての豆知識~よくある質問⑨
翻訳の品質を保ちながら翻訳の費用は安くできる?
機械翻訳をかけたら多くの手直しが発生!何とかならない?
翻訳の依頼を検討している人も、すでに依頼している人も必見!お客様の疑問を解消する「翻訳会社についての豆知識シリーズ・第九弾」です。翻訳会社のことを知らない方も、翻訳会社とお取引をしたことがある方も、様々な方に翻訳会社を知っていただくためのコーナーです。
(過去のシリーズ記事は、株式会社川村インターナショナルのコーポレートサイトにて公開中です。前回の記事はこちら:翻訳会社についての豆知識 ~よくある質問⑧OCRと形態素解析、翻訳資産の構築~)
今回の記事で回答する質問は以下の2点です。気になる方はぜひご一読ください!
その1 ある程度の翻訳の品質を保ちつつ、コストを削減することはできますか?
回答: ご希望の品質が満たされる形でポストエディットを行うことで、品質を保ちつつコストを安く抑えることが可能です。 |
ポストエディットとは、機械翻訳の出力結果を人が修正して、翻訳者が翻訳した場合の品質に近づける作業のことです。
こちらの質問のような要望は多くのお客様が持っておられます。突発的に翻訳が必要になったけれども予算を十分に充てられず少しでも安くしたい場合、翻訳が必要なドキュメントが定期的にあるけれど、予算を他のことで使用するため、以前ほど翻訳に費用を充てられずコストを下げなければならない場合など、お客様によって事情は様々です。
コストを下げる方法として、このシリーズでは過去に機械翻訳やポストエディットの提案をしました。今回のようにコストを抑えることに加え、ある程度の品質を保ちたいという要望があった場合はどうしたらよいでしょうか。
ポストエディットはコストや納期のメリットが大きいサービスですが、品質もある程度選ぶことができます。それでも機械翻訳の出力結果をなるべく活用するサービスであるため、人手翻訳よりは品質面で劣りますが、ご要望に応じた品質の提供が可能です。機械翻訳のエラーを修正することが多いですが、それ以外にも下記のようなチェック項目を選んでいただくことができます。
|
例えば専門用語の調査を行わない場合、機械翻訳結果で出てくる用語が通常使われる正しい専門用語でなくても、意味が正しければ機械翻訳結果を優先します。またスタイルの統一を行わない場合、ですます調の混在や、表記の不統一(ユーザーとユーザなど)が見られたとしても、修正は行いません。
もちろん、上記以外にもお客様のほうでご要望があれば、そちらをポストエディットに適用する方向で作業内容を調整します。基本的には品質とコストは比例関係にあり、品質が上がればその分コストも上がります。そのため、上記のチェック項目やお客様のご要望が増えれば増えるほどコストも高くなり、本来のポストエディットの目的であるコスト削減や納期短縮のメリットが小さくなります。
コスト削減ありきの場合、最低限どのチェック項目が満たされていればよいのかという観点で決めていただくとよいと思います。そうすることでポストエディットのメリットを活かしつつ、ある程度ご希望通りの品質を提供することができます。
その2 機械翻訳のあとに結構手直しが発生しますが、何か良い方法はないでしょうか?
回答: 解決法の1つとして、自社向けに機械翻訳をカスタマイズすることで、修正の工数を減らすことが可能です。 |
ご存じのとおり、機械翻訳の精度向上は目覚ましいものがあり、今や企業にも導入されて積極的に活用されています。一昔前に比べると非常に流暢な翻訳結果が得られるようになり、機械翻訳だけで十分と考える人もいるかもしれません。
とはいっても、機械翻訳ではエラーが出ることがあり、機械翻訳の訳出結果をそのまま使用することにはリスクが伴います。たいていの場合は、機械翻訳を下訳として使用し、その後、機械翻訳の結果に修正を入れます。
ただ、従来の人手翻訳のみで対応していたときと比べると、加えるべき修正が多いと感じるケースも多々あり、もう少し効率よくできないかと悩む方もいらっしゃいます。修正が多いと感じるケースには、主に以下の2パターンがあります。
1. 用語の修正が多く、手間がかかる
機械翻訳を使うと、専門用語などに関して、通常は汎用的な用語が機械翻訳で出力されます。自社で使っている決まった用語がある場合など、自社の用語に逐一変更しなければなりません。
このようなケースで用語修正の手間を減らす方法として、機械翻訳に用語集を適用させ、該当する用語が出現したときに置き換え処理をする方法があります。この方法を使うと、漏れなく指定した用語に置き換えることができるため、用語修正の手間を減らすことができます。
ただ注意点としては、一般的な用語(管理など)が用語集に含まれる場合、置き換えをしたときにその他の部分が意図しない翻訳結果になることがあります。そのため、製品名などの固有名詞、専門用語等、なるべく用語を絞り込む必要があります。また、用語をたくさん登録すると、機械翻訳結果の精度そのものが落ちるため、用語登録時に注意が必要です。
2. 表記の仕方などが自社にあっていないため、修正の手間が多い
機械翻訳の場合、汎用的な表現として出力されることが多いため、自社の言い回しとは異なるものが多々見つかるかもしれません。表記スタイルなどは、前述のように用語で指定して置き換える方法は難しいです。
このような場合、機械翻訳エンジンをカスタマイズして、自社向けのエンジンを生成するという方法があります。そのためには、エンジンが学習するための対訳データ(原文と訳文のセット)が必要になります。ある程度の分量が必要となりますが、それらのデータを使ってエンジンをカスタマイズすれば、自社向けの表現が出力されるようになり、修正の手間を減らすことができます。
川村インターナショナルでは機械翻訳エンジンを有効に活用いただくための各種提案をしております。また、言語資産を有効活用し、上記のようなエンジンを手軽に生成するための自社開発プラットフォームも備えております。お困りごとがありましたら、ぜひサポートさせていただければと思っております。
まとめ
今回は品質を保ちつつコストを安くする方法、また機械翻訳を効率よく活用する方法についてご紹介しました。また次回の「豆知識シリーズ」をお楽しみに!
関連記事