LDX hub: レイアウトや書式を維持したドキュメント翻訳とその未来
現代のグローバル化したビジネス環境において、ドキュメントの翻訳は欠かせない要素となっています。特に、企業が国際的に展開する際には、正確で迅速な翻訳が求められます。
LDX hubは、ドキュメントの翻訳処理において、その翻訳精度を高めながらレイアウトや書式を最大限維持すること(LDX hub DocFlexテクノロジ)にも注力してきました。今回は、LDX hubのドキュメント処理を構成する様々な機能や、実際の出力結果について例を交えて紹介します。
目次[非表示]
- 1.ドキュメント翻訳のプロセス
- 1.1.作業用ファイルへの変換
- 1.2.作業用ファイル内のテキストを機械翻訳・加工・変換
- 1.3.元のドキュメントへのマージ(復元)
- 2.機械翻訳エンジンとの連携
- 3.ドキュメント処理技術の未来: 生成AIとの連携
- 4.まとめ
ドキュメント翻訳のプロセス
作業用ファイルへの変換
LDX hubのドキュメント翻訳プロセスは、まず様々な形式のドキュメントをテキストや書式情報を格納した作業用ファイルに変換することから始まります。この作業用ファイルは、元のドキュメントがどのような形式であろうとも共通の構造を持っているため、格納されているテキストを柔軟に加工する処理に向いています。
[図: 作業用ファイルの運用イメージ]
作業用ファイル内のテキストを機械翻訳・加工・変換
LDX hubは、作業用ファイルに格納された書式情報を可能な限り損なうことなくテキストを加工するための独自のプロセスを実行します。これにより、機械翻訳などの加工を行った後でも、元のドキュメントの大部分のレイアウトや書式を維持したままの結果を得ることができます(一部の機械翻訳には非対応)。
元のドキュメントへのマージ(復元)
加工した作業用ファイルと元のファイルとのマージ処理を行うと、元のファイル形式での加工結果を得られます。LDX hubの特長であるレイアウトや書式を維持した機械翻訳は、自然な結果を提供します。
[図: レイアウトや書式を維持した機械翻訳結果の例]
※画像拡大は、画像で右クリックしショートカットメニューから[新しいタブで画像を開く]もしくは[画像の拡大]をクリックしてください。
機械翻訳エンジンとの連携
LDX hubは、様々な機械翻訳エンジンへのコネクタを保有しています。前述の作業用ファイルと、さまざまなコネクタを組み合わせることで、幅広いドキュメント形式に対して、対応するすべての機械翻訳エンジンの適用が可能となります。LDX hubが連携可能な主な機械翻訳エンジンは下記の通りです(執筆時点)。
- みんなの自動翻訳@KI
- Google Cloud Translation Advanced
- Google Cloud Translation Basic
- Microsoft Translator
- Amazon Translate
- DeepL
- SAP Translation Hub
- IBM Watson Language Translator
- Globalese
- Rozetta T-4OO
- SYSTRAN Translate
- ModernMT
- Intento
- Lingvanex
- Papago Translation
ドキュメント処理技術の未来: 生成AIとの連携
各社の生成AIへのコネクタを整備することにより、生成AIを使った翻訳はもちろんのこと、さらに発展的なドキュメント変換が可能となってきています。LDX hubにはすでに以下の機能が実装されています(執筆時点)。
- 翻訳
- 文法上の修正
- 敬体(です・ます調)への変換
- 常体(だ・である調)への変換
- 任意の指示 (例: "関西弁に変換して")
[図: レイアウトや書式を維持した常体(だ・である調)への変換結果の例]
※画像拡大は、画像で右クリックしショートカットメニューから[新しいタブで画像を開く]もしくは[画像の拡大]をクリックしてください。
まとめ
LDX hubは、今後も技術の進化に合わせて、さらに多様なニーズに応えるべく開発を続けていきます。特に、生成AIとの連携は今後の技術革新において重要なテーマとなっています。
次回以降のブログでは、生成AIがどのようにLDX hubと統合され、具体的なビジネスシーンでどのように活用されているのかを詳しく紹介する予定です。
関連記事