LDX hub: ドキュメント処理を最速化するための仕組み
LDX hubは、現代のビジネス環境において不可欠なドキュメント処理を効率化するための強力なプラットフォームです。LDX hubには毎日膨大な数のドキュメントが投入され、フォーマットの変換・翻訳・音声系の入出力といった多岐にわたるリクエストに応えています。この記事では、LDX hubの特長や機能について詳しく解説します。
目次[非表示]
- 1.LDX hubの強み
- 2.処理開始条件と並列処理
- 3.APIによる進捗管理
- 4.サポートするドキュメント処理
- 5.*1: 利用可能な機械翻訳サービス
- 6.まとめ
LDX hubの強み
LDX hubの最大の特長は、連続したドキュメント処理を一気に投入し、処理効率を最大限に引き上げることができる点です。これにより、ビジネスプロセスのスピードアップが可能となります。
[図: 連続したドキュメント処理が投入されるイメージ]
投入されたドキュメント処理の開始条件が整うと、直ちに処理が開始され、最速で結果を得られるように構成されています。たとえドキュメント処理が複数に分岐する場合であっても、それぞれの処理は並列に実行されるため、待ち時間が増えることはありません。
[図: 複数のドキュメント処理が並列に処理されるイメージ]
処理開始条件と並列処理
ドキュメント処理の開始条件は、機械翻訳などの処理単位別に管理された同時実行数の制限や、LDX hubを利用するテナント(ユーザ)ごとの同時実行数の制限によって瞬時に判定されます。これにより、特定の機械翻訳サービスで大量の処理が実行されていたとしても、他のサービスを利用するドキュメント処理が遅延することはありません。
APIによる進捗管理
APIを通じて、各ドキュメント処理の進捗を可能な限りの細かい単位で取得できるため、LDX hubのAPIユーザはそのエンドユーザに対して適切なフィードバックを提供することが可能です。
[図: 進捗を取得して表示するイメージ]
※画像拡大は、画像で右クリックしショートカットメニューから[新しいタブで画像を開く]もしくは[画像の拡大]をクリックしてください。
サポートするドキュメント処理
LDX hubがサポートする主なドキュメント処理は以下の通りです(執筆時点)。
- PDF変換 (入力: PDF、出力: Word/Excel/PowerPoint)
- OCR (入力: PDF/TIFF/JPEG/PNG/BMP、出力: Word/Excel/PowerPoint)
- テキスト抽出 (入力: Word/Excel/PowerPoint/Text/HTML/XML/SRT/CSV/TSV/EPUB3、出力: XLIFF)
- 形態素解析 (入力: PDF/Word/Excel/PowerPoint/Text、出力: Excel)
- 機械翻訳・テキスト変換(*1) (入力: Word/Excel/PowerPoint/Text/HTML/XML/SRT/CSV/TSV/EPUB3/XLIFF/MQXLIFF/SDLXLIFF、出力: 元のフォーマット)
- 音声文字起こし (入力: WAVE/MP3、出力: Text/SRT)
- 音声合成 (入力: Text、出力: WAVE)
-
翻訳品質 (BLEU、NIST、RIBES、WER)評価(入力: XLIFF/MQXLIFF/SDLXLIFF、出力: 元のフォーマット)
*1: 利用可能な機械翻訳サービス
機械翻訳・テキスト変換に利用可能な主なサービスは以下の通りです(執筆時点)。
- みんなの自動翻訳@KI
- Google Cloud Translation Advanced
- Google Cloud Translation Basic
- Microsoft Translator
- Amazon Translate
- DeepL
- SAP Translation Hub
- IBM Watson Language Translator
- Globalese
- Rozetta T-4OO
- SYSTRAN Translate
- ModernMT
- Intento
- Lingvanex
- Papago Translation
- OpenAI (GPT-4o)
- Azure OpenAI Service (GPT-4o)
- Google Cloud Vertex AI (Gemini 1.5 pro)
- Anthropic (Claude 3.5 Sonnet)
- Amazon Bedrock (Amazon Titan Text G1 - プレミアム)
まとめ
LDX hubのドキュメント処理の内部を紹介した今回の記事はいかがでしたか。LDX hubは、今後も機能追加・改善を続けていく予定です。特に、ユーザのニーズに応じた新しいドキュメント形式への対応や、ドキュメント変換精度の向上を目指しています。また、機械翻訳・生成AIサービスへのコネクタの拡充も継続して行い、より多くのサービスと連携することで、ユーザにとって最適な環境を提供していきます。
関連記事