対訳データは、将来の翻訳費用の低減を可能にする翻訳メモリや、機械翻訳エンジンをトレーニングするための教師データに加工できます。
機械学習用の教師データ |
翻訳メモリ |
翻訳メモリとはなんですか?
自社の保有する翻訳されたテキストのデータを、原文と翻訳文を一対としてデータベース化したものです。このデータを再利用することで翻訳にかかる費用を低減することができます。CorpusNowでは、日本語と英語以外の言語の組み合わせによる翻訳メモリ作成も可能です。
どのようなファイル形式で納品されますか?
Excel、TSV/CSV、TMXなど、ご要望に応じたファイル形式での納品が可能です。まずはお問い合わせください。
他社のWebサイトからテキスト情報をスクレイピングするのは可能ですか?
はい、可能です。ただし、スクレイピングが禁止されているWebサイトは除外されます。また、取得したデータは、著作権法で定められた用途以外には利用できません。
機械翻訳エンジンのカスタマイズの支援は可能ですか?
はい、可能です。弊社ではGoogle AutoML、Globalese、Microsoft Custom Translator、みんなの自動翻訳@KIなどを利用した機械翻訳エンジンのカスタマイズが可能です。また、弊社の提供する機械翻訳活用プラットフォーム「XMAT®」では、教師データの作成からエンジンのカスタマイズ、機械翻訳の利用まで、同一ソリューション内でまとめてご利用いただくことも可能です。
Webサイト以外のデータを対訳データの形にすることは可能ですか?
はい、可能です。WordやPowerPointなどのMicrosoft Office形式のファイルや、HTML、XML、テキストデータなどを対訳データに変換できます。お気軽にお問い合わせください。
費用の目安を教えてください。
20万ワードの対訳データ作成を10万円からご提供しております。対象となるデータ量が増えるにつれて、費用も低減いたします。詳しくは、お問い合せください。
© Kawamura International Co., Ltd. All Rights Reserved.