[
    {
        "index": 0,
        "source": "こんにちは。",
        "target": ""
    },
    {
        "index": 1,
        "source": "さようなら。",
        "target": ""
    },
    {
        "index": 2,
        "source": "また明日。",
        "target": ""
    }
]

この入力に対して、生成AIが以下のような出力を返すことを期待します。

[
    {
        "index": 0,
        "source": "こんにちは。",
        "target": "Hello."
    },
    {
        "index": 1,
        "source": "さようなら。",
        "target": "Goodbye."
    },
    {
        "index": 2,
        "source": "また明日。",
        "target": "See you tomorrow."
    }
]

このように、入力と出力の構造を明確に定義することで、生成AIが期待通りの結果を返す可能性が高まります。

入出力を厳密なJSONで行うためのプロンプトを構築する

前述の仕様を実現するためには、プロンプトの完成度をぎりぎりまで追究することが何より重要です。

各社生成AIの最新モデルの能力は非常に高く、プロンプトの完成度を極めることで実用に耐えうる高い精度を期待できるようになります。その実現には、期待する出力形式や構造を明確にし、生成AIがそれに従って出力を生成できるようにすることが求められます。

プロンプトでカバーしきれない課題の解決

残念ながら、出力されるJSONがわずかに破損していることが稀にあります。その場合に備えた適切なエラーハンドリングやリトライの実装が必要です。

しかし、どのような対処療法的な実装を施したとしても、アプリケーションの確実性への影響を0にすることはできません。プロンプトでカバーしきれない課題解決のためには、生成AI側が提供する機能についても目を向ける必要があります。

Structured Outputsのもたらす確実性

OpenAIが公開した新機能「Structured Outputs」は、出力構造をJSONスキーマで厳格に指定することができ、JSONの破損を心配しなくて済むようになりました。ぎりぎりまで精度を追究したプロンプトから得られる出力データの型に確実性を与えるものとして非常に有用です。

例として、前述のJSONが出力されることを想定したスキーマは以下のような記述となります。

{
    "type": "object",
    "properties": {
        "results": {
            "type": "array",
            "items": {
                "type": "object",
                "properties": {
                    "index": {
                        "type": "integer"
                    },
                    "source": {
                        "type": "string"
                    },
                    "target": {
                        "type": "string"
                    }
                },
                "additionalProperties": false,
                "required": [
                    "index",
                    "source",
                    "target"
                ]
            }
        }
    },
    "additionalProperties": false,
    "required": [
        "results"
    ]
}

このスキーマを用いることで、生成AIは指定された形式に従って出力を生成し、JSONの破損を防ぎます。

結果を見てみましょう。

{
    "results": [
        {
            "index": 0,
            "source": "こんにちは。",
            "target": "Hello."
        },
        {
            "index": 1,
            "source": "さようなら。",
            "target": "Goodbye."
        },
        {
            "index": 2,
            "source": "また明日。",
            "target": "See you tomorrow."
        }
    ]
}

定義通りの構造で出力されていますね。

Structured Outputsの精度は100%と言われており、LDX hubにおけるこれまでのサンプリングでは、出力されるJSONに問題があったケースはありません。

まとめ

生成AIを活用したテキスト変換は、今後も進化を続けることでしょう。さまざまな分野での応用が期待されます。

LDX hubは生成AIの新機能を常にフォローし、精度・品質・速度のさらなる向上を目指して取り組んでいきます。

翻訳とコトバを変革するAPI群「LDX hub」｜機械翻訳・AIの有効活用言語データのデジタル変革を実現【LDX lab】 LDX hubは、自社システムと連携を検討中の企業や、言語サービスの開発に携わるのエンジニアの皆様に、言語の変換を制御するアプリケーションのハブとなるAPI群を提供するサービスです。 2,000通り以上の処理の組み合わせから、課題解決・活用/連携をサポートいたします。各社の生成AIとの連携や新しいAPI連携も継続して拡張し続けます。 LDX lab

KIマーケティングチーム

川村インターナショナルWebマーケティングチームです。開催予定セミナーやイベントの告知、ブログ運営などを担当しています。

ChatGPTと機械翻訳の意外な関係

LDX hub: レイアウトや書式を維持したドキュメント翻訳とその未来

翻訳業務の効率化でお悩みの方は
お気軽にご相談ください

ご不明な点はお気軽に
お問い合わせください。

お問い合わせ

各ソリューション資料はこちらから
ご請求ください。

資料請求

ブログ

LDX hub: 生成AIを使ったテキスト変換処理のコツ

LDX hubの取り組み

複数のテキスト(文)を可能な限りまとめて処理する

入出力を厳密なJSONで行うためのプロンプトを構築する

プロンプトでカバーしきれない課題の解決

Structured Outputsのもたらす確実性

まとめ

前の記事

次の記事

翻訳業務の効率化でお悩みの方は
お気軽にご相談ください

人気記事ランキング

英文開示の「スピード・品質・コスト」を叶えるAI翻訳の活用法！事例でポイントをご紹介

AI翻訳について展示会でよく聞かれる質問

【2025年最新版】おすすめの機械翻訳は？4種類のAI翻訳エンジンを比べてみた！

IPランドスケープと知財経営戦略におけるAI翻訳ソリューションの活用

機械翻訳エンジンと生成AIを比較！翻訳性能の違いを徹底解説

タグ一覧

ブログ

LDX hub: 生成AIを使ったテキスト変換処理のコツ

LDX hubの取り組み

複数のテキスト(文)を可能な限りまとめて処理する

入出力を厳密なJSONで行うためのプロンプトを構築する

プロンプトでカバーしきれない課題の解決

Structured Outputsのもたらす確実性

まとめ

前の記事

次の記事

翻訳業務の効率化でお悩みの方はお気軽にご相談ください

人気記事ランキング

英文開示の「スピード・品質・コスト」を叶えるAI翻訳の活用法！事例でポイントをご紹介

AI翻訳について展示会でよく聞かれる質問

【2025年最新版】おすすめの機械翻訳は？4種類のAI翻訳エンジンを比べてみた！

IPランドスケープと知財経営戦略におけるAI翻訳ソリューションの活用

機械翻訳エンジンと生成AIを比較！翻訳性能の違いを徹底解説

タグ一覧

翻訳業務の効率化でお悩みの方は
お気軽にご相談ください