X (Twitter)

AIを使った記事翻訳について、いくつか考察をお話ししたいと思います。その核となる考え方は次のとおりです。最高の翻訳とは、実際に書き直すことです。高品質の結果を得るには、プロセスをステップに分割する必要があります。ただし、これはシナリオによって異なります。一般的な翻訳ニーズであれば、通常は1回の書き換えで十分です。現在の大規模言語モデル、特にGemini 3 Proのようなモデルの性能を考えると、1回の書き換えで得られる品質は既に非常に優れています。プロ級の翻訳を目指すなら、最初の書き直しの後にAIに校正させて文章をブラッシュアップしてもらうことが必要です。重要なのは、コンテンツが極端に短い場合を除き、翻訳、校正、磨き上げを 1 つのプロンプトに詰め込まないようにすることです。主な理由は、昨日私が言及したことと同じです。モデルは非常に長い入力を処理できますが、必要な出力が長すぎる場合は手抜きをしたり、深刻な幻覚症状に悩まされたりする傾向があります。 2,000語の記事を翻訳すると想像してみてください。モデルに書き直し、校正、そして最後に磨きをかける作業を一度に依頼すると、出力は簡単に5,000～6,000語に膨れ上がり、最終的に完成する頃には品質は著しく低下してしまうでしょう。したがって、翻訳、校正、磨き上げはそれぞれ独立して行うのが最適です。翻訳から始めましょう。プロンプトは過度に複雑である必要はありません。以下の情報を指定すれば、「rewrite（書き換える）」と指示するだけで十分です。 - 記事のスタイル - 一般的な用語やマッピングの用語集 - 対象読者（オプション）校正には、原文と翻訳の両方をご提供いただく必要があります。ここでの目的は、漏れや誤りがないか確認することです。精度への要求がそれほど高くない場合は、この手順を省略できます。ポリッシングを行うには、元の英語のテキストはもはや必要ありません。翻訳だけで十分です。この段階では、結果がスムーズに流れるか、言い回しがネイティブの表現習慣に沿っているかを確認するためのモデルのみが必要です。元のテキストはもはや必要ありません。さらに、記事が長すぎる場合は、ブロックに分割する必要があります。自然な章または段落ごとに分割するのが最善ですが、通常は段落レベルで分割すれば十分です。現在のブロックと前のブロックの連続性を確保する方法としては、前のブロックの原文と翻訳をコンテキストに追加することがシンプルかつ効果的です。これにより、次のブロックの翻訳で、前のブロックの内容とスタイルを参照できるようになります。どの程度の履歴を保持するかは、モデルとブロックのサイズによって異なります。通常は、直前のブロックのソースと翻訳があれば十分であり、それほど多くの履歴は必要ありません。実際、履歴を全く保持しなくても問題ない場合もあります。このプロセスは、APIを使ったプログラムで自動化することも、モデルインターフェース内で手動で行うこともできます。個人的にはGeminiを使用しています。プロンプトごとに異なる「Gem」を作成し、必要なときにコンテンツを対応するGemに貼り付けるだけです。

高品質な翻訳を求める - - プロンプト - - 以下の記事を、分かりやすく、流暢で、魅力的な{{簡体字中国語}}に書き直してください。コア要件: - 対象読者とスタイル：AIに関心のある一般読者をターゲットにしてください。学術論文のようなトーンではなく、明快で分かりやすいストーリーテリングスタイルを採用してください。 - 正確さ第一: 中核となる事実、データ、ロジックは、元のテキストと厳密に一致している必要があります。 - 流れと流暢さ：ターゲット言語の自然な文構造を重視します。長く複雑な文は、より自然で短いフレーズに分解します。 - 標準用語：技術用語については、業界で認められた標準的な翻訳を使用してください（例：{{overfitting -> 过拟合}}）。用語が初めて出現する際は、元のテキストを括弧で囲んで記載してください。 - 書式を保持: 見出し、太字、斜体、画像など、元の Markdown 書式を維持します。 - 文脈注釈：専門用語が一般の人にとって理解しにくい場合、または背景知識が不足しているために理解が妨げられる場合は、適切な注釈を追加して理解を促します。これらの注釈は、(注釈)のように太字の括弧で囲みます。用語集/共通語彙: {{- AI エージェント -> AI 智能体 - LLM -> 大语言モデル}} それでは、以下の内容を書き直してください。

宝玉（@dotey）のスレッド

作者情報

スレッド内容