多言語サイトで機械翻訳を使うときの5つの注意点

多言語サイトで機械翻訳を使うときの5つの注意点
WEBチーム:堤
2024.04.02 2024.10.03

こんにちは、アイディーエー株式会社Webチームの堤です。翻訳会社内のWeb制作部門で、年間20〜30の多言語サイトの制作・運営に携わっています。

今回は近年進化が著しい機械翻訳・AI翻訳を多言語サイトで使用する際に注意するポイントを5つ紹介します。SEO対策の重要なポイントや多言語サイトの品質に影響の大きいポイントもありますので、機械翻訳の活用をご検討されている方はぜひ参考になさってください。

1. 検索エンジンに対応した方式を選ぶ

多言語サイトで機械翻訳を活用する際には、検索エンジン対策(SEO)を考慮したアプローチが重要です。検索エンジンが正しくコンテンツを認識できなければ、海外のユーザが検索エンジン経由でサイトに訪れることもありません。

検索エンジンに対応しているかどうかは、下記の2点で判別できますのでチェックしてみてください。

  1. ブラウザ上でテキストを置き換える方式はNG
  2. 各言語のページが個別のURLを持つこと

ブラウザ上でテキストを置き換える方式はNG

ページ上部に「このページを翻訳」というボタンがあり、押すとページを翻訳する仕掛けを見たことがないでしょうか。これはブラウザに表示したテキストをリアルタイムに翻訳して置き換える仕組みです。

この方式だと翻訳されたテキストはその人のブラウザにしか反映せず、インターネット上には存在しないため、検索エンジンの検索対象にはなりません。

これを自動化するシステムを「多言語対応」と謳っている有料サービスも存在しますが、検索エンジンの対象にならない点は同じです。検索流入の割合の多いコーポレートサイトや製品・サービスサイトでは、この方式は避けたほうがよいと思います。

多言語の各ページが独自のURLを持つこと

ブラウザ上でテキストを置き換えているのかどうかはページのURLで確認できます。ページの言語を切り替えてURLが変化していれば、個別のURLを持っている=検索エンジンの対象になることがわかります。言語を切り替えてもURLが同じであれば、多言語ページは検索エンジンの対象外になっている可能性が高いです。

検索エンジンはページ単位で言語を識別していますので、多言語のそれぞれのページが独自のURLを持つことが多言語SEOの必須条件になります。

多言語サイトのSEOやGoogleの多言語ガイドラインについては、こちらの記事で詳しく紹介しています。

2. Googleのスパムポリシーを理解する

多言語サイトで機械翻訳を利用する際には、検索エンジンのスパムポリシーにも注意が必要です。

機械翻訳を人のチェックなしで公開するのはNG

Googleのスパムポリシーでは、機械翻訳を人のチェックなしで公開することを禁止しています。

Google 翻訳やGeminiといった翻訳もできる生成AIをリリースしているGoogleのスパムポリシーにこういう項目があるのはなぜでしょうか。それはおそらく、「そのコンテンツを誰も確認せず公開する」ということが、コンテンツの質を重視するGoogleのポリシーに合致しないからだと思います。

チェックせずに公開する場合は noindex 処理を

Googleのポリシーでは機械翻訳をノーチェックで公開する場合、noindexタグ等で検索エンジンの対象外とすることを求めています。人の翻訳ではとても間に合わない大量のテキストを機械翻訳にかける場合などでは、検索エンジンの対象にならないよう noindexタグやrobots.txtなどで検索対象外とする設定を行ってください。

重要なコンテンツは、人がチェックしてから公開する

noindex にするということは検索エンジンにヒットしなくなるということを意味します。海外のユーザに製品やサービスを認知してもらうためには、検索エンジンに対応することは必須ですので、多言語サイトで機械翻訳を使用する際には必ず人のチェックを行った上で公開してください。

3. なぜ機械翻訳のチェックが必要なのか

近年、機械翻訳は目覚ましい進歩を遂げていますが、完璧な翻訳ツールとはなっておらず、誤訳や不適切な表現が含まれることを前提とする必要があります。

機械翻訳の限界を理解する

機械翻訳の限界としては、例えば下記の点が挙げられます。

  • 固有名詞や専門用語の翻訳精度が低い
  • 文脈やニュアンスの表現が難しい
  • 文化や慣習の違いを理解した上で訳出できない
  • 今日問題なかった訳でも、明日は違う訳を出力する可能性がある

ほかにも例えば、日本語では主語が省略されても文が成立しますが、英語への翻訳では主語がないと文が成立しません。そのとき何を主語とするかは文脈によりますが、機械翻訳で100%の正解を出すことは難しいようです。原文によっては人間でも判断が分かれるので仕方ないのですが、人間だと「こちらを主語として訳した」と申し送りすることができます。そうした補足ができないことも、機械翻訳の限界のひとつと言えるかもしれません。

「流暢に」間違える生成AI翻訳

Chat GPT や Google Gemini のような生成AI も非常に自然な訳を出力しますが、正確さより自然さを優先する傾向があり、翻訳の精度という点ではGoogle翻訳や DeepLといった翻訳専用にチューンされた機械翻訳エンジンよりは劣るといわれています。

生成する訳文は流暢なのですが、人の翻訳や既存の機械翻訳でもあり得ないような間違い方をすることもあるため、注意が必要です。実際に目にした誤訳でも下記のようなものがありました。

  • 「○○できない」を「○○できる」と逆の意味に訳してしまう
  • 特定の固有名詞に含まれる「2024年」を「2020年」と訳してしまう
  • スマホに関する文に出てくる「アプリ」を「アプリコット」と訳してしまう

コンテンツの質を確保するためにはチェックが必要

「今はまだ機械翻訳の精度が低いから人のチェックが必要」ということではなく、「翻訳したものをノーチェックで公開してしまうこと」が問題なのだと思います。人が翻訳していても、誰もその内容を確認していなかったら、誤訳や不適切な表現の可能性が残ります。

これは翻訳に限ったことではなく、日本語のコンテンツでも誰もチェックせずに公開してしまうと問題があるのと同じです。

4. 人がチェックする方法は?

翻訳業界では近年、機械翻訳とプロの翻訳者の両方のメリットを活かした「ポストエディット」という手法の活用が広がっています。

プロの翻訳者がチェックする「ポストエディット」

「ポストエディット」とは、機械翻訳の翻訳結果をプロの翻訳者が編集・修正して仕上げる手法のことです。機械翻訳には誤りや不自然な表現が含まれる場合がありますが、ポストエディットによってそれを補い、機械翻訳のコストメリットを活かしつつ、より自然で正確な翻訳を実現することができます。機械翻訳(Machine Translation)を後から編集(Post Edit)するので「MTPE」と略されることもあります。

ポストエディットの対応レベルとは?

ポストエディットには対応レベルという考え方があります。機械翻訳にかけた文をどこまで後編集するかというレベルで、求められる品質とコストに応じた対応が可能です。編集の度合いが少ないほど費用は少なく、度合いが増えるほど品質は高くなります。

対応レベル例 主な用途 編集内容
簡易PE 必要最小限のチェックでコストを削減
  • 訳文をネイティブチェックし、文法間違い、表記間違い等を修正
  • 校正ツールによる品質チェック
通常PE 費用を抑えつつ機械翻訳のデメリットを補う
  • 簡易PEに加えて、原文と照合し誤訳をチェック
  • 用語集がある場合に用語集を適用
フルPE プロの翻訳と同等のチェックと編集
  • 通常PEに加えて、文章スタイル・用語・表現の統一
  • 読みやすさを考慮した文体の調整・改善
  • プロの校正者による校正

ポストエディットについては下記の記事で詳しく解説しています。

5. 大切なのは翻訳手法の使い分け

自社のビジョンや重要製品の説明は、なるべく質の高い翻訳で海外に発信したいところです。一方で大量のテキスト全てに最高品質の翻訳を求めると、予算的な制約でできることが制限されてしまいます。肝心なのはコンテンツに応じて適切な翻訳手法を使い分ける柔軟さだと思います。

翻訳手法を目的に応じて使い分ける

原稿の内容や目的に応じて、例えば下記のように翻訳手法を使い分けることが考えられます。

原稿の種類 原稿の例 翻訳手法
テキスト分量は多いが、訳の正確性はあまり求められない原稿 ユーザレビュー、ユーザコメント 機械翻訳+noindex
簡易PE
一般的なビジネス文書で、コストを抑えつつ正確性も確保したい場合 一般ビジネス文書 通常PE
プロ翻訳者
専門性が高く、誤訳がないことはもちろん、用語の選択も含めた技術的な正確性を求められる原稿 ビジネス文書全般、技術文書、製品・サービス紹介、企業メッセージ・IR情報 プロ翻訳者
口語が多く、話者の人柄や意図を伝えることが重要な原稿 インタビュー、トップメッセージ プロ翻訳者
抽象的、情緒的な原文のニュアンスを外国語ネイティブに伝えることが必要な原稿 ラグジュアリーツーリズム向け翻訳、海外マーケティング向け(翻訳以上コピーライティング未満)の翻訳 プロ翻訳者+プロのリライト

まとめ:機械翻訳の活用で、より多くの価値を提供

多言語サイトで機械翻訳を使うときの注意点をまとめると下記の5つになります。

  1. 検索エンジンに対応した方式を選ぶ
  2. 機械翻訳を人のチェックなしで公開するのはNG
  3. コンテンツの質を確保するためにはチェックが必要
  4. 機械翻訳をプロの翻訳者がチェックする「ポストエディット」を活用
  5. 翻訳手法を目的に応じて使い分けることが重要

機械翻訳を多言語サイトで活用することで、これまで費用の関係で翻訳対象にできなかったコンテンツを海外に発信できたり、対応できていなかった言語に対応することができ、より多くの価値をユーザに提供することができます。

アイ・ディー・エーでは実際の原稿を翻訳部門が確認した上で、機械翻訳の活用も含めた最適な翻訳手法をご提案しています。多言語サイトでの機械翻訳の活用にご興味がありましたら、下記からご相談ください。

WEBチーム:堤

多言語サイト制作や機械翻訳の活用に関するご相談を承っています。

ご相談、お見積りのご依頼はこちらから

ライターWEBチーム:堤

翻訳会社内の多言語ウェブ制作部門に所属。B2Bサイト・インバウンドサイトなど多くの多言語サイトの制作・運営に携わる。