AI翻訳の精度ってどれくらい?翻訳者が特許明細書を使って徹底解説!

「AI翻訳とは何か」を文字通り理解するならば、AI(人工知能)を使った翻訳ということになりますが、「AI(人工知能)とは何か」という話になると、専門家の間でも意見が分かれており、統一的な定義は今のところありません。

つまり、AI翻訳のソフトを開発・販売している企業がいろいろな表現を使って、自社の技術の優位性を強調してはいますが、AI翻訳の精度となるとまだまだ疑問符が付くというのが実際のところだと思います。

ですが、翻訳業界では自分で使ったこともないのに「よく分からないがAIってスゴイらしい」とか、「もう翻訳者はいらないらしい」という漠然とした期待や喜びや、恐れをだた持っているだけという人が多い印象です。

そこで、この記事では、AI翻訳というものは実際どの程度使い物になるのか、翻訳者は本当に不要になるのかを、具体的な特許明細書の一部を使って、以下解説していきたいと思います。

AI翻訳の仕組み

各社が有している「AI」そのものに対する考え方の違いから、AI翻訳の仕組みについても各々異なるアプローチがなされています。

例えば、NTTコミュニケーションズのCOTOHA Translatorという製品 では
「ニューラル機械翻訳技術」が使われ

https://www.ntt.com/business/services/application/ai/cotoha-translator.html?utm_source=google&utm_medium=cpc&utm_campaign=cotoha-tr_001_ac_g&waad=45Mh0vWT

みらい翻訳では「ニューラル機械翻訳(NMT)エンジンを搭載する機械翻訳サービス」であると証されています。(https://miraitranslate.com/service/miraitranslator/)。

ではそのニューラル翻訳は何かとなると、「人間の神経細胞における情報伝達の仕組みを模した計算モデル」と説明されているわけですが、(https://www.jstage.jst.go.jp/article/johokanri/60/5/60_299/_html/-char/ja/

そもそも人間の「脳の仕組み」はいまだ解明されていませんので、あくまで、その仕組みを計算機で処理できる形に単純化した「仮説」「近似」に過ぎないと考えるべきでしょう。

翻訳エンジンがいかに優秀であるかを強調するために、TOEIC950点とか、満点レベルだなどとカタログでは謳われていますが、そもそもTOEICの点数と翻訳力が直結しないことは、 翻訳業界ではよく知られています。

この記事を書いている2020年4月時点で、私の主催する講座がスタートして、9.5年が経過しているわけですが、その間講座を受講されたのべ600人以上の受講生を見てきて断言できることは、TOEICの点数が700点後半以上ならTOEIC点数と実務的な翻訳力とは相関関係はほとんど無いということです。

つまり、難関大学に現役合格できる高校生であれば、ほぼプロの翻訳者に必要な英語力の基礎は備わっており、プロになるためには「それ以外」の能力を身につけることが大切であると言えるのです。

さらに言えば、TOEIC点数が800点を超えて900点までは翻訳力との間で弱い相関関係は認められるものの、900点を超えると相関関係が認められなくなります。

産業翻訳・特許翻訳などいわゆる「実務翻訳」の世界では一応このようなことが言えますので、AI翻訳エンジンの開発元が、TOEIC950点相当とか980点相当と宣伝する気持ちは分かりますが、あまり実務を知らない人の宣伝文句と言えるでしょう。

もちろん、TOEIC点数と実務で必要な英語力との関係が「逆比例」することはありません。繰り返しになりますが、翻訳者のコアスキルは、もっと複雑で「複合的」なものから成り立っているので、翻訳者の「能力を判定」するなら「実戦」すなわち「実ジョブ」ですべきというのが業界の常識となっています。

ですから、TOEICの点数自体は、応募者が多い場合の「足きり」の参考に使われる程度のものだと捉えるべきです。

プロの翻訳者の中には、まずTOEICの点数を900点に乗せてからとか、どこそこの検定でどのクラスの認定もらってから、翻訳の勉強をしようと考える人が相当数いるようですが、プロになって稼ぐという観点からは遠回りになりますのでご注意ください。

AI翻訳エンジンには有料・無料のものがいくつかあります。ここではその仕組みに ついて解説はしません。

なぜなら、多くの人が興味があるのは、

  • AI翻訳が翻訳者にとって脅威となるのか
  • 翻訳者は失業してしまうのか
  • 翻訳者になるための勉強や投資が無駄になるのか

という点にあるからです。

AI翻訳サービス・アプリ(無料版)

無料で利用できるAI翻訳サービス・アプリは様々なものがありますが、今回は既に利用者が多い、あるいはこれから増えるであろう2つのサービスをご紹介したいと思います。

Google 翻訳

Googleが提供する翻訳サイトで、テキストの一部分(5000字以内)もしくは、ウエブページ全体を他言語に翻訳するサービスです 。(https://translate.google.com/

(資料)

統計的機械翻訳による独自の翻訳エンジンで、国連の文書類による
二百億程度の語から成るコーパスを用いて、原文と国連の翻訳者の翻訳文を
相互に探索して類型を抽出して翻訳エキスパートシステムを作成。
2016年に翻訳アルゴリズムがニューラルネットワークを使用したものに
なったことで翻訳の精度が向上した。

Wikipedia より

DeepL

従来、欧米の言語への対応が中心でしたが、2020年3月19日から日本語と中国語にも対応を始めた、最近話題の翻訳システムです。 https://www.deepl.com/translator

AI翻訳サービス・アプリ(有料版)

今回は翻訳業界で代表的な3つの翻訳サービスをご紹介したいと思います。その中には、導入前にその精度を確かめたいという方向けに「試用制度」を設けているところもありますので、興味のある方はぜひそちらをご利用下さい。

みらい翻訳

みらい翻訳は、株式会社みらい翻訳が提供するニューラル機械翻訳(NMT)エンジンを搭載する機械翻訳サービスで、ウェブブラウザを通して利用できるクラウドサービスです。

職場のグループ単位でのカスタマイズ機能を有し、固有の商品名や専門用語等の辞書登録などが行えるという特徴を有するとされています。

現在、無料お試し翻訳や、有料ですが14日間トライアルも用意されていますので、興味のある方はサイトからアクセスしてみてください。 (https://miraitranslate.com/

T-4OO(ロゼッタ)

T-4OOは、株式会社ロゼッタが提供するAI自動翻訳で、 2,000の分野からなる専門分野データベースと、ユーザーごとの専用データベースを有します。

T-4OO(Translation for onsha Only)というサービスの名称にも使われているように、各社専用データベースに翻訳結果を蓄積することで学習が進み、各ユーザーに合った自動翻訳にカスタマイズが可能です(https://www.jukkou.com/

無料デモンストレーションが以前は可能でしたが、残念ながら2020年4月現在では「法人限定」のサービスとなっているようです。

AI翻訳の精度を実際の特許明細書を使って比較・検証してみた

翻訳者が「誤訳」した箇所をAI翻訳エンジンは克服できているのか、翻訳者より「高精度」な訳文を吐き出せるのかという観点から人による翻訳結果と比較してみます。

Google翻訳の精度

バイオの特許明細書の以下の短文を使ってみます。

DOX and WOR were conjugated to the hydrazide groups of PEG-p(Hyd) through an acid-sensitive hydrazone linkage at their 13-C and 17-C positions, respectively.(https://patents.google.com/patent/US20080248097

Google翻訳の出力結果

DOXおよびWORは、それぞれ13-Cおよび17-Cの位置で酸感受性ヒドラゾン結合を介してPEG-p(Hyd)のヒドラジド基に結合しました。

Google翻訳の精度を検討した結果・評価

conjugated」が訳出されていません。誤訳です。
「しました」も「した」ですね。

このミスは、同じ画面で「翻訳方向を反転させて処理」させるとよく分かります。

DOXおよびWORは、それぞれ13-Cおよび17-Cの位置で酸感受性ヒドラゾン結合を介してPEG-p(Hyd)のヒドラジド基に結合しました。

というGoogleの出力を、英語にしてみると

DOX and WOR bound to the hydrazide group of PEG-p (Hyd) via acid-sensitive hydrazone linkages at 13-C and 17-C, respectively.

となり、「conjugated」が「bound」になっています。両者は意味が異なります。 化学の基礎知識がある高校生なら分かる初歩的な誤訳です。

英日、日英と異なる方向で翻訳してみて同じ結果が出なければ、プロ仕様のエンジンとはいえません。

みらい翻訳の精度

Google翻訳との比較のために、以下の同じ文章を翻訳してみます。

DOX and WOR were conjugated to the hydrazide groups of PEG-p(Hyd) through an acid-sensitive hydrazone linkage at their 13-C and 17-C positions, respectively.(https://patents.google.com/patent/US20080248097

みらい翻訳の出力結果

DOXとWORはそれぞれ13‐Cと17‐C位置で酸感受性ヒドラゾン結合を介してPEG‐p(ハイド)のヒドラジド基に共役していた。

みらい翻訳の精度を検討した結果・評価

Google翻訳より上ですね。ちなみに公開特許で対訳が確認できますが、 問題の文章には誤訳が含まれていました。ですから、この文章だけに限れば、みらい翻訳の方が優れていると言えます。

ちなみに、みらい翻訳の日本語出力を、英語にしてみると

DOX and WOR were conjugated to the hydrazide group of PEG-p (Hyde) via an acid-sensitive hydrazone linkage at the 13 C and 17 C positions, respectively.

となっていますが、

DOX and WOR were conjugated to the hydrazide groups of PEG-p(Hyd) through an acid-sensitive hydrazone linkage at their 13-C and 17-C positions, respectively.

という原文と比較してみると、「through」が「via」となっている点は問題とする点ではありませんが、「their」が抜けている点で「いまひとつ」の評価となります。

T-4OOの精度

残念ながら、「試用」は法人限定のサービスとなってしまいましたので、ここは割愛させていただきます。

AI翻訳が人(翻訳者)を超えられない壁とは

上記の文章では、Google翻訳より高精度だったみらい翻訳ですが、 別の文章では完全に誤訳してしまっています。

使ったのはこちらの文章

Cytotoxic activity of combination use of free drugs and mixed polymeric micelles against a human breast cancer MCF-7 cell line at 30 hours (A) and 72 hours (B) after drug exposure.(https://patents.google.com/patent/US20080248097)

こちらもバイオ案件(DDS関連)ですが、結果は、NGです。

みらい翻訳の出力結果

薬物曝露後30時間 (A) と72時間 (B) でのヒト乳癌MCF‐7細胞株に対する遊離薬物と混合高分子ミセルの併用使用の細胞毒性活性。

みらい翻訳の精度を検討した結果・評価

特許翻訳講座ではありませんので、なぜそこがダメなのかという解説はここでは割愛させていただきますが(私が運営している翻訳講座では解説しています)「併用」部分が誤訳です。

実際の特許明細書にはグラフが添付されているのですが、AIは「絵柄」からの情報読み取りを苦手としていて、そのために正確に訳すことが難しくなっているようです。機械が人を超えるにはまだ時間が必要なのではないでしょうか。

AI翻訳エンジンは、2パターンの解釈が可能な文章については、エンジン内部に取り込まれたコーパス(文章を構造化し、大規模に集積したデータベース)に依存して訳出しする傾向があり、また、文章の切れ目が複数存在する場合にも、処理しきれずに誤訳する傾向があるように思われます。

内容を理解していれば問題なく処理できる場合でも、内容・意味理解が苦手なAI翻訳は、まだまだ発展途上にあると言えるでしょう。

翻訳の仕事がない、なくなると心配している人へのアドバイス

AI翻訳の登場によって、自分がどうなるのか心配している人の中には、様々な立ち位置の人がいると思いますので、それぞれ分けてアドバイスを送りたいと思います。

これから翻訳の仕事を始める人へ

翻訳だけで勝負できる実力をつける

王道ですが、100人の翻訳者の「まずは」上位20-30人に入るような勉強を積み重ねるべきです。そしてさらには、上位10人、上位5人...を目指すべきです。今後、AIエンジンの改良に伴い高レートで稼働できる割合はさらに絞られ、上位3人程度が生き残る厳しい世界になるかも知れません。

翻訳業界。10年前、20年前とは事情が異なります。安易なノウハウやテクニックで生き残ることは不可能ですし、残れたとしても低レート・低収入に沈むことになるでしょう。トライアル突破も簡単ではなくなっています。実力が一定レベル以上でないと、クラウドで安い仕事を奪い合う自称翻訳者で終わってしまうでしょう。

複業も視野にいれる

講座ではすでにその取り組みを始めています。2~3年前ぐらいから、講座受講生にはブログの立ち上げを勧めており、情報発信・アフィリなどを使った収入の複線化も視野に入れる必要が あると思います。

翻訳できる実力でMTPEに参入する

翻訳業界では、AI翻訳の訳質でOKというクライアントに対しては、AI翻訳の結果を翻訳者にチェックさせて、明らかな間違い部分だけを修正して納品し、コストダウンを狙う動きが加速しています。

ですが、この処理フローでは「100%の精度」での納品は不可能です。

なぜなら、現状の「MTPE導入」はもっぱら「コストダウン」が目的なので、AI翻訳の出力を「完璧に修正」できるだけの上位の翻訳者に担当してもらうことは、その「報酬の高さ」からできないためです。

結果、精度95%のいまいちな訳文がネットにあふれ、それを教師データとして学習したAIエンジンの精度が上がらないという矛盾に陥っているように見受けられます。

今後、MTPEがきちんと認知されて、95%精度を100%精度まで順次高めていくためには、高レートでのMTPE案件が増えていかなければなりません。

ただ、その時にこの作業に必要となるのは上位の翻訳者だけです。ですから、生き残っていくためには、実力を上げるしかないいというのが結論です。

すでに翻訳者として稼働中の人へ

翻訳支援ツールとの協働作業で効率を上げる

AIエンジンを「下訳者」として活用し、入力作業を効率化しつつ高速で処理することができれば、より高い稼働率と高い年収が期待できます。

そのためにはAIという「下訳者」のミスを瞬時に見抜いて修正する力、特に英訳案件において、AIエンジンが誤訳しないような日本語にする力、つまり、高い日本語力と専門知識に基づく正確な内容理解が必須となります。

実力者がますます稼げる状況になりつつあると同時に、中間層が没落し、下位グループと同じ低レートのMTPE案件に沈む危険もはらんでいます。二極化した世界のどちらで稼ぐつもりなのか、覚悟を決める必要があると思います。

まとめ

  • 実力者はより稼げるようになる
  • 中間層は没落し、下位グループに転落するリスクがある
  • 翻訳者は、AIを下訳者として使えるITスキルが必須となる
  • これまで以上に高い日本語運用能力が求められる
  • 専門知識を前提とした内容理解なくしてAI翻訳には勝てない

そして、上記スキルを兼ね備えた「真の実力者」は、さらに稼げるようになると確信しています。

<追記>

筆者が講師を務めている「レバレッジ特許翻訳講座」では、
「講座の動画32本」を無料でプレゼントするキャンペーンを行っています。
自宅でゆっくりご覧頂けますので、翻訳に興味のある方はぜひご利用下さい。

最初のコメントをしよう

必須