採録
2008年09月25日なぜ自動翻訳は使い物にならないのか? ― 翻訳を生業とする立場と経験から分析してみる
筆者は1980年代の終わり頃から産業翻訳という仕事に携わっている。最初は、ある翻訳会社(以後“T社”)に完全出来高制で採用されたのだが、1年半ほどで独立した。私が独立した後、T社が新会社設立のプランを立てて銀行に融資を願い出たところ、あっさりOKが出たらしい(まだバブル崩壊まで1年以上残していた時期の話だ)。“自動翻訳機”を数台導入し、翻訳物を量産して大儲けするというプランだった。 沖電気、三菱電機、東芝、シャープ、日本電気、日立製作所、リコーなど、日本の電機メーカー各社は、1980年代から自動翻訳機(機械翻訳システム)の開発と商品化に力を入れていた。自動翻訳の機能しか持たない専用機1台に数百万の価格が付けられていた。T社の新会社が導入したのはシャープのDuetか、三洋電機のSYSTRANのどちらかだったと思う。
しかし、大儲けなど出来やしなかった。その当時の翻訳原稿は、まだ紙ベースが大半。スキャナは存在していたが、OCR(文字認識)技術がまだ発達しておらず、結局は手入力に頼らざるを得なかった。ここに第一のボトルネックがあった。
そして、最大のボトルネックは、機械翻訳の出力の品質があまりに低く、そのままクライアントに納入できないという点だった。そのため、出力をチェックして修正する“ポストエディタ”なるスタッフが必要となるのだが、翻訳ソースを読んで正しく意味を理解できる人でないと勤まらない仕事だった。
要するに、翻訳者の卵程度の技量はないと勤まらない。翻訳者の卵は翻訳者になることを目指しているので、煩雑な“ポストエディタ”の仕事に魅力を感じない。だから使える人材がなかなか集まらない。
バブル崩壊が追い打ちをかけて、その新会社は倒産。親会社のT社も、まもなく多額の負債を抱えて倒産に至った。
■自動翻訳が普及したことで質の悪さも周知されるように
さて、今日では大仕掛けな“翻訳専用機”に頼らなくても、誰でも簡単に無料で自動翻訳を利用できる。たとえば、googleの検索結果ページでは海外のWeb ページを自動翻訳して閲覧することが可能になっている。現在はまだBETA版ということなので、今後は改良が続けられていくことになるようなのだが、現時点では次のような奇っ怪な訳文が生成される。
擬態のMyna才能
九官鳥の中国に2つの騒々しいオウムを閉めることに成功-猫のようなm iaowを学んでいる。
鳥のオーナー江氏は、南京、 mynaを買ったと話すように教えたのためのビジネスを誘致する。
すべてうまくいった-オウムを買ったとまでは、 2つのケージは、 m ynaの横に入れ、 Y angtseイブニングポストを報告します。
江主席は、 2つのオウムは非常にはチャタリングのmyna動揺と怒らせておしゃべりしている。
これは熱狂的にケージ内の2つのオウム到着後にジャンプを開始した。その後、 mynaの近くに猫がやってきて、 miaowed 、突然オウムはすごく”と同氏は説明した静かなことに気づいた。
その後のことを学んだしていた私に聞いて驚いた九官鳥、猫miaowingをまねると、そのまま何度も一日。それは、彼のすべての私は彼に教えた中国語を忘れているようだ!
あまりにもうるさいれるたびに、オウム、 myna猫を真似て、はったりと、オウムをすぐに口止めを呼び出します。
これは、先日の記事「九官鳥対オウムの争いは、猫の鳴き声を真似た九官鳥の逆転勝利」でソースとして参照したAnanovaの記事をgoogleの自動翻訳にかけたものである。全体を通して意味不明なことはもちろん、九官鳥を意味する英単語であるmynaが訳されていないことや、飼い主の名前が勝手に“江主席”と訳されているなど、突っ込みどころ満載である。
Ananovaの記事は比較的プレーンな英語で書かれているのだが、それでも上のような有様。有料の翻訳ソフトなら、もう少しましな出力が得られるかもしれないが、編集なしで日本語として通用させるのに無理があるのは、どのソフトも同じだろう。
自動翻訳を手軽に利用できるようになるまでは、世間の人たちがその精度の低さを認識していなかったように思う。というのも、以前は、私が世間の人に「翻訳を生業としている」と言うと、「でも、これからは自動翻訳が発達するので将来仕事が減ったりしませんか」みたいな反応を示されることがよくあった。最近は、そんな反応を示されることがめっきり少なくなったのだ。
■路上を自動的に走る自動車はまだ実現されていない
自動車はその名に反して、自動的に走る車ではない。人間が運転席に座り、自分の判断でハンドルを切ったり、アクセルを踏んだり、ブレーキをかけたり、変速したりするものとして最初から設計されていた。
ところが、機械翻訳システムは、最初から人間の判断を介入させることなく全自動で翻訳出力を生み出すシステムを目指して設計されてきた。自動車の設計思想にならい半自動の翻訳機能を人間が操作しながら翻訳出力を生み出すシステムを目指していれば、もっと使えるものが出来ていた可能性もある。
最初から“全自動”という、あまりにも重くて実現困難な使命を負わされていたことに加え、どの分野の原典にも対応できる“汎用性”を売りにしようとしたところにも無理があった。分野の違いへの対応は、用語辞書だけで済まそうとしていた。
さらに、機械翻訳システムでは、原典が“正しい言語”で書かれていることが大前提となる。原典に誤りがあったり、新しい用語や新しい表現が含まれていると、もう正しく対応できなくなる。
翻訳現場の人間から言わせてもらえば、完璧な原典に出会えることはめったにない。最近では、米国で書かれたものであっても、非ネイティブの書き手による英語に遭遇することが非常に多くなっている。原文の誤りや不足箇所を補いながらでないと翻訳できないことがしばしばである。
今日の翻訳ソフトやオンライン翻訳も、上記の問題点にいまだに呪縛されている。
なお、こういった問題が特に顕著になるのは、英語などの印欧語と日本語の間の翻訳の場合である。印欧語どうし(特に英語とドイツ語など)の自動翻訳は、たとえ無料のオンライン翻訳であっても、かなり精度が高くなっている。当ブログで珍ネタを取り上げるときにも、ときどきドイツ語やオランダ語などの情報ソースを英語に訳して参照することがあるが、参照用としては十分使えるレベルにある(もっとも、不特定多数が参照する文書としてそのまま使用できるレベルにないことも確かだ)。
また、韓国語のニュース記事などをオンライン翻訳で日本語化した場合も、かなり精度の高い出力が得られる。実際、当ブログは韓国からの閲覧者も多いのだが、その多くはオンライン翻訳で当ブログの記事を韓国語化して読んでいるらしいことが、アクセス解析の結果からわかっている。
■グローバル翻訳業界では機械翻訳よりも翻訳データベースが主流
印欧語どうしの翻訳は人間が行う場合も、印欧語・日本語間の翻訳よりはるかに生産性が高い。だから、後編集の必要となる機械翻訳にかけるよりも人間に翻訳させた方が、結局、コストが低くなる。
1990年代半ばから世界の産業翻訳業界を席巻しているのは、機械翻訳ではなく“トランスレーション・メモリ”と呼ばれる翻訳データベースに既存の翻訳を文章単位で(原文と訳文のペアとして)蓄積していくタイプのCAT(Computer Aided Translation)ツールである。
特に有名なのはTradosと呼ばれるツールである。CATツールが出回りだした当初は、その使用が義務づけられていないことが多かったので、個人的に翻訳データベースを構築して美味しい思いをしたこともある。
しかし、最近では、マニュアルなどの英日翻訳の発注元企業(大半は米国企業の日本法人)がその使用を要求するのがごく普通のことになっている。最近では、非外資系の日本企業も翻訳の発注(この場合は日英翻訳も含まれる)に際してCATツールの使用を必須条件にすることが増えてきた。
過去の翻訳に同じ文があったり、似ている文があると、翻訳データベースから自動的に呼び出される。その一致率に応じて、翻訳料金がディスカウントされる。これにより、ソース・クライアントはコスト減を実現できる、という寸法である。
まあしかし、翻訳データベースにも、いろいろと欠点がある。たとえば、ほとんど同じ文であっても、分野、文脈、あるいは文書内での出現箇所によっては、訳語や表現を変える必要がある。しかし、そういった違いを自動的にカバーしてくれるようなシステムにはなっていない。
原文が100パーセント一致していれば、その箇所はディスカウントされるわけで、基本的に手を入れない。手を入れる約束になると、クライアントは思ったほどのコスト節減効果を得られないことになる。
このことから、もう1つ大きな問題が生じている。過去に蓄積された訳文の品質という問題である。既存の訳文の品質が悪いと、それがそのまま新しい文書にも引き継がれてしまう。
■筆者の構想:完全にプログラミング可能な翻訳システム
機械翻訳があらゆる分野でまったく役に立っていないかというと、決してそうではない。ボキャブラリが限られており、表現が定型化されている分野では威力を発揮する。具体的には株式市況や天気予報などである。
上にも書いたが、従来の機械翻訳システムの設計上の大きな誤りは、あらゆる分野に対応可能な“汎用型”システムを目指した点にあると思う。特定分野だけに特化したシステムにすれば、今の数倍は精度が上がるだろう。
という観点に基づき、筆者はずいぶん前から「完全にプログラミング可能な翻訳システム」を作ればよいのではないかという構想を持っている。漠然とした構想なので、業界の人に話しても、あまり関心を持ってもらえたためしがない。
従来の機械翻訳システムや現在の翻訳ソフトは、入力と出力だけしか外から見えない一種のブラックボックスのようなものである。内部の仕組みを知っている必要がないがゆえ、すぐに使い始めることができるが、その反面、翻訳精度が悪くても辞書以外の方法ではチューニングができない。
筆者が考えているのは、その動作をすべて“プログラミング言語”で制御できる翻訳システムである。ロボットのプログラミングにたとえた方がわかりやすいかもしれない。特定の分野や用途に応じて“翻訳ロボット”の動作を細かく制御できるのだ。
このシステムは、翻訳データベースも活用することになる。特定の条件を満たしている場合は、過去の訳文を取り出してきて自動的に修正を加える。
「そんなシステムが出来たら、あんたが真っ先に職を失うのではないか?」と心配してくれる人がいるかもしれないが、そんな心配は無用と感じる。こういうシステムの開発に関与し、そのシステムが成功すれば、発案者の私にも多少実入りはあるだろうし、そもそも翻訳プログラミングが次の仕事になる。こつこつ作業した結果が翻訳データベースに吸い取られてディスカウントを食らっている現状よりは、よほどましである。
ーーーーーえーっと、AI に近いところにおって、色々思うところがあるわけで、ちょっと書いてみる。エンドユーザはこう思っているのかーと、なかなか興味深いのだが。
まず、なぜ自動翻訳は使い物にならないのか?というタイトルだが、使い物になるわけがない。
この人も書いているように、印欧語同士でない翻訳、例えば日英/英日などは、単語と単語の意味が、ぴったりと対応しているわけではない。例えば、日本語の「糠雨」と「霧雨」を区別できる英単語はあるだろうか。アラブの方には、たくさんのラクダをあらわす単語があるらしい。日本語では多分「○○なラクダ」としか言いようがない。そして面倒なことに、「糠雨」と「霧雨」はちょっとニュアンスが違う。糠雨の方が湿度が高くてしっとり感があるが、ベタベタではない。降るなら春先かな、みたいな。そこまではさすがに翻訳できない。翻訳家なら、そのニュアンスも加味して翻訳することができるかもしれない。そんなわけで、単語と単語の置き換えだけでは、まずうまくいかない。文脈を解析して、意味を理解した上での置き換えなら、うまくいくかもしれないが、現在の技術では、意味解析の実用化はまだ無理。オントロジーだのセマンティック web だのも、一時期流行したものの、現在は、なんか良さそうだけど何に使おうか?という感じ。実際に動くようになるのは 20 年後くらいじゃないか。現在使われている形態素解析だって、実は 20-30 年くらいは研究され続けてきているのだから。
使い物にならない理由として、ほかに挙げられるのは、チューニングができないということ。チューニングするには、バイリンガルの協力が不可欠だが、翻訳家は「精度が上がると自分たちの仕事がなくなる!」と思って、なかなか協力してくれない。人間の仕事がなくなるほど精度が上がるなんて、現在のところはまったく考えられないのだが、説明してもわかってくれない。結果、日本語ネイティブがあーでもないこーでもないと、英語のチューニングをしていたりする。精度の上がりようがない。上記リンクの人は理解があるが、大多数の翻訳家は、この人ほど理解がない。
現在、ホワイトボックステストでも多分精度は 7-8 割くらいだろうと思う。ここまでは割とサクサクと来るのだが、実はここからが難しい。ここから精度を 1% 上げるのに数年かかったりするのだが、普通の人には「精度が 1% 上がりましたー!」と言っても、「…で?」と言われるだろう。企業としても、精度を上げる方向で開発を続けづらい。ここ 10 年くらいで開発をやめちゃった企業もたくさんある。こういうのは知識の蓄積でできているので、一度やめちゃうと、多分もう二度と開発を始められない。例えば、アメリカは大昔に「機械翻訳なんてクソ」と開発をやめてしまったので、その分野では、ヨーロッパに大分遅れを取っている。
ま、そんなこんなで、全自動で機械翻訳なんて、まだまだ無理。できるかも!と思ってる人って結構いるのかな。
上記記事へのツッコミ。使えない例として、google の翻訳をあげているが、これは大変にひどい例なので、例としては如何なものか。結果から見るに、google のは統計的手法を主にした機械翻訳なのだろうと思う。これは学習に食わせるドキュメントの質と量で、格段に差が出る。forgot なんか入れると、パスワード云々なんて日本語が出ていたので、食わせているのはきっとマニュアルとか、そういう類の文書。学習データにあわせて、ニュースよりもマニュアルを入力にしたら、もうちょっと質が良いものが出力されるかも。学習に使う文書だが、日英の対がそろっている文書なんて、実はそうたくさんない。購入することもできるが、結構お高くてよ。多分、google のは学習量が足りなすぎ。他のルールベースのサービスに比較できる品質になるには、まだ大分お金をかける必要があるが、翻訳サービスにそれだけの価値を見出すかどうかは、google 次第。個人的には、全然期待していない。
統計的手法はここ 10 年くらいにホットになったが、従来のルールベースほど精度が出ないということで、統計とルールを両方使うほうが良さそう、ということで FA になっている。ところが、統計的手法のエンジンは比較的簡単に構築できるが、ルールを記述するのは、それなりにシステムもルール全体もわかっていないとダメ。新しくルールを入れたら、別の方がおかしくなった、ということが良くある。だから、ルールをユーザにカスタマイズさせないのは、そういう理由。「筆者の構想:完全にプログラミング可能な翻訳システム」の内容が実現されていないのも、そういう理由による。作る側は「ユーザは何をしでかすかわからない人」という思想でソフトを作る。ある程度コンピュータリテラシの高い人を想定してソフトを作ったとして、それが何本売れるだろう?それよりは「どんな人でもOK」というソフトを作ったほうが、明らかに売れる。たとえ、訳がかなりおかしいとしても、である。
半自動の翻訳機能を人間が操作しながら翻訳出力を生み出すシステムを目指していれば、もっと使えるものが出来ていた可能性もある。
とあるけれど、実は既に存在する。汎用性を目指すと帯にもたすきにもならないのは、開発の人もわかっているので、分野を特定すれば良いのでは?というのは、誰でも考え付く。企業としても、いつまで経っても実用化できない開発は続けられないが、多少でも実用化できれば、開発費が一部でも回収できるかもしれない。実際、欧州では、天気予報というジャンルに限って、欧州内の各言語に翻訳するシステムが、大分前から稼動している。それを日本でもと思うのは当然。なわけで、実際にある。でも、企業の中で使われているので、一般の人が知らないだけ。天気予報じゃなくて、アレとかコレとか。ちょっと書けないけど。
翻訳メモリに関しては、翻訳家の間で必須なツールであることは、開発側もわかっている。しかし、シェアはほぼ TRADOS の寡占状態なので、TRADOS と提携するのも難しいし、新規に作った別の翻訳メモリ+翻訳ソフトに乗り換えてもらうのも難しい。
翻訳家の人の気持ちもわかるんだけど、色々オトナの事情というのがあるのだよ。
ここまで書いたのは、ちょっと前の AI 業界近所の話。今はもうちょっと違う状況なのかな。
ーーーーー機械翻訳の歴史は古い。1940年代にコンピューターが発明されてまもなく、研究が始まっている。構文解析によって、原語を分析し、翻訳語を生成するルールベースの機械翻訳だった。それが行き詰ると、今度は統計的機械翻訳という分野が注目された。大量に用意された2つの言語の文の対に基づいて、最も確からしい翻訳結果を出力するシステムである(Google 翻訳がこの一例だ)。
機械翻訳では、文章が定型的で、2つの言語が文法的によく似ている場合、かなりよい精度で翻訳できる。英語とオランダ語、フランス語とイタリア語、日本語と韓国語などでは、ほぼ実用水準に達している。
しかし、文章が少しでも型を外れると、とたんに翻訳精度が下がる。また言語間の距離が遠ざかると、まともな文章が出力されない。日本語と英語などという関連性がほぼゼロの言語同士だと、惨めな結果しか得られない。
熱心に研究している人たちには気の毒だが、現在の手法では永遠に汎用的で精度の高い機械翻訳は不可能だろう。
なぜか。答えは簡単だ。機械に文章の「意味」が理解できないからだ。
日本語と英語の間の翻訳をやったことのあるひとなら誰でも分かるはずだ。日本語と英語の間では逐語訳ができない。つまり単語を置き換え、語順を並び替えるだけでは翻訳不可能なのだ。まず文章の意味を理解し、文化的な差異を配慮したうえで、翻訳しなければ読者に理解できる文章にならない。
日本語の文章を英語に翻訳するのは非常に難しい。なぜなら、日本語は主語や動作対象の省略が通常なのに対して、英語ではそれらの要素を必ず指定しなければならないからだ。日本語の文章を英語に訳すとき「あれ?これは誰が言ってるんだ?」「この動作の対象は何か?」という疑問が湧いてくることが多い。つまり、その文章の意味を理解しないと、翻訳できないのである。
(ちなみに英語から日本語に訳すときは、英語では表現されていた多くの要素を切り捨てないと自然な日本語にならない。この点で、日本語というのは単位空間あたりで表現される情報量が少なくなってしまいがちな言語だな、と思う。「日本語が非論理的」と主張する人たちはこの現象を指しているのではないか)
私は永遠に機械翻訳が実現しないと言っているのではない。その必要条件は「意味が理解できる機械」の誕生だと言いたいだけだ。
「意味が理解できる機械」については、現在、まったく実用化のメドが立っていない。現在のノイマン型と呼ばれる動作原理のコンピュータがいくら進歩しても、意味が理解できる機械にはならないだろう。私たちは、「意味が理解できる機械」の実用化を待っているという意味では、コンピュータ発明以前の人たちとなんら変わらない立場にいるのだ。
というわけで、ごく限定的な用途を除くと、機械翻訳が私たちの生活を大きく変えることは(残念ながら)当分ないだろう。日本人は、機械翻訳に期待せず、自分の頭を使って英語を学ぶべきだ。
P.S.
現在、定型的な文章の翻訳者の間では「翻訳メモリ」と呼ばれる翻訳支援ソフトウェアが使われるのがあたりまえになっているとのこと。これは、大量の対訳を段落単位に用意しておいて、原語の段落に最も適合する対訳を検索表示できるシステムらしい。統計的手動翻訳というところか。これは、現在のコンピュータの動作原理に忠実なソフトウェアであり、この方向の進化は期待できるのではないだろうか。ーーーーーうーん