"BOKU"のITな日常

62歳・文系システムエンジニアの”BOKU”は日々勉強を楽しんでます

Google翻訳より日本語らしい訳文の「みらい翻訳お試し版」を試す

Google翻訳以上に日本語らしい文章に翻訳してくれる「みらい翻訳」を知りました。

ちょっと嬉しかったので記事にしてみます。

f:id:arakan_no_boku:20190617214150p:plain  

 

 

まずスマホ版のアプリを使ってみました

 

みらい翻訳は「情報通信研究機関(NICT)」という総務省管轄の研究機関が開発しています。 

www.nict.go.jp

どうも「ポケトーク」とかの自動翻訳エンジンも提供しているそうです。

こちらの記事だと、Google翻訳より精度が高いとか書いてあるので試してみることにしました。

www.itmedia.co.jp

 

スマホ版は「VoiceTra」

 

NICTが直接、提供しているスマホ翻訳アプリがあります。

voicetra.nict.go.jp

自分のスマホのスペックは低いのか、音声入力から翻訳結果がでるのに、ちょっとだけ時間はかかりますが、結構、いい感じの英文に翻訳して、音声読み上げしてくれます。

これはこれで使えそう。

でも、スマホ版だと、Google翻訳との違いの比較はしずらいですね。

 

PC版が「みらい翻訳」

 

PC版は、NICTが直接提供しているものではありません。

ライセンス提供みたいです。
www.nict.go.jp

実際のおためし版はこちらです。

これでGoogle翻訳との比較をやってみます。

miraitranslate.com

使い方は、Google翻訳とほぼ一緒ですが、どのくらい自然な日本語になるのかやってみます。

 

まずは日本語→英語で比較です

 

普通の文章だと違いがわかりづらいので、誤訳しやすいとして記事でも話題になっていた大阪の地下鉄堺筋線でためしてみます。

日本語文。

僕は堺筋線の電車の3両目に乗ってます。

Google翻訳結果

I am in the third eye of a train on the Sakai muscle line

 ハハハ。

たしかに・・。

本当に「the Sakai muscle line」だし「the third eye」なんですね。

これと同じ文章を、みらい翻訳でやってみると。

I'm on the third car of the Sakaisuji Line train.

おお・・。

なかなか、いい感じの英文です。

まあ、日本で開発しているから当たり前ではありますが、こういう一般的でない単語で誤訳しやすいといわれているものについては、あえて、みらい翻訳でやってみる・・という選択肢はあるかな・・とは思います。

 

今度は英語→日本語です

 

正直、メインで使うのは英語→日本語翻訳です。

適当な英文として、ブルームバーグの2019/6/17時点の記事を使います。

www.bloomberg.com

こんな記事を翻訳してみました。

As hundreds of thousands of protesters march in Hong Kong’s streets against unpopular China-backed extradition legislation, another battle is unfolding across Beijing’s Great Firewall. Photos and information about the biggest protests since the handover of the former British colony are being systematically wiped from China’s internet. Meanwhile, Chinese state media is pushing a narrative blaming the protest movement on U.S. interference.

 Google翻訳

数十万人もの抗議者たちが香港の路上で中国を支持する不名誉な引き渡し法に反対して行進している中、別の戦いが北京のグレートファイアウォールを越えて展開しています。

元イギリス植民地の譲渡以来の最大の抗議に関する写真と情報は、中国のインターネットから体系的に抹消されています。

一方、中国の国営メディアは、米国の干渉に対する抗議運動を非難する物語を押している。

みらい翻訳

 中国政府が支援する人気のない犯罪者引き渡し法案に反対して、何十万人もの抗議者が香港の街を行進する中、北京の万里の長城をまたいで新たな戦いが始まっています。

旧英国植民地の返還以来最大の抗議行動に関する写真や情報が、中国のインターネットから組織的に削除されている。

一方、中国国営メディアは、抗議運動を米国の干渉だと非難する物語を推し進めています。

うーーん。

一長一短ありますね。

でも「みらい翻訳」の方が自然な日本語になっている気はします。

グレートファイアウォールが「万里の長城」になってるのは、ご愛敬ですが(笑)。

 

とはいえ。

十分に実用レベルにあるのは間違いありません。

すぐれた翻訳ソフトの選択肢がまたひとつ増えました。

ありがたいことです。

 

NICTは日本語のみにフォーカスしているから当然といえば当然

 

 

 

ただ、Google翻訳より、NICTの翻訳エンジンを比較して、後者がより日本語の訳文が自然だというのは、ある意味当然らしいです。

だって、「NICT」は日本語だけにフォーカスしているので、より多くの言語や国をカバーしようとする「Google」ではそもそも目的が違う・・ということでした。

引用すると。

GoogleNICTではそもそも考え方が全く異なります。

彼らの目的はより多くの言語や国・地域をカバーすることにあるはず。

多くの言語を扱うと全体を高精度にするのはとても難しいでしょう。

~ 中略 ~

NICTの場合は、製造、医療、金融など特定領域のニーズに特化した翻訳エンジンを日本企業向けに開発しているため、その分野において高い精度を実現できるそうです。

隅田氏は「言語と分野を絞り、その領域で求められる精度を実現することを重視しています。

高精度な自動翻訳エンジンを作ることが目的なら、特定の領域に絞るというアプローチしかないでしょう

このアプローチは実に納得です。

ありがたく、使わせていただこうと思います。

ではでは。