"BOKU"のITな日常

還暦越えの文系システムエンジニアの”BOKU”は新しいことが大好きです。

いいの見つけました。Google翻訳より日本語らしい訳文のみらい翻訳お試し版(*^▽^*)

Google翻訳以上に日本語らしい文章に翻訳してくれる「みらい翻訳」を知りました。

ちょっと嬉しかったので記事にしてみます。

f:id:arakan_no_boku:20190617214150p:plain

  

こちらの記事で知りました

 

情報通信研究機関(NICT)という総務省管轄の研究機関があるのは知ってました。

www.nict.go.jp

でも。

正直、何をしているのかはよく知らなかったのですが、こちらの記事を見ると「ポケトーク」とかの自動翻訳エンジンを提供しているとか、Google翻訳より精度が高いとか、なんやらスゴイみたいです。

www.itmedia.co.jp

 

アプローチが違うんだな

 

Google翻訳より精度が高いというのは正直懐疑的でした。

だって、天下のGoogleですよ。

そこに日本のお役所管轄の研究所が勝てるのか?って感じです。

でも、記事を読んでると、日本語の翻訳に関してGoogle翻訳より、NICTの翻訳エンジンが精度が高いのは当たり前だなと思えるようになりました。

ちょっと引用してみると。

GoogleNICTではそもそも考え方が全く異なります。

彼らの目的はより多くの言語や国・地域をカバーすることにあるはず。

多くの言語を扱うと全体を高精度にするのはとても難しいでしょう。

~ 中略 ~

NICTの場合は、製造、医療、金融など特定領域のニーズに特化した翻訳エンジンを日本企業向けに開発しているため、その分野において高い精度を実現できるそうです。

隅田氏は「言語と分野を絞り、その領域で求められる精度を実現することを重視しています。

高精度な自動翻訳エンジンを作ることが目的なら、特定の領域に絞るというアプローチしかないでしょう

このアプローチは実に納得です。

 

まずスマホ版のアプリを使ってみました

 

NICTが直接、提供しているスマホ翻訳アプリがありました。

voicetra.nict.go.jp

早速、自分のスマホにダウンロードして使ってます。

自分のスマホのスペックは低いので、音声入力から翻訳結果がでるのに、ちょっとだけ時間はかかりますが、結構、いい感じの英文に翻訳して、音声読み上げしてくれます。

ちょっと外人さんに道を尋ねられたりとかしたときには、便利かもです。

ただ、Google翻訳との違いの比較はしずらいので、PC版を探してみることにします。

 

本命のPC版のみらい翻訳を使ってみました

 

NICTが直接提供しているものではないですが、「みらい翻訳」というのがありました。www.nict.go.jp

実際のおためし版はこちらです。

miraitranslate.com

使い方は、Google翻訳とほぼ一緒ですが、どのくらい自然な日本語になるのかやってみます。

 

まずは日本語→英語で比較です

 

違いがわかりやすいのは、記事でも話題になっていた大阪の地下鉄堺筋線ですかね。

日本語文。

僕は堺筋線の電車の3両目に乗ってます。

Google翻訳結果

I am in the third eye of a train on the Sakai muscle line

 ハハハ。

本当に「the Sakai muscle line」だし「the third eye」なんですね。

これと同じ文章を、みらい翻訳でやってみると。

I'm on the third car of the Sakaisuji Line train.

おお・・。

なかなか、いい感じの英文です。

 

今度は英語→日本語です

 

英語から日本語に適当な記事で翻訳してみます。

ブルームバーグの6/17時点の記事を使います。

www.bloomberg.com

こんな記事を翻訳してみました。

As hundreds of thousands of protesters march in Hong Kong’s streets against unpopular China-backed extradition legislation, another battle is unfolding across Beijing’s Great Firewall. Photos and information about the biggest protests since the handover of the former British colony are being systematically wiped from China’s internet. Meanwhile, Chinese state media is pushing a narrative blaming the protest movement on U.S. interference.

 Google翻訳

数十万人もの抗議者たちが香港の路上で中国を支持する不名誉な引き渡し法に反対して行進している中、別の戦いが北京のグレートファイアウォールを越えて展開しています。

元イギリス植民地の譲渡以来の最大の抗議に関する写真と情報は、中国のインターネットから体系的に抹消されています。

一方、中国の国営メディアは、米国の干渉に対する抗議運動を非難する物語を押している。

みらい翻訳

 中国政府が支援する人気のない犯罪者引き渡し法案に反対して、何十万人もの抗議者が香港の街を行進する中、北京の万里の長城をまたいで新たな戦いが始まっています。

旧英国植民地の返還以来最大の抗議行動に関する写真や情報が、中国のインターネットから組織的に削除されている。

一方、中国国営メディアは、抗議運動を米国の干渉だと非難する物語を推し進めています。

うーーん。

一長一短あるとはいえ、やっぱり「みらい翻訳」の方が自然な日本語ではありますね。

グレートファイアウォールが「万里の長城」になってるのは、ご愛敬ですが。

正直、Google翻訳でも意味はわかります。

調べものをしたり、ざっくり意味を知るだけならまったく問題ありません。

でも。

翻訳した文章を、社内資料に引用するとかみたいに自然な日本語に近い方がありがたい場合の選択肢が増えるってのはありがたいです。

みらい翻訳お試し版。

いいの見つけました。

ということで、もう、みんな知ってるよな・・と思いながらも、久々に嬉しい発見だったので記事にしてみました。

ではでは。