BREAKING NEWS

[5]
目指すは、来る多文化共生の時代 そのために日本と外国の文化の違いや気づきに関して、株式会社わかたむが日々収集しているコンテンツを「違い」と「びっくりおもしろい」という切り口でご紹介します。 下の、「ホーム」の横の△で「バックナンバー」をご覧いただけます。

では単語の翻訳を試してみましょう   機械翻訳についての推敲 その2

こんにちは
前回から始めました機械翻訳についての推敲ですが、今週少し触れてみて、来週さらに深堀していきたいと思います。

まず大前提として、私の考え
機械翻訳は(の)

存在を否定しているわけではなく
とても便利なものであり
今後精度は格段に向上していくもの

だという風に個人的には思っています。

その役立つものが対 日本語 ということになるともともと英語で作られているものなのでなかなか日本語への対応が追い付いていない。ということなのだと思います。

なので、単語で言うと日本語にある正式な表記をしている場合の精度は限りなく高いです。
例えばランダムに5個ピックアップしてみる

◎ 嬉しい  Happy
◎ 大学  University
◎ ラーメン  Ramen
◎ 旅 Travel
〇? ちらし寿司  Chirashi sushi

ちょっとちらし寿司だけ詳細は分からなかったみたいですが、ほかのはOK

じゃあなんで文章になったらダメなんだ?

という声が聞こえてきそうですが、その質問に答える前に再度単語でチェック
先ほどと同じ意味の日本語の表記を変えて、全部ひらがなにするとどうなる?

〇 うれしい  Glad

?? だいがく  Grateful

◎ らあめん  Ramen

× たび  Every time

☠ ちらしすし  Flyer sushi

表でまとめてみるとこうなります。

元の単語 英訳 同一単語ひらがな表記 英訳
嬉しい
Happy うれしい Glad
大学
University だいがく Grateful
ラーメン
Ramen らーめん Ramen
Travel たび Every time
ちらし寿司
Chirashi sushi ちらしずし Flyer sushi

嬉しいは、翻訳は変わっているけどまあOK
大学は、なんで「Grateful」なんでしょ 笑

ラーメンはさすがですね。
旅(たび)はなんとなくわからんでもない。

ちらしは、


紙のちらしになっちゃってますね^^

写真は広告のイメージ^^


文章の精度をうんぬんする前に、まずは外国語と日本語の違いをとらえることが上手な機械翻訳ができる第一歩です。

まずは
① 日本語とは、ひらがな、カタカナ、漢字、英語(ローマ字)を織り交ぜて使う言葉であること
② 同じ単語を表すのに複数の表現がある(ありすぎる)こと
③ 同じ言葉(音)で複数のものがあること
➃ 日本にしかない独自なもの(外国語で表現しにくいもの)があること

このことがまず腑に落ちることが大事かなと思います^^

次回はもう少し単語に関して深堀します^^