お気づきだと思いますが、携帯専用ページに続き、先日から韓国語、英語版、中国語版のページを作ろうと、四苦八苦しています。何せ毎日1~2時間しかブログにかける時間がないので、少しも進みませんが、どうにかオープンだけはできました。まだ内容はほとんどありませんが、サイドバーのメニューなどから確認してみてください。
現在ここで解説している「韓国語版」はありません。新たに作り直しましたのでそちらをごらんください。またここで書いている技術的なことを含め、現在ではほとんど通用しない古い内容です。古き良き時代の苦労話として笑ってお読みください。詳しくはこちらの記事をご覧ください。(2022.07.16)
なお、韓国語と中国語(簡体字)の表示には専用フォントが必要です(文字化けして読めません)。Yahoo!のこのページなどで簡潔に説明されていますし、ダウンロードもあっと言う間です。Windows版IEの場合は、何もしなくても、ほとんど自動でインストールしてくれます。
内容的にはかなりこなれていない酷い訳ですが、まあ、読む側に努力してもらえば何とか意味は通じると思うし、とりあえずこういうコミュニケーションの関係は、何かしら完璧を求めるよりも、とりあえずはじめてみることが重要だと思います。今後はここにある記事を片端から訳していくんではなくて、アジアや欧米の方にも訴えたい内容をピックアップして掲載していくつもりです。韓国のブログなどにもこちらから積極的にトラックバックなどをうっていきたいと考えています。
なお、各国語版に日本語でコメントやトラックバックを入れるのはやめてくださいね。最低限英語で送ってください。肝心の外国人が見た場合に文字化けしてしまいますのでどのみち読めません。韓国語版ページなどで日本語のコメントやトラバを見つけたら消すつもりです。記事には日本語の原文へのリンクをつけておきますので、コメントなどは日本語版ページにしてくださるようお願いします。
以下、「俺もやってみたい」という方のために、開設までのドタバタを、少し詳しく書いて残しておこうかなと思います。
[Sponsor Ad]
まず、外国語文の作成(翻訳)です。これができないと話になりません。外国語のページを見て「草加って4ヶ国語ができるんだ!」と思った方はほとんどおられないでしょうが(笑)、私は人一倍と、言うか、人の何倍も語学が苦手です。もちろんこの3カ国語が使えるわけもなく、お察しの通り翻訳ソフトを使用したり、ネット上の翻訳サービスを利用して作成しています。
さて、翻訳サービスは無料ですが、短文を細切れで訳しているとストレスがたまります。かと言ってページまるごとWeb翻訳で訳すと精度が落ちるし、MTでJAVAなどを使用したページは翻訳してくれません。そこで多彩な機能を持って辞書の数も多い翻訳ソフトですが、こいつが高い!そこそこの機能と精度を持ったものだと8万から10万円もする。そこでまあ、通じればいいやという割り切りで、3つ前くらいのバージョンの売れ残り(5年以上前の製品)を、ワゴンセールで5千円ほどで購入しました。最新ソフトの使い心地を知らなければ、これでも充分という感じです。
しかしここでブログに書いた文章を、そのまんまソフトや翻訳サービスに放り込んでも「なんじゃこりゃ」って感じでろくな訳は返してくれません。そこでもう一工夫必要してみました。
たとえばWeb翻訳を使っているとわかると思うのですが、新聞社のページなどは比較的わかりやすい日本語にしてくれますが、個人の趣味で作ったページなどはわけワカメな訳になってしまいます。だからまず自分の文章を、機械にあわせて直してやります。
具体的には(英語の場合)主語を省略しない。「。」を省略しないでその位置にも注意する。時制については不正確な訳をすることが多いので、現在形と過去形の2種類だけで訳せる文章にする。単数と複数がはっきりわかるような表現にする。関係代名詞や受身形などを思い出し、ソフトの訳のクセなども加味しつつ意識して書く。などです。要するに中学校で何度も見た「直訳」風の文章にしてやればいいわけです。日本語的な微妙な表現は、ソフトの辞書によっては上手に訳してくれることもありますが、基本的にはばっさり削ってしまいますし、「、」で修飾語を続ける表現はさけ、できるだけ「。」を多用して短文にします。
たとえば上の文章ならこうします。
「私は主語を省略しないように注意します。ソフトは時制について不正確な訳をすることが多いです。私は現在形と過去形の2種類だけを使います。私は単数か複数かをわかりやすくします。ソフトの持つ癖に注意して文章を書くことも必要です。つまりそれは中学生のような「直訳文」を作成することです。」
次にこうしてできた外国語の訳文を、今度は逆にソフトで日本語に翻訳してみます。そうしてできた日本語が、まあ意味の通った文章になっておれば、一応は外国人が読んでもなんとか意味が通る文章になっていると思ってよろしかろうというわけです。そうでない場合はソフトが元の日本語を謝って解釈していることが考えられるので、よく見て必要な修正をするか、またはもっと簡単な表現に省略してしまいます。
たとえば、正確には忘れましたが「私は反戦の闘いをしていました」という意味の文章を中国語で訳した時、日本語に戻してみると「私は戦争に対する闘争に反対していました」と、まったく逆の意味になっていました。英語ならまだしも、中国語では気がつきもしないので危ないところです。
まず英語については問題ありません。日本語の文字コードでも半角アルファベットがあるので、どこでも好きな所に掲載してください。しかし問題は韓国語と中国語です。複数の言語を混在させて使用する場合は(他にも方法はあるようですが)基本的に文字コードはUnicode(UTF-8)を使用していることが前提です。
今は世界的にもUTF-8が標準になりつつありますが、日本では未だにShift-JISやEUC-JPが主流です。もともとUTF-8が標準であるブログでさえ、3分の2のサービスがわざわざShift-JISやEUC-JPに直して運用されています。日本のプログラマーに「日本語さえ通ればいいや」的な一国主義ちゅうか、鎖国主義ちゅうか、島国根性があるんだろうなんて指摘もされています。
あなたのブログで韓国語や中国語が扱えるかどうかは、こちらに全124サービスの使用文字コードチェック表がありますので確認してください。
実は私も作成した外国語ページを、最初は意気揚揚とこのブログ内のカテゴリーの一つとして設置しましたが、なんとバケバケに文字化けしてしまいました。MTを設置した時にUTF-8で設定したはずなのに、おかしいな~、と思ってテンプレートを必死に調べました。それで韓国語を問題無く表示しているブログのソースと比較してみると、ありましたありました!
html xmlns=”http://www.w3.org/1999/xhtml” lang=”ja” >
各テンプレートの頭にあるこれは使用させていただいておりますHINAGATA様のテンプレートについているものでした。意味はよくわからんが(オイオイ!)、ともかく「lang=”ja”」というのが怪しい。それでこれをMT標準のテンプレートにある通り「html xmlns=”http://www.w3.org/1999/xhtml”」とだけにした所、みごとに韓国語が表示されました。
しかし意味もわからずに修正するのはさすがに恐い。今のところWin+IEでは問題無く表示されますが、これを書いたら元に戻しておくことにしましょう。
さて、ページの表示に成功したところで、喜び勇んで韓国のブログにトラックバックを送りました。すると今度はなんと送ったトラバが、先方のブログで文字化けしてしまい、頭を抱えました。あちゃー、これでは大迷惑。ますます日本人の評判が悪くなる(笑)。ひょっとしたらトラバだけでなく、こちらではちゃんと見えている私の韓国語のページも文字化けして読めてないかも。
あと、韓国語などのページはブログのトップページには表示されないようにしましたが、どうしても携帯専用ページには表示されてしまう。しかも携帯はShift-JISだから文字化けして読めないまま。
仕方なく自分のブログ内での「多言語共存」を断念。別のブログサービスを借りて、そこを外国語専用とすることにしました。UTF-8で運用されているはずのいくつかのブログを試しましたが、本文はちゃんと表示されるのにエントリータイトルが文字化けする(なんでじゃ~!)などの失敗を繰り返し、日本のネット環境の鎖国主義にほとほと疲れきった私は、最終的に韓国発のブログサービスNAVER上に移転しました。ここは韓国内のコンテンツとも連動しているので、多言語表示には大変に相性がいいです。
これでもう大丈夫だろうと思ったのですが(確かに韓国語や中国語の表示も完璧です)やはりトラックバックは韓国語で送ったにもかかわらず、先方で文字化けしてしまいます。あーもう嫌!(ただし韓国のブログに韓国語でコメントを書き込むのは大丈夫です)。
文字化けは先方の環境にも起因しておこりますが、欧米人や中国人よりも主に韓国人との交流が動機でしたので、やはりこれはもうこちらから歩み寄って、韓国の国内に存在する韓国語環境のブログサービスを利用するしかないと思いまして、今いろいろと調べて手続きしています。
しかし韓国の無料サービスはすべて「実名確認主義」なようで、どういうことかと言えば、初回登録には身分証明が必要なんです。と、言っても何かの証明書を提出するのではなく、住民登録番号をネット上で打ち込まないといけないようになっていまして、「何かの場合にはそこから本人を特定するぞ!」という趣旨のようです。「偽って他人の番号を打ち込むと懲役3ヶ月云々」みたいな注意書きが添えられるのがお約束になってます。
まあ「有効なクレジットカード番号」を本人確認に使用したりしている日本よりも安全で公平と言えばそうかもしれませんが、日本でもそのうち住民登録番号がこういうふうに「企業利用」される時がくるのかなあ。今でもやろうと思えば今日からでもできますからねえ。確かにネットウヨ的な極端な差別言論などは少なくなるかもしれないが、今でもそういう「確信犯」的な差別者は自分のブログやサイトを持ったりしないからねえ(当然だが)。単に2Ch掲示板がますます繁盛するだけのような気もする。
また、有害ネット記事からの子供の保護という趣旨なんだろうが、法的規制で申し込みが大人と子供(14歳未満)に別れているのも特徴的。最初は韓国版ヤフーに申し込もうとしたが、ヤフーは質問項目が多すぎてギブアップ。次にドリーム・ウィズホムピに申し込んでみました。ここは最近のブログブームの中では苦戦しているようだが、申し込みページに「身分証明番号の無い外国人」というコースがあってとっつきやすい。
とりあえず外国人などは身分証明書をスキャンしてメールに添付して送ればいいらしい(Faxでも可)ので、登録手続きの後、保険証をスキャンして送ってみました。するとその日のうちに先方から返事。読もうと思ったら・・・。ガ-ン、文字化けして読めましぇーん!(涙)
アルファベットだけは文字化けしてないが、ヘルプ画面へのリンクが書いてある所をみますと、きっと何か不備があったと思われる。しかしその不備の内容がわからない。日本のメールサーバーが受け取った段階で文字化けしてるので、修復して翻訳のしようもない(先方に英語で送れとも言い難いしねえ)。
つまり何かい、まず韓国語のメールをやりとりするために韓国のフリーメールサービス(Webメール)と契約しないといけないが、それもまた身分証明が必要で、その内容をメールでやりとりするためには・・・。
つーことで、現在のところ「韓国のブログを借りよう」計画は頓挫しております。ただしまだ諦めてないけどね。どなたかこのブログを見ていて韓国語に堪能な方、面白そうだと思ったら協力してください。
コメントを見る
Unicodeが使われないのは鎖国主義というより技術的にめんどくさいからでしょう。
漢字統合を抜きにしても、多言語を一つのコード体系に突っ込むと色々なトレードオフが出てきます。
特に日本語の場合、「だいたい合っていて一部が文字化けする」といった厄介なことが起こりやすいのです。
まあ、アンチUnicodeばかり言って変換表の統一といったことを怠ってきた日本人にも責任はありますが。
http://www.debian.or.jp/~kubota/unicode-symbols.html
http://euc.jp/i18n/ucsnote.ja.html
さらに、Unicodeにはアラビア文字やデヴァナガリ文字のように扱いの難しい文字があります。
「Unicodeを使っているだけの日本語専用プログラム」にしてしまわないためには、
プログラマの大きな努力が必要です。
http://www.opengroup.org/onlinepubs/009638399/toc.htm
そういった事情がありますので、「まともに」Unicodeをサポートしているプログラムは
商用ソフトウェアでも限られており、まして「完全対応」は多くの場合原理的に不可能です。
以上、技術者の卵として言い訳させていただきます。