2009年12月4日金曜日

[Google] また先を越されましたとさ

[CNET Japan] グーグル、日本語入力ソフトのベータ版を公開

すごいところ
・式子内親王、祐子内親王家紀伊、二条院讃岐、待賢門院堀河などのタイプ量が大幅に減る。
・「難波潟」「浅茅生の」「松帆の浦の」あたりがすっと出てくる。
あと一歩、惜しいところ
・前大僧正慈円(さきのだいそうじょうじえん)や入道前太政大臣(にゅうどうさきのだいじょうだいじん)等で見られる「前」(さきの)が「早希の」や「崎の」になってしまう。ちなみに早希の順位がえらく上になっているのは、やっぱり稲垣早希によるものなんでしょうかw。このシステムの仕組みが良くわかりますね。
・権中納言で敦忠・定家・匡房までは候補に出るので定頼も是非(ちなみに大納言は公任・経信ともにOK)
他にも高陽院(かやのいん、ことえりでは出る)など、ちょっと見ただけでも幾つか取りこぼしがあるようですが、その辺の強化については、この変換の仕組みから考えて、全然問題ないでしょう。ちなみに「夜半の月」が「よはのつき」で変換されたので正仮名にも対応しているのかと早合点しましたが、やはり基本的には新仮名のみでインデクシングしてるみたいですね。

インターネット上のコンテンツを素材にしてコーパスを作ればこの程度のことは出来るというのはずっと前から言われてきたわけですが、それを実用レベルにま で持ってくるにはGoogleレベルの体力が必要だったということですね。とりあえず、産学官連携とかいうアレは絵に描いた餅だったんだなということだけ は良く分かりました。

KOTONOHAにしたって、もっと成果をオープンにして行かなきゃ話にならんでしょ。完成度なんて後回しでいいし小出しでいいから国民が享受出来る形で成果を示してくれないと本当にプレゼンス無くなっちゃうよ。

0 件のコメント:

コメントを投稿