2008年11月30日日曜日

[一言居士] やめとけ。諸君のやろうとしているのは漢字の再発明だ。

元ネタ: Google Japan Blog: 絵文字のユニコード符号化: 符号化提案用のオープンソースデータ

一言で言うと「つまんねぇことすんな」

理由はとりあえず4点

(1)標準化など不要だから

標準化というものを全否定するつもりはない。アドホックな標準化作業の積み重ねでしか達成し得ない事もあるというのは理解している。だが「どっからどうみても売れそうに無い製品を作らなければならなくなったエンジニアの悲哀」と同じ臭いを、俺はUnicodeに感じている。UTF8などの成果物を常用しつつも、その根底にあるのがいかにも中途半端なコード表でしかないということを意識してしまうと慄然とせざるをえないのだ。

そもそもUnicodeコンソーシアムに何かを期待する方が間違っているのかもしれない。「全ての文字をコード表にマッピングすりゃいいんだろ」という安易な発想が根底にある以上、見込める成果など知れたものなのだから。そんな姿勢はサロゲートペアという、目的と手段が完全にひっくりかえった醜悪な実装にもよく現れている。

本当に必要なものであれば、ユーザは自ら発明し利用し広める。標準化機構の出る幕など無い。というか、標準化機構の仕事って「ユーザの足を引っ張ること」になっちゃってねぇか?

(2)標準化など不可能だから


絵文字の表現力は「笑アイコン」ひとつ取ってもそれが「莞爾」なのか「冷笑」なのか「微笑」なのか「嘲笑」なのかわからないお粗末なものだ。これらひとつひとつについてアイコンを一個一個定義していくのか? 漢字が、少なく見積もっても三千年かかってやってきたことを一からやり直すのか? 正気の沙汰じゃねぇ。

「いやいや、その数を限定するのが今回の目的なんだよ」というのが本件の主眼であることは理解している。何を取り込み何を切るかについて、何らかの権威のもとで定義しておこうというわけだ。

よろしい。あえて挫折を繰り返すというのだね。所詮完璧なものなどできないのだから目先の事だけでも片付けようと言うのだね。私は手を動かす事それ自体には何の価値もないという考えの持ち主だが、諸君がやるというならば、その意志は尊重されねばならぬ。

だがそれでもなお問わずにはいられないのだ。その先にはさらに苦しい道のりが待っているということを理解した上で言ってますか? と。

なぜなら、絵文字・アイコン、というかその本来の姿である「イコン」というものは、それに関する十分なコンテキストが提供されていなければユーザ間のコミュニケーションに利用出来ないものだからだ。リテラルコミュケーションですらそういったコンテキストは不足しがちなのに、全く新しい記号体系に関してそれを提供する覚悟はおありですか?

あぁ、そういったアイコンとコンテキストのペアは既にユーザによってネット上に日々アップされてるから不要だと申されるのですね。じゃ、君達いらないじゃんw。おっと、このwもemoticonだったね。失敬失敬。

(3)絵文字自体の重要度が低いから

上でも述べたように、本件はまさに「漢字の再発明」であり「もっと他にやることあるだろう」と言わずにはいられない。自然言語処理、コーパス利用条件の緩和などいくらでもやるべきことはあるはずなのに。

なぜ絵文字のユニコード符号化などというしょうもないことにGoogle(もしかしたらGoogle Japanだけ?)が血道をあげるのか不思議でならない。おおかた「他がやってるからウチも」というレベルなんだろう。頭の悪い営業戦略を見ているようで笑える。

まぁそこは世界のGoogleということで「心配すんな。今回はうるせーやつがいたからちゃっちゃと片付けただけなんだよ。本道もきちんとやってるぜ。そのうち見せてやるから楽しみにしてな」という頼もしい声明が出てくる事を期待している。

余談だがDave Winerの記事に絵文字が出てきた時には茶ぁ噴いた。やっぱりこのおっさん、本当は何もわかってないんじゃなかろうか?

(4)日本人の、つまり日本語のためにならないから

ネガティブと呼ばれるのは百も承知の上で言う。

本件について「日本発の文化が世界に!」とか言ってる連中は全然ダメだ。この程度のことを日本の文化と呼ぶようではご先祖様が泣く。日本の文化、そしてその精華でありプラットフォームである日本語を築くために死闘をくりひろげた先人達がうかばれない。

「ことのは」「ことだま」をないがしろにしておきながら、こんな出来損ないを世界に輸出するというのは日本の・日本人の・そしてなによりも日本語の未来のためにならない。実際、BUKKAKEとかHENTAIとかと同じくらい恥ずかしいレベルだぜ、こいつはよ。

ちなみに本件は、先日の日本人ノーベル賞受賞者濫発と同じ臭いがする。日本人もなめられたものだ。まぁ仕方ないか。それこそUnicodeというお仕着せのアーキテクチャの上でしかその存在が認められていないんだからな。

いい加減なんとかしようや。

2 件のコメント:

  1. > おおかた「他がやってるからウチも」というレベルなんだろう。
    どこがやっているのですか?
    絵文字の標準化なんて聞いたこと無いのですが。
    docomo、au、SoftbankMobileのいずれもが独自コードで好き勝手やって、
    国内標準化すら全くされていないと思うのですが。

    なんとなく、難癖を付けたい、という前提の元に書かれているように思います。
    とにかく気に入らない、と。

    返信削除
  2. >どこがやっているのですか?
    >絵文字の標準化なんて聞いたこと無いのですが。

    申し訳ありません。これは私の説明が不足しております。

    ご指摘の通り「他がやってる」のは「絵文字の標準化」ではなく「絵文字への対応」であります。

    「頭の悪い営業戦略」というフレーズは、「他のキャリアが絵文字対応しているからウチもやる」という安易な判断、すなわち絵文字というものの是非を問うことなく鵜呑みで採用したことに対する私なりの評価であります。Googleらしくない、とでも申しましょうか。

    ちなみにこの点につきましてはAppleについてもiPhone2.2で同様の動きがありました。これも「らしくない」ということになります。

    とはいえ、上に述べたような事は私の憶測でしかないなので、本当のところはどうなのかGoogleの中の人に聞いてみたいところではあります。

    実は本件に関しては社内で大きな論争があって、その結果を踏まえたうえで今回の動きがあったのだ、というのが真相なのかもしれません。

    以上述べた中で気付いたのですが、ご指摘いただいたことで、明確になった事があります。

    どうやら私は以下の2つについてごっちゃにしていたという事です。少なくともこの2点については分けて論じるべきでした。

    1.いわゆる「絵文字」をわざわざフォントなりビットマップに落とし込むこと

    2.それにコードを割り振ること

    1.に関して申しますと、元エントリ内の(1)にても触れましたが、こういった絵文字に相当するものは既に長きにわたってユーザが独自に、それもありあわせの既存キャラクタを組み合わせて作り出し、利用してきました。2chのAA板等からも窺えますように、日々新たな絵文字が送り出されています。

    私はこれで十分だと思っています。アイコンとして固定化された絵文字しか使えないというのは愚の骨頂だと思っています。

    2.に関しましては、実は私、レヴィ=ストロースが言うところの「ブリコラージュ」というやつが好きでして、絵文字に関しましてもそういった「今あるものでなんとかする」2ch的活況というか自生的秩序に任せるのが良いと常々考えております。

    標準化という「権威付け」に対する懐疑は、そういったところから出たものです。

    なお、今回の標準化へのとりくみについては、ソフトウェア開発の現場で良く言われる「早すぎる最適化」というのがあてはまると考えておりますことも付け加えさせていただきます。

    >なんとなく、難癖を付けたい、という前提の元に書かれているように思います。
    >とにかく気に入らない、と。

    そうなんです。難癖つけずにはいられなかったのです。正直申しまして、この程度の事で喜んでる場合じゃないだろと。

    もちろん、国内キャリアの不甲斐なさについてはご指摘の通りです。彼らが
    ユーザビリティやインターオペラビリティといったことに無関心なことは、私もいくらかの諦念とともに認識しております。

    ですが、それすらも私はどうでもいいことだと思っています。

    話がでかくなりそうだったので(4)にてそれとなく触れる程度にとどめたのですが、実は私、「日本語をきちんと処理出来るアーキテクチャの実現」無しに日本人のコンピューティングにおける未来は無いという危機感を持っております。

    いつまでUnicodeという枠に縛られ続けるつもりですか?と問いたいのです。

    そういう意味では、本件の主眼である「絵文字の標準化」とは別の場所で論じるべきものかとも思いましたが、やはり根底について言及せずにはいられなかったのです。

    Unicodeコンソーシアムに対する不信は、(1)にも書きました通り、その根底にある「全ての文字はコード表にマッピングしさえすればハンドリング出来る」という思い上がりに対する反感から生じております。「日本語をなめるな」もしくは「東洋をなめるな」もしくは「表意文字をなめるな」と言い換えても良いのかもしれません。

    えらい大風呂敷な話ですし「そのアーキテクチャとやらの実現のためにアンタは何をしてるんだよ」と問われますと「いやぁ実は何も...」としか現状では言いようがございません。お恥ずかしい限りです。

    文句たれるだけで何も生産しないというのも癪なので、せめて吠えてみた、といったところでしょうか。

    まだまだ支離滅裂で言葉足らずですが、みなさんにつついていただければひょっとするとモノになるかもしれません。

    ということで今後ともよろしくお願いいたします。

    返信削除