遥かへのスピードランナー

シリコンバレーでAndroidアプリの開発してます。コンピュータービジョン・3D・アルゴリズム界隈にもたまに出現します。

Googleの絵文字に対する取り組み

本日、Googleブログにて、日本の携帯端末の絵文字に関する取り組みについての記事が公開されました。

Google Japan Blog:絵文字のユニコード符号化: 符号化提案用のオープンソースデータ

現在、日本の携帯絵文字の全てをユニコードの文字として共通符号化しようという提案が進行しています。そのためには、現在使用されている絵文字のうちどれが既にユニコード符号化されているか、新しく符号化しなければならない絵文字はどれかなどを調査する作業が必要です。この提案を支援する目的で、私たちが提案している絵文字のマッピングや変換表、更に絵文字データからHTMLの表などを作成するのに役立つツールなどを 「emoji4unicode 」という名前でオープンソースプロジェクトとして公開します。

共通符号化の提案は、大変すばらしいことだと思いますが、どういう風に各キャリア統一化していくか、っていうところもネックになってくると思います。
既にマッピングされている絵文字とバッティングしないように割り当てていかなければいけないというのはもちろん、Webで絵文字を表示するだけでも端末に依って文字コードをサポートしている・いないとか、表記方法が数種類もあったりとかしますし、それ以外にもメール送信やフォームから送られてくる絵文字コードもまた各々異なるので意識しなければなりません。

そういう意味では、日本の携帯絵文字の議論をするのに以下のページは参考資料としてはずせないです。
CodeRepos - 携帯の文字コードと絵文字の基礎知識
たぶんこの件に関わるなかの人は全員読んだ方がいいと思います。

ちなみに既に統一Unicodeマップのドラフト案がこのへんで公開されていたりするんですが、ここのUnicodeコードポイントを見ると、例えば太陽の絵文字はU+2600とかになってて、それって私用領域じゃないけどいいの?って思ったんですけど、どうやらU+2600は既に太陽を指示す特殊文字として定義されていたんですね。知りませんでした。

僕もFireMobileSimulatorの開発で、絵文字周りは結構苦労したので、その苦労を活かせればいいなと思い、早速「emoji4unicode」プロジェクトに参加してみました。
自分の経験や知識をフィードバックしていきたいと思います。