2007年12月23日

Python の unicodedata モジュール

Unicode のちょっとしたテキスト処理をしようと思い、 Python の unicodedata モジュールを使ってみました。これは非常に便利です。

続きを読む...
投稿者 satoru : 固定リンク | このエントリーを含むはてなブックマーク

2005年9月23日

UTF-8 のオクテット数

UTF-8 で表現した 1文字は最長で 6オクテット (バイト) と思っていたのですが、新しい方の RFC では 4 オクテットまでとなっているのを知りました。

続きを読む...
投稿者 satoru : 固定リンク | このエントリーを含むはてなブックマーク

2005年8月21日

JavaScript Unicode Charts

Unicode の表を JavaScript で動的に生成して、検索もできたりするツールがあると便利ではないかと思い立ちました。そこで、自分で作り始める前に試しに javascript unicode で検索してみたところ、ちょうど欲しいと思っていたようなものが見つかりました。JavaScript Unicode Charts というページです。

続きを読む...
投稿者 satoru : 固定リンク | このエントリーを含むはてなブックマーク