2006-07-01から1ヶ月間の記事一覧

日本語(EUC-JP)の substr の続き

正直なところ、僕はあんまり日本語処理に詳しいわけではないので話を続けるのもどうかと思ったけど、もうちょっと書いてみます。この前のエントリ 日本語(EUC-JP)の substr でなんで Encode.pm を使わないで実装したかったかというと、 my $new_str = encode…

日本語(EUC-JP)の substr

今の Perl(5.8 以降)は文字列が utf8 だったら標準添付の substr() を使って終了なネタなわけだが、わけあって EUC-JP な文字列で日本語も 1 文字と数えて substr をするサブルーチンを考えてみた。今さら。かの有名な Perlメモに日本語(EUC-JP)を含む文字列…