perlで日本語文字コードを判別する

perlでutf8と格闘中。

  • 今触っている値が、どの文字コードになっているのか判別するための便利なモジュール Unicode::Japanese日本語マニュアルもあります。こんな感じに使えば判別できるらしい。
    use Unicode::Japanese;
    my $s = Unicode::Japanese->new();
    my $code = $s->getcode("判別したい文字列等");
    print $code, "\n";
  • utf8フラグが着いているかどうかをチェックする方法
    print utf8::is_utf8("文字列") ? 'with UTF-8 Flag' : 'without UTF-8 Flag';
  • 覚え書き
    • utf8の文字列を、decodeしてとutfフラグ付きのutf8内部コードにする
    • utfフラグ付きの文字列をprintすると、wide character… というワーニングが出る
    • encodeで元の文字列(utf8)に戻す
カテゴリー: Tips パーマリンク

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です