文字コード

ASP.NET(VB.NET)でダウンロード時に日本語ファイル名が文字化けする。

Windows (NT系)はカーネルはUnicodeをアプリケーションはShift_JISを使っている。 HTTPリスポンスヘッダーのファイル名指定で日本語を使うと文字化けする場合があるが、URLエンコーディングを使うと回避できる。 Dim strFile As String = "テスト.xls"Respo…

PHPで数値文字参照を文字列に変換

数値文字列参照 あいうえお 文字列(UTF-8) あいうえお PHPで数値文字参照を文字列に変換するにはmb_convert_encoding関数を使う。 $str = "あいうえ&#12362"; echo $str; $str = mb_convert_encoding…

kccコマンドをCentOS4.5にインストール

文字コードの自動判別をするためにkccコマンドを使ってみる。yumではインストールできないので、RPMインストールする。 kccのソースRPMパッケージをダウンロード wget ftp://rpmfind.net/linux/ASPLinux/sources/SRPMS.11.2/kcc-2.3-24.src.rpm リビルドする…

Apacheのディフォルトのcharsetを無効にする

Apacheの設定ファイル(/etc/httpd/conf/httpd.conf)に以下のようなディフォルトcharsetが 設定されている場合、これを無視するには値をOffに変えればOK. ;AddDefaultCharset UTF-8 AddDefaultCharset Off httpd.confを変更したくない時は.htaccessに"AddDefa…

PerlのUTF-8処理

UTF-8のテキスト処理をする時はまず入り口でUTF-8フラグを立てる。 最後の出力(出口)ではUTF-8フラグを落とす。 my $str = "日本語"; #UTF-8フラグを立てる utf8::decode($str); #UTF-8かどうかをチェック print utf8::is_utf8($str); #・・・なにかの処理…

Perlで日本語メールを送信する。

SubjectとBodyをISO-2022-JP (JIS)に変換、 プラスSubjectをBase64エンコードしないと文字化けする。 (注) 最近のメーラーのほとんどはUTF-8のメールを認識できる。*以下のファイルはUTF-8で保存 use strict; use MIME::Base64; use Encode qw(encode); my …