[[diary/Kojima]]

・XMLの文字コード

XML の規格や PHP に内蔵されている XML 関連の関数を見ると,XML ファイル
の文字コードは iso8859-1 か UTF-8 でなければならないらしいけど,[[ここ:http://keithdevens.com/software/phpxml]]で
公開されている xml.php というライブラリを使えば EUC-JP な文字コードでも
問題なく連想配列に展開してくれるみたい.

XML な処理をきちんとやろうとすれば多少問題が出てきそうな気はするけど,
とりあえずのニーズは手書きの EUC-JP な XML ファイルを読み込むことなので,
安直な方向に走っても悪くはないか(苦笑

ただ既存の連想配列を xml に生成した時に EUC-JP な文字コードでも大丈夫か
の検証は必要だろうな.それがうまく行かないようなら,データ入力部分は何
か別の方法を考えないといけなくなりそう.

しかし,XML の文字コードもそうだけど,最近は UTF-8 でゴーな世界なのか
なぁ..国際化と日本語化の効果比なんてのは考えるまでもないとは思うが,
今までの ISO-2022-JP や EUC-JP,Shift-JIS で作ってきた文化というのは,
あまり安易に捨てさるべきではないように思うのだけど..
-ファイル名も何気に UTF-8 化されつつあるように感じます。SJIS, EUC-JP でゴチャゴチャするくらいならUTF-8でもまとめられるものにした方が楽なような気がしている最近です。 --  &new{2006-02-11 (土) 11:20:58};
-Windows Vista になると 漢字コード体系の変更があるそうです。昔のコードとの差異が UTF-8 化することで吸収されるとすれば、やっぱり UTF-8 にまとまって行くように思います。  --  &new{2006-02-13 (月) 22:43:29};

#comment

トップ   編集 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS