UTF-8 サポートについて nkf_utf8-2002.08.22 by furukawa@tcp-ip.or.jp nkf-1.92 をベースに、UTF-8 対応してみました。 nkf を対応版に入れ換えるだけで、入力が UTF-8 ならば、 勝手に自動判別して、コード変換できることを目標としています。 従来の nkf と同様に、nkf -e として起動すると、自動判別で UTF-8 と判定されれば、そのまま euc-jp に変換されます オプションで、文字コードを指定することもできます。 -w 出力を utf-8 に指定します -W 入力を utf-8 と仮定します まだバグがある可能性が高いです。 (特に自動判別、コード混在、エラー処理系) 何か問題を見つけたら、furukawa@tcp-ip.or.jp まで御連絡を お願いします。 その他、nkf-1.92 に対し、 ・-Z3 オプションの新設 X0208 の '>', '<', '”', '&' をそれぞれ '>', '<', '"', '&' に変換します ・もともとの nkf 1.92 にあった、-Z1 オプションのバグ修正 という改造をしています。 <履歴> 2002.08.22 * コンパイル時の warning への対処 (馬場さんのパッチによる) * utf-8 の判定のバグ修正 正しい文字コードが来ているぶんには問題ありませんが、 不正なコードが来ても、utf-8 モードから抜けない可能性が ありました * wvHtml の出力への対処 (北川文孝さんの御報告による) -- Rei FURUKAWA furukawa@tcp-ip.or.jp