X-Git-Url: http://git.sourceforge.jp/view?p=nkf%2Fnkf.git;a=blobdiff_plain;f=nkf.1j;h=b59ddfaddc0cc87e8865246ea3cea830794cf2f3;hp=8bcb8340e5d81cd7363a73bb8c3ebbd37bc52969;hb=04b7732bcb71a33d4f625e80437df8e341afb0dd;hpb=b920d1af62e6739ceb7fb1906adda6480d330d13 diff --git a/nkf.1j b/nkf.1j index 8bcb834..b59ddfa 100644 --- a/nkf.1j +++ b/nkf.1j @@ -1,6 +1,6 @@ -.TH NKF 2 9/Sep/2002 +.TH NKF 1 07/Feb/2004 .SH NAME -nkf \- ネットワーク用漢字コード変換フィルタ v2.0 +nkf \- ネットワーク用漢字コード変換フィルタ v2.0.5 .SH SYNOPSIS .B nkf .RI [ options ] @@ -16,8 +16,8 @@ nkf \- ネットワーク用漢字コード変換フィルタ v2.0 安全なものにはなっている。 .PP 現在、\fInkf\fPが認識できる入力の漢字コード系は、いわゆる「JISコード」(ISO- -2022-JPに基づくもの)、MS漢字コード(シフトJIS)、日本語EUC(AT&Tコード)のい -ずれかである。出力する漢字コード系も、この3種類である。 +2022-JPに基づくもの)、MS漢字コード(シフトJIS)、日本語EUC(AT&Tコード)、 +UTF-8、UTF-16のいずれかである。出力する漢字コード系も、これらである。 .PP 入力は、ファイルを指定しなければ、標準入力となる。出力は標準出力である。 .PP @@ -33,50 +33,106 @@ EUCコードを出力する。 シフトJISコードを出力する。 .TP .B \-w +UTF8コードを出力する。(BOM無し) +.B \-w8 UTF8コードを出力する。 +.B \-w80 +UTF8コードを出力する。(BOM無し) +.B \-w16 +UTF16コードを出力する。(Big Endian / BOM無し) +.B \-w16B +UTF16コードを出力する。(Big Endian / BOM有り) +.B \-w16B0 +UTF16コードを出力する。(Big Endian / BOM無し) +.B \-w16L +UTF16コードを出力する。(Little Endian / BOM有り) +.B \-w16L0 +UTF16コードを出力する。(Little Endian / BOM無し) .TP .B \-m[BQSN0] MIME を解読する。(デフォルト) ISO-2022-JP(base64)とISO-8859-1(Q encode) のみを解読する。ISO-8859-1 (Latin-1) を解読する時は、 -lフラグも必要である。\-m0 ではMIMEを解読しない。\-mQ, \-mBでは、 Q encode, B encode されているものとして処理する。 -.nf - \-mB MIME base64 stream を解読する。ヘッダなどは取り除くこと。 - \-mQ MIME quoted stream を解読する。 - \-mS MIME のチェックを厳しくする (デフォルト) - \-mN MIME のチェックを緩くする - \-m0 MIME を解読しない。 - - \-mS は、宣言の内容と、その後に続くbase64の整合性をチェックする。 - \-mN は、改行で切られたMIMEなども解読する。解読が止まらないこともある。 -.fi +.PD 0 +.RS +.RS 3 +.TP 4 +\-mB +MIME base64 stream を解読する。ヘッダなどは取り除くこと。 +.TP +\-mQ +MIME quoted stream を解読する。 +.TP +\-mS +MIME のチェックを厳しくする (デフォルト) +.TP +\-mN +MIME のチェックを緩くする +.TP +\-m0 +MIME を解読しない。 +.RE +.PD +\-mS は、宣言の内容と、その後に続くbase64の整合性をチェックする。 +\-mN は、改行で切られたMIMEなども解読する。解読が止まらないこともある。 +.RE .TP .B \-M[BQ] MIME に変換する。JISにコード変換してからbase64される。 -.RS -.nf - \-M ヘッダ形式に変換する - \-MB base64 stream に変換する - \-MQ Quoted stream に変換する -.fi +.RS 8 +.PD 0 +.TP +\-M +ヘッダ形式に変換する +.TP +\-MB +base64 stream に変換する +.TP +\-MQ +Quoted stream に変換する +.RE +.PD .TP .B "\-J \-E \-S \-X \-B" 期待される入力コードの性質を指定する。 .RS -.IP \fB\-J\fP +.TP +.B \-J ISO-2022-JPを仮定する。 -.IP \fB\-E\fP +.TP +.B \-E 日本語EUC(AT&T)を仮定する。 -.IP \fB\-S\fP +.TP +.B \-S MS漢字を仮定する。X0201仮名も仮定される。 -.IP \fB\-X\fP +.TP +.B \-W +UTF-8を仮定する。 +.TP +.B \-W8 +UTF-8を仮定する。 +.TP +.B \-W16 +UTF-16(Little Endien)を仮定する。 +.TP +.B \-W16B +UTF-16(Big Endien)を仮定する。 +.TP +.B \-W16L +UTF-16(Little Endien)を仮定する。 +.TP +.B \-X MS漢字中にX0201仮名があると仮定する。 -.IP \fB\-B\fP +.TP +.B \-B 壊れた(Broken)JISコード。ESCがなくなったと仮定する。 .RS -.IP \fB\-B1\fP +.TP +.B \-B1 \fBESC-(\fP, \fBESC-$\fP のあとのコードを問わない -.IP \fB\-B2\fP +.TP +.B \-B2 改行のあとに強制的にASCIIの戻す .RE .RE @@ -115,6 +171,9 @@ JIS漢字を指示するシーケンスとして \fBESC-'$'-\fP\fI?\fPを使用する。 .B \-r ROT13/47の変換をする。 .TP +.B \-g +自動判別の結果を出力します。 +.TP .B \-v バージョンを表示する。 .TP @@ -144,29 +203,79 @@ NLまえにCRを付加する。 .B \-d NLまえのCRを削除する。単独のCRは、NLに置き換えられる。 .TP -.B \-L[wmu] 改行モード -.nf - -Lu unix (LF) - -Lw windows (CRLF) - -Lm mac (CR) - デフォルトは変換なし。 -.fi +.B \-L[wmu] +改行モード +.RS +.RS +.PD 0 +.TP +-Lu +unix (LF) +.TP +-Lw +windows (CRLF) +.TP +-Lm +mac (CR) +.RE +デフォルトは変換なし。 +.RE +.PD .TP .B \-- 長い名前のオプション。これらは、上のオプションの組合せの別名。 -.nf - \--fj,\--unix,\--mac,\--msdos, \--windows - これらのシステムに適した変換をします。 - - \--jis,\--euc,\--sjis,\--mime,\--base64 - 対応する変換をします。 - - \--hirakana, \--katakana 平仮名、片仮名変換 - \--cap-input, \--url-input それぞれ ':', '%' に続く 16 進数を文字に変換する - \--overwrite 元のファイルを変換結果で置き換える。複数のファイルを書き換えることも可能。 - \--help - \--version - \-- これ以降のオプションを無視する -.fi +.RS +.PD 0 +.TP +\--fj,\--unix,\--mac,\--msdos, \--windows +これらのシステムに適した変換をします。 +.PD +.TP +\--jis,\--euc,\--sjis,\--mime,\--base64 +対応する変換をします。 +.TP +\--hirakana, \--katakana +平仮名、片仮名変換 +.TP +\--cap-input, \--url-input +それぞれ ':', '%' に続く 16 進数を文字に変換する +.TP +\--numchar-input +&#....; のような、Unicode文字参照を変換する +.TP +\--no-cp932 +Shift_JIS の、FAxx-FCxx を、CP932 で同値な文字に読み換える動作を無効にする +.TP +\--cp932inv +Shift_JIS への変換の際、EDxx-EFxx を、CP932 で同値な FAxx-FCxx の文字に変換する +.TP +\--ms-ucs-map +MicrosoftのUCSマッピング互換の変換を行う +.TP +\--overwrite +元のファイルを変換結果で置き換える。複数のファイルを書き換えることも可能 +.TP +\--guess +自動判別の結果を出力する +.TP +\--help +.TP +\--version +.TP +\-- +これ以降のオプションを無視する +.RE +.TP +.B 次の 2 つは、config.h で EXEC_IO を define してコンパイルした時のみ有効 +.RS +.PD 0 +.TP +\--exec-in +nkf [options] --exec-in cmd args... とやると、cmd の出力を nkf の入力とする +.PD +.TP +\--exec-out +nkf [options] --exec-out cmd args... とやると、nkf の出力を cmd の入力とする +.RE .SH AUTHOR .nf @@ -271,7 +380,7 @@ UTF-8 と判定されれば、そのまま euc-jp に変換される。 \-w 出力を utf-8 に指定します \-W 入力を utf-8 と仮定します .PP -特に自動判別、コード混在、エラー処理系には判定を失敗するこがある。 +特に自動判別、コード混在、エラー処理系には判定を失敗することがある。 .PP \-Z3 オプションの新設 @@ -285,8 +394,7 @@ newline を保存する folding -F。fmtに近い動作をする。 .PP folding のマージン。-f60-0 などと、0にすると禁 -則せずに、強制的にfoldingする。携帯にメールを送るときに使 -う。 +則せずに、強制的にfoldingする。携帯にメールを送るときに使う。 .PP nkf \-f40\-0 @@ -316,6 +424,9 @@ non-strict mime \-MN では、空白、改行をまたいで、base64 encoding を解読する。これで、スクリーンからcut&pasteで デコードすることも可能。止まらない可能性あり。 +.SH +その他 + .PP nkf_test.pl のバグチェックを増やした。 test が失敗したときにdiffを取るようにした。 @@ -335,12 +446,73 @@ rot13が1.9で動かなくなっていたのを修正。 .PP hiragana/katakana 変換ができるようになりました。 - \-h1 \--katakana ひらがな->かたかな - \-h2 \--hirakana かたかな->ひらがな - \-h3 \--hirakana-katakana かたかな<->ひらがな + \-h1 \--hiragana カタカナ->ひらがな + \-h2 \--katakana ひらがな->カタカナ + \-h3 \--katakana-hiragana カタカナ<->ひらがな \--overwrite で、引数のファイルを直接、置き換えることができます。 +.SH nkf 2.0.4 + +.PP +Shift_JIS の FAxx-FCxx について、普通の式では euc に変換できませんが、CP932 で同値な文字に読み換えて変換します。この動作を無効にするには、--no-cp932 をつけてください。 + +.PP +perl module に + nkf_continue オプション、自動判別の状態などを引き継いで変換 + inputcode 自動判別結果の文字コードを返す +を追加しました。 + +.PP +\--numchar-input オプションを新設 + mhonarc など、日本語を UTF-16 の &#....; のパターンで出力するものを変換します。 + +.PP +\--exec-in, \--exec-out オプションを新設 (config.h で EXEC_IO を define してコンパイルした時のみ有効) + + nkf -e \--exec-in cmd args... + とやると、cmd の出力を nkf の入力とします。 + + nkf -e \--exec-out cmd args... + とやると、nkf の出力を cmd の入力とします。 + + +.SH nkf 2.0.5 + +.PP +--cp932inv というオプションをつけると Shift_JIS への変換の際、EDxx-EFxx については、 +CP932 で同値な FAxx-FCxx の文字に変換します。 + +.PP +--guess または -g というオプションをつけると自動判別の結果を出力します。 + +.PP +--prefix= というオプションをつけると、EUC-JP から Shift_JIS への変換の際、2 バイト目 +に現れた文字の前にエスケープ文字をつけることができます。 +引数の 1 文字目がエスケープ文字、2文字目以降にエスケープされるべき文字を指定します。 + +例えば、 + +--prefix=\$@ とすると、Shift_JIS の 2 文字目に $, @ が来たら、その前に \ が挿入されます +--prefix=@@ とすると、Shift_JIS の 2 文字目に @ が来たら、その前に @ が挿入されます + +.PP +-w8, -w16B, -w16L, -W8, -W16B, -W16L というオプションを追加しました。 + +.PP +--ms-ucs-map というオプションを付けると、 +MicrosoftのUCSマッピング互換の変換を行います。 + +.SH nkf 2.0.6 + +.PP +ひらがなカタカナ変換のドキュメントが逆になっていたので、これを修正しました。 +正しいドキュメントは以下の通りです。 + \-h1 \--hiragana カタカナ->ひらがな + \-h2 \--katakana ひらがな->カタカナ + \-h3 \--katakana-hiragana カタカナ<->ひらがな + + .SH ACKNOWLEDGE @@ -354,11 +526,14 @@ yuki@flab.fujitsu 他、fujitsu & flab.fujitsuの皆さんの協力に感謝。 shinoda@cs.titech, kato@cs.titech, uematsu@cs.titech TNX kono@ie.u-ryukyu.ac.jp -nkf 1.9 +nkf 1.9- Akio Furukawa +Andy Taki From: OHARA Shigeki +Fumitaka Kitagawa Hiroaki Sengoku Ikuhiro MORITA (森田 育宏) +Yoshiharu ITO Junn Ohta KAWAMURA Masao Kazuhiko Mori @@ -373,11 +548,13 @@ Rei FURUKAWA Satoru Takabayashi Shigeyuki Takagi Shin MICHIMUKO +Tadamasa Teranishi +TOYODA Jiro +TSUCHIYA Masatoshi Tsutomu Sakai YAMASHITA Junji (山下 純司) Yasuyuki Sato Yoshiaki Yanagihara -Yoshiaki Yanagihara hat@so-net DCC技術部渡辺 かとぺ / 加藤 貴司 @@ -419,7 +596,12 @@ hat@so-net 落合一喜 林 亮 國安 治 - +木下 雄介 +成瀬ゆい +鶴谷直樹 +中田伸悦 +わたなべひろふみ +MoonWolf 河野真治 www.ie.u-ryukyu.ac.jp/~kono/nkf/