X-Git-Url: http://git.sourceforge.jp/view?p=nkf%2Fnkf.git;a=blobdiff_plain;f=nkf.1j;h=b59ddfaddc0cc87e8865246ea3cea830794cf2f3;hp=8bcb8340e5d81cd7363a73bb8c3ebbd37bc52969;hb=04b7732bcb71a33d4f625e80437df8e341afb0dd;hpb=b920d1af62e6739ceb7fb1906adda6480d330d13

diff --git a/nkf.1j b/nkf.1j
index 8bcb834..b59ddfa 100644
--- a/nkf.1j
+++ b/nkf.1j
@@ -1,6 +1,6 @@
-.TH NKF 2 9/Sep/2002
+.TH NKF 1 07/Feb/2004
 .SH NAME
-nkf \- ネットワーク用漢字コード変換フィルタ v2.0
+nkf \- ネットワーク用漢字コード変換フィルタ v2.0.5
 .SH SYNOPSIS
 .B nkf
 .RI [ options ]
@@ -16,8 +16,8 @@ nkf \- ネットワーク用漢字コード変換フィルタ v2.0
 安全なものにはなっている。
 .PP
 現在、\fInkf\fPが認識できる入力の漢字コード系は、いわゆる「JISコード」(ISO-
-2022-JPに基づくもの)、MS漢字コード(シフトJIS)、日本語EUC(AT&Tコード)のい
-ずれかである。出力する漢字コード系も、この3種類である。
+2022-JPに基づくもの)、MS漢字コード(シフトJIS)、日本語EUC(AT&Tコード)、
+UTF-8、UTF-16のいずれかである。出力する漢字コード系も、これらである。
 .PP
 入力は、ファイルを指定しなければ、標準入力となる。出力は標準出力である。
 .PP
@@ -33,50 +33,106 @@ EUCコードを出力する。
 シフトJISコードを出力する。
 .TP
 .B \-w
+UTF8コードを出力する。（BOM無し）
+.B \-w8
 UTF8コードを出力する。
+.B \-w80
+UTF8コードを出力する。（BOM無し）
+.B \-w16
+UTF16コードを出力する。（Big Endian / BOM無し）
+.B \-w16B
+UTF16コードを出力する。（Big Endian / BOM有り）
+.B \-w16B0
+UTF16コードを出力する。（Big Endian / BOM無し）
+.B \-w16L
+UTF16コードを出力する。（Little Endian / BOM有り）
+.B \-w16L0
+UTF16コードを出力する。（Little Endian / BOM無し）
 .TP
 .B \-m[BQSN0]
 MIME を解読する。(デフォルト) ISO-2022-JP(base64)とISO-8859-1(Q encode)
 のみを解読する。ISO-8859-1 (Latin-1) を解読する時は、
 -lフラグも必要である。\-m0 ではMIMEを解読しない。\-mQ, \-mBでは、
 Q encode, B encode されているものとして処理する。
-.nf
-  \-mB   MIME base64 stream を解読する。ヘッダなどは取り除くこと。
-  \-mQ   MIME quoted stream を解読する。
-  \-mS   MIME のチェックを厳しくする (デフォルト)
-  \-mN   MIME のチェックを緩くする
-  \-m0   MIME を解読しない。
-
-   \-mS は、宣言の内容と、その後に続くbase64の整合性をチェックする。
-   \-mN  は、改行で切られたMIMEなども解読する。解読が止まらないこともある。
-.fi
+.PD 0
+.RS
+.RS 3
+.TP 4
+\-mB
+MIME base64 stream を解読する。ヘッダなどは取り除くこと。
+.TP
+\-mQ
+MIME quoted stream を解読する。
+.TP
+\-mS
+MIME のチェックを厳しくする (デフォルト)
+.TP
+\-mN
+MIME のチェックを緩くする
+.TP
+\-m0
+MIME を解読しない。
+.RE
+.PD
+\-mS は、宣言の内容と、その後に続くbase64の整合性をチェックする。
+\-mN は、改行で切られたMIMEなども解読する。解読が止まらないこともある。
+.RE
 .TP
 .B  \-M[BQ] 
 MIME に変換する。JISにコード変換してからbase64される。
-.RS
-.nf
-  \-M    ヘッダ形式に変換する
-  \-MB   base64 stream に変換する
-  \-MQ   Quoted stream に変換する
-.fi
+.RS 8
+.PD 0
+.TP
+\-M
+ヘッダ形式に変換する
+.TP
+\-MB
+base64 stream に変換する
+.TP
+\-MQ
+Quoted stream に変換する
+.RE
+.PD
 .TP
 .B "\-J \-E \-S \-X \-B"
 期待される入力コードの性質を指定する。
 .RS
-.IP \fB\-J\fP
+.TP
+.B \-J
 ISO-2022-JPを仮定する。
-.IP \fB\-E\fP
+.TP
+.B \-E
 日本語EUC(AT&T)を仮定する。
-.IP \fB\-S\fP
+.TP
+.B \-S
 MS漢字を仮定する。X0201仮名も仮定される。
-.IP \fB\-X\fP
+.TP
+.B \-W
+UTF-8を仮定する。
+.TP
+.B \-W8
+UTF-8を仮定する。
+.TP
+.B \-W16
+UTF-16(Little Endien)を仮定する。
+.TP
+.B \-W16B
+UTF-16(Big Endien)を仮定する。
+.TP
+.B \-W16L
+UTF-16(Little Endien)を仮定する。
+.TP
+.B \-X
 MS漢字中にX0201仮名があると仮定する。
-.IP \fB\-B\fP
+.TP
+.B \-B
 壊れた(Broken)JISコード。ESCがなくなったと仮定する。
 .RS
-.IP \fB\-B1\fP
+.TP
+.B \-B1
  \fBESC-(\fP, \fBESC-$\fP のあとのコードを問わない
-.IP \fB\-B2\fP
+.TP
+.B \-B2
 改行のあとに強制的にASCIIの戻す
 .RE
 .RE
@@ -115,6 +171,9 @@ JIS漢字を指示するシーケンスとして \fBESC-'$'-\fP\fI?\fPを使用する。
 .B \-r
 ROT13/47の変換をする。
 .TP
+.B \-g
+自動判別の結果を出力します。
+.TP
 .B \-v
 バージョンを表示する。
 .TP
@@ -144,29 +203,79 @@ NLまえにCRを付加する。
 .B \-d
 NLまえのCRを削除する。単独のCRは、NLに置き換えられる。
 .TP
-.B \-L[wmu] 改行モード 
-.nf
-		    -Lu   unix (LF) 
-		    -Lw   windows (CRLF) 
-		    -Lm   mac (CR) 
-		デフォルトは変換なし。
-.fi
+.B \-L[wmu]
+改行モード 
+.RS
+.RS
+.PD 0
+.TP
+-Lu
+unix (LF) 
+.TP
+-Lw
+windows (CRLF) 
+.TP
+-Lm
+mac (CR) 
+.RE
+デフォルトは変換なし。
+.RE
+.PD
 .TP
 .B \-- 長い名前のオプション。これらは、上のオプションの組合せの別名。
-.nf
-     \--fj,\--unix,\--mac,\--msdos, \--windows
-           これらのシステムに適した変換をします。
-
-     \--jis,\--euc,\--sjis,\--mime,\--base64  
-	   対応する変換をします。
-
-     \--hirakana, \--katakana 平仮名、片仮名変換
-     \--cap-input, \--url-input それぞれ ':', '%' に続く 16 進数を文字に変換する
-     \--overwrite 元のファイルを変換結果で置き換える。複数のファイルを書き換えることも可能。
-     \--help
-     \--version
-     \--		これ以降のオプションを無視する
-.fi
+.RS
+.PD 0
+.TP
+\--fj,\--unix,\--mac,\--msdos, \--windows
+これらのシステムに適した変換をします。
+.PD
+.TP
+\--jis,\--euc,\--sjis,\--mime,\--base64  
+対応する変換をします。
+.TP
+\--hirakana, \--katakana
+平仮名、片仮名変換
+.TP
+\--cap-input, \--url-input
+それぞれ ':', '%' に続く 16 進数を文字に変換する
+.TP
+\--numchar-input
+&#....; のような、Unicode文字参照を変換する
+.TP
+\--no-cp932
+Shift_JIS の、FAxx-FCxx を、CP932 で同値な文字に読み換える動作を無効にする
+.TP
+\--cp932inv
+Shift_JIS への変換の際、EDxx-EFxx を、CP932 で同値な FAxx-FCxx の文字に変換する
+.TP
+\--ms-ucs-map
+MicrosoftのUCSマッピング互換の変換を行う
+.TP
+\--overwrite
+元のファイルを変換結果で置き換える。複数のファイルを書き換えることも可能
+.TP
+\--guess
+自動判別の結果を出力する
+.TP
+\--help
+.TP
+\--version
+.TP
+\--
+これ以降のオプションを無視する
+.RE
+.TP
+.B 次の 2 つは、config.h で EXEC_IO を define してコンパイルした時のみ有効
+.RS
+.PD 0
+.TP
+\--exec-in
+nkf [options] --exec-in cmd args... とやると、cmd の出力を nkf の入力とする
+.PD
+.TP
+\--exec-out
+nkf [options] --exec-out cmd args... とやると、nkf の出力を cmd の入力とする
+.RE
 .SH AUTHOR
 
 .nf
@@ -271,7 +380,7 @@ UTF-8 と判定されれば、そのまま euc-jp に変換される。
     \-w   出力を utf-8 に指定します
     \-W   入力を utf-8 と仮定します
 .PP
-特に自動判別、コード混在、エラー処理系には判定を失敗するこがある。
+特に自動判別、コード混在、エラー処理系には判定を失敗することがある。
 
 .PP
   \-Z3 オプションの新設
@@ -285,8 +394,7 @@ newline を保存する folding -F。fmtに近い動作をする。
 
 .PP
 folding のマージン。-f60-0 などと、0にすると禁
-則せずに、強制的にfoldingする。携帯にメールを送るときに使
-う。
+則せずに、強制的にfoldingする。携帯にメールを送るときに使う。
 
 .PP
 nkf \-f40\-0
@@ -316,6 +424,9 @@ non-strict mime \-MN では、空白、改行をまたいで、base64 encoding
 を解読する。これで、スクリーンからcut&pasteで
 デコードすることも可能。止まらない可能性あり。
 
+.SH
+その他
+
 .PP
 nkf_test.pl のバグチェックを増やした。
 test が失敗したときにdiffを取るようにした。
@@ -335,12 +446,73 @@ rot13が1.9で動かなくなっていたのを修正。
 
 .PP
 hiragana/katakana 変換ができるようになりました。
-   \-h1   \--katakana ひらがな->かたかな
-   \-h2   \--hirakana かたかな->ひらがな
-   \-h3   \--hirakana-katakana かたかな<->ひらがな
+   \-h1   \--hiragana カタカナ->ひらがな
+   \-h2   \--katakana ひらがな->カタカナ
+   \-h3   \--katakana-hiragana カタカナ<->ひらがな
 
 \--overwrite で、引数のファイルを直接、置き換えることができます。
 
+.SH nkf 2.0.4
+
+.PP
+Shift_JIS の FAxx-FCxx について、普通の式では euc に変換できませんが、CP932 で同値な文字に読み換えて変換します。この動作を無効にするには、--no-cp932 をつけてください。
+
+.PP
+perl module に
+   nkf_continue     オプション、自動判別の状態などを引き継いで変換
+   inputcode        自動判別結果の文字コードを返す
+を追加しました。
+
+.PP
+\--numchar-input オプションを新設
+    mhonarc など、日本語を UTF-16 の &#....; のパターンで出力するものを変換します。
+
+.PP
+\--exec-in, \--exec-out オプションを新設 (config.h で EXEC_IO を define してコンパイルした時のみ有効)
+
+    nkf -e \--exec-in cmd args...
+    とやると、cmd の出力を nkf の入力とします。
+
+    nkf -e \--exec-out cmd args...
+    とやると、nkf の出力を cmd の入力とします。
+
+
+.SH nkf 2.0.5
+
+.PP
+--cp932inv というオプションをつけると Shift_JIS への変換の際、EDxx-EFxx については、
+CP932 で同値な FAxx-FCxx の文字に変換します。
+
+.PP
+--guess または -g というオプションをつけると自動判別の結果を出力します。
+
+.PP
+--prefix= というオプションをつけると、EUC-JP から Shift_JIS への変換の際、2 バイト目
+に現れた文字の前にエスケープ文字をつけることができます。
+引数の 1 文字目がエスケープ文字、2文字目以降にエスケープされるべき文字を指定します。
+
+例えば、
+
+--prefix=\$@ とすると、Shift_JIS の 2 文字目に $, @ が来たら、その前に \ が挿入されます
+--prefix=@@ とすると、Shift_JIS の 2 文字目に @ が来たら、その前に @ が挿入されます
+
+.PP
+-w8, -w16B, -w16L, -W8, -W16B, -W16L というオプションを追加しました。
+
+.PP
+--ms-ucs-map というオプションを付けると、
+MicrosoftのUCSマッピング互換の変換を行います。
+
+.SH nkf 2.0.6
+
+.PP
+ひらがなカタカナ変換のドキュメントが逆になっていたので、これを修正しました。
+正しいドキュメントは以下の通りです。
+   \-h1   \--hiragana カタカナ->ひらがな
+   \-h2   \--katakana ひらがな->カタカナ
+   \-h3   \--katakana-hiragana カタカナ<->ひらがな
+
+
 
 .SH ACKNOWLEDGE
 
@@ -354,11 +526,14 @@ yuki@flab.fujitsu 他、fujitsu & flab.fujitsuの皆さんの協力に感謝。
 shinoda@cs.titech, kato@cs.titech, uematsu@cs.titech  TNX
 kono@ie.u-ryukyu.ac.jp
 
-nkf 1.9
+nkf 1.9-
 Akio Furukawa
+Andy Taki
 From: OHARA Shigeki
+Fumitaka Kitagawa
 Hiroaki Sengoku 
 Ikuhiro MORITA (森田 育宏)
+Yoshiharu ITO
 Junn Ohta
 KAWAMURA Masao
 Kazuhiko Mori 
@@ -373,11 +548,13 @@ Rei FURUKAWA
 Satoru Takabayashi
 Shigeyuki Takagi
 Shin MICHIMUKO 
+Tadamasa Teranishi
+TOYODA Jiro
+TSUCHIYA Masatoshi
 Tsutomu Sakai 
 YAMASHITA Junji (山下 純司)
 Yasuyuki Sato 
 Yoshiaki Yanagihara
-Yoshiaki Yanagihara 
 hat@so-net
 ＤＣＣ技術部渡辺
 かとぺ / 加藤 貴司
@@ -419,7 +596,12 @@ hat@so-net
 落合一喜
 林  亮
 國安 治
-
+木下 雄介
+成瀬ゆい
+鶴谷直樹
+中田伸悦
+わたなべひろふみ
+MoonWolf
 
 河野真治
      www.ie.u-ryukyu.ac.jp/~kono/nkf/