【実行形式】 modifyHtm [-acijknsuw] [-d:abcfhilos] [htmlfiles] 【パラメータ】 -acijknsuw: a 全角の英字を半角にします。 c タグの中の小文字(a〜z)を大文字(A〜Z)にします。 ただし、文字列内("…" または '…')はそのままになります。 i タグ括弧エラーを無視します。 j 最後が'>'で終わっていない行を結合します。 <PRE>…</PRE>の中は除外します。 また、行頭が"<P>…"という場合には、直前の行に改行コードを付加します。 k 半角カナを全角カナに変換します。 n 全角の数字を半角にします。 また、全角の数字に挟まれた「.」、「,」、「−」も半角にします。 s リンク内の大文字を小文字にします。 ただし、文字列内はそのままになります。 u リンクやイメージデータを全て同じディレクトリ内の参照にします。 例えば「<IMG SRC="../image/a.jpg">」は「<IMG SRC="a.jpg">」となります。 w 元のファイルに上書きします。 これはコピーしたファイルに対して行うことをお勧めします。 -d:abcfhilos: a リンクタグ(<a>〜</a>)を外します。 b タグ内のbgcolor指定を外します。 c コメント(<!-- 〜 -->)の記述を削除します。 f フォントタグ(<font>〜</font>)を外します。 h タグ内のcharsetオプションを外します。 i イメージタグを外します。 l TABLEタグのalign指定を削除します。 o bgsoundタグを外します。 s フォントタグのサイズ指定を外します。 htmlfiles HTML文書ファイル これを省略した場合、標準入力から読込まれます。【補足説明】
【実行例】
・uni2sj input.htm | modifyhtm -d:h > output.htm
(input.htmをユニコードからシフトJISに変換した後、charsetオプションを削除して、output.htmに出力します。)