modifyHtm 使用方法



【機能概要】
 HTMLファイル(Shift JISコード)を編集します。
 ただし、コメント内(<!-- 〜 -->)及びスクリプト内(<script> 〜 </script>)は編集しません。
【実行形式】
  modifyHtm [-acijknsuw] [-d:abcfhilos] [htmlfiles]

【パラメータ】
    -acijknsuw:
    
      a   全角の英字を半角にします。

      c   タグの中の小文字(a〜z)を大文字(A〜Z)にします。
          ただし、文字列内("…" または '…')はそのままになります。

      i   タグ括弧エラーを無視します。

      j   最後が'>'で終わっていない行を結合します。
          <PRE>…</PRE>の中は除外します。
          また、行頭が"<P>…"という場合には、直前の行に改行コードを付加します。

      k   半角カナを全角カナに変換します。

      n   全角の数字を半角にします。
          また、全角の数字に挟まれた「.」、「,」、「−」も半角にします。

      s   リンク内の大文字を小文字にします。
          ただし、文字列内はそのままになります。
      
      u   リンクやイメージデータを全て同じディレクトリ内の参照にします。
          例えば「<IMG SRC="../image/a.jpg">」は「<IMG SRC="a.jpg">」となります。

      w   元のファイルに上書きします。
          これはコピーしたファイルに対して行うことをお勧めします。
 
    -d:abcfhilos:
      a   リンクタグ(<a>〜</a>)を外します。
 
     b   タグ内のbgcolor指定を外します。

      c   コメント(<!-- 〜 -->)の記述を削除します。
     
      f   フォントタグ(<font>〜</font>)を外します。

      h   タグ内のcharsetオプションを外します。

      i   イメージタグを外します。
      
      l   TABLEタグのalign指定を削除します。
      
      o   bgsoundタグを外します。
 
      s   フォントタグのサイズ指定を外します。
      
  htmlfiles  HTML文書ファイル
              これを省略した場合、標準入力から読込まれます。
【補足説明】
 処理としては、'<'が現れたら、'>'が現れるまでのテキスト中の大文字('A'から'Z')を編集します。 この場合、'<'と'>'は対になっている必要があります。そうでない場合、処理はそこで打ち切られます。 また、何らかのエラーが検出された場合も、処理はそこで打ち切られます。

【実行例】
・uni2sj input.htm | modifyhtm -d:h > output.htm
(input.htmをユニコードからシフトJISに変換した後、charsetオプションを削除して、output.htmに出力します。)


ホームページへ