133. テレパソ (2005/7/29)


戻る前回次回
最近いわゆる「テレパソ」にハマっている。なんてことはない、パソコンでHDDレコーダをやるだけの話なのだが、突き詰めていくポイントがいくつもあってのめりこんでしまった。

■きっかけ

私がそもそもテレパソをやろうと思った動機は、テレビを見ながらパソコンに向かいたいというだけのことだった。録画してとっておきたいと思うこともあったが、それは二の次であった。部屋の配置上、テレビを見ながらパソコンに向かうことが出来なかったのだ。

テレビは面白い番組も面白くない番組もある。昔は面白い番組だけを集中して見ていた。しかし次第に面白いと思うような番組が少なくなってきて、一時期テレビをあまり見なくなったこともある。ただ、まるっきり面白くないかというとそういうわけではなく、面白い部分だけを見て、あとは音だけ聞きながら他の作業をしたりするというスタイルを取れば、結構楽しめる番組が多い。ゲームも同じで、いつも集中してプレイするタイプのゲームではないオンラインゲームとの相性がとてもいいのだ。

こうして、ダラダラとテレビを見るライフスタイルを取り入れることになった。

■最初のチューナーカード

パソコンでテレビを見るための拡張カードのことを、チューナーカードという。私のチューナーカードとの出会いを少しさかのぼってたどってみよう。

私が初めてチューナーカードを手に入れたのは、友人から中古で買ったDOS/V用のものだった。その友人は、自分が意図していた動作と違うので、欲しいなら一万円で売ると言ってきた。私が買わなければ中古で売り払うとのことだった。当時私はそれほどチューナーカードを欲しいと思っていたわけではないが、自分の母親のマシンに入れてテレビを見れるようにすると良いかも、と思ってそれを買った。

友人がどのような動作を期待していたのか知らないが、そのチューナーカードはオーバーレイによりVGAに割り込んで全画面でテレビ画面を表示するというものだった。ビデオカードからのアナログ出力を差すコネクタがあり、いったんビデオカードの出力をチューナーカードに入れるのだ。そしてチューナーカードはモードによってビデオ信号をスルーしたり上書きしたりして、モニタへと信号を送る。キーボード操作で好きなときにテレビ画面を表示させることができた。

当時は 486DX 66MHz という非常に貧弱なマシンで、ハードディスクもたった 400MBしかなかったから、録画なんてまったく出来なかった。

■キャプチャカード

秋葉原の定期巡回で、LeadtekのVC100という非常にシンプルなキャプチャカードを手に入れた。入力端子としてコンポジットとS端子しかないシンプルなものだ。チューナーはついていない。五千数百円という安価な値段で売られていたので、興味本位で買ってみた。テレビのモニタ映像出力とつなぐと、テレビの映像がパソコンのウィンドウに表示される。サウンドカードの音声入力とテレビのモニタ音声出力とをつなぐことで、音声も聞くことが出来る。対応ソフトの録画ボタンを押すと、それがそのまま録画されるという寸法だ。

初めてのテレビ録画はちょっとした感動だった。

しかしいくつも問題があり、お遊びの域を出なかった。映像の質が悪かった。

解像度の最大が352×240だった。この解像度だと一秒間に15回のキャプチャがせいぜいだった。テレビ放送は、走査線の奇数番目と偶数番目を交互に一秒間に30回ずつフラッシュして映像を描いていくようになっているので、一秒間に30回程度でなければカクカクしてしまう。

そもそも映像のレベルも悪かった。映像入力は確か五つか六つのパラメータで微調整できたが、白抜けや黒抜けという現象に対応できなかった。ソフトウェアによる補正が必要なのか、もともとの信号が悪いのか、どちらかだろう。以前USBカメラをLinuxマシンに接続して遊んだときには、Video For Linux という下位ドライバだけでは白抜けや黒抜けが起きたので、信号を平均化する処理をわざわざ手で書かなければならなかった覚えがある。

■ローエンドカード

それから時がたち、CPUの周波数はギガを超え、ハードディスクも数十ギガバイトとなっていた。マシンのパワーがアップしたことで、ソフトウェアによる高品質なエンコーディングが可能になり、安価なカードが出回りだした頃だと思う。以前は、専用の高価なDSPに助けてもらわなければ、動画をエンコーディングすることが出来なかったのだ。DSPとはハードウェアでデジタル信号を処理する専用のLSIのことである。エンコーディングとは、一秒間に30枚程度の画像で構成される動画を効率よく圧縮する処理のことであり、一般に非常に時間の掛かる重たい処理なのである。従来はとてもソフトウェアではエンコーディングできなかったが、CPUの性能が上がったことにより、リアルタイムでソフトウェアによる処理が可能となった。

次に手に入れたのが、I-O DATA のソフトウェアエンコーディングのチューナーカードである。私が買ったのはこのメーカーのソフトウェアエンコーディング方式の通算五番目のカードだったので、だいぶこなれてきてからだ。リモコンもついて一万五千円程度だった。パソコンの初心者でも分かりやすいよう色々と工夫された製品だった。パッケージングからして写真や説明が豊富で、手にとって買いやすいようになっていた。

この製品は、最初のチューナーカードと違い、Windows の中の一つのアプリケーションとして動く。ウィンドウでテレビ画面が開くので、ネットサーフィンしながらテレビを見ることが出来た。まあそれだけならパソコンを二台用意すればいいだけなのだが、使い勝手はだいぶあがった。もちろん全画面モードにして大画面で視聴することもできる。

ワンタッチで録画が可能になった。ボタンを押すだけで録画が始まる。ただし、ソフトウェアエンコーディングの処理が重く、私が当時使っていた Athlon 800MHz 程度では 352×480 の解像度でやっと実用になった。これでも一応 VHS 程度の画質で録画できる。録画が始まると CPU のパワーを食い始めるので、あまり他のことを同じマシンでやることができなくなった。もし無理に何かやろうとしたら、録画中にコマ落ちが発生し、最悪の場合マシンが固まってしまう。

また致命的なことに、白抜けが発生するという欠点があった。普段はちゃんと見れてても、朝の明るい色調の番組や、アニメで白を多く使ったシーンになると、途端に画質が崩れて使い物にならなくなった。この欠点が存在する限り、まともなテレビ視聴にすら耐えないのだ。

■ハイエンドカードの復旧版

そしてようやく私にとってのブレイクスルーが登場する。テレパソという市場を切り開いたカノープスが、これまでの高価だったハードウェアエンコーディングのチューナーカードを、廉価版にして出してきたのだ。それが MTVX2004 だ。これまでの MTV1000 や 2000といった最低でも三万円台が当たり前のものと比べて、二万円で出してきた。パーツが少し安いものになったとはいえ、これまでカノープスが培ってきたドライバやアプリなんかのソフトウェアは変わらず、定評のあった安定性もそのままである。

このモデルになると、画質が全然違う。もう普通のテレビとほとんど変わらない。その上、予約録画の機能が充実していて、マシンをスタンバイ状態や休止状態にしておいても、Windowsのタスクスケジューラの機能を利用して予約時間になると勝手に立ち上がって録画を開始する。ハードウェアでエンコーディングを行うので、CPUの使用率が10%以下で安定性抜群だ。

ここにきてようやく、私のライフスタイルを変えるほどのインパクトがあった。

VHSのビデオデッキで撮り貯めていたときは、テープの長さの分しか一度に予約できず、磁気テープなので使いまわしているうちに劣化してしまう。録画予約のためにリモコンと格闘しなければならず、ミスりやすいので時々違うものを撮ってしまうことがあった。

ところがチューナーカードだと、ハードディスクの容量の限り録画が出来る。SVHS以上の画質で、一時間番組が2.5GBくらい。つまりハードディスクが80GBあると30時間以上撮りつづけられる。画質を落とせばもっともっと撮れる。

見たい場所だけを頭だし出来る。見終えたあとにわざわざ巻き戻さなくていい。気に入ったものは圧縮してCD-RやDVD-Rに焼いて保存しておける。いらないものはすぐに消去する。撮ったものはデジタルなので劣化しない。

■コーデック乱立

最初は基本的に録画して一度見て捨てての繰り返しで、よほどのものでない限り保存しようと思わなかった。そのままとっておくとファイルが大きすぎるので圧縮するのだが、通常のファイル圧縮は効かない。そこで動画として圧縮することになる。

通常のハードウェアエンコーディングのチューナーカードは、まずMPEG2という形式で記録する。これはDVDに記録してある形式と同じだ。MPEG2といってもビットレートや音声の形式などで幅があって、ひとえにこれというものではない。私の場合、まず可変長ビットレートの平均6Mbps(最大9Mbps)で撮る。ビットレートとは、一秒間の映像に対してどれだけの情報を使って表すかというデータ量の単位のことである。平均6Mbpsだと先ほど述べたように一時間で2.5GBぐらいとってしまう。そこでサイズを落とすために画質をあきらめることになる。MPEG2のままでもビットレートを落とすことでサイズを落とすことが可能なのだが、MPEG2というエンコーディング方式は低ビットレートがあまり得意ではないと言われている。

そこで他のエンコーディング方式に変換することになる。一般に録画の方法をエンコーディング方式、再生の方法をデコーディング方式と呼び、これらはセットになるわけだが、合わせてコーデックと呼ぶ。

まず第一の候補は、MPEG1である。MPEG2より古い規格なのになぜわざわざ利用するのかと思う人もいるかもしれない。しかしMPEG1だとマシンパワーをあまり食わないという利点があるほか、再生機器の幅が広いといった汎用性がある。特に、MPEG1の中でもVideo-CDと呼ばれる規格に合ったレベルにすると、Video-CDを作ることが出来るので用途が広がる。一般にVideo-CDだとVHS程度の画質だと言われている。エンコードのためのソフトによって画質が大きく変わるのも重要で、中でも日本製のTMPGEncというソフトウェアを使うと、MPEG1を時代遅れとは言わせないぐらいの画質が得られる。

次の候補はMPEG4である。このMPEG4には亜種が様々あるので注意が必要だ。オリジナルとなったのがAppleのQuickTimeで使われていたものだ。しかしなかなか企画が統一されず、マイクロソフトがMS-Mpeg4という規格を作って出したほか、MPEG4ベースのフリーなコーデックを多く生み出した。初期のMPEG4は、低ビットレートつまりデータ量を減らしたときの再現性が高いという利点がある反面、高ビットレートつまりデータ量をふやしたときの再現性が劣るという欠点がある。また、激しい動きのあるシーンで、ブロックノイズと呼ばれる荒い四角形が現れやすい。映像を圧縮している関係上、どうしてもデータ量の足りない部分はごまかさなければならないのだが、それをいかにごまかすかもコーデックの良し悪しである。もちろん優秀なコーデックならごまかしは少なくて済むが、なかなかそうもいかない。

MPEG4の亜種として最もメジャーなのがDivXである。アングラな動画によく使われたのでダーティなイメージがあるが、そういう経緯もあり、現在かなり広く使われている。個人が作り、会社が設立され、現在シェアウェアのような形で流通している。再生はタダ、録画も試用期間が長く、一時期は広告ソフトウェアを入れることでタダで使用できた。

Windowsの標準としてマイクロソフトはMS-Mpeg4を早々に放棄し、引き続き MPEG4 を元にして Windows Media Player 形式を作った。バージョンがあがるにつれて強化されていき、現在ではMPEG4の亜種の中では一番質がいいと言われている。ただしエンコードに時間が掛かるほか、最近になってようやくLinuxでも再生可能になったというように、マイクロソフトの囲い込みが懸念されている。

そして現在一番新しいのが MPEG4 AVC と呼ばれるもので、DVDの次の光メディアへの採用がほぼ決まっているほか、PSPに搭載されておりソニーが推進するUMDという小型ディスクに既に採用されている。コーデックの性能は高いが、それに伴いエンコードとデコードともにマシンパワーを食う、未来志向の規格である。PSPはAVC再生のためのDSPつまりハードウェアを搭載している。パソコン用としては現在開発中であり、一応現在も利用可能であるが、安定して使われる状況には至っていない。

現在の状況を総括すると、まず第一に使われるのがMPEG2であり、この規格だけでも家庭用DVDレコーダなどで使われるので問題ない。画質をなるべく保ったまま圧縮したい人々が、MPEG4ベースのいくつかの技術を好みで使っている。DVD-ROMの搭載率が100%になるまではVideo-CDも使われるのでMPEG1が残っている。

現在はこのように過渡期なのでいくつもの形式が乱立しているが、次第にMPEG4 AVC に統一されるのではないかと思う。しかし用途によって向き不向きがあるので、いくつかの規格が並存する形となるだろう。

■私のコーデック比較

私は何を選んだかというと、結局DivXを選んだ。次点でMPEG1だ。

私が重視したのは、第一にメジャー性(可搬性)、第二にサイズ優先の画質、第三にエンコード速度だ。MPEG1とMPEG2とMS-MPEG4とDivXとWMPで比較した。Xvidなどうわさに聞くコーデックも一応考えたが、消える可能性が高いのでやめた。AVCを先取りしたかったが、現時点ではまだ厳しいので断念した。

ただし画質はコーデックだけではなくエンコードソフトにも大きく影響される。国産のフリーソフトから生まれたTMPGEncの質は高く、他の市販ソフトでエンコードしたものと比べてすぐに分かるぐらいハッキリとした差がある。私の中でMPEG1が現役なのはこのソフトがあるからこそだ。

ソフトの質以外にも、ソフトごとに設定項目があり、時間を掛けて圧縮する設定をすればするほど画質がよくなる代わりに、エンコードのための速度が非常に長く掛かるようになる。まずデータソースつまり元の映像に対してノイズフィルタやゴーストリデューサなどを掛けた上で、一回でエンコードするのではなく2-passと呼ばれる二段階のエンコードを行う手法を使ったりすると、たった30分の映像に丸一日以上掛かってしまったりする。

Video-CDくらいの画質のMPEG1だと、30分で260MBくらい。映像が1150Kbpsで音声が384kbps(?)くらいなのでだいたい合計1.5Mbpsになる。最初のチューナーからキャプチャしたものが平均6Mbpsなので、大体四分の一から五分の一くらいになる。音声の比率が高いのは、あのMP3の前の規格でエンコードしているからだ。MP3とは MPEG1 Layer 3 のオーディオコーデックなのだが、Video-CD用だとMPEG1 Layer 2 だったかを使うので、圧縮率が悪い。

DivXのR6でエンコードすると、30分で180MBくらい。映像を780Kbpsで、音声をMP3の54Kbpsでエンコードする。54Kbpsはちょっと悪いが、もともと地上波なのでCDをエンコードするのと比べてそんなに気を使う必要はないと思う。実はそのままの状態だと54Kbpsより上の設定が制限されており、何か買い足さなければこれ以上の品質でエンコードできないようなのだ。一方映像は、Video-CDの品質のMPEG1では解像度が352×240だが、DivXの場合640×480でも問題ない。実のところ解像度が高いほうがデータ量の使い方が下手になる傾向があるので、解像度が低いほうが大体の状況において画質が良くなってしまう。しかし特に静止画では解像度が高いほうが再現性が高く、特にのっぺりしたアニメ絵なんかにはいい。

じっくり検討した結果、私はDivXを選んだが、なるべく他の技術が出てきてほしいなと思っている。オープンソースで強力なものが一般的になってくれるのが一番いい。DivXはフリーではないからだ。別にお金が惜しいわけではない。Windows Media Player 形式は、マイクロソフトという巨大メーカーが作って事実上タダで配布しているものだが、動画を何年も残すことを考えると不安がある。DivXも消える可能性が十分あるが、最悪すべて他のフォーマットに変換すればいいと考えている。DivXは2ちゃんねるでの評判があまりよくない。エンコーダの性能が5.11から退化しつづけていると言っている人がいる。

■ダブルチューナー&トランスコーダー

最近になってチューナーカードを買い換えた。I-O DATA の GV-MVP/GXW だ。X-Code II という低ビットレートでの画質に定評のあるエンコードチップを搭載し、チューナーを二台搭載しているモデルだ。従来はダブルチューナーといえばほとんどの部品を二台分持たなくてはならなかったが、このモデルはエンコードチップ一つでチューナー二台での同時録画に対応できるようにしたために、コストパフォーマンスが非常に高い。以前 I-O DATA のソフトウェアエンコーディングの廉価版チューナーカードを買って、ユーティリティソフトの出来がカノープスと比べていまいちだったので躊躇はしたが、ハードの性能に負けて買ってみた。

カノープスの MTVX2004 で録画すると、処理が重くてフレーム落ちしたときの処理が独特なため、付属のプレイヤーを使って見る分には問題ないのだが、普通のたとえば Windows Media Player で再生すると徐々に音ズレしてしまうという致命的な問題があった。この問題があったために、録画したファイルをそのまま TMPGEnc で再エンコードすると音ズレしてしまうので、わざわざこの音ズレをなぜか補正してくれる Ulead 製のソフトを介してエンコードしていた。こんな無駄なことはないのでついに買い替えを決心したのだ。

とはいっても、I-O DATA の GV-MVP/GXW にも短所があり、買い換えて改めて MTVX2004 の良いところも見えてきた。まずダイレクトオーバーレイなら MTVX2004 でなければならない。GV-MVP/GXW だと一度取り込んでファイルにしたものを表示しているので、時間差が起きてしまう。テレビを見るだけでディスクアクセスが生じるのだ。ダイレクトオーバーレイはビデオカードに依存してしまうので、なるべく多くのハードに対応しなければならない I-O DATA では採用できなかったのだろう。にしても、現在は一応ダイレクトオーバーレイのモードを持っているにも関わらず、なぜいまだに時間差があるのかが謎である。

ソフトウェアの質もカノープスのほうがいい。ただ、I-O DATA の mAgicTV も、設定項目が細かくなっていて、マニア向けになっている。一方のカノープスはあまりいじらなくていい分だけ親切ではある。

トランスコーダの質はいまいちだ。トランスコーダというのは、ハードウェアでMPEG2などの形式やビットレートの変換をやってくれる機能なのだが、ちょっとマシンが重くなるとエラーでとまってしまう。恐らくコマ落ちが発生した瞬間にエラーになってしまうのだろう。そんなのリアルタイムでやってるんじゃないんだから対応しろよと言いたくなる。それはともかくとして、このエラーが発生する現象のおかげで、どのくらいマシンに負荷を掛けたらコマ落ちが発生するのかがよく分かった。

■まだまだ

この道は奥が深い。私はまだ一歩踏み出したばかりである。

コーデックやエンコードソフトの設定次第で、生成される動画の質は全然違ってくる。設定のテクニックというものがあるので、名人と素人では出来るものが違う。たとえば日本のアニメは秒間24枚しかないので、秒間24枚を判別してエンコードする24fps化というテクニックがある。細かくなると、シーンの変わり目を自分でチマチマ指定することで質を上げるという方法もある。ここまで極めたいとは思わないが、最低限の知識をもってなるべく良い形で動画を残したい。

残した先には何があるか。残しただけで終わるかもしれない。多分何回も何回も見ることはないだろう。せいぜい一回か二回。そのためにここまで労力を掛けることはないのかもしれない。何も考えずに撮った状態のままDVDに焼いていけばいいと割り切ったほうがいいのかもしれない。PSPのような携帯機器で動画を見るために圧縮するという目的もある。

パソコンのマシンパワーはもはやゲームのためにしか利用されないのか、というところにおおかたの人がたどり着いてしまったことがあったが、ここへきてようやくマルチメディア処理という目的がメジャーになってきたと思う。かつてそれは一部のマニアのみのものだった。マルチメディア?そんなの誰がやるの?という状況が長く続いていたが、テレビを手軽に録画して保存するという誰でもやりそうなことが一般的になってきたことにより、ようやく我々の身近な目的になってきた。将来的には、動画の音声やテロップに言語検索を掛けたり、映像にも何らかの高速な情報処理が可能になるかもしれない。いまはその始まりなのである。


戻る前回次回
gomi@din.or.jp