Macの奴隷臍茶な話
渡邊鼎の!言いたい放談!
 

135:今後期待する高速化手法


機種は何にしろ、私が、実施して欲しいと思っている高速化手段は、SDRAMのDDR化と、L2キャッシュのDDR化、および、2MByteなどの大容量化です。

まず、DRAMのDDR=Double Data Rate 化はもう既に世の中準備中ですね、RAMBUSとかSLDRAMとか、有名だからご存じでしょう。
現在、DRAMはGrackleというCPUバス-PCIバス変換チップに内蔵しているDRAM制御回路によってコントロールされ、データバスはCPUバスに直結しています。ここをDDRにするには、データ転送の送受信部を双方ともDDR対応にするわけで、当然DDR-SDRAM側はDDR送受信可能になっているものを使用します。次にCPUのデータバスもDDRに対応できるようになっていなければなりません。制御回路もそうですね。出来れば、Grackle自身もデータ転送はDDR対応しといてくれた方がいいですね。ま、あまり効かないかもしれませんが。

キャッシュは多ければCPUは速く動きますが、リニアに効いてくるわけではありません。でも、アプリケーションによりますが、1MBくらいでは、まだ伸びの余裕が残っています。G4では2MBのL2キャッシュまで使えるようになるようです。G3に内蔵しているキャッシュTagメモリーやアドレスコンパレーターのbit長が1MByteのキャッシュ分しか用意して無く、これを1bit増やすだけですが、変更が必要になります。でもG3に変更を加えるとOSも修正しなくちゃいけませんね。さらに出来ればこれに使うL2キャッシュの2倍容量化=2チップでOKということも、面積を今まで程度に押さえたいのでやって欲しいですね。ま、これは出来無くはないけど、もう少し先まで迄待っても良いかな。

実は、非常にやって欲しくて、世の中全然やっていないのが、L2キャッシュのDDR化です。
現在L2キャッシュは300MHzがやっとの所です。しかも、なかなか収量が取れないので高価になっています。
で、現在L2キャッシュは同期型高速SRAMで出来ています。よって、CPU内臓のバックサイドキャッシュコントローラーによって制御され、CPUとの、L2キャッシュ専用バスでのデータRWは、CPUクロックとの比率設定によって決まるクロックの立ち上がりで一回という感じでRWしているわけです。一方SDRAMやRAMBUSのDDR転送ではクロックの立ち上がりと立ち下がりの2回/1クロックあたりの転送を行うようになっています。この転送方式をL2キャッシュにも適用できれば割と簡単にL2キャッシュバスのデータ転送速度を高速化できます。これを実現するためにはCPU側のバックサイドキャッシュコントローラーやバスIOレジスターらをDDRに対応できるように変更し、L2キャッシュの高速SRAM側も、これに対応できるように変更すれば出来るわけです。これがうまくいくと、安い150MHzのSRAMを使っても、300MHzで転送できるわけで、今後400MHz以上に上がっていくCPUとのクロック比が1:1が実現できるようになるわけです。さらに、うまくいくと、300MHzのSRAMで600MHzが実現でき、CPU側も2倍の300MHzでDDRに対応できれば、L2キャッシュとの転送が600MHzで出来るようになり、抜本的なL1キャッシュとL2キャッシュの速度差削減になると言うわけです。

このとき2倍の速度で作動する必要があるのは、DDRの制御やデータバッファーなどだけなので、やれなくはないと思います。
ま、うまくいくかどうかわかりませんが。


ま、こんなとこですかね。

 


AGPは入ってないと言われていましたが、
PCIの第一スロットはAGP概略対応66MHz,3.3Vです。これはAGPの仕様決定がなかなか決まらず、Yosemiteに間に合わなかったため、AGPと呼ぶことを止めているという話です。
そして、ATIの新チップを載せたカードは、Graphicメモリー16MBをカード内に内蔵しており、結果的に、AGPの高速バスを、「graphicのRWに使用することによるバスのCPU占有率低下」をさせないようになっています。

AGPを使っていないと言うのはそういうことだったんですね。

AGPという技術は、もともとは、Graphic用RAMを昔のように主記憶DRAMと別に持つことはコストが高いので、低コスト機種を作るときコストダウンするためにはこれを共用しようと言うのが発端です。で、そうすると、Graphic側からのアクセスが多いとき、CPU側の主記憶アクセスを邪魔してしまい、全体の速度が低下してしまう、という欠陥を最初から内在していました。で、これを少しでも軽減するため、及び、Graphicチップの処理の高速化のため、AGPのバスをPCIバスの2倍とか、4倍とか早くする2X、4XAGPなど改訂してきているわけです。

せっかくAGPバスはPCIに較べて速いわけですから、Graphincカード上にGraphicDRAMも内蔵している場合にもAGPバス=高速バスを使うと、GraphicチップへのCPUのアクセスが高速化できますので、メリットがあるわけです。

この辺のところが、どうも忘れやすくて、AGPだ、2X,4XAGPだとかいうと、これまでより格段に速い技術だと思って、使われないと、時代に乗り遅れちゃった感じがしていたのは、勘違いだったということもあるんですね。

渡邊鼎じゃった。


[Home] [Linkし放題] [Fleamarket]