打倒NVIDIA!元プレステ開発者が挑む、消費電力9割減のAIチップ「CGLA」の秘密

AI技術の進化を支えるAIチップ市場。その圧倒的なシェアを誇るNVIDIAに、日本発のスタートアップ企業が挑戦状を叩きつけようとしています。その名は「Renzowe(レンズ)」かつてPlayStationの心臓部である半導体を開発していた技術者たちが集結し、NVIDIAのGPUと比較して最大9割の消費電力を削減できるという、革新的なAIチップ「CGLA」を開発しているのです。
今回の記事では、Renzoweの創業者である藤原さんと共同創業者の仲島さんのお話から、CGLAの技術的な秘密、NVIDIAへの挑戦、そしてAIチップ市場の未来について深く掘り下げていきます。
Renzoweが開発する革新的AIチップ「CGLA」とは?
Renzoweが開発しているのは、高い電力効率を誇る計算機「CGLA」です。現在、目にしているのは試作品の状態ですが、近いうちに台湾のTSMCに製造を委託し、5mm角の半導体チップとして完成する見込みです。
このプロジェクトには、藤原さんのもとに、かつてPlayStationの半導体を開発していた元東芝の技術者たちが集まっています。長年の経験と知識を結集し、CGLAの開発に取り組んでいるのです。
ラピダスとの違い:Renzoweが目指す場所
日本の半導体企業として「ラピダス」を思い浮かべる方もいるかもしれません。しかし、ラピダスとRenzoweは目指す場所が大きく異なります。ラピダスは最先端の半導体を国内で量産するための製造会社であるのに対し、Renzoweは半導体の中身、つまりその仕組みそのものを設計する設計会社なのです。
同じ半導体でも、アプローチが全く異なるという点を理解しておく必要があります。
NVIDIAへの挑戦:CGLAの強みと弱点
AI半導体市場で圧倒的なシェアを誇るNVIDIA。そのシェアはなんと9割にも及び、時価総額は日本円で600兆円を超えるという超巨大企業です。Renzoweは、一体どのようにしてNVIDIAに立ち向かおうとしているのでしょうか?
藤原さんは、NVIDIAの弱点として、30年以上使い続けてきたアーキテクチャの限界を指摘します。NVIDIAが採用しているノイマン型アーキテクチャは、データの流れにおいてボトルネックが存在し、消費電力の増大を招いているというのです。
Renzoweは、このノイマン型アーキテクチャの限界を打破するために、CGLAという全く新しい構造を開発しました。データの流れを根本から見直し、消費電力の大幅な削減を目指しているのです。
データ移動が消費電力のボトルネックに
半導体は、データを貯めるメモリと、実際に計算を行う演算器という2つの主要な部分から構成されています。データは、この2つの間を頻繁に行き来しますが、実は、演算に必要な消費電力よりも、データの移動に必要な電力消費の方がはるかに大きいのです。
NVIDIAの研究者による試算では、演算を1回行うのに必要なエネルギーは20ピコジュールであるのに対し、半導体の中をデータがわずか1mm移動するのに26ピコジュールのエネルギーが消費されるという結果が出ています。つまり、現在の半導体は、計算そのものよりも、データをあちこちに動かすことの方が電気を食ってしまうのです。
Renzoweは、このデータの流れそのものを根本から作り直すことで、消費電力の大幅な削減を目指しています。
CPU、GPU、そしてCGLA:データフローの違い
では、データは実際にどのように流れていくのでしょうか?CPU、GPU、そしてCGLAでは、データの流れ方がどのように異なるのでしょうか?
CPU:ノイマン型アーキテクチャの限界
CPUは、メモリとALU(演算論理ユニット)という2つの部品から構成されています。メモリは、実行するプログラムと対象となるデータを保持し、ALUは足し算、引き算、掛け算、割り算などの計算を行います。
CPUは、ノイマン型アーキテクチャを採用しており、ALUがその都度、メモリからプログラムとデータを取りに行くという仕組みになっています。例えば、足し算を行う場合、まず足し算のプログラムをメモリから取りに行き、次に足し算する対象となるAとBの値を取りに行きます。そして、計算した結果Cを再びメモリに書き戻します。
この一連のサイクルの中で、メモリへのアクセスが最低でも4回発生します。プログラムの取得、AとBの値の取得、そして結果Cの書き戻しです。このメモリへの頻繁なアクセスが、ノイマン型アーキテクチャのボトルネックとなっているのです。
GPU:コアレッシングによる効率化
GPUも、メモリと演算器を備えていますが、CPUとは異なり、データのリクエストをある程度まとめて一気に取りに行き、まとめてデータを処理するという「コアレッシング」という手法を採用しています。
これにより、CPUよりもメモリへのアクセス頻度を減らすことができますが、それでもメモリと演算器の間のデータ移動は依然として多く、ボトルネックとなっています。AI半導体やAIサーバーの消費電力の半分以上が、メモリと演算器の間のデータ移動によって消費されているという現状があります。
GoogleのTPU:データフロー型アーキテクチャ
近年注目されているのが、NVIDIAのGPUではなく、GoogleのTPU(Tensor Processing Unit)です。TPUは、AI、特に機械学習に特化した半導体で、Googleが独自に開発しました。ジェミニ3の開発にも使われたと言われています。
TPUは、ALUが単純な和演算(足し算)と積演算(掛け算)しかできないように設計されており、これらの演算を行う計算機が多数並んでいます。CPUやGPUとは異なり、TPUはデータフロー型アーキテクチャを採用しており、メモリの方からデータをプッシュで送り続けるという仕組みになっています。
TPUは、「シストリックアレイ」とも呼ばれ、上から順番にデータを流し続け、計算が終わったデータを次の計算機に渡すという順番があらかじめ決められています。これにより、演算器側からデータを要求する必要がなくなり、メモリへのアクセスを大幅に減らすことができます。
TPUは、行列演算やテンソル計算に特化しているため、AIの特定の用途においては非常に高い効率を発揮します。
RenzoweのCGLA:柔軟性と汎用性
CGLAは、TPUのようにデータの流れを固定するのではなく、データの渡し方を自由に決めることができる柔軟性を持っています。これにより、行列演算やテンソル計算だけでなく、他の計算にも対応できる汎用性を実現しています。
CGLAは、メモリに対する要求が低く、メモリへのアクセス頻度を減らすことができるため、消費電力を大幅に削減できます。また、TPUのように特定の用途に特化しているわけではないため、将来的にどのようなアルゴリズムが登場しても対応できる柔軟性を持っています。
CGLAの優位性:NVIDIA、Googleとの比較
改めて、RenzoweのCGLAがNVIDIAのGPUやGoogleのTPUと比較してどのような点で優れているのかを整理してみましょう。
- NVIDIAのGPU:高い汎用性を持つが、効率の悪さが課題。
- GoogleのTPU:効率には優れるが、特定の計算にしか対応できない。
- RenzoweのCGLA:高い電力効率と高い汎用性を両立。
CGLAは、GPUよりも圧倒的に消費電力を抑えながら、将来全く新しいAIの仕組みが登場したとしても、使い方を変えることで対応できるという強みを持っています。
汎用性の重要性:AIアルゴリズムの進化に対応
電力効率の高さは理解しやすいメリットですが、汎用性の高さの重要性については、いまいちピンとこない方もいるかもしれません。現在の生成AIの多くは、トランスフォーマーと呼ばれる仕組みをベースにしていますが、AIの世界は変化が早く、トランスフォーマーとは異なるアプローチの仕組みも次々と登場しています。
ここで問題になるのが、半導体の側がその変化についていけるかどうかという点です。GoogleのTPUは、トランスフォーマーのような計算を効率よく処理することに特化していますが、もしAIの主流となるアルゴリズムが大きく変わってしまった場合、ハードウェアそのものが最適ではなくなる可能性があります。
Renzoweは、電力効率が高く、なおかつ汎用性も失わないという立ち位置を目指しています。これにより、将来どのようなAIアルゴリズムが登場しても、ハードウェアを根本的に作り替えることなく、ソフトウェアの変更だけで対応できるようになるのです。
クーダの壁:NVIDIAの強固なソフトウェア基盤
Renzoweに対する期待が高まる一方で、大きな壁が立ちはだかります。それは、NVIDIA独自のソフトウェア開発環境である「クーダ(CUDA)」です。NVIDIAのGPUがAI半導体市場を席巻してきた理由の一つに、このクーダの存在があります。
クーダは、プログラマー以外の人は普段意識することはないかもしれませんが、AI開発者にとっては空気のような存在です。AIを使う人たちは、NVIDIAのGPUでAIを動かすために、クーダを利用したコードを何の疑問もなく書いています。
裏を返せば、クーダが使えない半導体は、既存のAIソフトがそのままでは動かしづらいため、AIの世界に入りづらいという現実があります。Renzoweは、このクーダというあまりにも大きい壁に、どのように立ち向かっていくのでしょうか?
まとめ:Renzoweの挑戦とAIチップ市場の未来
Renzoweは、NVIDIAのGPUと比較して最大9割の消費電力を削減できるという、革新的なAIチップ「CGLA」を開発しています。CGLAは、高い電力効率と高い汎用性を両立しており、AIチップ市場に新たな風を吹き込む可能性を秘めています。
NVIDIAのクーダという壁は非常に高いですが、Renzoweは独自の戦略でこの壁を乗り越え、AIチップ市場で存在感を示すことができるのでしょうか。今後のRenzoweの動向に注目が集まります。
この記事を読んで、Renzoweの挑戦に興味を持った方は、ぜひ元のYouTube動画も視聴してみてください。より詳しい情報や、開発者たちの熱い想いを感じることができます。
→ YouTube動画「元プレステ開発陣がNVIDIAに挑む!消費電力9割減の新型AIチップ「CGLA」って何だ!?【橋本幸治の理系通信】」を視聴する

