CPU,GPU,TPU,VPU,NPU,QPUの違い

Screenshot of en.wikipedia.org

AI企業のプレスリリースなどで、TPU,VPU,NPU,QPUなど馴染みの無い言葉が増えてきましたので、これらの用語を整理してみたいと思います。いわゆるAIチップに搭載された計算ユニットの説明です。

大学に入って教養課程で情報処理の教科書を買ったときに、「CPU」というのは出てくるのですが、GPU(Graphics Processing Unit)というのは出てきましたか?少なくとも20世紀には出てきませんでした。3Dゲームとか無かったですからね。

でも21世紀にはGPUも大事になってきましたし、2012年のディープラーニング革命の後は、ニューラルネットワーク専用のコプロセッサ(補助プロセッサ)であるNPU(Neural network Processing Unit)が物凄い勢いで開発されて各社から発売されるようになりました。ニューラルネットワークの計算に特化した計算機(NPU)をサブルーチンのように呼び出して計算時間を短縮する仕組みです。

ここで各プロセッサの意義を復習いたします。NPUの派生プロセッサもご紹介いたします。TPU,VPU,KPU,DPUなど色んな用語がプレスリリースなどで出てきますが気にすることはありません。わかりやすく言えば、動物の脳神経細胞を真似したニューラルネットワークのデジタル実装なのです。「ああNPUの一種ね」と思えば良いのです。NPUを理解するにはニューラルネットワークを理解する必要があります。ニューラルネットワークの中でどのような計算が行われているかを学びましょう。

ニューラルネットワーク、ディープラーニング

ニューラルネットワーク

神経細胞の数学的モデル
動物の脳細胞の構成要素である神経細胞を数学的にモデル化すると、入力信号の総和が一定レベルを超えると次の神経細胞に信号伝達される仕組みが無数に繰り返されていることが分かります。ニューラルネットワークの機械学習や未知データ適用は、比較的単純な計算(行列計算)を無数に繰り返していることが分かります。この計算は8ビットとか16ビットで十分計算できるもので、普通のCPUのように64ビット浮動小数点の計算などは必要ありません。効率よく計算するためには、16ビットなどの低性能プロセッサ(計算コア)を多数用意した方が良いということになるわけです。

神経細胞

CPU・・・Central Processing Unit、中央処理装置。AND,OR,NOTの論理演算を行うデジタル回路。チューリングマシンのデジタル実装。2進数データ(バイナリコード)のプログラムを読み込んで解読し、データ処理して、結果をメモリに書き込みすることをひたすら繰り返します。ブール代数により、ゼロと1のAND/OR/NOTの論理演算を繰り返すことにより、あらゆる十進法の数値計算を行うことができると分かり、計算機械の設計が促進されました。バベッジの解析機関のように、チューリングマシンは機械式歯車でも実現することができます。チューリングの伝記映画イミテーションゲームを観れば機械式コンピューターの動作が分かります。現代のCPUは、いわば超高速の電子版ソロバンです。

FPU・・・これは、Floating Point Unit 浮動小数点計算ユニットで、1990年代中ごろまで使われていたCPUの隣に装着するコプロセッサでした。いまではCPUの中に浮動小数点演算ユニットが内臓されています。最も有名なFPUはi8087です。昔はこれを10万円出して買ったりしてました。

GPU・・・Graphics Processing Unit、2次元画像処理、3次元画像処理を効率的に行うため多数の並列演算ユニットを備えた画像処理プロセッサ。デスクトップ用CPUはビット数や命令数やレジスタ数やキャッシュメモリ容量を増やして高機能化を追求していますが、画像処理(RGB各8ビット)では低機能なCPUが沢山あった方が有利となります。そのような低機能CPU(計算コア)を多数並列配置しているのがGPUです。例えばnVidiaのRTX3090tiでは10752コアが実装されています。並列演算機能を流用して、仮想通貨ロックチェーンのproof of workの演算処理に使われたり、ニューラルネットワークのAIデータ処理に使われています。

NPU・・・Neural network Processing Unt、生物の脳神経細胞を数学モデル化したニューラルネットワークの機械学習と、学習結果を用いた推論処理(画像認識、音声認識、意味認識)などを行うための行列計算に特化した並列処理プロセッサ。機械学習および推論のサブルーチンを実行する場合に高速処理するための専用ハードウェア。神経細胞のように、例えば2とか3の入力信号を合計し、一定の閾値を超えていれば出力信号を発生する「計算機」です。並列演算器はGPUの計算ユニットを流用することもできるので、極端に言えば NPUとGPUは同じものと言えます。

TPU・・・Tensor Processing Unit, google が開発したNPU。テンソルは行列表現できる多次元配列(データの集まり)です。

VPU・・・Vision Processing Unit, インテルが2016年に買収したMovidius 社のAIアクセラレーターNPU。Myriad2 MA2450など。

KPU・・・Knowledge Processing Unit, 仮想通貨採掘Canaan 社が開発した並列計算機NPU、同社のKendryte K210 に使われています。K210はRISC-VのCPUとKPU並列計算機がワンチップに収められたAIチップです。仮想通貨をマイニングするときの効率を追求するために並列計算機を自社開発したら、それがニューラルネットワークの計算にも使えるので発売したということでしょうか。

BPU・・・Brain Processing Unit, 中国のベンチャー企業Horizon Robotics社のNPU。

IPU・・・Intelligent Processor Unit, 英国のAIスタートアップ Graphcore社のNPU。GC200はTSMC 7nmプロセスで設計され、594億個のトランジスタを搭載し、1472個の浮動小数点演算ユニットを並列で持っています。

DPU・・・Deeplearning Processing Unit, 富士通のAIプロセッサDLUに搭載された整数演算NPU。Deep learning integer という16ビット整数演算で浮動小数点タイプに劣らない精度を出しています。

APU・・・AI Processing Unit, メディアテック社Mediatek のSocに搭載されたNPU。まぎらわしいのですが、AMDのGPU内臓CPUのことを、Accelerated Processing Unit、略してAPUと呼ぶことがあります。

QPU・・・Quantum Processing Unit, 量子コンピュータの量子ビットのことをQPUと呼びます。量子コンピュータは通常のコンピュータ(古典コンピュータ)とのハイブリッド形式で提供されます。QPUが得意な量子フーリエ変換(QFT)を爆速で処理できます。QPUは量子コンピュータが得意な計算をサブルーチンの様に処理します。NPUのように機械学習に使うこともできます。量子機械学習(QML)、量子人工知能です。

いずれのNPUも、ニューラルネットワークの機械学習と推論を高速で処理できるように、並列計算に特化した構成になっています。これはノイマン型とはちょっと違うコンピューターの構成になります。バベッジとかチューリングとかノイマンとか、現在のコンピューターを発明した人々がこのNPUの構成を知ったら何と言うでしょうか。「そうか、21世紀には新しいコンピューターが発明されたのか!」と言うんじゃないかと思います。NPUはチューリングマシンであることは間違いないのですが、従来の意味でプログラムは存在せず、しいて言えば学習済みニューラルネットワーク(分類器)が存在するということになります。

QPUは、量子コンピュータそのものであり、これを従来の古典コンピュータに組み込んで呼び出す時の呼称になります。

※参考記事

チューリングマシンの仕組みと歴史

tk80でチューリングマシンを学べ!

シンギュラリティ革命と量子コンピュータ

※参考書籍

CQ出版社、インターフェース2020年10月号

シンギュラリティ年表

2012年は奇跡の年です。ディープラーニングニューラルネットワークによる画像認識エンジンが画像認識コンテストで初優勝した年であり、キャットペーパー論文が発表され、同時に遺伝子編集のクリスパーキャス9酵素が論文発表され、ビットコイン財団が設立され、ヒッグス粒子が観測され素粒子論の標準模型が完成し、量子コンピューターの部品となる量子もつれの距離143kmの実験が成功した年です。シンギュラリティ革命の萌芽が全て出現し、もの凄い勢いで拡大し始めた年なのです。
シンギュラリティ年号起こった出来事
シンギュラリティ元年(2012年)DNNが画像認識コンテスト優勝。グーグルのキャットペーパー論文発表(教師無し学習だけでコンピューターが猫を認識できた)。音声認識ソフトgoogle now公開(apple siri は2011年公開)。クリスパーキャス9酵素の論文発表。ブロックチェーンを運営するビットコイン財団設立。CERNがヒッグス粒子検出を発表し素粒子論の標準模型が完成、人類は質量機構とヒッグス場を認識した(7月革命)。カナリア諸島で143kmの量子もつれテレポーテーション実験成功。カナダのD-Wave Systems社の量子アニーリングマシンを使ってタンパク質の折り畳み問題が計算された。
シンギュラリティ2年(2013年)カナダバンクーバーのWavesコーヒーショップに世界初のビットコインATMであるRobocoinマシンが稼働開始。NASA,Google,USRA(米国大学宇宙研究協会)が共同で、Quantum Computing AI Lab(量子コンピューターAI研究所)を設立。ミコロフらのword2vec論文が発表され自然言語処理の革命的発展が始まった。
シンギュラリティ3年(2014年)ケビン・エスベルトの遺伝子ドライブ論文発表。クリスパーキャス9を使って、クリスパーキャス9の遺伝子を組み込むことにより、種全体の遺伝子を操作できることが判明した。amazonがスマートスピーカーECHOを発売。米国ローレンスリバモア研究所の慣性核融合実験施設で、吸収エネルギーを核融合放出エネルギーが上回る「自己加熱」達成。
シンギュラリティ4年(2015年)DNNディープニューラルネットを用いた画像認識エンジンが人類のエラー率を下回った。中国で、ヒト生殖細胞の遺伝子編集実験。Google brain が ディープラーニング機械学習ライブラリTensorFlow のソースコードを無料公開。国連総会でSDGs採択。IPFSアルファ版リリース。オープンソース&ライセンスフリーCPUのRISC-V財団設立。OpenAI設立。
シンギュラリティ5年(2016年)クレイグベンターの研究グループが、53万塩基対の人工細胞DNA合成に成功し、JCVI-syn3.0 ミニマルセル(最小細胞)と名付けられた。人工生命体(原核細胞)の誕生である。スイス連邦工科大学のソーラープレーンが世界一周飛行に成功。太陽光エネルギー時代の幕開け。DNNディープニューラルネットを用いたalphagoが世界戦で優勝経験のある韓国のトップ棋士イセドル9段に4勝1敗と勝ち越した。IBMが量子コンピューターのクラウドサービス IBM Quantum Experience を公開。米国NISTがPost-Quantum Cryptographyプロジェクト開始。世界初の量子通信衛星「墨子号」の打ち上げ。
シンギュラリティ6年(2017年)DNNディープニューラルネットを用いた音声認識エンジンが人類のエラー率を下回った。機械学習を用いた囲碁AIソフトalphagoが囲碁チャンピオン中国の柯潔9段に3連勝し、将棋AIソフトponanzaが将棋名人に勝利した。Alibaba子会社Alipayが顔認証決済サービスを開始。Deepl機械翻訳サービス開始。自然言語処理の精度を飛躍的に向上させLLMの起源となった Transformer 論文 Attention is All you need が発表された。
シンギュラリティ7年(2018年)DNNディープニューラルネットを用いた自然言語認識エンジンがwikipedia読解問題で人類の正答率を超えた。LIDARレーザースキャナを搭載した世界初の市販車アウディA8発売。遺伝子編集によりHIV感染しにくくなった赤ちゃんが中国で誕生。米国アリゾナ州フェニックスでwaymoの自動運転タクシー商用運転開始(運転手なし自動運転レベル4)。耐量子暗号LWE方式を提案したOded Regevがゲーデル賞受賞。
シンギュラリティ8年(2019年)グーグルが量子超越性(量子コンピューターが特定課題においてシリコンなどの半導体による古典コンピューターの性能を超えていること)を実証。ビットコインで支払うことができるVISAデビットカードcoinbase cardサービス開始。IBMが量子コンピューターIBM Q System One発売。NII&NTTのエキスパートシステムが2019年大学入試センター試験英語科目で200点満点中185点(偏差値64.1)達成。RISC-V財団が米国の貿易規制から脱出するためにスイスに移転し、RISC-V international に移行した。
シンギュラリティ9年(2020年)ロチェスター大学の研究グループは15℃で超電導状態を示す炭素質水素化硫黄化合物を発見し、常温超電導の扉を開いた。新型コロナウイルス対策として人工合成されたmRNAワクチンが実用化。OpenAIの自然言語モデルGPT-3の人工合成ニュース記事の人間による識別率が52%を記録し識別不能を意味する50%に肉薄した。
シンギュラリティ10年(2021年)braveブラウザ1.19.86がIPFSを初めて標準搭載した。中米エルサルバドルでビットコインが法定通貨になった。IBM Quantum Summit 2021において127量子ビットの量子プロセッサ「Eagle」公開。IBMが2nmプロセスの試験製造に成功。
シンギュラリティ11年(2022年)中央アフリカ共和国でビットコインが法定通貨になった。NIST米国標準技術研究所が耐量子公開鍵暗号の最終候補CRYSTALS-KYBERを発表。米国ローレンスリバモア研究所でレーザー核融合の発生エネルギーが投入エネルギーを初めて超過した。2.05 メガジュール (MJ) のエネルギーを供給することで核融合のしきい値を超え、3.15 MJ の核融合エネルギー出力が得られた。OpenSSH9.0で耐量子暗号NTRUが実装された(capture now,decrypt later対策)。
シンギュラリティ12年(2023年)OpenAIが大規模言語モデルLLMを月額20ドルで使えるChatGPTplusを開始した。Metaが商用利用可能なオープンソースのLLMであるllama2を公開した。岐阜県の核融合科学研究所で中性子を出さないpB11核融合反応実証。中国で20万kWの高温ガス炉実証炉石島湾原子力発電所1号機が商業運転開始。
シンギュラリティ13年(2024年)EUROfusionがJET核融合実験炉で69MJの世界記録。Appleがios17.4から耐量子暗号PQ3をiMessageに導入すると発表。


投稿日

カテゴリー:

投稿者:

タグ:

コメント

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です