NEOD 高効率なAI処理のプロセッサー設計を開発

, , ,

2021年9月8日

 新エネルギー・産業技術総合開発機構(NEDO)はこのほど、東京工業大学との研究チームがエッジ機器で高効率な畳み込みニューラルネットワーク(CNN)推論処理を行うプロセッサーアーキテクチャーを開発し、大規模集積回路(LSI)を試作したと発表した。

 今後、同技術の活用により、例えばスマートフォンの先進的な拡張現実(AR)アプリケーションやロボットの柔軟な動作制御など、電力供給量などの制約が厳しいエッジ機器でも高度なリアルタイムAI処理の単独での実行が期待できる。

 従来の深く枝刈り(プルーニング)されたCNNの推論処理では、メモリへのアクセスが不規則になるため計算効率が低下するという課題があった。こうした中、NEDOと東工大の研究チームは、既存のCNNモデルを変形して高精度で高効率な処理ができる形式に変換するアルゴリズムを開発。さらに、このアルゴリズムを効率的に処理するための、入力データの平面シフトを扱う整形機構と直積型並列演算アレイを中核としたアーキテクチャーを提案した。

 これにより試作LSIによる実測で、最大26.5TOPS/Wという世界トップレベルの実効効率を達成。今回の開発により、クラウド側で実行していた高度なリアルタイムAI処理をエッジ側で実行でき、AIサービスのプライバシー確保やクラウドへの通信量の削減などが期待できる。

 研究チームは今後、同研究の試作チップで実証した技術をさらに発展させ、枝刈り後の精度向上のための学習技術や、RISC-V(リスクファイブ)プロセッサーなどとのシステムレベル統合技術の開発など、より高精度・高効率なニューラルネット推論チップの実現を目指し、スマートフォンやロボットなどのエッジ機器での高度なAIアプリケーションの実現を目指す。