組み込みでDeep Learningにつかえるハードについて
Rasberry pi
シングルボードコンピュータ。手のひらサイズで値段も5000円とリーズナブルだが一人前のコンピューター。Linuxの練習にもうってつけ。クアッドコアだが機械学習としてはすこし非力。GPUもつかえない。電池で動く。何台もつなげてクラスター化する強者も。
スマホ
やはり今の時代にハードとしてスマホに注目しないわけにはいかない。Tensorflowならスマホ組み込みも。まだ開発版のみだが、アンドロイドもiosもどちらも遊べるらしい。
GPU
おなじみ。Deep Learning等は大量の行列演算を必要とする。GPUはもともとグラフィックスにフォーカスして作られていた演算回路だが、グラフィックス自体大量の行列演算だったため、Deep Learningに転用することで超高速な学習が可能になった。Deep learningやるなら必需品。ただ、これ自体を持ち出すのは困難。市販最速のNVIDIA GTX 1080 tiで10万円くらい。
FPGA
Field Programmable Gate Arrayの略。デジタル回路を自分で設計できる集積回路。集積回路といえば単一タスクを低電力低コストで高速な演算が可能だが、専門家しか作れなかったし、そもそも作ること自体が大変だった。FPGAは集積回路の設計をソフトで行うことで、柔軟に専門設計が可能になった。ちっちゃいので組み込みにも向いている。最近Scienceにのって話題になったGohst CytometryもFPGA使ってるそうな。(阪大、東大、理研AIPのコラボ。下で書くjetson化も視野に入れているらしい。)最近では各社がFPGAに取り組みだしている。Tensorflowも動かせるらしい。ただしやはり専門外ではとっつきにくい。ピンキリだがやすいので1万5千円くらい。論理回路設計がもとめられるのでぶっちゃけよくわからん。
jetson
NVIDIA組み込みモジュール。安価かつ高速でポータブルなGPUが使える。NVIDIA製ということで、Tensorflowも使えるのが嬉しい。値段は開発キットが599ドル(1ドル=114円換算で、6万8286円)で、製品に組み込んで出荷可能なProduction Moduleは1000個ロット時で399ドル(同、4万5486円)。256 CUDAコア(GTX 1080 tiで3584 cuda cores)なので、やはり学習済みモデルの運用がメインと思われる。
ディープラーニングに限らず、なにか作ったよとか、こんなの面白いよというのがあれば教えてください。最近ラズパイを持て余して困っています。
- 前の記事 : Parameter Tuning
- 次の記事 : 論文抄読で便利なサイト
- 関連記事 :