メモ: ランダムフォレストの並列処理

概要

・randomForestSRCパッケージを使えば比較的楽
・windowsでのみ確認。他のOSは未確認。

やり方

というより参考サイトに書いてある内容を抜粋したもの。

下記サイトからrandomForestSRC_X.x.x.zipという名前のバイナリファイルをダウンロード。
http://www.ccs.miami.edu/~hishwaran/rfsrc.html

RのGUIから先ほどダウンロードしたものをインストールさせる。以前から導入しているものがある場合、先にアンインストールしておく。

あとはコア数を以下のように指定して通常通りランダムフォレストを実行するだけ。

Xに負の値を代入すれば最大コア数を指定できる。またはrandamForestSRCパッケージにて定義されているdetectCores()を使えばマシンのコア数を取得することも出来るのでこういう書き方もできる

参考

randomForestSRC-package {randomForestSRC} | inside-R | A Community Site for R
http://www.inside-r.org/node/167798