R で大規模データを処理する

R では大規模なデータを扱うのは無理で、そのようなデータは SAS や SPSS、またはなんらかのライブラリを使うということは常識なのか?
以下に大規模データを処理する方法を書いていくつもり...

RDBMS を使う

並列処理を使う

大規模な計算をする中で、並列処理が可能な計算を行う場合、以下のようなライブラリを利用することが可能。
基本的には「分割」→「演算」→「集約」の手順で実装してある。
もちろんマルチコアかクラスター環境じゃないとあまり意味が無いのだが…。

とりあえず、列挙。使い方はしばし待たれよ…。

大規模なメモリーを扱えるパッケージ

汎用

特定用途向け

R と Big Data 処理

参考リンク


トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2015-03-01 (日) 01:15:59