Rは統計計算とグラフィックスのための言語・環境で、GNUプロジェクトの一つであり、AT&T(当時)のベル研究所*1でJohn M. Chambersと同僚により開発されたS言語・環境に似ています。RはSを別個に実装したものと考えられます。両者の仕様及び実装には幾つかの重要な違いが在りますが、S用に書かれたコードの多くは変更無しでRでも実行できます。
Rは多様な統計手法(線形・非線形モデル・古典的統計検定・時系列解析・判別分析・クラスタリング・その他)とグラフィックスを提供し、広汎な拡張が可能です。Sは高頻度で統計的手法による研究の手段の選択肢となりますが、Rを使えばそうした活動にオープンソースの道から参加できるようになります。
Rの強みの一つは、巧くデザインされた出版物並みのプロットを容易に作成できる点であり、これには必要なら数学記号や式を含めることもできます。グラフィックスにおける細かなデザインの標準設定に、これまで周到な配慮が払われてきていますが、ユーザーが完全に制御することもできます。
RはFree Software FoundationのGNU General Public Licenseの条項*2のもとで、ソースコードの形で入手できます。様々なUNIX(類似のシステムのBSDやLinuxを含む)・Windows・MacOSでは、ダウンロードすればそのままでコンパイル・使用できます。
【訳注】なお、現時点でのRの最新版は2013年5月16日にリリースされた3.0.1です。*3
Rはデータ操作・計算・そしてグラフィックス表示のためのソフト機能の統合された纏まりで、次のものが含まれます。
「環境」という言葉が使われているのは、Rは完全に計画され一貫性を持ったシステムであり、固有の目的のみを持って融通の利かない道具の積み重ねではない(他のデータ解析ソフトウェアは屡そうなのですが。)という特徴を示すためです。RはSと同様に真の計算機言語としてデザインされており、ユーザーは新しい関数を定義して新しい機能を追加できるようになっています。
システムそのものの大部分はSの方言Rで書かれており、ユーザーは使われているアルゴリズムを容易に吟味できるようになっています。計算量が特に多い作業にはC・C++・Fortranのコードを実行時にリンクして呼び出せます。経験豊富なユーザーはRのオブジェクトを直接に操作するCコードを書くこともできます。
多くのユーザーはRを統計システムと考えるでしょう。しかし、我々はRは環境であり、その中で統計的手法が実装されていると考えたいと思います。Rはパッケージにより(容易に)拡張できます。8種類程のパッケージがRの配布物セットと共に提供され、また、CRAN*4というインターネット・サイトの集合*5からは、現代統計学の幅広い分野をカバーする更に多くのパッケージが入手可能*6です。
Rには独自のLaTeX風の文書書式があり、それを用いて、纏まったドキュメントが幾つかの書式のオンライン文書や印刷物として提供されています。
本文は「What is R?」の日本語翻訳です。
S-PLUSはベル研究所のS言語の実装にInsightful*7が独自の拡張を加えた商用パッケージの名称で、処理系としてはSに準じます。
また、日本には(当時の)アイザック(現NTTデータセキスイシステムズ)が機能を独自に拡張しているS という商用パッケージも在ります。