このページでは,
R FAQ
Frequently Asked Questions on R
Version 1.7-27, 2003-07-16
ISBN 3-901167-51-X
Kurt Hornik
(http://cran.r-project.org/doc/FAQ/R-FAQ.html ) の第 5.1章の日本語訳に取り組みます.
- 担当者: yy
- 修正案の取扱い: みなさまからの修正案は, 下記のコメント欄に書いていただければと思います. 修正そのものは (当面は) 担当者が行います.
- 分担翻訳の取扱い: 期限を区切って, それまでの間は担当者がひととおりの翻訳を行い, その後, 他の方に翻訳の分担をお願いすべきか検討したいと思います (期限: 2003年 8月 31日まで). よろしくお願いします.
- 注意点: そのまま訳すと意味がわかりにくくなりそうな場合, オリジナル (英文) の表現やレイアウト等を変更しています.
- 注意点: 訳注は { } で囲って示します.
R-FAQ 日本語訳全体の目次
5 R のアドオン・パッケージ (R Add-On Packages)
- R にはどのようなアドオン・パッケージが存在しますか? (Which add-on packages exist for R?)
- アドオン・パッケージをインストールするには? (How can add-on packages be installed?)
- アドオン・パッケージを使用するには? (How can add-on packages be used?)
- アドオン・パッケージを削除するには? (How can add-on packages be removed?)
- R のパッケージを作るには? (How can I create an R package?)
- R に貢献するには? (How can I contribute to R?)
5.1 R にはどのようなアドオン・パッケージが存在しますか? (Which add-on packages exist for R?)
- R 内のアドオン・パッケージ (Add-on packages in R)
- CRAN からのアドオン・パッケージ (Add-on packages from CRAN)
- Omegahat からのアドオン・パッケージ (Add-on packages from Omegahat)
- BioConductor からのアドオン・パッケージ (Add-on packages from BioConductor)
- その他のアドオン・パッケージ (Other add-on packages)
5.1.1 R 内のアドオン・パッケージ (Add-on packages in R)
R のディストリビューションにはつぎの追加パッケージが付属しています:
- ctest
- 古典的な検定 (Classical TESTs) 集. Ansari-Bradley, Bartlett, カイ 2乗 (chi-squared), Fisher, Kruskal-Wallis, Kolmogorov-Smirnov, t, および Wilcoxon 検定を含みます.
- eda
- 探索的データ解析 (Exploratory Data Analysis). 現在のところ, ロバストな直線の当てはめ, median polish および平滑化だけ含まれます.
- lqs
- 耐性回帰 (resistant regression) および共分散推定.
- methods
- R のオブジェクトについて正式に定義されたメソッドおよびクラスに加えて, 緑本 (Green Book) に記述されている, その他のプログラミング・ツール.
- modreg
- モダンな回帰 (MODern REGression): 平滑化および局所法.
- mva
- 多変量解析 (MultiVariate Analysis). 現在のところ, 含まれるコードは: 主成分分析, 正準相関分析, 計量多次元尺度法, 因子分析, 階層型および k-means クラスタリング.
- nls
- 非線型回帰ルーチン.
- splines
- 回帰スプライン (spline) 関数およびクラス.
- stepfun
- ステップ関数 (STEP FUNctions) を取り扱うためのコード. 経験累積分布関数を含みます.
- tcltk
- Tcl/Tk GUI 要素へのインターフェイスおよび言語のバインディング.
- tools
- パッケージの開発および管理のツール (Tools).
- ts
- 時系列 (Time Series).
5.1.2 CRAN からのアドオン・パッケージ (Add-on packages from CRAN)
下記のパッケージは, CRAN の src/contrib から入手可能です. (Recommended (推奨) が付いているパッケージは, R のすべてのバイナリー・ディストリビューションに含まれています.)
- AnalyzeFMRI
- ANALYZE 形式で格納された機能的磁気共鳴映像法 (fMRI) データセットの I/O, 可視化および分析のための関数.
- Bhat
- 一般的な尤度探索のための関数 (MLE, MCMC, CIs).
- CGIwithR
- R を使って CGI スクリプトを書くための機能.
- CircStats
- Circular Statistics ("Topics in Circular Statistics" by S. Rao Jammalamadaka and A. SenGupta, 2001, World Scientific に由来する).
- CoCoAn
- 制約付きコレスポンデンス分析 (Constrained Correspondence Analysis).
- DAAG
- "Data Analysis and Graphics Using R" by John H. Maindonald and W. John Brown, 2003 の例題と演習問題で用いられた種々のデータセット.
- DBI
- 共通データベース・インターフェイス (DBI) のクラスおよびメソッドの定義. このパッケージ内のすべてのクラスが仮想的なものなので, 種々の DBMS の実装によって拡張する必要があります.
- Davies
- Davies クォンタイル関数および一般化ラムダ分布のための関数.
- Design
- 当てはめに高度なモデル設計属性を格納することによる回帰モデリング, 検定, 推定, 妥当性検証, グラフィクス, 予測, および組版. Design は, (とくに生物統計学および疫学のアプリケーションのための) モデリングを支援・能率化する約 180の関数のコレクションです. これはまた, バイナリー/順序型ロジステイック回帰モデル, および右側打ち切りレスポンスに関する Buckley-James の重回帰モデルのための新しい関数を含み, ロジステイックおよび通常の線形モデルについて罰則付き最尤推定を実装します. Design は, ほとんどどのような回帰モデルでも機能しますが, とくに, ロジステイック回帰, Cox 回帰, 加速度故障時間モデル, 通常の線形モデル, および Buckley-James モデルで機能するように書かれました.
- Devore5
- "Probability and Statistics for Engineering and the Sciences (5th ed)" by Jay L. Devore, 2000, Duxbury のデータセットおよび標本分析.
- Devore6
- "Probability and Statistics for Engineering and the Sciences (6th ed)" by Jay L. Devore, 2003, Duxbury のデータセットおよび標本分析.
- EMV
- k-最近傍アルゴリズムによる行列内の欠損値の推定 (Estimation of missing values).
- GLMMGibbs
- Gibbs サンプリングによる一般化線形混合モデル (Generalised Linear Mixed Models).
- GRASS
- GRASS 地理情報システムと R とのインターフェイスで, GRASS 環境の内部から R を起動し, 選択された LOCATION_NAME および MAPSET に基づきます. 各種の R 関数についてそのインターフェイスのメタデータ構造に適合するようにラッパーおよびヘルパー関数が提供されます.
- GenKern
- 一般化ビン分割カーネル密度 (generalised binned kernel density) 推定値を生成し, 操作するための関数.
- GeneSOM
- 自己組織化マップ (Self-Organizing Maps (SOMs)) を用いて遺伝子をクラスタリングします.
- Hmisc
- データ分析に有用な関数, 高レヴェルのグラフィクス, ユーティリティ操作, 標本のサイズおよび検出力の計算, データセットのインポート, 欠損値の補完 (imputing), 高度な表の作成, 種々のクラスタリング, 文字列操作, S のオブジェクトの LaTeX コードへの変換, 変数の再コード化 (recoding), およびブートストラップ反復測定分析のための関数.
- HyperbolicDist
- 双曲型分布 (hyperbolic distribution) のための基本的な関数:確率密度関数, 分布関数, クォンタイル関数, 双曲型分布から観測値を生成するためのルーチン, および双曲型分布をデータに当てはめるための関数.
- ISwR
- "Introductory Statistics with R" by Peter Dalgaard, 2002, Springer のデータセット.
- KMsurv
- "Survival Analysis, Techniques for Censored and Truncated Data" by Klein and Moeschberger, 1997, Springer のためのデータセットおよび関数.
- KernSmooth
- カーネル平滑化 (および密度推定) のための関数. 書籍 "Kernel Smoothing" by M. P. Wand and M. C. Jones, 1995 に対応します. Recommended.
- MASS
- Venables and Ripley, "Modern Applied Statistics with S" の主要パッケージの関数およびデータセット. VR バンドルに含まれます. Recommended.
- MCMCpack
- マルコフ連鎖モンテカルロ (Markov chain Monte Carlo (MCMC)) パッケージ: 多数の統計モデルについての事後シミュレーションのための関数.
- MPV
- 書籍 "Introduction to Linear Regression Analysis" by D. C. Montgomery, E. A. Peck, and C. G. Vining, 2001, John Wiley and Sons のデータセット.
- Matrix
- 行列パッケージ.
- NISTnls
- NIST, the U.S. National Institute for Standards and Technology からの非線形最小二乗法のテスト例集.
- Oarray
- 任意のオフセットを持つ配列.
- PHYLOGR
- (パッケージ PDAP の PDSIMUL から得られるような) 系統学的にシミュレートされたデータセットの操作および分析, および GLS を用いる系統学に基づく分析.
- PTAk
- 非同一性メトリクスおよび罰則化をサポートする SVD (特異値分解) の一般化として, 任意のオーダーのテンソル (配列) を分解するための多元的手法. 他の多元的手法もいくつか含みます.
- R2HTML
- R のオブジェクトおよびグラフィクスを HTML 文書にエクスポートするための関数.
- RArcInfo
- Arc/Info V7.x のカヴァレッジ (coverages) およびデータをインポートするための関数.
- RColorBrewer
- ある変数にしたがって陰影を付けた素敵な地図を描くための ColorBrewer パレット.
- RMySQL
- R と MySQL データベース・システムとのインターフェイス.
- RODBC
- ODBC データベース・インターフェイス.
- ROracle
- R 用の Oracle データベース・インターフェイス・ドライヴァー. ProC/C++ 組込み SQL を用います.
- RQuantLib
- R の内部から QuantLib 関数 (のいくつか) へのアクセス手段を提供します;
現在のところ, いくつかのオプション価格付けおよび分析の関数に限られています.
QuantLib プロジェクトは, 計量ファイナンスのための包括的なソフトウエアの枠組みを提供することを目的としています.
- RSQLite
- SQLite 用のデータベース・インターフェイスの R ドライヴァー. R に SQLite データベース・エンジンを組み込みます.
- RSvgDevice
- Scalable Vector Graphics (SVG) のための新しい w3.org XML 標準を用いる R 用のグラフィクス・デバイス.
- RadioSonde
- ラジオゾンデ (典型的な, 気球に搭載する天候装置) によって集められたデータについて
SKEW-T,log p ダイアグラムおよび風速分布を読み込み, プロットするためのプログラム集.
- RandomFields
- 種々の手法を用いてランダム場を生成します.
- Rcmdr
- プラットフォーム独立な, R 用の基本統計解析 GUI (グラフィカル・ユーザー・インターフェイス). tcltk パッケージに基づいています.
- RmSQL
- R と mSQL データベース・システムとのインターフェイス.
- Rwave
- 1次元信号 の時間-頻度分析のための環境 (とくに, ノイズのある信号のウェーブレットおよび Gabor 変換のための). 書籍 "Practical Time-Frequency Analysis: Gabor and Wavelet Transforms with an Implementation in S" by Rene Carmona, Wen L. Hwang and Bruno Torresani, 1998, Academic Press に基づいています.
- SASmixed
- "SAS System for Mixed Models" by R. C. Littell, G. A. Milliken, W. W. Stroup and R. D. Wolfinger, 1996, SAS Institute における例に対応するデータセットおよびサンプル線形混合効果分析.
- SenSrivastava
- "Regression Analysis, Theory, Methods and Applications" by A. Sen and M. Srivastava, 1990, Springer-Verlag からのデータセット集.
- SparseM
- スパースな行列のための基本的な線形代数.
- StatDataML
- StatDataML の読み書き.
- SuppDists
- R の中にビルドされる分布を補う 10種類の分布 (Inverse Gauss, Kruskal-Wallis, Kendall のタウ (Tau), Friedman のカイ 2乗 (chi squared), Spearman のロー (rho), 最大化 F 比 (maximum F ratio), Pearson 積率相関係数, Johnson 分布, 正規スコア, および一般化超幾何分布).
- VLMC
- VLMC (可変長マルコフ連鎖 (Variable Length Markov Chain)) モデルの推定, 予測, およびシミュレーション (ブートストラップ) のための関数, クラスおよびメソッド.
- XML
- XML 文書および DTDs を読むための機能.
- abind
- 多次元配列を組み合せます.
- acepack
- 回帰変換を選択するための ACE (交替条件付き期待値 (Alternating Conditional Expectations)) および AVAS (回帰のための加法性と分散の安定化 (Additivity and VAriance Stabilization for regression)) 手法.
- adapt
- 20次元までの適応型求積法 (Adaptive quadrature).
- ade4
- 多変量データ解析およびグラフィクス表示.
- agce
- 成長曲線の実験の解析.
- akima
- 不規則グリッド・データについての線形あるいは 3次スプライン補間.
- amap
- もう 1つの多次元解析パッケージ.
- anm
- 統計的/経験的ダウンスケーリングについてのアナログ・モデル.
- ape
- 系統学および進化の解析 (Analyses of Phylogenetics and Evolution).
括弧でくくられた形式 (標準 Newick 形式) での系統樹の読込みおよびプロット,
系統学の枠組みでの比較データの解析, 多様化および大進化の解析, 対立遺伝子およびヌクレオチド・データからの距離の計算, インターネット経由で GenBank からヌクレオチド配列を読み込むのための関数, そして, Mantel の検定, 最小全域木 (minimum spanning tree), あるいは種々のアプローチに基づく人口パラメーター シータ (theta) の計算のようないくつかのツールを提供します.
- ash
- 1次元および 2次元密度推定のための David Scott の ASH ルーチン.
- aws
- 適応型重み平滑化 (adaptive weights smoothing) を実行するための関数.
- bindata
- 相関のある人工的バイナリー・データの生成.
- blighty
- 英国の海岸線を描くための関数.
- boolean
- ブール型ロジットおよびプロビット: ブール型仮説を検証するための手続き.
- boot
- 書籍 "Bootstrap Methods and Their Applications" by A. C. Davison and D. V. Hinkley, 1997, Cambridge University Press からのブートストラップのための関数およびデータセット. Recommended.
- bootstrap
- 書籍 "An Introduction to the Bootstrap" by B. Efron and R. Tibshirani, 1993, Chapman and Hall についてのソフトウエア (ブートストラップ, 交差検証 (cross-validation), ジャックナイフ), データおよび正誤表.
- bqtl
- inbred crosses およびリコンビナント近交系のための QTL マッピング・ツールキット. 最尤法およびベイジアン・ツールを含みます.
- brlr
- 偏りを減らしたロジスティック回帰 (Bias-reduced logistic regression): 罰則付き最大尤度によってロジスティック回帰モデルを当てはめます.
- car
- 応用回帰への手引 (Companion to Applied Regression). 応用回帰, 線形モデル, および一般化線形モデルのための関数を含み, 回帰診断, とくにグラフィカルな診断手法に重点が置かれています.
- cclust
- 凸クラスタリング手法 (Convex clustering methods). k-means アルゴリズム, オンライン・アップデート・アルゴリズム (Hard Competitive Learning) および Neural Gas アルゴリズム (Soft Competitive Learning), そして, データセット内のクラスターの数を発見するためのいくつかのインデクスの計算を含みます.
- cfa
- configuration {変数値のあらゆる組合せ} の頻度の解析.
- chron
- 時間的オブジェクト (時刻および日付) に作用するパッケージ.
- class
- クラス分類 (k-最近傍 (k-nearest neighbor) および LVQ) のための関数. VR バンドルに含まれます. Recommended.
- classPP
- 教師付きクラス分類のための射影追跡法 (Projection Pursuit).
- clim.pact
- 月次・日次データについての気候分析およびダウンスケーリング.
- cluster
- クラスター分析のための関数. Recommended.
- cmprsk
- 競合するリスクにおける subdistribution 分布関数の推定, 検定および回帰モデリング.
- cobs
- 制約付き B-スプライン (Constrained B-splines): 線形計画による定性的制約付き (回帰) 平滑化.
- coda
- マルコフ連鎖モンテカルロ (Markov chain Monte Carlo (MCMC)) シミュレーションについての出力の分析および診断.
- combinat
- 組合せ論のユーティリティ.
- conf.design
- 交絡および一部実施計画 (confounded and fractional factorial designs) を構築・操作するための一続きの簡単なツール群.
- cramer
- 多変量ノンパラメトリック Cramer 検定のためのルーチン.
- date
- 日付を取り扱う関数. そのもっとも有用な点は, 入力の日付ベクトルを 8/30/53, 30Aug53, 30 August 1953, ..., August 30 53 といった形式のいずれでも受け付けることです (これらの日付形式を混在させるのも可).
- dblcens
- 二重打ち切り (doubly censored) データに関する生存分布の NPMLE {nonparametric maximum likelihood estimator} を計算します.
- deal
- 連続および (あるいは) 離散変数を持つベイジアン・ネットワークを習得し, データから比較することができます.
- deldir
- 平面の点集合の (その平面全体に関する) Delaunay 三角分割, および Dirichlet あるいは Voronoi 分割 (tesselation) を計算します.
- diamonds
- 平面上, あるいは 8面体, 20面体の表面に, アパーチャー 4 の (aperture-4) ダイアモンド分割を描くための関数. グリッドのサンプリングあるいは分析に用います.
- dichromat
- 二色型色覚者 (dichromats) のための配色. 赤-緑の区別をなくすことにより, 色盲の影響をシミュレートします.
- diptest
- 単峰性について Hartigan の dip 検定統計量を計算します.
- dispmod
- GLMs (一般化線形モデル) における分散性 (dispersion) をモデリングするための関数.
- dr
- 次元縮小 (dimension reduction) 回帰の当てはめのための関数, 手法およびデータセット. pHd (principal Hessian directions) および逆回帰 (inverse regression) 手法である SIR (sliced inverse regression) と SAVE (sliced average variance estimation) を含みます.
- dse
- 動的システム推定 (Dynamic System Estimation), 多変量時系列パッケージ.
下記のものが入っています: dse1 (ベース・システム. 多変量 ARMA および状態空間モデルを含みます), dse2 (推定技法の評価, 予測, および予測モデルの評価のための機能拡張), tframe (時間の表現に独立であるコードを書くための関数), および setRNG (S と R において同一の乱数群を生成するための仕組み).
- e1071
- the Department of Statistics at TU Wien (E1071) で用いられている雑多な関数. モーメント, 短時間フーリエ変換, 独立成分分析, 潜在クラス分析, サポートベクターマシン, ファジー・クラスタリング, 最短経路計算, bagged clustering 等を含みます.
- effects
- 線形および一般化線形モデルに関する (たとえば, 相互作用についての) グラフィクスおよび表形式での効果表示 (effect displays).
- eha
- 生存分析およびイベント履歴分析 (event history analysis) のパッケージ.
- ellipse
- 楕円, および楕円型の信頼域を描くためのパッケージ.
- emme2
- EMME/2 データバンクから読み込む (に書き込む) ための関数.
- emplik
- 右側打ち切りの可能性のある (possibly right censored) データからの平均値/クォンタイル/ハザードについての経験的尤度比.
- evd
- 極値分布 (extreme value distributions) の関数.
シミュレーション, 分布, クォンタイルおよび密度関数を
1変量, 2変量および (シミュレーションについて) 多変量パラメトリック極値分布に拡張し, 1変量および 2変量モデルについての最尤推定を計算する当てはめ関数を提供します.
- exactLoglinTest
- 対数線形モデルについてのモンテカルロ正確確率検定 (exact tests).
- exactRankTests
- Streitberg/Roehmel シフト・アルゴリズム (shift algorithm) の実装を用いて正確な p-値とクォンタイルを計算します.
- fastICA
- 独立成分分析 (Independent Component Analysis (ICA)) および射影追跡法 (Projection Pursuit) を実行するための FastICA アルゴリズムの実装.
- fdim
- フラクタル次元を計算するための関数.
- fields
- 空間データに重点を置いた, 曲線および関数の当てはめのためのプログラム集. 実装されている主な手法には, 3次 (cubic) スプラインおよび 薄板(thin plate) スプライン, universal Kriging および大規模データセットのための Kriging が含まれます. その主要な性質は, R に実装されている任意の共分散関数を空間的予測に用いることができるということです.
- flexmix
- 柔軟な混合モデリング (Flexible Mixture Modeling): EM アルゴリズムを用いる回帰モデルの有限混合についての一般的な枠組み.
- foreign
- Minitab, SAS, SPSS, Stata 等の統計処理ソフトウエアによって格納されたデータを読み書きするための関数. Recommended.
- forward
- 線形および一般化線形回帰モデルにおけるロバストな分析のための前方検索 (forward search) によるアプローチ.
- fpc
- 不動点クラスター (Fixed point clusters), クラスター状回帰および判別プロット.
- fracdiff
- fractionally differenced ARIMA(p,d,q) モデル (Haslett and Raftery, Applied Statistics, 1989) のパラメーターの最尤推定.
- g.data
- 遅延データ (delayed-data) パッケージ (DDP's) を生成・保守します.
- gafit
- 曲線の当てはめのための遺伝的アルゴリズム (Genetic algorithm).
- gbm
- 一般化ブースト回帰モデル (Generalized Boosted Regression Models): Freund と Schapire の AdaBoost アルゴリズムおよび J. Friedman の勾配ブースティング・マシン (gradient boosting machine) への拡張を実装します. 最小二乗についての回帰手法, 絶対損失, ロジスティック, Poisson, Cox 比例ハザード部分尤度 (Cox proportional hazards partial likelihood), および AdaBoost 指数損失 (exponential loss) を含みます.
- gee
- 依存データについての GLMs (一般化線形モデル) のための Liang/Zeger 一般化推定方程式 (generalized estimating equation) によるアプローチの実装.
- geepack
- 平均, 尺度 (scale) および相関構造におけるパラメーターに対する, 平均リンク, 尺度リンクおよび相関リンクを用いた, 一般化推定方程式 (generalized estimating equation) 解決器. クラスター化されたカテゴリー型応答を取り扱うこともできます.
- genetics
- 遺伝子データを取り扱うためのクラスおよびメソッド. 単一のマーカーから複数の染色体上の複数のマーカーまでの遺伝子型およびハプロタイプを表現するためのクラス, および対立遺伝子の頻度を計算する, ホモ/ヘテロ接合体にフラグを付ける, 所定の対立遺伝子のキャリアーにフラグを付ける, 不均衡を計算する, Hardy-Weinberg 平衡を検定する, ... ための関数を含みます.
- geoR
- モデルに基づく手法を含む, 地球統計学的 (geostatistical) データ分析を実行するための関数.
- geoRglm
- 一般化線形空間モデル (generalised linear spatial models) における推論のための関数.
- gld
- 一般化 (Tukey) ラムダ分布 (generalised (Tukey) lambda distribution) のための基本的な関数.
- glmmML
- ランダムな切片 (intercept) を持つ一般化線形モデルのための最尤推定 (Maximum Likelihood) によるアプローチ.
- gpclib
- Alan Murta の C ライブラリーに基づく R 用の一般的な多角形クリッピングのルーチン.
- grasper
- R 用の一般化回帰分析および空間的予測.
- gregmisc
- Gregory R. Warnes によって作成・保守されている雑多な関数.
- grid
- グリッド・グラフィクス・パッケージ. グラフィクス・レイアウト能力の書き直しに, 対話的操作 (interaction) のためのいくつかのサポート機能が加えられています. Recommended (ヴァージョン 1.8.0 用の R のディストリビューションに統合される予定です).
- gss
- 平滑化スプラインを用いる構造的多変量関数推定のための包括的なパッケージ.
- gstat
- 多変量地球統計学的モデリング, 予測およびシミュレーション.
バリオグラム (variogram) モデリングについての下記のコードを含みます:
simple, ordinary および universal point あるいは block (co)kriging,
逐次型ガウスあるいは指標 (共) シミュレーション ((co)simulation), および地図プロット関数.
- gtkDevice
- R-GNOME インターフェイスと独立に用いることのできる, GTK グラフィクス・デバイス・ドライバー. Gtk の描画領域ウィジェットを用いて (たとえば, RGtk を用いて), GUI 内の組込み要素として R デバイスを生成するのに用いることができます.
- haplo.score
- 連鎖の相 (phase) が不明瞭な場合のハプロタイプを持つ形質の関連性についてのスコア検定.
- hdf5
- NCSA HDF5 ライブラリーとのインターフェイス.
- hier.part
- 階層的分割 (Hierarchical Partitioning): 多変量データセットの分散分割.
- homals
- 等質性分析 (Homogeneity Analysis (HOMALS)) パッケージ. オプションとして Tcl/Tk インターフェイスを備えています.
- hwde
- Hardy-Weinberg 平衡からの逸脱, および遺伝子座間の独立性についてのモデルおよび検定.
- ifs
- 反復関数系 (Iterated Function Systems) による分布関数推定法.
- ineq
- 不平等, 集中および貧困の尺度, および Lorenz 曲線 (経験的および理論的な).
- ipred
- クラス分類と回帰における直接・間接ブートストラップ集約による, また同様に予測エラーのリサンプリングに基づく推定量による, 改良型予測モデル (Improved predictive models).
- ismev
- "An Introduction to Statistical Modeling of Extreme Values" by S. Coles, 2001, Springer において実行される諸計算をサポートするための関数. その関数群はつぎのグループに分けることができます: 最大値/最小値, 順序統計, 閾値超過のピーク (peaks over thresholds) および点過程.
- its
- 不規則時系列 (irregular time series) を取り扱うための S4 クラス.
- knnTree
- k-最近傍 (k-nearest neighbor, k-nn) クラス分類器を構築, あるいはそれを用いて予測します. 交差検証 (cross-validation) を用いて, k の選択, 変数の選択 (前進あるいは後退選択による), およびスケーリングの選択 (スケーリングなし, 列を SD {標準偏差 (standard deviation)} でスケーリング, 列を MAD {平均絶対偏差 (mean absolute deviation)} でスケーリング, の中から選択) を行います. 完成したクラス分類器は, 各葉に 1つの k-nn クラス分類器を持つようなクラス分類木で構成されることになるでしょう.
- lars
- 最小角度回帰 (Least Angle Regression), Lasso and Forward Stagewise: lasso 列の全体を, 単一の最小二乗当てはめのコストで当てはめるための効果的な手続き.
- lasso2
- 回帰問題を解くためのルーチンおよび文書. ただし, Osborne et al. (1998) のアルゴリズムに基づいて, 推定値に L1 制約を課します.
- lattice
- 格子のグラフィクス, Trellis Graphics 関数の実装. Recommended.
- leaps
- 所与のリグレッサー (regressors) 候補の集合について, 最良の部分集合を求める全数探索を実行するパッケージ. 分枝限定アルゴリズムを用います. また, 所要時間を減らす多数の技法を用いて探索を実行します.
- lgtdl
- 経時 (longitudinal) データ・オブジェクトのための手法集.
- lme4
- 線形および一般化線形混合効果モデルを当てはめます.
- lmtest
- 書籍 "The linear regression model under test" by W. Kraemer and H. Sonnberger, 1986, Physica からの線形回帰モデルの仮定に基づく検定集.
- locfit
- 局所回帰 (Local Regression), 尤度および密度推定.
- logspline
- 対数スプライン (Logspline) 密度推定.
- lokern
- 適応型局所/大域的プラグイン・バンド幅選択を用いるカーネル回帰平滑化.
- lpridge
- 局所多項式 (リッジ (ridge)) 回帰.
- maptools
- 地理データ, とくに ESRI シェイプファイル (shapefiles), の操作・読込みを行うためのツール集.
- maptree
- 階層型クラスタリングとクラス分類と回帰木からモデルをグラフ化およびマッピングのための関数 (実行例のデータ付き).
- maxstat
- いくつかの p-値近似法による最大選択 (maximally selected) ランクおよび Gauss 統計.
- mclust
- モデルに基づくクラスター分析 (Model-based cluster analysis): MCLUST の 2002年ヴァージョン.
- mclust1998
- モデルに基づくクラスター分析 (Model-based cluster analysis): MCLUST の 1998年ヴァージョン.
- mda
- 混合判別分析 (mixture discriminant analysis (MDA)), 可変 (flexible) 判別分析 (FDA), 罰則付き (penalized) 判別分析 (PDA), 多変量加法回帰スプライン (additive regression splines (MARS)), 適応型 back-fitting スプライン (BRUTO), および罰則付き回帰についてのコード.
- meanscore
- ロジスティック回帰モデルにおける欠損共変量データについての平均スコア法 (Mean Score method).
- merror
- 測定の正確さと精度 (Accuracy and precision).
- mgcv
- GAMs {一般化加法モデル}, および他の一般化リッジ回帰問題のためのルーチン. GCV あるいは UBRE による多重平滑化パラメーター選択を伴う. Recommended.
- mimR
- R におけるグラフィカル・モデリングのための MIM {Mixed Interaction Models} との R のインターフェイス.
- mix
- 混合カテゴリカルおよび連続データについての推定/多重補完 (multiple imputation) プログラム.
- mlbench
- 人工および実世界の機械学習のベンチマーク問題集. ボストンの住宅データを含みます.
- moc
- ユーザー定義の分布および曲線によって, 多変量観測値についての種々の混合モデルを当てはめます.
- msm
- 連続時間マルコフ多状態モデルを, 任意時点に観測された (オプションとして, 誤分類された応答を伴う) カテゴリカル・プロセスに当てはめるための関数. 推移率あるいは誤分類率について共変量の当てはめも行います.
- muhaz
- 生存分析におけるハザード関数の推定.
- multcomp
- 一元配置のための多重比較の方法.
- multidim
- 多次元記述統計: 因子的手法およびクラス分類.
- multiv
- 階層型クラスタリング, 分割, 結合エネルギー・アルゴリズム, Sammon マッピング, PCA {主成分分析 (principal component analysis)} およびコレスポンデンス分析のための関数.
- mvnmle
- 欠損値を持つ多変量正規 (multivariate normal) データについての ML {最尤 (maximum likelihood)} 推定.
- mvtnorm
- 多変量正規および t 分布.
- ncomplete
- バイナリー回帰に対して regression depth method (RDM) を実行するための関数.
観測値のデータセットからいくつかのデータを削除する際, 残りのデータセットが完全分離を持つことができる削除可能な観測値の数の最小値を近似するために用います.
- negenes
- ランダムなトランスポゾン変異誘発実験のデータに基づいて, Gibbs サンプラーを用い, ゲノム内の重要遺伝子 (essential genes) の数を推定します.
- netCDF
- netCDF ファイルからデータを読み込みます.
- nlme
- ガウス型線形および非線形混合効果モデルを当てはめ・比較します. Recommended.
- nlmeODE
- 微分方程式を用いる混合効果モデリングについて nlme および odesolve パッケージを比較します.
- nlrq
- 非線形クォンタイル回帰.
- nnet
- 単一隠れ層パーセプトロン ("フィード‐フォワード・ニューラル・ネットワーク"), および多項型対数線形モデルについてのソフトウエア. VR バンドルに含まれます. Recommended.
- norm
- 欠損値を持つ多変量正規データセットの分析.
- normalp
- オーダー p の正規分布 (一般誤差分布) についてのユーティリティ集.
- normix
- 1次元正規混合モデルのクラス (たとえば, 密度推定あるいはクラスタリング・アルゴリズムの研究および教育のための); 広く用いられている Marron-Wand 密度を提供します.
- noverlap
- バイナリー回帰に対して regression depth method (RDM) を実行するための関数. 観測値のデータセットにもはや重複がなくなるように削除する必要のある観測値の数の最小値, つまり, 重複量, を近似するために用います.
- npmc
- ノンパラメトリック多重比較 (Nonparametric Multiple Comparisons): 特定の分布を仮定することなく, 一元配置 (one-way layout) についての同時ランク検定方法を提供します.
- odesolve
- 常微分方程式 (Ordinary Differential Equation (ODE)) 解決器 lsoda 用のインターフェイス. ODEs は R の関数として表現されます.
- orientlib
- 方位 SO(3) データの表現, 変換および表示.
- oz
- オーストラリアの海岸線および州境をプロットするための関数.
- pamr
- Pam: マイクロアレイについての予測分析 (Prediction Analysis for Microarrays).
- panel
- モデルをパネル・データに当てはめるための関数およびデータセット.
- pastecs
- 時空間生態学系列 (Space-Time Ecological Series) の分析のためのパッケージ.
- pcurve
- 主曲線 (principal curve) を任意次元の数値多変量データセットに当てはめます. 診断プロットを作ります. また, Bray-Curtis および他の距離行列を計算し, 多次元尺度および主成分分析を実行します.
- pear
- 周期型自己回帰分析 (Periodic Autoregression Analysis).
- permax
- DNA 配列データのある種の基礎的な分析 (とくに, 2つのタイプの組織間での発現レヴェルの比較に関して) を容易にすることを意図した関数.
- pinktoe
- S の木を HTML/Perl ファイルに変換します. これらのファイルは対話的な木の走査 (traversal) に用いることができます.
- pixmap
- ビットマップ・イメージのインポート, エクスポート, プロットおよびその他の操作のための関数.
- pls.pcr
- PLS {partial least squares} および PCR {principal component regression} による多変量回帰.
- polspline
- C. Kooperberg および共著者による, 多項式スプライン当てはめルーチン・ハザード回帰, ハザード推定, 対数スプライン, lspec {logspline estimation of a spectral distribution}, polyclass {polychotomous regression and multiple classification}, および polymars {multivariate adaptive polynomial spline regression} のためのルーチン.
- polynom
- 一変量多項式操作についてのクラスを実装するための関数のコレクション.
- pps
- 層別単純ランダム・サンプリング (stratified simple random sampling) について, PPS (サイズに比例する確率 (probability proportional to size)) サンプリングを用いてサンプルを選択し, PPS サンプリングについての Sampford の手法についての結合包含確率 (joint inclusion probabilities) を計算するための関数.
- prabclus
- クラスタリングについての距離に基づくパラメトリック・ブートストラップ検定. 主に, 存在-不在 (presence-absence) データ (種の分布図のクラスタリング) について考慮されます. Jaccard および Kulczynski の距離尺度, MDS スコアのクラスタリング, および最近傍に基づくノイズ検出.
- princurve
- 主曲線を任意次元の点の行列に当てはめます.
- pspline
- m 次導関数上の罰則付きの平滑化スプライン (Smoothing splines with penalties).
- qtl
- QTLs {量的形質遺伝子座 (quantitative trait loci)} を同定するための実験的交配の分析.
- quadprog
- 二次計画問題を解くために用います.
- quantreg
- クォンタイル回帰および関連する手法.
- qvcalc
- 近似誤差 (approximation error) の quasi-variances および関連する尺度を計算するための関数.
- randomForest
- Breiman の random forest クラス分類器.
- relimp
- 線形あるいは一般化線形モデルにおける予測変数の相対的重要性 (relative importance of predictors) についての推論を容易にするための関数.
- rgenoud
- 導関数を用いる遺伝的最適化 (GENetic Optimization Using Derivatives) の R ヴァージョン.
- rimage
- イメージ処理のための関数. Sobel フィルター, ランク・フィルター, fft, ヒストグラム均等化 (histogram equalization), および JPEG ファイルの読み込みを含みます.
- rmeta
- バイナリー (2値) による結果の 2つのサンプルの比較についての, 単純な固定およびランダム効果 (fixed and random effects) のメタ分析のための関数.
- rpart
- 再帰的分割 (Recursive PARTitioning) および回帰木. Recommended.
- rpvm
- PVM (Parallel Virtual Machine) との R のインターフェイス. PVM APIs とのインターフェイス, およびその使用のための実行例と文書を提供します.
- rqmcmb2
- クォンタイル回帰についてのマルコフ連鎖周辺ブートストラップ (Markov chain marginal bootstrap).
- rsprng
- SPRNG (Scalable Parallel Random Number Generators) APIs とのインターフェイス, およびその使用のための実行例と文書を提供します.
- sampfling
- Sampford サンプリング・アルゴリズムの修正ヴァージョンを実装します. 母集団における各ユニットに所与の量を割り当てるとき, サンプルは, そのサンプルに含まれるユニット群の量の積に比例する確率で抽出されます.
- sca
- 単純な成分分析 (Simple Component Analysis).
- scatterplot3d
- 3次元(3D) 点群 (point cloud) を透視図的にプロットします.
- seao
- 単純な進化型アルゴリズム最適化 (Simple Evolutionary Algorithm Optimization).
- seao.gui
- 単純な進化型アルゴリズム最適化 (Simple Evolutionary Algorithm Optimization): グラフィカル・ユーザー・インターフェイス.
- sem
- 一般線形構造方程式モデル (Structural Equation Models) (観測および非観測変数を持つ) を, RAM {Reticular Action Model} アプローチを用いる最尤法によって当てはめるための関数.
- serialize
- 接続 (connections) へのシリアル化のための単純なインターフェイス.
- session
- R のセッションとの対話, 保存および復元のための関数.
- sgeostat
- 地球統計学的 (geostatistical) モデリングのためのオブジェクト指向の枠組み
- shapefiles
- ESRI シェイプファイル (shapefiles) を読み書きするための関数.
- sm
- 書籍 "Applied Smoothing Techniques for Data Analysis: The Kernel Approach with SPLUS Illustrations" by A. W. Bowman and A. Azzalini (1997), Oxford University Press とリンクしたソフトウエア.
- sma
- 探索的 (統計的) マイクロアレイ分析のための関数.
- sn
- 非対称正規 (skew-normal) 確率分布を操作し, スカラーおよび多変量の場合に, それらの分布をデータに当てはめるための関数.
- sna
- 社会ネットワーク分析のためのツール各種. ノードおよびグラフ‐レヴェルのインデクス, 構造的距離および共分散法, 構造同値の検出, p* モデリング, およびネットワークの可視化を含みます.
- snow
- 簡単なワークステーションのネットワーク (Simple Network of Workstations (NOWs)): R での簡単な並列計算をサポートします.
- sound
- R 用のサウンド・インターフェイス: .wav ファイルを扱うための基本的な関数およびサウンドのサンプル.
- spatial
- "Modern Applied Statistics with S" by W. Venables and B. Ripley からの kriging および点パターン分析のための関数. VR バンドルに含まれます. Recommended.
- spatstat
- 2次元点パターンについてのデータ分析およびモデリング. multitype 点および空間共変量を含みます.
- spdep
- 空間的重み行列 (spatial weights matrix) のオブジェクトを, 多角形の隣接関係や, 距離と分割 (tesselations) による点パターンから, これらのオブジェクトを要約し, 空間データ分析でそれらを使えるように, 生成するための関数のコレクション; 空間的自己相関についての検定のコレクション. 大域的な Moran の I および Geary の C, 局所的な Moran の I, 大域的および局所的な Moran の I についての鞍点 (saddlepoint) 近似を含みます; そして, 空間的同時自己回帰 (spatial simultaneous autoregressive (SAR)) モデルを推定するための関数. (以前は下記の 3つのパッケージでした: spweights, sptests, および spsarlm.)
- splancs
- 空間および時空間点のパターン分析の関数.
- statmod
- 雑多な生物統計学的モデリングの関数.
- strucchange
- 線形回帰モデルにおける構造的変化についての種々の検定.
- subselect
- あるデータセット全体の代わりとなる変数の部分集合について, その品質を評価し, 種々の評価基準の下で最適となる部分集合を探索する関数のコレクション.
- survey
- 層別の, クラスター抽出された, 不均等な重み付きの調査サンプルについての要約統計量, 一般化線形モデル, および一般最尤推定.
- survival
- 生存分析のための関数. 罰則付き尤度を含みます. Recommended.
- survrec
- 反復性 (recurrent) イベント・データについての生存分析.
- systemfit
- 通常の最小二乗法 (Ordinary Least Sqaures (OLS)), 2段階最小二乗法 (Two-Stage Least Squares (2SLS)), および 3段階最小二乗法 (Three-Stage Least Squares (3SLS)) を用いる連立方程式を当てはめるための関数.
- tapiR
- R において (英国) 議会の情報にアクセスするためのツール.
- tensor
- 配列のテンソル積.
- tkrplot
- Tk ウィジェットに R のグラフィクスを置くための簡単な仕組み.
- tree
- クラス分類および回帰木.
- tripack
- 制約付き 2次元 Delaunay 三角分割 (triangulation) パッケージ.
- tseries
- 非線形モデリングに重点を置いた時系列分析のためのパッケージ.
- twostage
- 平均スコア法 (Mean Score method) を用いる 2段階研究 (two-stage-studies) の最適デザインのための関数.
- vardiag
- 対話的バリオグラム診断 (variogram diagnostics).
- vcd
- 書籍 "Visualizing Categorical Data" by Michael Friendly に基づく関数およびデータセット.
- vegan
- 植生学者 (vegetation scientists) および群集生態学者 (community ecologists) のための種々のヘルプ関数
- waveslim
- 時系列分析のための基本的なウェーブレット・ルーチン.
- wavethresh
- 1次元および 2次元ウェーブレット統計および変換を実行するためのソフトウエア.
- wle
- 重み付き尤度アプローチによるロバストな統計的推論.
- xgobi
- グラフィカル・データ分析についての XGobi および XGvis プログラムとのインターフェイス.
- xtable
- データを LaTeX および HTML の表にエクスポートします.
より詳しい情報については, CRAN の src/contrib/PACKAGES をご参照ください.
また, CRAN の src/contrib/Devel ディレクトリーには, まだ "開発中" の, あるいは現在の開発ヴァージョンだけに存在する機能に依存しているパッケージが含まれています. 有志の方々には, もちろん, これらを試してみるようにお誘いします. CRAN のこの領域には現在以下のものが含まれています:
- Dopt
- D-optimal の実験的デザインを発見します.
- RPgSQL
- PostgreSQL のテーブルに格納されたデータにアクセスするためのメソッドを提供します.
Provides methods for accessing data stored in PostgreSQL tables.
- Rmpi
- MPI (Message-Passing Interface) APIs とのインターフェイス (ラッパー).
また, C(++) や FORTRAN よりも R で簡単に MPI プログラミングを書けるようにするための, 対話的な R slave 機能を提供します.
- dseplus
- dse, 動的システム推定 (Dynamic System Estimation) 多変量時系列パッケージ, への拡張. PADI, juice and monitoring 拡張を含みます.
- ensemble
- 3つのクラス分類器のアンサンブル.
- gllm
- 不完全な分割表の対数線形モデルのためのルーチン. EM および Fisher スコアリングのアプローチによる, いくつかの潜在クラス (latent class) モデルを含みます.
- pls
- 一変量部分最小二乗回帰 (Univariate Partial Least Squares Regression).
- runStat
- 中央値および平均値を実行します.
- write.snns
- データ・フレームあるいは行列から SNNS {Stuttgart Neural Network Simulator} パターン・ファイルを書くための関数.
5.1.3 Omegahat からのアドオン・パッケージ (Add-on packages from Omegahat)
CRAN サイトの src/contrib/Omegahat ディレクトリーには,
統計処理計算のための Omegahat プロジェクトからの, まだリリースされていないパッケージが入っています. 現在, 下記のものがあります:
- CORBA
- R 用の動的 CORBA クライアント/サーヴァー機能. 別の計算機上の, 任意の言語で開発された他の CORBA 対応の (CORBA-aware) アプリケーションに接続し, R の機能を他のアプリケーションに同様にしてエクスポートすることが可能です.
- OOP
- R および SPLUS 用の OOP {オブジェクト指向プログラミング} スタイルのクラスおよびメソッド. オブジェクトのリファレンスおよびクラスに基づくメソッドの定義は Java や C++ のような言語のスタイルでサポートされます.
- REmbeddedPostgres
- SQL 関数 (per-record, 集約 (aggregate) およびトリガー (trigger) 関数) を実装するために, R の関数およびオブジェクトを利用できるようにします.
- REventLoop
- ツールキットに独立であり, R のイベント・ループを置き換えるために用いることのできる, 抽象的なイベント・ループ機構.
- RGdkPixbuf
- イメージを操作するための GdkPixbuf ライブラリーにおける機能にアクセスするための S 言語の関数.
- RGnumeric
- Gnumeric スプレッドシートについて, R の関数をシート内のセルから呼び出したり, 自動再計算等を可能にするプラグイン.
- RGtk
- Gtk, Gnome GUI ツールキットを用いてグラフィカル・インターフェイスをプログラミングするための S 言語での機能.
- RGtkBindingGenerator
- Gtk に基づくライブラリーへのバインディングを提供するための C および R のコードを生成するメタ‐パッケージ.
- RGtkExtra
- gtk+extra ライブラリーにおけるウィジェットとのインターフェイスを提供する S の関数のコレクション. たとえば, GtkSheet データ‐グリッド表示, アイコン・リスト, ファイル・リストおよびディレクトリー・ツリーなど.
- RGtkGlade
- Glade, 対話型 Gnome GUI 作成ツールとのインターフェイスを提供する S 言語のバインディング.
- RGtkHTML
- ファイルあるいは S において動的に生成されるコンテンツから HTML 文書を表示するために用いることのできる, HTML ウィジェットを生成・制御するインターフェイスを提供する S の関数のコレクション.
- RGtkViewers
- さまざまな S のオブジェクト, データベース, クラスおよびウィジェットの階層構造, S のソース・ファイルのコンテンツ等を眺めるためのツール集.
- RJavaDevice
- Java のコンポーネントおよびグラフィクス APIs を用いる R 用のグラフィック・デバイス.
- RObjectTables
- この C と S のコードによって, R のオブジェクトを検索パスの要素として用いるように定義することができます. 変数を読み書きするための独自のセマンティクスと機能を備えています. そのオブジェクトは, R の関数 (メソッドあるいは閉包 (closures)) を通して簡単なインターフェイスを実装し, (たとえば, 他のアプリケーション, 言語, フォーマット等における) 外部データにアクセスすることができます.
- RSMethods
- R 用の S ヴァージョン 4 のメソッドとクラスの実装. "Programming with Data" by John M. Chambers, 1998, Springer NY における基本資料と一致します.
- RSPerl
- R から, 組込み・永続型 Perl インタープリターへのインターフェイス. 任意の Perl サブルーチン, クラスおよびメソッドを呼び出すことができます.
- RSPython
- これによって, Python プログラムが S の関数, メソッド等を起動することができ, S のコードが Python の機能を呼び出すことができるようにします.
- RXLisp
- R の内部から XLisp-Stat 関数を呼び出すためのインターフェイス.
- SASXML
- SAS 8.2 の様式で XML ファイルを読み込む実行例.
- SJava
- Java のオブジェクトおよびメソッドを生成し, 呼び出すための R から Java へのインターフェイス.
- SLanguage
- R と SPLUS の両方で機能する S 言語プログラミングをサポートするための関数および C サポート・ユーティリティ.
- SNetscape
- Netscape および JavaScript のためのプラグイン.
- SWinRegistry
- Windows のレジストリーを読み書きするための R 内部からのアクセス手段を提供します.
- SWinTypeLibs
- {Windows の} インターフェイスのメソッド, プロパティ等を記述するタイプ・ライブラリーおよび (あるいは) DCOM オブジェクトからタイプ情報を抽出するための方法を提供します.
- SXalan
- R で実装された XSL 関数を用い, R からの出力を動的に代入して, XML 文書を処理します.
- Slcc
- C のソース・コードを構文解析します. S からそのコードへのインターフェイスを解析し, 自動的に生成できるようにします. S がアクセス可能なネイティヴ・シンボルのテーブル, パラメーターの数え上げ (count) およびタイプ情報, C のオブジェクトからの S のコンストラクター, コール・グラフ等を含みます.
- Sxslt
- XSL の関数を R の関数を使って実装できるようにする, libxslt (XML-XSL 文書翻訳ツール) のための拡張モジュール.
Bioconductor プロジェクトは, DNA マイクロアレイを用いる推論にいちばんの重点を置いて, バイオインフォマティクスで働いている生物学者や統計学者を支援するオープン・ソース・ソフトウエアの枠組みを提供します. 下記の R パッケージは, BioConductor の現在のリリースに含まれているもので, この他に多くの開発中のパッケージがあります.
- AnnBuilder
- GenBank, the Gene Ontology Consortium, LocusLink, UniGene, the UCSC Human Genome Project のようなデータベースから, ゲノム注釈データを収集し, 処理します.
- Biobase
- ゲノム・データ (S4 クラス構造) についてのオブジェクト指向表現および操作.
- DynDoc
- 動的文書, ヴィネット (vignettes) およびその他の文書を生成し, 対話的操作を行うための機能.
- RBGL
- グラフ・パッケージと Boost グラフ・ライブラリーの間のインターフェイス. R におけるグラフ・オブジェクトの素早い操作を可能にします.
- ROC
- 2つのタイプのサンプルで差異的に発現している (differentially expressed) 遺伝子を同定するための受信者操作特性 (Receiver Operating Characteristic (ROC)) アプローチ.
- Rgraphviz
- R でグラフ・オブジェクトをプロットするための Graphviz とのインターフェイス.
- Ruuid
- R で Universally Unique ID 値 (UUIDs) を生成します.
- SAGElyzer
- SAGE {serial analysis of gene expression} タグに基づいて遺伝子の位置を突き止めます.
- affy
- Affymetrix オリゴヌクレオチド・アレイのための手法.
- affycomp
- Affymetrix 発現尺度 (expression measures) の評価のためのグラフィクス・ツールボックス.
- affydata
- デモンストレーション目的の Affymetrix データ.
- annotate
- 実時間での実験データを, GenBank, LocusLink および PubMed のような web データベースからの生物学的メタデータに関連付けます. クエリー (問い合わせ) 結果を処理・格納します. HTML 形式の分析レポートを生成します.
- edd
- 発現密度診断 (Expression density diagnostics): 分布形状のクラス分類についてのグラフィカルな手法およびパターン認識アルゴリズム.
- genefilter
- 幅広い種類のフィルタリング関数を用いて遺伝子を逐次的にフィルタリングするためのツール. フィルターの例に含まれるものは: 欠損値の数, 発現尺度の変異係数 (coefficient of variation of expression measures), ANOVA p-値, Cox モデル p-値. 遺伝子へのフィルタリング関数の逐次的な適用.
- geneplotter
- ゲノム・データのためのグラフィカル・ツール. たとえば, 染色体に沿って発現データをプロットする, 発現データ行列のカラー・イメージを生成するなど.
- graph
- R の内部でグラフを生成・操作するためのクラスおよびツール.
- hexbin
- ビン分割 (binning) 関数. とくにグラフ化のための六角形のビンによる分割.
- limma
- マイクロアレイ・データのための線形モデル.
- marrayClasses
- 事前正規化 (pre-normalized) および正規化 cDNA マイクロアレイ・データについてのクラス定義. アクセス/置換, プリント, サブセット化のための基本的メソッド.
- marrayInput
- さまざまなイメージ分析の出力ファイル, およびプローブおよびターゲット記述ファイルから, R にマイクロアレイ・データを読み込むための関数.
データの入力, およびこれらのデータを格納するためのマイクロアレイ特有の R オブジェクトの生成を容易にし, 自動化するためのウィジェットが与えられます.
- marrayNorm
- ロバストな局所回帰に基づく, 位置およびスケールの正規化の手続きのための関数.
- marrayPlots
- 事前/事後正規化 (pre- and post-normalization) cDNA マイクロアレイ強度データについての診断プロットのための関数: ボックスプロット, 散布図, カラー・イメージ.
- marrayTools
- UCB および UCSF における機能ゲノム学センター (the functional genomics core facility) で用いられている雑多な関数.
- multtest
- 一連の検定群 (ファミリー) あたりのエラー率 (family-wise error rate (FWER)) および過誤発見率 (false discovery rate (FDR)) を制御するための多重検定の方法. 検定は, t-統計量 あるいは F-統計量を基にすることができます. また, 調整された p-値を推定するために並べ替え法 (permutation procedures) を利用することができます.
- reposTools
- ファイル・レポジトリーを扱うためのツール. これを用いることで, ユーザーは, パッケージ, ヴィネット (vignettes) およびその他のファイルを簡単にインストール, アップデート, 配布することができます.
- rhdf5
- HDF5 ライブラリーおよびファイル・フォーマットを用いる大規模データセットの格納および検索.
- tkWidgets
- Bioconductor パッケージのための機能を提供する, Tcl/Tk で書かれたウィジェット.
- vsn
- Affymetrix および cDNA アレイ・データの両方についてのキャリブレーション (calibration) および分散安定化変換 (variance stabilizing transformations).
- widgetTools
- Tcl/Tk ウィジェット, つまり小規模のグラフィカル・ユーザー・インターフェイスを作成するためのツール.
これらのパッケージは最終的には CRAN 経由で同様に利用可能になるでしょう.
5.1.5 その他のアドオン・パッケージ (Other add-on packages)
Jim Lindsey は, 非線型回帰および反復測定についての R のパッケージ集を書いています. これは下記のもので構成されています: event (イベント履歴手順およびモデル), gnlm (一般化非線型回帰モデル), growth (多変量正規および楕円型 (elliptically-contoured) 反復測定モデル), repeated (non-normal 反復測定モデル), rmutil (非線型回帰および反復測定のためのユーティリティ), および stable (定常分布についての確率関数および一般化回帰モデル). 彼の著作 "Models for Repeated Measurements" (1999, Oxford University Press) の新版におけるすべての分析がこれらのパッケージを用いて行なわれました. Jim はまた, DNA 配列の分析のための手順を伴うパッケージ dna に着手しています. Jim のパッケージは http://www.luc.ac.be/~jlindsey/rcode.html から取得することができます.
Frank Harrell は, 彼の Design and Hmisc パッケージの R への移植版を作成していて,
http://hesweb1.med.virginia.edu/biostat/s/library/r/ から入手可能です.
さらに多くのコードが r-help メーリング・リストに投稿されていて, このメーリング・リスト・アーカイヴから取得することができます.
{ 5.1章おわり }
最終更新日: 2003-09-02 (火) 21:26:45