[[R掲示板]]
Rで下記のようなデータを用いて主成分分析を行いました.

[ある2グループのマウスの274代謝物の標準化を行ったデータ]
----------------------------------------------------------------
metabolite   A1   A2   A3   B1   B2   B3
Glycolate      2    2    3    4   4    5
.
.
.
.
(274代謝物質)
----------------------------------------------------------------

result <- prcomp(data,scale = F)
print(summary(result))

Importance of components:
                          PC1    PC2    PC3    PC4    PC5     PC6     PC7
Standard deviation     1.6199 1.1883 1.0904 0.9896 0.9271 0.80668 0.74706
Proportion of Variance 0.2846 0.1531 0.1289 0.1062 0.0932 0.07056 0.06052
Cumulative Proportion  0.2846 0.4377 0.5666 0.6728 0.7660 0.83658 0.89710
 
                          PC8     PC9      PC10
Standard deviation     0.70142 0.67599 3.233e-08
Proportion of Variance 0.05335 0.04955 0.000e+00
Cumulative Proportion  0.95045 1.00000 1.000e+00


ここで自分が疑問に感じたのが,代謝物質が274物質あるにもかかわらず,
PCの数が10個しか存在しないのは,PC10の段階で累積寄与率が限りなく1に近づいたために
PC11以降が表示されなくなったのでしょうか?

代謝物が274個もあるのに,PCが10個しか表示されないのは,
代謝物の濃度が限りなく低くいものが多く存在し,それらはPC11以降の主成分に
ほとんど影響をしていないと解釈してもいいのでしょうか?


トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS