2011年10月24日 ジョン M. クイック
(この記事は、最初に公開されたRチュートリアルシリーズ 、そして親切に貢献してR -ブロガー)
探索的因子分析(EFA)は、潜在変数の小さなセットとしていくつかの測定変数間の差異を説明するための社会科学における一般的な手法です。 EFAは、しばしばグループ(因子)の基礎となる個々の質問を明らかにすることにより、調査データを統合するために使用されます。 これは、このチュートリアルのデモンストレーションのためのコンテキストになります。
我々が開始する前に、ダウンロードすることをお勧めしますデータセット(.csvファイル)このチュートリアルで使用する。 右クリックして、Rの作業ディレクトリにファイルを保存してください。 このデータセットは、大学生の好きな主題の調査から6項目の300応答の仮想的なサンプルが含まれています。 項目は、強く強く好きに嫌うからスケールを表すか、1から5の値にまで及びます。 私達の6項目は、生物学(BIO)、地質(GEO)、化学(CHEM)、代数(ALG)、微積分(CALC)、および統計(STAT)を含むさまざまな大学の主題分野、彼らの好みを評価する学生に尋ねた。 すべての学生が、それによってEFAを(冗談です)実施するための不十分な分散をレンダリングする、すべてのこれらのコンテンツ領域の強嫌いと評価されるため、このチュートリアルでは、終わるところです。
開始するには、我々はRに我々のデータセットを読み込み、変数にその内容を格納する必要があります。
>#read.csv(ファイル)機能を使用して、Rの変数にデータセットを読み込む >データ< - read.csv("dataset_EFA.csv")
データセットの最初の10行
次に、我々は、EFAを行うときに私が使用したいサイケパッケージを 、インストールしてロードする必要があります。 このチュートリアルでは、我々はパッケージのFA()関数を利用します。
>#パッケージをインストール > install.packages("サイケ") >#パッケージをロードする >ライブラリ(サイケ)
このチュートリアルでは、我々は要因の適切な数がすでにそのような固有値、スクリー・テスト、および事前の注意事項スルーとして、2であることが決定されているものと仮定します。 ほとんどの場合には、要因の最適な数を確保するために決定された量が選択された上下のソリューションをテストします。
要因の解決策を導出するために、我々は、主に次のような引数を受け取るサイケパッケージ 、からFA()関数を使用します。
EFAを行う際にいくつかの回転と因数分解の方法が利用可能であることに注意してください。 回転方式は、結果の要因を相関させることを許可するかどの、結果として得られる要因が相関することが許可されないこれ、 直交 、および斜めとして記述することができます。 因数分解の方法は、目的はデータの量を削減するときに使用される、目的はよりよいデータを記述するときに使用される一般的な 、、とコンポーネントとして記述することができます。 FA()関数は、一般的なファクタリングのために使用されます。 成分分析のために、princomp()を参照してください。 最良の方法は状況によって異なり、したがって、あなたの将来の必須脂肪酸の最適なパラメータを決定する際にプロの協議を求めることをお勧めします。
このチュートリアルでは、我々は現実の世界では、学生の潜在的主題の嗜好の要因の間に何らかの相関する可能性があることを認識する斜交回転を(="obliminを"回転させる )、使用します。 我々は、ほとんどのデータに内在する構造を特定することに興味があるので、我々は、(FM ="PA")主軸のファクタリングを使用します。
>#相関行列を計算する > corMat < - COR(データ) >#相関行列を表示する > corMat
相関行列
>#斜め主要な軸探索的因子分析を実施するFA()を使用して >#Rの変数へのソリューションを保存する >ソリューション< - FA(R = corMat、nfactors = 2、回転="oblimin"、FM ="PA") >#ソリューションの出力を表示する >ソリューション
私達の因子負荷量を見ることによって、我々の要因の解決策を評価するために始めることができます。 私たちは、BIO、GEO、およびCHEMはすべて第一の要因(PA1)で約0.8高い因子負荷量を持っていることがわかります。 したがって、我々はこの因子の科学を呼び出し、それに科学の主題で学生の興味の代表を検討するかもしれない。 非常に我々は数学を呼び出す可能性のある第二の要因(PA2)、上同様に、ALG、CALC、およびSTATの負荷。 STATは、ALGまたはCALCよりPA2上はるかに低い負荷を持っており、それが要因PA1にわずかな負荷を持っていることに注意してください。 これは、統計が代数と微積分よりも数学の概念にあまり関係していることを示唆している。 単に負荷のテーブルの下に、我々は、それぞれの要因が、学生の主題の設定で全分散の66%を占める要因の解決につながる、応答の分散の約30%を占めていることがわかります。 最後に、私達の要因が0.21で相関していることに気付くと斜交回転の私達の選択は、この関係の認識に許可されることを思い出してください。
もちろん、ここで提示されることはありませんEFAの開発と評価に行われるため、他の多くの考慮事項があります。 このチュートリアルで意図はEFAの詳細と消化概要についてはR.でEFAの基本的な実行を示すために単にあった、私は因子分析の毛による多変量データ解析の章、黒、バンビ、とアンダーソンをお勧めします。
EFAのデータはRでサイケのパッケージを使用して編成する方法の完全な例を参照するには、ダウンロードしてくださいEFAの例(。TXT)ファイルを。 このチュートリアルで使用されているコードの場合は、ダウンロードEFAの例(。R)ファイルを。