[[Q&A (初級者コース)/15]]

さぼりんです。またお世話になります。

トレーニングデータをもとにモデルを構築し、テストデータを用いてモデルの当てはまりの良さを確認したいです。

トレーニングデータ"130725_test31_train.csv"は、X(入力)が7行x6列で、Y(出力)が7行x1列です。また、テストデータ"130725_test31_test.csv"は、Xが3行x6列で、Yが3行x1列です。(CSVファイルは別途アップロードします。)

下記のコマンドを実行したところ、モデルからの予測値(test.pred)が7行表示されました。テストデータに対する予測を行うのだから、値は3行表示されるべきだと考えています。コマンドの出力結果は正しいのでしょうか。

恐れ入りますが、ご教授をお願い致します。

> test31.train <- read.csv ("130725_test31_train.csv")
> Y <- as.matrix(test31.train[ ,7])
> X <- as.matrix(test31.train[ ,1:6])
> Y <- scale(Y)
> X <- scale(X)
> test31.pls <- plsr(OUTPUT ~ X, 2, data = test31.train, validation = "LOO")
> 
> test31.test <- read.csv ("130725_test31_test.csv")
> Y <- as.matrix(test31.test[ ,7])
> X <- as.matrix(test31.test[ ,1:6])
> Y <- scale(Y)
> X <- scale(X)
> 
> test.pred <- predict(test31.pls, ncomp = , test31.test$X)
> test.pred
>
> , , 1 comps
>
>     OUTPUT
> 1 437321.1
> 2 437871.6
> 3 436570.5
> 4 439711.1
> 5 438163.7
> 6 440080.2
> 7 437147.9
>
> , , 2 comps
>
>    OUTPUT
> 1 439055.4
> 2 439095.0
> 3 436742.8
> 4 440570.5
> 5 436976.8
> 6 439369.7
> 7 435055.7


トップ   編集 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS