なんでも掲示板アーカイブ(1)

注意:ここに保存した記事へのコメントは自由です。ただしあまり古い記事の場合は、新規に最新の「なんでも掲示板」に新規に項目を立てられた方が良いかも知れません。

元記事日付 2003-07-17 から 2003-11-26 分


行列データの抜き出し方(時系列)

さかもと? (2003-11-26 (水) 10:08:12)

ある時系列データセット(1980年から2002年)を

ts(data="data set name",start=1980,end=2002,frequency=1) → D
として読み込んだ後,ある変数の1980年のデータを取り出したときに年を指定できないのでしょうか?例えば,

D[1980,] # ← 1980年のデータすべてを表示としたいのですが・・・
確認できていることは,

D[1,] # ← だったら1980年のデータを参照することができます.
年の指定ができるとそうさもしやすいのですが・・・.なにとぞご教示ください.

  • window(D,start=1980,end=1980)ではどうでしょう。 -- なかま 2003-11-26 (水) 11:30:37
  • アドホックですが、頻繁に年度で参照したければ次のように専用関数 ofs を臨時に定義するというやりかたもあり。-- 2003-11-26 (水) 12:02:52
    > library(ts) 
    > data(sunspot) 
    > sunspot 
    Time Series: Start = 1936 End = 1972 Frequency = 1  
    [1]  40 115 100  80  60  40  23  10  10  25  75 145 130 130  80  65  20  10   5 
    [20]  10  60 190 180 175 120  50  35  20  10  15  30  60 105 105 105  80  65 
    > ofs <- function(n) {n+1-attributes(sunspot)$tsp[[1]]} # sunspot データの年度を添字に変更する関数 
    > x[ofs(1936)] 
    [1] 40
  • 使いやすいかどうか分かりませんがラベルをつけるという手もあります。演算結果にラベルが付きまとい煩わしいかもしれません。 -- 2003-11-26 (水) 17:15:30
    > names(x)=1936:1972
    > x["1936"]
    1936
      40
  • 早速のリプライ多謝でございます.早速試させていただきます. -- さかもと? 2003-11-26 (水) 20:39:42

tests/p-r-random-tests.R

なかま (2003-11-25 (火) 23:48:51)

どうも乱数部分に問題?があるような気がするんですが目がショボショボで、
追えません。(爆)

for ((i=0;i<=100;i++))
do
        R -q --vanilla < R-1.8.1/tests/p-r-random-tests.R >  test.$i.Rout
done

とか

for ((i=0;i<=100;i++))
do
        Rterm.exe -q --vanilla < R-1.8.1/tests/p-r-random-tests.R >  test.$i.Rout
done


等とすると、テストがFAILする場合がたまにあります。
Rの中のMTはsrc/main/RNG.cの中にあって、

 A C-program for MT19937: Real number version([0,1)-interval)
   (1999/10/28)

なバージョンです。
どなたか、ハックしませんか。(^^;

# 明日から客先なんで。。。

  • 行く前に。一晩寝てみて、これってFAILEDする事もあるって論法(しないのが望ましい程度?)かしらん。 -- なかま 2003-11-26 (水) 09:42:28

CODAとBOA どちらがおすすめ?

(2003-11-25 (火) 18:39:33)

BUGSのサンプルデータで作成した出力ファイル(*.out,*.ind)を使って、CODA
(coda_0.5-14.tar.gz)とBOA(boa-1_0_1R.tgz)の両方を試してみました。
どちらも同じような感じだったのですが、それぞれの特徴的な違いは何でしょ
うか?どちらがおすすめでしょうか?
どちらも最新版の日付は2003年1月で開発が止まっているようにも見えません。


SOMパッケージの違い

amaki? (2003-11-25 (火) 06:17:59)

Rには"class"と"som"の2種類のsomパッケージが入っていますが、
どのように違うのか教えてください。
"class"がコホネンのsom_pakを基にしたもので、
"som"は別物と考えてよろしいのでしょうか?

今、100000ベクトルほどあるデータをsomパッケージでマップ化しています。
とても時間がかかってしまい(学習回数、1000,10000で半日)、
困っています。
学習効率、プロットの精度の観点から両者の違い等ありましたら、
どなたか教えて下さい。

デザインの領域のモノで初心者です。
ご助言、よろしくお願いします。

  • 少し表現が分かりにくかと思うので訂正します。現在使っているのは"class"ではなく、"som"です。 -- amaki? 2003-11-25 (火) 06:20:27

cygwinでRはできる?

taku? (2003-11-24 (月) 20:17:51)

cygwinでRがやりたいとおもい、
http://datamining.tama.ac.jp/~yama/R/install.html
を参考にインストールしようとしていましたが、
makeで失敗してしまいます。
make[3]:*** [devices.o] Error1
make[2]:*** [R] Error2
make[1]:*** [R] Error1
make:*** [R] Error1
cygwinではRはできないのでしょうか?

よろしくお願いします。

  • 確か、Cygwin は現在サポートしていないのではないですか?Win32のサポートはMinGWとVC?では。 -- 2003-11-24 (月) 22:11:34
  • そうなのですか。ありがとうございます。cygwinではできないのですか・・・。 -- taku? 2003-11-24 (月) 22:29:53
  • 以下の参考ページを見つけております。
    http://www1.accsnet.ne.jp/~gen/R-rev/cygwin-R.html
    http://www1.accsnet.ne.jp/~gen/R-rev/cygwin-R.pdf
    私自身まだうまくいってませんので、うまくインストールされましたら教えて下さい。 -- 2003-11-25 (火) 08:58:07
  • CygwinとMingwではいくつかのヘッダーの位置が異なるのと、define等で未定義の物とかの差異があると記憶してますので、ifdefとかでその分を吸収するパッチなりを自分でこさえないと難しいと思います。math関係も結構違ってたような記憶(以前いいかげんにざっと見た記憶ですが)があるので相当面倒臭い作業になるのではないかと。(^^; -- なかま 2003-11-25 (火) 09:32:49
  • いろいろありがとうございます。参考ページのとおりにまずやってみたいと思います。パッチは自分ではできなそうです^^;。 -- taku? 2003-11-25 (火) 10:22:52
  • とりあえずこれを参考に、gygwinからの起動はできました。今はemacsからの起動に挑戦しています。 -- taku? 2003-11-26 (水) 10:05:32

RGUI内でWindows の環境変数の設定できますか?

SJava? (2003-11-23 (日) 20:16:18)

 現在SJava をWindows内で使用しています。

 SJava を動作させるには、環境変数"JAVA_HOME"にJREのパスを指定しなくてはなりません。

 現在マシーンにはJavaSDKを導入していて、このSDKのパスをJAVA_HOMEにセットしているので、SJavaを使用後、元に戻すのが面倒です。

 SJAVAを使用するときだけ、JAVA_HOMEのパスを変更したいのですが、RGUI内でWindowsの環境変数を設定する方法、ご存知の方おられませんか?

  • 1.バッチでくるむ。2.Sys.putenv("JAVA_HOME"="hoge")。3.".Renviron"を作ってJAVA_HOME=hogeする。Rの作法的には.Renvironが一番いいかと。 -- なかま 2003-11-25 (火) 09:20:54
  • なかまさん、ありがとうございます。 -- 2003-11-27 (木) 02:29:51

Rでベイズ統計入門

(2003-11-21 (金) 03:18:38)

 Rを使ってベイズ統計を初歩から学べるようなサイトってあるのでしょうか?

  • ベイズ統計の意味によりますが、NIST にベイズ統計の実際的応用に関する E-learnig のページがあります。ただし、これは特に R を使ってではありませんし、今はやりのMCMC法と組み合わせたベイス統計ではなく、むしろ古典的なベイズ統計です。NIST についてはリンク集からたどってみて下さい。 -- 2003-11-21 (金) 08:23:55

多変量解析の演習門題

宮島 のぼる? (2003-11-20 (木) 14:38:48)

(X,Y){X=xi,Y=yj}でX,Yが独立でない時ρxy=0となる例は?
(ただし、i,j=1,2,3,‥‥)

  • これはもしかして学校のレポートの課題ではないでしょうね。もしそうなら、すぐさま消して下さい。 -- 2003-11-20 (木) 22:26:45
  • 少々きついコメントを書いてしまいましたが、もし真面目な質問でしたらごめんなさい。青木さんの掲示板でそうした質問が多数目についたので、注意しました。それにしても、この問題とこの Wiki のテーマである R の間に何の関係があるのかぐらいは補足するのが作法だと思います。 -- 2003-11-25 (火) 17:47:04

Rgraphviz on R for Win

(2003-11-19 (水) 15:22:42)

 BioConductor のgraphvizを RのWin版で動かされている方、おられませんか?

 MinGWでgraphvizをビルドできなくて、現在指をくわえたままです。


統計数理研究所ワークショップの発表内容のWebでの公開

(2003-11-17 (月) 22:37:40)

 統計数理研究所のワークショップですが、平日なので拝聴するのは無理でした。

 このワークショップでの発表はPDFやPPTで、Webで公表されないのでしょうか?

  • 代表者に話はしておきますが、そうした形で発表者が原稿を用意しているかどうかが問題ですね。事前に原稿の形式に対する指定はありませんでした。 -- 間瀬? 2003-11-17 (月) 23:01:29

誕生月でスポーツ能力が決まる?!

間瀬? (2003-11-17 (月) 22:25:52)

今日の日経新聞に面白い記事がでていました。今期の日本の J1サッカー選手とプロ野球選手(日本生まれのみ)を誕生月別に集計したものです。それによるとどちらも4ー9月生まれが多く、11ー3月生まれが少ないそうです。ちなみに昭和45年以降では、出生月による出生率の差は、ほとんどないそうです。日本の学期制が早生まれの子どもに不利に働いているとの解説がついていました。こうしたデータとそれからの結論はしばしば統計的に無意味なことがあるので検定してみました。グラフから読みとったJ1選手の月別誕生数を等確率帰無仮説にたいしてχ自乗検定すると

> x=c(23,20,21,51,57,43,46,42,46,38,26,19)
> chisq.test(x)

        Chi-squared test for given probabilities

data:  x
X-squared = 55.3889, df = 11, p-value = 6.578e-08


となりやはり強く有意なようです。これで我が家の男三人がスポーツ嫌い(12,1,2月生まれ)で女房は得意(8月生まれ)なわけがやっと分かりました(最後はかなり乱暴な結論)。

  • 二乗では?出生数の分布も一様でないそうですが、それを調整しての結果はいかがでしょうか? -- 2003-11-18 (火) 05:46:44
  • 自乗も二乗も特に区別されずに使われているのでは。私はむしろ二乗という呼び方に違和感を感じてしまいます。世代格差もしくは勉強した先生、本による趣味の問題? なおメモしたように、月別出生数は殆んど同一ですから、年別出生数による調整は無用と思いますが。 -- 2003-11-18 (火) 08:39:00
  • おお!わたしも長年の謎(自乗か二乗か)が解けてすっきりしました。(辞書ひいても無かったので) -- 2003-11-18 (火) 10:20:39
  • ワルノリして更に。昭和45年以降月別出生数は殆んど同一というのは、今回人口動態調査を検索して知りました。かっては月別出生数が相当違ったので、うっかりするとおかしな結論を出しかねませんでした。私の「常識」は相当錆びついているようです。前にいた大学でのこと、学部長選挙の席上、配られた教授資料の一覧表を暇潰しに月別集計したら相当偏りがあり、「某大某学部の教授」になりやすい誕生月があるという結論がでかねなかったのですが、彼らの世代の月別出生数の偏りを考えれば結局世代平均を反映しているに過ぎないことが分かりました。しかし、おかしかったのは元旦生まれというおめでたい教授が複数いたこと。昔は、誕生日のかってな変更は珍しくなかったようです。同じ理由で4月始め生まれはかっては3月末生まれに比べ有意に多くなる傾向があったようです。前にいた大学では一般教育の統計学を教えていたので、学生が面白がりそうなデータを集める癖がついてしまいました。私の経験では日経新聞は参考になることが多かったですね。後進の参考までに書き留めます。 -- 間瀬? 2003-11-18 (火) 18:03:09
  • カイ二乗が約2,830件,カイ自乗が約722件でした。-- google 2003-11-22 (土) 22:09:12
  • これほどの量をどのように集計したのですか。まさか一つ一つ数えたわけでは。もしうまい方法があれば今後の参考に公開して下さい。 -- 2003-11-25 (火) 18:55:22
  • 私の愛用のウェッブ英和・和英辞典のスペースアルクによると、カイ自乗分布と(非心)カイ二乗分布と混乱していました。 -- 2003-11-25 (火) 19:08:04
  • 常用漢字ではニをジ(漢語)と読まないので国語的には自乗が正しく、学術的?には二乗が正しいらしい。 -- 2003-11-26 (水) 00:41:43
  • ちなみに、二乗派はどう発音しているのでしょうか?「にじょう」ですか。稲垣先生の数理統計学本は自乗でした。東洋経済新報社の統計学辞典は二乗。世代格差ですか。 -- 2003-12-01 (月) 19:11:20

CRAN での自作パッケージの登録方法

(2003-11-16 (日) 16:09:14)

 CRAN で自作のRパッケージを登録したい場合、どのような手続きが必要なのでしょう?

  • 日本人によるパッケージがあればいいなと思っていました。もしお考えなら素晴らしい。CRAN に次の記載があります。”投稿”は自由らしいです。その上でパッケージの形式的完全度等のチェックがあるかどうかは知りません。おそらくすべて投稿者と利用者に任されているのでは。To "submit" to CRAN, simply upload to ftp://cran.r-project.org/incoming and send email to cran@r-project.org. Please indicate the copyright situation (GPL, ...) in your submission. -- 2003-11-16 (日) 18:40:07

Rから他言語利用 の gmrf.c のフルソースコード希望

(2003-11-14 (金) 14:44:19)

 現在、オープンソースの C++ で作成されたパッケージをRより利用することを考えております。Rから他言語利用は非常に参考になり感謝しております。

 ところで、Rから他言語利用にある、 gmrf.c のフルソースコードの添付、お願いできないでしょうか?


回帰分析に関する日本語文献

間瀬茂 (2003-11-11 (火) 20:05:53)

教えて下さい。重回帰分析 and/or 非線形回帰分析に関する良い文献は何でしょうか。現在入手可能で、日本語(訳含む)の本が対象なのですが。理論がしっかり書いてある本と、理論はともかく意味が良く分かるものの、二種類がしりたいのですが。私が昔勉強した本はいまだに良書だと思うのですが、現在入手できないようです。よろしくお願いします。

  • 間瀬先生,こっちでもお世話になります.え??,非線形回帰については,もう領域固有になっちゃうんじゃないでしょうか.植物・植生学,化学,どういう現象にはどの式をどうあてはめるべきかということになるのではないでしょうか.統計学のゼミや大学院の学生さんならばどんな本でもOKとおもいますけれども.意味がよくわかるというのは,こういう問題はこうやって解決するという教え方しかできないのではと思います.どんなもんでしょうか.(実は私も良書を知りたいです) -- 石原茂和? 2003-11-17 (月) 09:56:49
  • もし Amazon でのキーワード検索結果が完璧だとすると、現在日本語で入手可能な理論がしっかり書いてある本は皆無ということになるのでしょうか。少々驚きです。私は佐和先生や、Draper & Smith の応用回帰分析の翻訳などで勉強したのですが。もちろん英語でOKということならいっぱいあるのですが。 -- 間瀬? 2003-11-17 (月) 12:18:04
  • 英語で理論の本と意味の本とでは、どんな本が良いのでしょうか。教えてください。 -- 2003-11-18 (火) 00:10:58
  • すみません,上の書き込みで"え??"となったところは,文字化けです."えした.どうでもいいかもしれませんが,驚いているわけではありませんので.(笑) -- 石原茂和? 2003-11-18 (火) 18:58:23
  • それはさておき,確かに回帰分析を勉強する本はないですね.ターゲットはどの辺のひとでしょうか. -- 石原茂和? 2003-11-18 (火) 19:01:44

x <- c(....) vs x <- read.csv(...,...)

まさ? (2003-11-11 (火) 14:13:28)

prec <- c(3.2, 3.1, 5.1, 4.8, 8.3, 9.8, 8.3, 6.6, 5.1, 3.8, 5.2, 5.6, 6.5, 5.7, 5.7, 7.4, 6.2, 7.6, 7.5, 7.0, 6.2, 6.0, 8.8, 10.7, 8.5)の代わりにCSVファイル(tempdata.csv)で列並びで先頭をTempとして以下の
prec <- read.csv("tempdata.csv",header=T)として以下のことを行いました。
op <- par(mfrow=c(2,2))

#ヒストグラム
hist(prec,main="Histgram")
を実行すると
Error in hist.default(prec, main = "Histgram") :

       `x' must be numeric

と返ってきます。
listで確認したところ
prec <- c(...)では
1?

[1]  3.2  3.1  5.1  4.8  8.3  9.8  8.3  6.6  5.1  3.8  5.2  5.6  6.5  5.7  5.7

[16] 7.4 6.2 7.6 7.5 7.0 6.2 6.0 8.8 10.7 8.5
となり、グラフが作成できました。
prec <- read.csv("tempdata.csv",header=T)では
1?

  temp

1 3.2
2 3.1
3 5.1
4 4.8
5 8.3
6 9.8
7 8.3
8 6.6
9 5.1
10 3.8
11 5.2
12 5.6
13 6.5
14 5.7
15 5.7
16 7.4
17 6.2
18 7.0
19 6.7
20 5.7
21 6.2
22 6.0
23 8.8
24 10.7
25 8.5
となり、グラフが作成できません。
prec <- c(3.2, 3.1, 5.1, 4.8, 8.3, 9.8, 8.3, 6.6, 5.1, 3.8, 5.2, 5.6, 6.5, 5.7, 5.7, 7.4, 6.2, 7.6, 7.5, 7.0, 6.2, 6.0, 8.8, 10.7, 8.5)をCSVファイル
temp
3.2
3.1
5.1
4.8
8.3
9.8
8.3
6.6
5.1
3.8
5.2
5.6
6.5
5.7
5.7
7.4
6.2
7
6.7
5.7
6.2
6
8.8
10.7
8.5
のデータで実現するにはどうしたらよいでしょうか?

  • read.csvで付値したらデータフレームになるので,変数名も指定しないとベクトルになりません。hist(prec$temp)としてみてください。 -- 中澤? 2003-11-11 (火) 14:49:41
  • 長くなって他のトピが見づらくなるので、編集お願いします。>まささん -- 2003-11-12 (水) 01:26:16

エクセルの四捨五入

かずっち? (2003-11-11 (火) 11:05:43)

エクセルで202.85-201.4=1.45で小数1桁でroundをかけると
1.5にならなければいけないのに1.4になります何度計算をしても同じ減少です、
何か設定があるのでしょうか?

  • Rでもそうですね。round(1.35,1)は1.4になるし,round(1.55,1)は1.6になるのに,不思議なことに,round(1.45,1)は1.4ですね。round(1.45001,1)は1.5になりますが。数値の内部表現が原因でしょうか。 -- 中澤? 2003-11-11 (火) 11:19:49
  • R の help(round) によれば, round は 'IEEE standard' (IEEE 754-1985) に従って数値の丸めを行なうとのことです. http://www.statsdirect.com/discussion/_disc1/0000000d.htm , http://www.cpearson.com/excel/rounding.htm をご参照ください. -- 2003-11-11 (火) 15:31:43
  • かずっちさんの事例は Excel VBA 関数での現象と思いますが, 解決方法は, VBA 関数の round の代わりに, ワークシート関数の round を用いると良いようです. ワークシート関数の round は, ふつうの数値丸め処理が行なわれるようです. Application.WorksheetFunction?.Round(1.45, 1) のように書けばよいのでしょうか, VBA の書き方は詳しくないので...) -- 2003-11-11 (火) 15:32:18
  • Excel 固有の疑問はこの Wiki にはふさわしくないかと愚考します。JIS,ISO式四捨五入を御覧下さい。round 関数はいわゆる「四捨五入」とはことなるものです。1.4 になるのが「正しい」のです。それを承知でなお「四捨五入」を例えば R でやりたかったらこの掲示版の過去記事にある中間さんの自作「四捨五入」関数 oround を御覧下さい。 -- 2003-11-11 (火) 16:32:45
  • なるほど。1.45から1.4までと1.5までは差が同じなので,末尾が偶数になるように丸められるのですね。過去記事にあったとは迂闊でした。 -- 中澤? 2003-11-11 (火) 18:37:21

RMySQLをwindowsで使いたい

sakamoto? (2003-11-06 (木) 12:59:50)

RMySQLがwindowsで使えるようにした方はいらっしゃいませんか?

  • RMySQL/inst/{INSTALL.win,README.windows}に従えば良いように思われますが。あと、RODBCでもいけると思います。 -- なかま 2003-11-06 (木) 15:59:31
  • なかまさんありがとうございます。早速試してみたいと思います。 -- sakamoto? 2003-12-01 (月) 17:04:48

Rで0-1整数計画問題を解く

(2003-11-01 (土) 23:07:53)

 Rで数理計画を参考にさせていただいておりますが、ところで、0‐1整数計画問題はRで処理できるのでしょうか?

  • パッケージlpSolveのlpは整数計画問題も対応できるはずです。 -- ken? 2003-11-02 (日) 23:01:29
  • ken さん、ご教授ありがとうございます -- 2003-11-04 (火) 11:00:22

SAS ー> R

(2003-10-29 (水) 12:05:04)

R-jp の記事を転載します。R+SAS両刀使いの方いませんか。

RをWindowsで勉強しています。さてよくSASを使うとTypeII SSとTypeIII SSなんて出てきますが、Rではどうやって計算するのでしょうか?宜しくご教示ください

  • carパッケージに含まれています -- 2003-10-29 (水) 21:37:18
  • 中澤さんの Rtips に解説が掲載されております -- 間瀬? 2003-10-30 (木) 21:04:40

Rgui(非日本語パッチR for Win)のフォント指定をコマンドラインで

(2003-10-29 (水) 10:48:04)

 日本語パッチを当てていない、Windows用のR(1.8.0)で、"R GUI Configuration Editor"を開かないで、フォントを指定する方法はないのでしょうか?

  • R_HOME/etc/Rconsole -- なかま 2003-10-29 (水) 10:56:20
  • なかまさん、早速のレスありがとうございます。ところで、コマンドラインから同様なことをなんらかの関数を使ってできないのでしょうか? -- 2003-10-29 (水) 11:15:53
  • もしかして、Rのコマンドラインから変更してダイレクトに反映したいと言う意味だったのでしょうか?まあ、なんらかの関数を自作すれば可能だとは思いますが、少なくとも標準構成の中には無いと思います。 -- なかま 2003-10-29 (水) 13:59:56

[質問]名前に利用できる文字

_(アンダーバー)が使えると良いな? (2003-10-29 (水) 10:32:29)

質問というよりは、疑問なのですが...
なぜ、名前につかえる文字に _(アンダーバー)がなく
.(ドット)が含まれているのですか?
歴史的な理由でもあるのでしょうか?

  • 付値(代入)の演算子だったからです。 -- なかま 2003-10-29 (水) 10:52:43
  • R 1.8 からは _ は使えなくなったそうですが、ついでに変数名に使えるようになったなどということはないのでしょうね。まだ、バージョンアップできないでいる保守派より -- 2003-10-29 (水) 23:45:29
  • 変数名に"_"は使えません。essを使えば、"_"は"<-"に入力時に変換されます。 -- なかま 2003-10-30 (木) 00:54:03
  • 1.8.0から`が加わり、QuotedSymbolValue?の中はStringValue?(c)なので、"abc_"<-runif(10);mean( `abc_` )とか出来ない事もなかったりして。(^^; -- なかま 2003-11-04 (火) 20:37:17
  • 最近の r-help 記事によると数カ月後には名前の一部としてアンダースコアが使える予定とのことです。 -- 間瀬? 2003-11-29 (土) 00:01:04

Rの列数の限界値について

sallyh? (2003-10-28 (火) 16:09:52)

こんにちは。
Rの列数の限界値について調べています。
read.tableでデータを読み込ませようとした時、列数が30000列位あった為
いくらメモリを増やしても読み込むことが出来ませんでした。

そこで、Rの列数の上限を調べているのですが、調べ方が悪いらしく
良く分かりません。
(エクセルは確か256列でしたよね?)

もしかして、ものすごく基礎のことかもしれませんが、
ご存知の方いらっしゃいましたら、もし良ければ教えて下さい。
できれば、Windows版とUnix版で違いがあるのか等も知りたいです。

よろしくお願いします。

  • 答えではないのですが,help(read.table)すると,read.tableは大きな行列を読み込むには正しい方法ではない(とくに列数が多いとき)ので,そういうときは(列によってデータの属性がいろいろ違うのでなければ)scanを使えと書いてありました。matrixで試してみると30000列の行列をもつこと自体は問題なくできたので,たぶんscanならいけると思います。 -- 中澤? 2003-10-29 (水) 09:18:33
  • x=matrix(1.0,c(57000000,57000000)) はOK(すごいけど、おそらく他の作業はもうできないはず)。R は lisp を模範にしているのでおそらくメモリーがある限りどれだけでもできるはず。ただしファイルからの読み込みは、バッファー容量やらディスク速度等が絡んでくるので一概にはいえないのでは。-- 2003-10-29 (水) 09:30:36
  • 列数に制限は無いです。read.tableは列名を得るために何度もscanを実行して様々な努力をします。そして最後にデータを得るためにscanします。read.tableは列名を得るための簡易wrapperみたいなものです。read.tableとうつとread.tableのソースが見えるので良く解かると思います。全体にしめる処理速度から判断すると、ディスク関係は意識しなくても良い位です。CPUの2次キャッシュの大きさが与える影響の方が大きいでしょう。ですからセレロンの2Gとか最近の安いCPUは2次キャッシュがしょぼいので、昔のセレロンの1.3Gにも及ばない場合もあるかもしれません。 -- なかま 2003-10-29 (水) 10:49:21
  • ありがとうございます。助かりました。参考にします!! -- sallyh? 2003-10-30 (木) 20:51:10

Rでマルチ・エージェント

M.A.S.? (2003-10-23 (木) 00:46:19)

 マルチ・エージェントというと、SWARMが有名ですが、Rから利用できるMASのライブラリってないのでしょうか?

 CRANでは見当たりませんが?


RExcel【(D)COM】の使い方に関して

激・初心者です? (2003-10-21 (火) 17:13:18)

R Start をクリックすると、
『Fatal error:unable to open the base package』⇒
『Could not start RServer』⇒
『実行時エラー'462'リモートサーバがないか使用できる状態ではありません』
というエラーが出てしまい、何もできません。

原因がお判りになるかた、レスを頂ければ幸いです。

  • ちなみに、RExcel.xlaはきちんとアドインされているようです。R StartはExcelのツールバーのRExcelからクリックしました。 -- 状況補足? 2003-10-21 (火) 17:22:50

[質問] Rの分散分析について

R初心者? (2003-10-20 (月) 21:57:10)

Rの初心者です.つまずいていることがあります.

分散分析をする際に,
「母数モデル・変量モデル・混合モデル」の
いずれかを指定したいのですが,
変量モデルを指定する関数(SASでいうVARCOMP)は,あるのでしょうか?

  • 私自身は使う必要がないので詳細はわかりませんが、こうした話題は CRAN にある r-help の過去記事の検索機能でキーワード検索すると参考になるものです。例えば次のようなやりとりが見つかります。この記事から判断すると VARCOMP に相当するものは R にはなさそうですね。 Venables and Ripley (邦訳あり)に関連する話題がありそうですから見てみたらいかがでしょうか。
On Wed, 29 Aug 2001, Troels Ring wrote: 
> Dear friends. 
> 
> I know this has been discussed before but as lively as R is (thanks to all) 
> things might have changed. In Venables and Ripley(199) p 192-4 estimation 
> of variance components including robust methods is discussed. I cannot find 
> anything like that presently but might have overlooked it. Is it planned to 
> do it ? Is it obsolete ? 

It is not there in R and not planned. (You can check plans on 
developer.r-project.org.) It is still in S-PLUS, so not obselete. 
  • 2003-10-20 (月) 22:10:45
  • 分散分析 randam and mixed については、以下の URL にある文書を読む事をお勧めします。詳しくは書いてありませんが、役に立ちます。 http://www.agr.kuleuven.ac.be/vakken/statisticsbyR/ANOVAbyRr/indexANOVA.htm R and statistics : ANOVA 。 一般的には、package NLME の lme function を使う事になっております。 なお、function aov でも場合によっては良いです。私は統計学専攻ではないのでその点をご考慮ください。 -- 2003-10-27 (月) 22:54:04
  • おお.レスがこんなについてたとは・・・nlmeに当たってみます.ありがとうございます. -- Rの初心者? 2003-11-03 (月) 13:39:58

text関数を使って‥

R初心者? (2003-10-18 (土) 15:29:31)

text関数を使って描いたグラフのある位置に、求めた重要なパラメータを表示させたいのですが、文字と変数を一緒にする方法がわかりません。
具体例をあげますと‥
text(100,2,parameter)とすると当然画面上には変数parameterのみが現れますが、変数の左横に、"PARAMETER="も同時に書きたいのですがうまくいきません。gnuplot感覚で、text(100,2,"PARAMETER=",parameter)としてみたのですが‥、当然蹴られてしましました。どなた様か知っておられたらご教授願います。

  • 例えば次の例が参考になりますか。paste 関数を使って単一の文字列にするのがコツのようです。
    > x=runif(10) 
    > plot(1:length(x), x) 
    > legend(2, 0.5, paste("no of point", 10, "  "))   # 最後の空白文字列は隙間調整用
    > legend(2, 0.7, paste("no of point",  length(x), "  "))  

    #ref(): The style ref(filename,pagename) is ambiguous and become obsolete. Please try ref(pagename/filename)

    • 2003-10-18 (土) 18:25:19

[解決]table()で総和を出す方法

初心者2? (2003-10-18 (土) 05:34:19)

を考えています。

table(c(1,1,2,2,3))

とかで、一番最後にTotal 5と表示させたいのですが、いい方法はありませんでしょうか?

  • テーブル化された結果から元のデータ数を計算したいという意味(それとも table 関数そのものの仕様を変えたいという意味でしょうか)だと解釈します。-- 2003-10-18 (土) 18:52:01
    > x<-table(c(1,1,2,2,3)) 
    > sum(x) 
    [1] 5                                               
  • table関数の仕様を変えたいという意味です。 -- 初心者2? 2003-10-21 (火) 00:26:35
  • ttab <- function(x) { c(table(x),sum(table(x))) } としておいて,ttab(c(1,1,2,2,3))では駄目ですか? -- 中澤? 2003-10-21 (火) 01:04:11
  • ttab(floor(runif(10000,1,7)))でもちゃんと一番右に10000と出ます。 -- 中澤? 2003-10-21 (火) 01:16:53
  • ありがとうございます。ttabを使わせてもらいます。 -- 2003-10-21 (火) 11:13:44
  • NAを数えたい方は、-- 2003-10-21 (火) 11:39:01
    ttab <- function(x) { c(x<-table(x,exclude=NULL),sum=sum(x))}

lsfit関数について

R初心者? (2003-10-17 (金) 16:04:08)

lsfit(x,y)$coefで回帰係数であるaとbがX,Interceptとして得られますがRプログラムの中で、その回帰係数を使ってさらに計算をしなくてはいけない状況にあります。しかし、回帰係数a,bをどう取り出していったらよいかわかりません。コンソール上でいちいち呼び出してそれを手動で定義していくしか方法はないのでしょうか?どちらさまか知っておられましたら、ご教授おねがいいたします。

  • すみません。過去の「最初の一歩:必要な出力だけ欲しい時」を参考にした結果、できました。過去ログを確認せずに投稿して申し訳ありませんでした。 -- R初心者? 2003-10-17 (金) 17:38:04

R と Ruby

(2003-10-15 (水) 10:08:18)

RPy (R from Python) http://rpy.sourceforge.net/about.html
このようなのがあるのですね。
Ruby にもあるのでしょうか? 知っていたら教えてください。

  • Rとインターフェースのあるアプリ?にリンク先があります。 -- 2003-10-15 (水) 16:49:11
  • R Math library を Ruby からつかうものは実装があります。RAA:ruby-rmathlib http://raa.ruby-lang.org/list.rhtml?name=ruby-rmathlib -- n? 2003-12-12 (金) 21:03:56

コホネンのSOM_PAKをRから利用できるパッケージ

(2003-10-10 (金) 18:56:10)

 コホネンのSOM_PAKですが、これをRで呼び出して利用できるパッケージはないのでしょうか?CRANなどでは見当たりませんが?

  • 自己レスです。class パッケージにSOMはありますね。 -- 2003-10-16 (木) 02:23:40
  • som(旧名 GeneSOM) というパッケージもありますね。 -- 2003-10-16 (木) 14:28:59

[解決] 配列に収めたデータを正規化したいと思っているのですが…

激・初心者です? (2003-10-09 (木) 11:40:20)

全くどうしたら良いかわかりません。
列ごとに平均・標準偏差を求めて正規化を行いたいのですが、適当な関数があれば教えて頂きたいのですが…。
階層的クラスタリングに用いるデータで、その後の処理(Euclid距離計算・クラスタリング等)はできるようになったのですが、正規化ができません。
VisualBasic?で自作したツールでは不便でRを利用しようと考えているのですが、PCも統計も苦手な私には難儀です。
どなたか、気が向いた方、返答頂ければ幸いです。

  • sweep()(http://finzi.psych.upenn.edu/R/library/base/html/sweep.html)とかscale()(http://finzi.psych.upenn.edu/R/library/base/html/scale.html)でできそうですか? -- 竹澤? 2003-10-09 (木) 12:58:50
  • 関数を簡単に定義できるので、関数を自作し、applyすればいいのではないでしょうか? -- 2003-10-09 (木) 13:04:23
  • 早速、ありがとうございます。 -- 2003-10-09 (木) 16:06:40
  • 上記返答を参考に模索してみます(すぐ利用出来るほど賢くないもので…)。 -- 激初心者です? 2003-10-09 (木) 16:08:51
  • 例えば
    > x <- matrix(runif(20), c(5,4)) 
    > xx <- scale(x, apply(x,2,mean), apply(x,2,sd))  
    行について操作したければ、y <- t(x) と転置しておいて、最後に xx <- t(yy) とすればよい。-- 2003-10-09 (木) 21:36:06
  • 素晴らしいです、出来ました!ご丁寧にありがとうございます。 -- 激初心者です? 2003-10-10 (金) 09:32:38

中澤先生の「Rによる統計解析の基礎」の出版社

(2003-10-06 (月) 13:23:35)

 件名は10月に発行されるようですが、Amazonではヒットしませんでした。

 どこの出版社から出るのでしょうか?

  • 株式会社ピアソン・エデュケーションのようです。 -- 2003-10-07 (火) 02:57:01
  • 中澤 港:「Rによる統計解析の基礎」ピアソン・エデュケーション, 2003年10月15日初版第1刷,A5判,183pp.,ISBN4-89471-757-3, 1,800円+税 -- 2003-10-07 (火) 20:45:12

カーネル密度推定のわかりやすい文献

(2003-10-01 (水) 11:22:20)

 R言語はいくつかのパッケージで多くの種類のカーネル密度推定法をサポートしていますが、この手法をわかりやすく解説した書物はないのでしょうか?

  • この御質問に対する答えとしては、 A. Bowman and A. Azzalini(1997): Applied smoothing techniques: The kernel approach with S-Plus illustrations. (Oxford Statistical Science Ser (OSSS), No. 18), Oxford University Press ISBN 0-19-852396-3が紹介されることが多いようです。W.N. Venables and B.D. Ripley(2002):Modern applied statistics with S-PLUS, 4th ed. (Statics and Computing), Springer-Verlag.ISBN 0-387-95457-0やB. W. Silverman(1986): Density estimation for statistics and data analysis. Chapman&Hall, ISBN 0-412-24620-1 も定番です。 -- 竹澤? 2003-10-03 (金) 09:10:21

[解決]二つのグラフにまたがるタイトル

林 (2003-09-30 (火) 06:04:46)

お世話になります。

#ref(): File not found: "graphs.png" at page "なんでも掲示板アーカイブ(1)"

のようなふたつのグラフにまたがるようにタイトルをつけたいのですが、簡単なR内ですませる方法(lyout関数以外の方法)をご存知の方御教授お願いします。

  • layoutは使った事が無いんですがだいたい以下のようにしてます -- なかま 2003-09-30 (火) 17:35:16
    par(mfrow=c(1,2),oma=c(0,0,2,0))
    deg<-seq(-180,180)
    plot(deg,sin(deg/180*pi),type="l",main="sin")
    plot(deg,cos(deg/180*pi),type="l",main="cos")
    mtext(side=3,line=0,cex=1.4,font=2,outer=TRUE,"sin cos")
  • なるほどうまい。ついでですが、グラフィックス実例集で layout 関数の使い方を載せようとしましたが、png デバイスを使うと最後のプロットだけが表示され? この場合もやはり cos 関数のグラフしか png 画像には表示されません。最後のタイトルも行方不明。なにかコツがあるのか?-- 2003-09-30 (火) 18:15:42
  • おっ、有難うございました。いつもながら、やはり関数があるのですね、、、 -- 林 2003-10-01 (水) 02:09:52
  • 上手く行かないのはpngだけであればpngを疑うしかないかとwin2kでは出るから、*unixでしょうか。ldd /usr/lib/R/modules/R_X11.so と ls -1 /usr/lib/libpng* でわかる*かも*しれません。 -- なかま 2003-10-01 (水) 18:35:59
  • なぜ X11 デバイスには出力されるのに png デバイスだと複数の画面が一緒にならない(例えば example(lm) の4分割の画面はうまく出力されます)のかは不明なままですが、とりあえず X11 画面を png デバイスに再現すればうまくいくことが分かりました。こんな具合です。
    test() # なかまさんの例を X11 デバイスに出力
    pp <- recordPlot() # X11画面への作図手順を記録
    png("test.png")  # png デバイスを開く
    replayPlot(pp)  # png デバイスに出力
    dev.off() # デバイスを閉じる
    • 間瀬? 2003-10-01 (水) 21:33:13
  • 間瀬先生=debianと解釈。libpngのバージョンはいくつなんでしょうか。Rは何処のRでしょう。ちなみにVineもwinも問題ないんですが。(^^; -- なかま 2003-10-02 (木) 16:33:24
  • ローカルなトラブルですか。r-help を探しても報告は見つからなかったので変だなとおもっていました。Debian です。R は ftp://ftp.jp.debian.org/debian-jp stable-jp から apt でインストールしました。/usr/lib/libpng12.a, /usr/lib/libpng.so.2.1.0.12 が入っています。古いバージョンも残っていますが、これが悪さをしている? -- 間瀬です。? 2003-10-02 (木) 19:41:18
  • うちのだと、system(paste("ldd ",R.home(),"/modules/R_X11.so",sep="")) で libpng.so.2 => /usr/lib/libpng.so.2 で実体は /usr/lib/libpng.so.2 -> libpng.so.2.1.0.12 なので同じ?でしょうか。どのバージョンのlibpngだったかは忘れましたがダメなのがあったと思うのでそれかなと思ったんですが。違うようですね。 -- 2003-10-03 (金) 09:52:27

[解決]リストの名前タグ

dimnamesのように? (2003-09-21 (日) 11:01:04)

リストにあとから名前タグをつけるには、どうすればいいのでしょうか?

  • names 関数を使います(変更にも使えます。一部だけ使うには不要な部分に空のタグ名 "" を指定する)。つまり名前タグの実体はリストに付随する名前タグ文字列ベクトル names(x) のことですから、これをいじれば好きなように変えられます。-- 2003-09-21 (日) 11:13:01
    > x=list(1:3,matrix(1:4,c(2,2))) 
    > x
    [[1]] 
      [1] 1 2 3  
    [[2]]     
            [,1] [,2]
      [1,]    1    3 
      [2,]    2    4  
    > names(x) <- c("vector","matrix") 
    > x$vector 
    [1] 1 2 3 
    > x$matrix      
          [,1]  [,2] 
    [1,]    1    3 
    [2,]    2    4 
    > x[["vector"]]
     [1] 1 2 3  
    > names(x)[1] <- "vector" # 一部指定にはこのようなやり方も使えます
    > names(x)[1] <- "" # 名前タグを(見かけ上)取り去る
  • x$matrixには、colnames関数やrownames関数も使えました。ありがとうございました。 -- 2003-09-21 (日) 14:36:00

[解決]関数lagを使いたいのですが

lager? (2003-09-19 (金) 16:02:15)

時系列分析をやっているのですが、
RはSPlusのうち時系列分析関係の関数がかなり省かれているようです。
(たとえばtsplotなども)
lagを使いたいのですが、どこかにないものでしょうか。

  • すみません、パッケージでtsを入れたらできました。 -- lager? 2003-09-19 (金) 16:21:09

[解決]メモリの問題

林 啓一 (2003-09-18 (木) 03:20:51)

メモリが512Mのマシンを再起動後、Rのみを立ち上げて
7万*60変数ぐらいのデータフレームをつくり(下のやつです)
他のソフトで分析するためにwrite.tableで書き出そうとすると
メモリが足りないといわれてしまします。

メモリを変えるor小さく分けて書き出す以外になにか解決方法
ありませんでしょうか?

  • メッセージにもよりますが既に下の方の、Reached total allocation of なら、memory.limit(size=1024)で多少ならどうにかなるかもしれません。ただ、実用レベルから行けば512Mなら768Mあたりかなと思います。実メモリと常駐プロセス、スワップのバランスが崩れると異常に遅くなりますから、なるべくサービスを減らしたり、BIOSでグラフィックに割り当てたメモリの量を減らしたり涙ぐましい努力がないと実用には耐えないと思います。まあRも実メモリ又は1024Mとか根拠の無い上限をお気楽に採用しているので。 -- なかま 2003-09-18 (木) 11:52:51
  • write.tableがメモリを使うのは x <- as.matrix(x) でmatrixに変換しているせいかな。型毎にロジック組むと若干いいのかもしれませんね。 -- なかま 2003-09-18 (木) 11:57:29
  • memory.limit(size=1024)で17Mの.txtファイルの書き出しに成功しました。どうもありがとうございました。Windows2000/XPの主なサービス一覧
    http://www.geocities.co.jp/SiliconValley-SanJose/3220/XP-service.htm を読むといらないサービスばっかりですね>M$

CRANのakimaパッケージ内のinterp関数を入れたんですが…。

wash-and-go? (2003-09-17 (水) 18:21:17)

うまくいきません。途中でエラー出てしまいます。

Error in .Fortran(as.single(x), as.single(y), as.single(z),

as.integer(nx), :

function name must be a string (of length 1)

といった感じです。他にもパッケージが入っておらずエラーが出るの
でしょうか?どれを入れていいかもわかりません。

  • お使いの環境はなにか分かりませんが

     R1.7.1のWin版では、

 library(akima)
 test<-interp(rnorm(10),rnorm(10),rnorm(10))
 image(test$x,test$y,test$z)

 で、なんら問題は出ませんが。 -- 2003-09-17 (水) 19:03:19

  • このパッケージは Fortran コードを使っています。もし Linux 版ならばインストール時に一緒にコンパイルされるはずですが、Fortran コンパイラーがあるでしょうか。 MSW 版は最初からバイナリーのはずで、コンパイルする必要はないはずです。-- 2003-09-18 (木) 19:21:50
  • R から Fortran を呼び出す場合、.Fortran("関数名文字列",引数....)となるはずです。akimaのソースもWinのバイナリも関数名が消えている所はありませんでした。何処からどのakimaをダウンロードしたのでしょう。あと動かない時は最低限環境ぐらいは書かないと判断が難しいです。 -- なかま 2003-09-18 (木) 20:16:33
  • R1.7.0のWin版です。Fortranのコンパイラは入っていないと思います。最低限の環境とはどこまでをかけばよいですか?RをダウンロードしたHPからakimaを落としてきました。 -- wash-and-go? 2003-10-02 (木) 13:21:58
  • たしか、ここから落としてきました。http://www.bioconductor.org/CRAN/ -- wash-and-go? 2003-10-02 (木) 13:41:00
  • R_HOME/library/akima/DESCRIPTION の Buildには何と書いてありますでしょうか。ftp://ftp.u-aizu.ac.jp/pub/lang/R/CRAN/bin/windows/contrib/1.7 とかからひっぱって来てみてください。。http://www.bioconductor.org/CRAN/ の中の人は混乱しているの気がします。 -- なかま 2003-10-02 (木) 16:13:27
  • http://www.bioconductor.org/CRAN/の1.7のディレクトリの中身は1.8.0になってるようで。その上は1.5のだそうです。 -- なかま 2003-10-02 (木) 17:00:38
  • ftp://ftp.u-aizu.ac.jp/pub/lang/R/CRAN/bin/windows/contrib/1.7 からひっぱってきましたが、やはり同じエラーメッセージが出ます。Fortranのコンパイラを入れないと無理ということでしょうか?もし入れるなら、どこに入れればいいんでしょうか? -- わっしゅ? 2003-10-03 (金) 12:29:02
  • インストール時に古いakimaは消されたのでしょうか、akimaのディレクトリごと削除してみてください。インストールは「Pakeages」->「InstallPackage?(s) local zip files」からどうぞ。他には一寸思いつきません。WinならFortrunは不要です -- なかま 2003-10-03 (金) 12:54:57
  • 消しましたがうまくいきません。一度、バージョンを新しくしてみますね。 -- wash-and-go? 2003-10-14 (火) 14:38:30
  • バージョンを1.8.0にしてakimaを入れてみたらうまくいきました。ありがとうございました。 -- wash-and-go? 2003-10-22 (水) 21:25:26

NP問題

なかま (2003-09-17 (水) 14:05:38)

どこかにNP問題の一覧みたいなのって無いんでしょうか。
Rで紐解いてるのがあるともっと嬉しいです。

  • 一覧があるかどうかは知りません。R の base パッケージにはヨーロッパ主要都市間距離 eurodist というデータセットがあり、関数 otptim の例示用コードには、これを SANN (シミュレーテッドアニーリング)法で解いた解(いわゆる travelling salesman problem)があります。NP 困難問題を解くもうひとつの定番手法である GA (genetic algorithm, 遺伝アルゴリズム)用のパッケージがあるとおもったのですが、見当たりませんね。 -- 2003-09-17 (水) 16:51:35
  • 素晴らし過ぎます。でも、キーワードが思い付かないと本当に探せませんね。(^^; -- なかま 2003-09-17 (水) 17:59:38
  • ga は http://www.dst.unive.it/~claudio/R/index.html#ga ですね。 -- なかま 2003-09-18 (木) 00:13:00
  • CRAN パッケージ gafit は曲線当てはめという特殊目的のようですが、GA 手法を使っているようです。 -- 2003-09-18 (木) 00:40:29

[解決] 効率のいいデータの変形(stack)

林 啓一 (2003-09-16 (火) 13:13:43)
一人6回観察されている1万2千件のレコードを1万2千*6回という形にstackしたいのですが、下記のコードではforを使っているため、メモリ512MのPCでやってもUNIXサーバー(下記エラーです)でやっても変形できません、なにかいい解決方法ないでしょうか?

> memory.size(30000000)  
[1] 829953112
> for(id in 1: nrow(data)){ for(t in c(15,22,33,46,50,51)) {
      newdata<-rbind(newdata,cbind(t(data[id,]),outcome=data[id,t],time=t))}}
Error in rbind(newdata, cbind(t(data[id,  ]), outc..: Unable to obtain requested dynamic 
memory (this request is for 2725680 bytes, 830035032 bytes already in use)
  • いまひとつイメージがつかめませんが、t(data[id,])はt(data[id,t])じゃないのかなぁと思うのですが。沢山メモリを使うと思います。 -- なかま 2003-09-16 (火) 16:40:12
  • もちろん perl 等を使ってデータファイルを preprocessing しないでということですよね。 -- 2003-09-16 (火) 20:23:37
  • loopは出来るだけ使わない、cbindやrbindの繰り返しでデータが大きくなっていくようなプログラムは組まない等という鉄則が
    S-PLUS for UNIX/Linux Version 6 Programmer's Guide
    http://www.msi.co.jp/splus/support/download/
    のp.509-14に書いてありました。必要なデータセットは
    y<-c(15,22,33,46,50,51)
    system.time(stackdata<-matrix(rep(as.vector(t(as.matrix(data))),6),ncol=56,b=T))
    outcome<-as.vector(as.matrix(data[,y]))
    time<-sort(rep(1:6,12686))
    cbind(stackdata,outcome,time,unique=1:12686*6)
    で作成できました。お騒がせしました。2行目のn*mの行列をたてに6回並べるのにもっとエレガントな方法があると思いますので、引き続き情報をお待ちします。 -- 林 啓一 2003-09-17 (水) 00:07:17
  • 単純にデータフレームを縦に6個並べると言う意味でしょうか?stackdata<-rbind(data,data,data,data,data,data)。個数が不定と言う意味ならparse(text="rbind(data,...)")みたいにすれば良いと言う意味でしょうか。良くわからんなら書くなと言われそうですが。(笑) -- なかま 2003-09-17 (水) 12:34:30
  • なかまさんありがとうございます。
    stackdata<-rbind(data,data,data,data,data,data)
    が一番早そうですね。Rでいいコードを書くにまとめておきました。 -- 林 啓一 2003-09-17 (水) 12:48:11

SASの番組

(2003-09-15 (月) 20:19:54)

Rと直接関係がありませんが、いま、NTVで有名な福利厚生についての番組をやっていますね。前にTBSのCBSドキュメントでもやっていました。

  • 番組を見ていないでの意味不明です。SAS(あの統計ソフトですよね)を使った解析結果が紹介されていたという意味でしょうか。一寸気になるのでお教え下さい。 -- 2003-09-16 (火) 00:33:30
  • 「世界まる見え!テレビ特捜部」(20:00-20:54)の中の「仰天社員天国」で、SAS社の社員のための福利厚生の充実度の紹介されていました。SASジャパンはどうかは知りませんが。 -- 2003-09-16 (火) 02:47:44
  • R関係と言う事で、Rの日本語化をしている人の福利厚生を紹介しましょう。庭先ではナスが栽培され、駐車場を減らしてジャガイモの栽培が行われています。冬季は家の前が坂なので娘とソリ遊びで楽しみます。(笑) -- 匿名希望? 2003-09-16 (火) 10:41:48

データフレームからの要素の取り出し

竹澤? (2003-09-10 (水) 11:32:56)

竹澤(中央農業総合研究センター・農業情報研究部)です。

 以下のRオブジェクトを実行しました。

function ()
{
xx <- data.frame(x1=c("a1","b1","b1","d1"), x2=c("a2","b2","b2","b2"))
print("xx=")
print(xx)
yy <- xx[,1]
print("yy=")
print(yy)
zz <- xx[,2]
qq <- c(yy,zz)
print("qq=")
print(qq)
rr <- c(as.vector(yy), as.vector(zz))
print("rr=")
print(rr)
}

結果は以下のものです。

[1] "xx="
  x1 x2
1 a1 a2
2 b1 b2
3 b1 b2
4 d1 b2
[1] "yy="
[1] a1 b1 b1 d1
Levels: a1 b1 d1
[1] "qq="
[1] 1 2 2 3 1 2 2 2
[1] "rr="
[1] "a1" "b1" "b1" "d1" "a2" "b2" "b2" "b2"

データフレームからの要素の取り出しには注意が必要なのですね、
ってなことは自明だ、という方が多いのでしょうか。

  • おっしゃりたいことを分かりにくいので、もう少し説明してもらえますでしょうか? -- 2003-09-10 (水) 23:58:46
  • http://buran.u-gakugei.ac.jp/~mori/LEARN/R/R-intro-jp.170.pdf の page27(pdf的には33) の 6.3 データフレームをお読みください。xx <- data.frame(x1=c(100,200,200,400), x2=c(1000,2000,2000,2000)) 等としたものと動作が異なると言う意味ですよね。データフレームの制限事項(在る意味非常に有用ですが)ですね。 -- なかま 2003-09-16 (火) 11:00:38
  • なるほど。 -- 竹澤? 2003-10-03 (金) 08:55:22
  • 「6.3 データフレーム」の「数値ベクトルと論理値、因子はそのままの状態で含まれ、文字ベクトルは因子に強制変換される。その水準はベクトルに現れるユニークな値である」という部分ですね。こういう機能は、使いこなせる人には便利なのでしょうね。 -- 竹澤? 2003-10-03 (金) 08:58:05

2chぽいですが

(2003-09-08 (月) 19:53:26)

http://epio.jpinfo.ne.jp/1057/index.html
グラフがExcelのようですが、Excelで求めたんですかね。


[質問]--vsize --nsize オプションの使い方について…

INA? (2003-09-04 (木) 11:32:47)

 初心者ですが、経済分野の「産業連関分析」で、Rを利用させていただこうと考え、いろいろといじくりまわしています。
 ただ私の環境では、少し大きなデータを読み込ませるとすぐにErrorとなってしまい、はじめの一歩から困っています。(Win2000+256Mメモリ+R1.7.1の環境を作っています)

 どなたか似たような経験をなさった方はおられないでしょうか…ご指導いただけましたら幸いです。
 
 「産業連関分析」では作業の手始めとして「工業統計調査」「商業統計調査」などのデータをとりまとめ、「ある産業がどんな品目の製品を、どれくらいの額出荷したか」の巨大なクロス表(600×600くらい)を作成します。
つまり

		品目1	品目2	品目3…	計

産業分類1
産業分類2
産業分類3
  :


という具合です。

 データの形式は

'産業分類','品目分類','出荷額'←実際は英語です
'1843','184312',33000
'3494','349419',1125
'1931','193111',10979


の形で続いており、約59万レコードあります。(サイズは7MBくらいです)

これを

data <- read.csv("c:?Hogehoge.csv",header=TRUE,sep=",")

で読み込もうとしているのですが、どうしても

$"Reached total allocation of 126Mb: see help(memory.size)"#126Mなんて割り当ててないのに

のメッセージが出て、最後まで読み込むことができません。

念のためvsizeオプションを使い、コマンドラインから

rgui --vsize 36M 

として走らせて見ましたが、やはり読みきれません。


ちなみに同じようなデータ、約18万レコードは問題なく読み込むことができました。
(その後、>tapply(data$出荷額,list(data$産業分類,data$品目番号),sum)  でクロス表にもできました。)
ご存知の方、どうぞご指導のほどよろしくお願い致します。

  • GlobalMemoryStatus? から、R_max_memory = min(1024 * Mega, ms.dwTotalPhys?);R_max_memory = max(16 * Mega, R_max_memory); で、物理メモリーが最大値として設定されます。R_max_memory/1048576 として表示しますから、OSが物理メモリーを126M として認識している可能性があります。タスクマネージャ等でも確認してみてください。 -- なかま 2003-09-04 (木) 13:13:40
  • R上からでも、memory.limit()で認識している物理メモリサイズが解かると思います。 -- なかま 2003-09-04 (木) 13:15:05
  • ご指導有り難うございました。雷の影響かチップがおかしくなっていたようです。でもRでこの大きさのデータを扱うのは、128Mでも足りないものなのでしょうか?(あるいは--nsizeオプションも使うべきでしょうか?) -- INA? 2003-09-05 (金) 09:11:52
  • どういうデータなのかにもよると思いますが、ちょうど126M以上が必要になったのでは? memory.size(TRUE)とかで必要になったサイズのレポートが出ますから、データ量と睨めっこしてみてください。演算すれば更に要求されたりしますから。--vsize とかは古いオプションだったと思います。 -- なかま 2003-09-05 (金) 12:46:45
  • PCをパワーアップして1Gまでメモリを積んだところ、問題なく実行できました。ご指導有り難うございました。 -- INA? 2003-09-18 (木) 12:30:31

最初の一歩:必要な出力だけ欲しい時

角煮? (2003-09-02 (火) 10:38:14)

初心者の私が、必要な出力だけ欲しい時、悩んでしまいました。 それは、以下のような出力でした。

> x<-c(1,3,5)

> y<-c(3,5,4)

> wout<-lsfit(x,y)$coef

> wout[1]

 Intercept 
    3.25 

> wout[[1]]

 [1] 3.25

> cat(wout[1])

 3.25

これで、やっと数値3.25だけ得られました。(ここまで来るのに一苦労。 同じ境遇の方がいたら参考になれば良いですが)

  • lsfit(x,y)$coef["Intercept"] -- 2003-09-02 (火) 11:54:44
  • 私もてこずりました。リスト型式は慣れると便利です。
    Betaの書き出し http://plaza.umin.ac.jp/~epi/cgi-bin/fswiki/wiki.cgi?page=R
    にも書きましたが、SASやSTATAでは簡単に書き出せない統計量など
    (違ったらすみません、)書き出しやすいのがR(S)のいいところです。

1.str() でリストの中身 (階層構造も) が参照できる
2.リストは$名前で参照できるとともに、

[[順番]][[その階層での順番]]

でも参照できるということがポイントだと思います。私なら

str(lsfit(x,y))   
lsfit(x,y)[[1]][[1]]

でその後の解析に使います。cat()までして数字したいという状況に興味があります。--林 2003-09-04 (木) 14:33:07


樹形モデル

(2003-08-30 (土) 11:56:24)

S-plusのtree関数に相当するものは、Rのパッケージに存在するのでしょうか?
アドバイスよろしくお願いします。


software patent in Europe

(2003-08-27 (水) 19:27:59)

9月1日、"software patent "の導入について欧州議会で投票があるようですが。オープンソースも影響を受けるとのことですが、この、"software patent "とはどのようなものでしょうか?


Splusでのinterp()の関数はRにはありますか?

wash-and-go? (2003-08-25 (月) 16:15:24)

影響関数を描くのに必要な関数なんですが、
Rにはinterp()という関数はあるでしょうか?

  • CRANのakimaパッケージ内のinterp関数(不規則分布のポイントよりグリッドデータの作成)が該当するものではないでしょうか? -- 2003-08-25 (月) 16:21:20

gstatの日本語マニュアル

丸山? (2003-08-22 (金) 13:47:42)

CRANに多変量地球統計学のパッケージとして提供されているgstatの
レフェレンスマニュアルを和訳しました.まだ未完成ですが,興味が
ある方は御覧下さい.

http://home.csis.u-tokyo.ac.jp/~maruyama/gstat/gstatmanjp.pdf

作り方のエッセンス(vine linuxの場合)
・/usr/lib/R/share/texmf/Rd.styを?usepackage{Rd.sty}
で指定する.
・/usr/lib/R/library/gstat/latex/*.texを和訳・編集して
つなぎ合わせる.
・コンパイルしてdviファイルを作り,dvipdfm

  • 地理学ご出身の丸山先生に、なんですが、31ページの「メウス川」は一般的な地名表記(文科省指定?)では、「ミューズ川」ではないのでしょうか?それとも、これはオランダ語(フラマン語)での発音? -- 2003-08-22 (金) 15:54:46
  • すみません.改訂時に修正します.この川を知らなかったので,適当に訳しました.それにしても31ページまで見て頂いてありがとうございます. -- 丸山? 2003-08-22 (金) 16:59:47


R Commanderのメニューについて

(2003-08-03 (日) 07:50:20)


R Commanderのメニューって、デフォルトの関数以外でも指定できるのですか?

  • 0.90ではetcに*.Rを入れればできると書かれています。もっとも,0.90にしたら日本語化メニューが通らないという現象が起きて困っているのですが。 -- 中澤? 2003-08-25 (月) 18:04:24
  • 日本語化R.dllを入れると、utf-8が読めないので日本語menuのRcmdrは使えなくなります。多分、sjis対応なTclを入れてリンクしなおせばいいのかなとは思うのですが、まだそこまで手が回っていません。http://www.sra.co.jp/people/m-hirano/tcltkjp/ あたりかなぁ。 -- なかま 2003-08-25 (月) 19:09:53
  • あっ、元もと国際化版のTcl/Tkですから、なんか弄れば出そうですね。 -- なかま 2003-08-25 (月) 19:35:01
  • 0.90の問題ではなかったんですね。R.dllを元に戻してから林さんの日本語化メニューを入れたらそのまま使えました。 -- 中澤? 2003-08-25 (月) 19:44:15
  • Vineのtcltkを引き摺り出して8.0.5のWinのtcltk(SJIS)をこさえてみました。http://r.nakama.ne.jp/R-1.7.1/binary/win32/Rcmdr/ の Rtcljp_pack.20030826.tar.gz を ren $R_HOME/library/tcltk $R_HOME/library/tcltk.orig ; ren $R_HOME/Tcl $R_HOME/Tcl.orig 等としてから置き換えてみてください。2byte目がブラケット'['だと通らないので、長音'ー'はマイナス'‐'に置き換えるとうまくいきます。 -- なかま 2003-08-26 (火) 18:30:35
  • 今ひとつ分かりませんが、0.90は日本語化R.dllでは動作しないということでしょうか? -- 2003-08-27 (水) 11:15:21
  • メニュ‐ファイルをRで読み込むんですが、SJISをきちんと読み込めるように細工したのが日本語版R.dllです。でも林さんのファイルはutf-8で、tclもutf-8です。で、副作用が発生してエラ‐(読み込めない)になります。PC-UNIX系ではtclは添付されてないので、例えばVineの場合eucなtclが入っているのでそのまま動きます。 -- なかま 2003-08-27 (水) 12:14:33
  • ここだと判りにくいと思うので詳細?はRと日本語にまとめてあります -- なかま 2003-08-27 (水) 14:12:39

Rのライセンスについて

(2003-08-03 (日) 03:32:38)


ところで、RはよりゆるやかなLGPLなどのラインセンスには移行しないのでしょうか?

  • 将来のことは R Foundation メンバーが決めるのでしょうが、現在のところ可能性は低いと思います。もしそれをしたら、貢献者から猛反発がでるのでは。 -- 2003-08-04 (月) 23:10:45
  • 他のGPLのソースとか(LGPLのソースも)もRには含まれています。LGPLに移行するのはコアメンバーにとってもコストもメリットも無いでしょう。 -- なかま 2003-09-16 (火) 11:37:49

夏時間

なかま (2003-08-01 (金) 11:08:15)


検証しようとする方は、

export TZ=est5edt # 夏時間
export TZ=est5    # 夏時間無し

日本にもそういえば戦前、二つの時間があった時期がありましたね。(生まれるずっと前)

# 北米におけるtimezone は以下参照
http://cvs.parisc-linux.org/glibc/timezone/northamerica?rev=1.1&content-type=text/vnd.viewcvs-markup
日本も明治6年より前は太陰暦だし(閏3月とか表現は難しい)、グレゴリオ暦の導入時期も各国バラバラ。イスラム歴はよくわからないし。
商用ソフトでも、西暦9999年まで大丈夫と言いながら、西暦0年があったりするので、暦の話は難しいですね。

# そのうち実装する人が現れるのだろうか?


VineLinuxユーザ向けESSのrpmこさえました

なかま (2003-07-31 (木) 18:36:50)


http://www.nakama.ne.jp/memo/cran-R/ess/ からどうぞ。
ところで、VineLinux使ってる人ってどの位いるんでしょうか。

  • 素晴らしい!!!早速ダウンロードさせてもらいました。インストール時にバイトコンパイルされたせいか、rpmに切り替えたら起動がずいぶん速くなりました。 -- 2003-08-21 (木) 17:52:09
  • おまけに、私のW2K上のMeadowにessを入れた例?も追加してみました。 -- なかま 2003-08-25 (月) 18:16:14

[質問]if(0){}を色分けしてくれるエディタ

コメント多用するので、、、? (2003-07-30 (水) 11:07:09)


Rでの複数行コメント
if(0){
コメント
}
を色分けしてくれるエディタというとどのようなエディタでしょうか?EMACS/ESSだとできますでしょうか?

  • これは本来のコメントではなく、正規の構文の特性を生かした裏技的なやりかたなので、無理なのでは。少なくとも私のXemacs+ESS では色はつきません。Elisp 通ならそうなるようにすることは可能だと思いますが。 -- 2003-07-31 (木) 09:16:26
  • 裏技ということは承知しています。正規表現とかでうまくいくのでしょうか?そっか受けの}の直前にユニークな文字などを書くようにすればいいのですね、、、しかし今使っているエディタでは複数行の色分けに対応していない罠。ESSではキーワードなど複数行にわたっている場合色分けしてくれますか? -- 2003-07-31 (木) 11:13:02
  • ヒントになるかどうかわかりませんが、Xemacs では対応括弧の間を(カーソルが一方の括弧の位置にくると)ハイライトしてくれる機能があります。私はこれで不便を感じていませんが。 -- 2003-07-31 (木) 11:57:03
  • Windows 上の editor でよければ。 -- 2003-09-11 (木) 23:37:08
  • 済ません、上の書き込みの続きです。真魚[まな] www.vector.co.jp/magazine/softnews/ 020529/n0205294.html これはいかがですか。少なくとも ( ) # { } は同じ色が付きます。コメントも付けられますが、まだ私には使用法が判っていません。 -- 2003-09-11 (木) 23:42:49

Eclipse プラグイン

(2003-07-30 (水) 07:08:12)


R-helpで流れているように、R用のEclipseプラグインの開発を考えている方、おられませんか?

  • 7/30から今までに何のレスも付いていないところを見ると、おられないようですねえ。 -- ???? 2003-12-11 (木) 16:20:32

四捨五入

なかま (2003-07-29 (火) 09:42:52)


私は銀行屋でもなく、科学技術計算をする訳でもないので、roundがIEEEでは
いささか都合が悪いです。

oround <- function(f,n=0)
{
    five <- 0.5
    signed <- sign(f)
    signed[signed == 0] <- 1
    r <- f
    p <- 10**(n)
    r <- abs(r) * p
    r <- floor(r + five)
    r / 10**(n) * signed
}

と、とりあえず濁して書きましたが、どなたか車輪を既に発明していませんか。?

  • だいぶ前に、Excel の四捨五入は IEEE 方式でないと聞きましたが、現在は? -- 2003-07-29 (火) 10:54:53
  • 無知で申し訳ないのですが、IEEE 方式って何ですか? -- 2003-07-29 (火) 11:31:31
  • google で四捨五入をキーワードに検索するとわかります。普通に知られている四捨五入と JIS やISO で定めた方式とは一部ですが微妙に異なります。と書いて?と思いました。これと IEEE 方式とは同じですよね。 ところで銀行屋さんは四捨五入するのですか。-> 為替相場は小数だからやはり使うかな、利子計算もあるし。いややっぱり、事情(どちらが得か)に応じて、切り下げ、切り上げをもっぱらしていたりして。-- 2003-07-29 (火) 11:50:24
  • JIS,ISO式四捨五入 を参照 -- 2003-07-29 (火) 18:04:48
  • よく、消費税の小数点以下を四捨五入と言うのを見ます。Excelの場合はマクロのroundだと四捨五入でVBAだとIEEEで計算されます。(^^; roundした総和は必ず四捨五入の方が大きくなるのでは?(税務署の罠?) -- 2003-07-29 (火) 23:17:24
  • JIS,ISO式四捨五入 にシミュレーション結果
  • Banker's rounding(五捨五入)とround off(四捨五入)の説明する場合に、R風だとsum(seq(1,100))とsum(hogeround(seq(1,100),-1))として説明します。誤差が少なくなると言うのと、現実社会での表現の差を今のところ瞬時に一番解かってもらえる方法と自分で思ってます。(一般の人は小数が入るとピンと来ませんし、バグじゃないのかと言われても適材適所で使うものと説明するのも困難な部類ではないかと)(^^; -- なかま 2003-07-30 (水) 10:21:42
  • 書き込むべき所が分かりませんでしたので、こちらに書きます。JIS,ISO式四捨五入(R 1.81)において、round(0.5:605.5)は全て規格通りに丸められていますが、round(0.55:600.55,1) や round(0.055:600.055,2) では、整数部の大きさによって丸め方が異なっています。例えば round(0.55,1)=0.6 なのに round(2.55,1)=2.5 となってしまいます。これは既知のバグなのでしょうか。 -- ちゃんぺこ? 2003-12-06 (土) 13:51:41
  • oroundにもエラーが出るようです。> oround(0.135,2) [1] 0.14 > oround(0.145,2) [1] 0.14 floor関数もround関数同様の問題が含まれていると思われます。 -- zushi? 2013-11-16 (土) 00:07:23

不思議な関数

r-help の記事から (2003-07-28 (月) 13:36:01)

 > "+<-" <- function(lhs, rhs, value) value - rhs
 > x + 1 <- 3
 > x
 [1] 2

つまり x + 1 == 3 が成り立つように x の値が決まる。面白いけど使い道は?

  • 1.8.0からは出来なくなりました。(バグでしょやっぱ) -- 2003-11-11 (火) 18:01:43

R の使い方

(2003-07-26 (土) 21:05:31)


「うがっ!ここは R の出番だ!」
さぁ,貴方はどうする?
(1) RGui 起動!
(2) コマンドラインから R 起動
(3) お気に入りのエディタ起動(含・MS Word)で,関数を書き始める
(4) お気に入りのエディタから R 起動 (ex. ESS)

普段どのように使っているかも知りたい所です.
私は,Emacs から ESS ですが,小数派でしょうか?


curve関数

(2003-07-26 (土) 19:10:28)


curve(sin,-100,100)とxの範囲を広くすると見るも無残な曲線が描画されますが
これは仕様ですか?

  • デフォールトがこうなるという意味では仕様です。そもそもほとんどx軸と区別がつかないグラフを書いてどうされるつもりですか。 -- 2003-07-26 (土) 21:10:17
  • curve のhelp を見たら,n という引数が指定できますね。
> curve(sin,-100,100,n=10000)

とか書けば(出力デバイスの解像度が許せばだけど)ちったあましなサインカーブになる -- 2003-07-27 (日) 04:43:26

#ref(): File not found: "sin1.png" at page "なんでも掲示板アーカイブ(1)"

  • あまり横に長いものをおかれると他の記事が見にくくなりますのでご配慮を。 -- 2003-07-27 (日) 08:06:46
  • n という引数を学習しました。ありがとうございます。画像小さくしておきました。 -- 2003-07-27 (日) 10:25:22
  • 質問者です。Helpにもしっかり載ってますね・・・お蔭様で理由もわかりました。ありがとうございました。 -- 2003-07-28 (月) 12:28:27

ラグ変数の作り方?

(2003-07-25 (金) 12:11:44)


教えてください。
Rにおいて、回帰分析をする際に1期前のラグ変数をどうやって表現すればいいのでしょうか?他のパッケージソフトですと、"変数名(-1)"などが一般的だと思います。今の所、スプレッド形式のソフトでラグ変数を作り、Rにloadしているという使い方をしています。
また、時系列データをRで扱う方法として、CSV形式ファイルをread.talbeで読み込み、attachを掛けて、tsコマンドで時系列データとして認識させる方法を扱っています。その際に、attachをデータフレーム全体に掛けると、tsで時系列データとして認識させた後各変量が個別で扱えません。
何か間違っているのでしょうか?よろしくご指導ください。

  • 一期前の変数ですか。
> x <- 1:10
> lag.x <- c(NA, x)[-length(x)-1]

かな?NA を取るなどはその後で -- 2003-07-25 (金) 12:18:33

  • ts ライブラリーにはそのものずばり lag という関数があります。
Description:
    Computed a lagged version of a time series, shifting the time base
    back by a given number of observations.
Usage:
    lag(x, k = 1, ...)
Arguments:
    x: A vector or matrix or univariate or multivariate time series
    k: The number of lags (in units of observations).

matrix(1:15, nc=3, byrow=TRUE) に対して,各行に 11:13 を加えるにはどうしますか。エレガント(?)な解を

  • 5x3 行列を 5x6 行列にするという意味ですか。rbind、cbind を使えば二つの行列をつなげることができます。 -- 2003-07-25 (金) 08:15:36
  • cbind(matrix(1:15, nc=3, byrow=TRUE), matrix(rep(11:13,5), nc=3,byrow=T)) --2003-07-25 (金) 09:24:08
  • エレガントではありませんが、、、
cbind(matrix(1:15,nc=3,b=T),11,12,13)

はどうでしょうか?足りない要素は繰り返されるというのがポイントです。

  • x <- matrix(1:15, nc=3, byrow=TRUE) とすると,t(t(x)+11:13) ということでしょう。足りない要素が繰り返されるのが列優先なので,行列を転置して加算し最後にまた転置して元に戻すのがポイント。 -- 2003-07-25 (金) 11:48:13
  • Tips なのかな -- 2003-07-25 (金) 11:49:25
  • そっかt()か・・・ -- 2003-07-25 (金) 12:10:16

数値ベクトル x(x(i), i = 1,2,...,n)があり,xx(1) = 0,j=2,...,n-1 については xx(j) = sum(x, i=1,...,j-1)となるベクトルを定義するには?

  • たとえば,x <- 1:10; n <- length(x); c(0, cumsum(x))[-(n+1)] かな -- 2003-07-25 (金) 11:58:18
  • 同じことですが c(0,cumsum(x)[-length(x)])。いずれにしても 累積和ベクトルを作る関数 cumsum を知っていればいかようにも対処できるのでは。 -- 2003-07-25 (金) 17:33:44

viバインドのコマンド編集

~emacs? (2003-07-24 (木) 12:40:23)


Rはreadlineライブラリを使ってるようなのでemacsバインドではなくviバインドにもできるような気がします。実際はどうなのでしょうか?
ご存知の方がいらっしゃったら教えてください。

よろしくお願いします。

  • readlineだから、(M-C-j)でvi、(C-e)でemacs。 -- なかま 2003-07-24 (木) 16:58:25
  • レスありがとうございます。M-C-jとは(Meta-Control-j)でよろしいのでしょうか? -- ~emacs? 2003-07-24 (木) 21:31:17
  • Metaは何なのでしょうか。。。。EscでもAltでもできませんでした。環境はLinuxとcygwinです。 -- ~emacs? 2003-07-24 (木) 21:33:10
  • [Alt]+[Ctrl]+[j] です。man readline に書いてあります。inputrcにset editing-mode vi と書いてもOKです。どのinputrcを読みにいったかは、strace -f R 2>log.txt 等として参照してみてください。あと環境によってキーバインドが異なるのかもしれませんね。 -- なかま 2003-07-24 (木) 22:08:57
  • .inputrcで実現できました。ありがとうございました。 -- [[~emacs? ]] 2003-07-26 (土) 19:05:49

RGui の help() で検索はできる?

(2003-07-23 (水) 15:18:08)


MS Windows 阪の RGui で help() を使うと別ウィンドウが出ますが,この中で検索はできるのでしょうか?
CUI 阪のコマンドラインですとページャ (ex. less) の機能で可能ですが

  • help("hoge",htmlhelp=T)ではダメでしょうか。どのみち別窓ですし。 -- なかま 2003-07-24 (木) 17:02:17
  • help("hoge",htmlhelp=T) これっていいですね。私はいままで、editorにcopy pasteして行っていました。 -- mitsu5? 2003-07-24 (木) 23:50:29
  • help.start() しておけばよいのですね.ってか何故検索できないのでしょうね? すごく不便ではないですか? -- 2003-07-25 (金) 00:04:32
  • emac/essやexyzzyなどhelpの結果を検索できるのではないでしょうか? -- 2003-07-27 (日) 11:20:39

RSSからHTMLの生成

? (2003-07-19 (土) 14:57:47)


うちのサイトでこちらのWikiのRSSを利用したページ
http://www.ikushimo.com/sal/diaryandwiki.html 
を作成しました.
サーバに負荷がかかるとやめるかもしれませんがとりあえずご連絡しておきます.
このページのソースに書いてあるタグを打ち込んだページを用意すれば皆さんのサイトにもRjpWikiの更新されたページ15件分のリンクを入れられます.
ただし, うちのサーバかこちらのサーバのどちらかが止まっているとダメですけど.

  • 便利に使っています。--チルダの位置を変えました。

[質問] R の因子分析法について -> 希望の手法は現在の R には無い?

(2003-07-18 (金) 06:32:48)


SPSSなどではメインである主因子法を、なぜRはサポートしないのですか?

  • ある分野では中心的である手法も、統計学全体から見れば、むしろ特殊ということも良くあります。商用ソフトはそれぞれ、顧客の種類に応じて特殊化する傾向があるようです。主因子法とは principal component analysis のことでしょうか。貢献パッケージ一覧を検討して下さい。もしくは CRAN の検索機能で検索すればおそらく見つかるでしょう。R はボランティア作業で成り立っています。もし、重要であれば、誰かが作っているはずです。多変量解析関連のパッケージに入っている可能性も高いですね。私自身は使ったことがありませんが、どなたかユーザーからからコメントがあるといいですね。 -- 2003-07-18 (金) 07:55:22
  • レスありがとうございます。principal component analysis は主成分分析で、やや因子分析には似ていますが別物で、これもrに含まれています。私の質問の趣旨は、私の言葉足らずで申し訳ありませんが、Rは因子分析をサポートしているが(factanal関数)、因子を求める手法については最尤法のみのサポートに留まっており、S-PLUSのように何ゆえ、主因子法をサポートしないのでしょうかということです?CRANでの検索などを行いましたが、いつもこの話は立ち消えのようです。また、慶應の渡辺先生のサイトにはRのスクリプトがあることは存じておりますが、やはり、因子分析の計算がケースが多ければ、計算時間がかかるので、ネィティブなライブラリをコールしてあるものがあればよいのですが。 -- 2003-07-18 (金) 11:09:04
  • とんちんかんなコメント失礼しました。
  • 主因子法より最尤法が明らかに優れているので,あえて主因子法をサポートする価値がないと判断しているのではないでしょうか。主因子法は古典的な方法になってしまいました。同じく,因子軸の回転といえばバリマックス直交回転というのが普通でしたが,今では斜交回転の方が推奨される。斜交回転して直行していれば「ああそうなんだ」ということですよね。斜交回転では結果として直交回転でいいことはわかるが,直交回転では斜交回転の可能性などさぐれない。 -- 2003-07-18 (金) 21:13:23
  • 質問者です、懇切丁寧なレスありがとうございます。因子分析については再度テキストを調べてみます。しかし、やはり、deterministic に言われるよりも、色々な手法が試せるほうが、過去の研究の手法と比較しながら、使って納得できるのではないでしょうか? その方がRらしい。-- 2003-07-18 (金) 23:17:34
  • 「色々な手法が試せるほうが、過去の研究の手法と比較しながら、使って納得できるのではないでしょうか? その方がRらしい」これは大きな誤解です。 むしろRらしいのです。R を支えているボランティアたちは現在の統計学の staus quo を提供しようとしています。商用ソフトの無料版を提供するためにボランティアしているわけではないのです。使用者の欲しがるものを提供するのは、そして欲しがらないものは無視するのは、商用ソフトです。だって、金とってるんですから。むしろ pspp (SPSSのクローン) を試されてはいかがでしょうか。
  • オープンソースなのですから、どうしても必要としている方が多ければ、自然とどなたかが作ってcontributeされるものだと思います。Rぐらいメジャーなオープンソースプロダクトになると、Rでサポートされていない方法はむしろ必要としている人がさほど多くない、というようにも判断できるかもしれません。 -- 2003-07-19 (土) 10:08:58
  • biased sampling かも知れません。旧来の方法に不満を持つ人が R/S を使い、そして contribute する。結果として旧来の方法は R/S にない。商用ソフトは、良かれ悪しかれメインのユーザーのレベル(決して低い、高いをいうつもりはありません)以上でも、以下でもないような。-> 多少偏見気味、当方貧乏で商用ソフトを試す機会に恵まれません。

[質問] データ読み込み時に列や行を選ぶことは出来ますか? -> できないことはなさそう

SASから移行です (2003-07-18 (金) 03:5:42)


大きなデータを扱っているもので、上記のことができるといいのですが、helpではよくわかりませんでした。どなたいい方法をご存知ですか?

  • データがファイルに平文で書かれていると仮定します。また、一度に R に読み込むのは難しいとも仮定します。こうした時の普通の、そして賢い、やりかたは Perl, Awk 等のツールで簡単な(慣れれば :-))スクリプトを書いて、必要な部分だけを抜き出してから(一旦ファイルに書き出すか、Unix のパイプ機能を中間に使い)R に読み込むことだと思います。
  • SAS ではそうした作業を Proc Data で行いやすいので,そうしたことを R 環境内でできないか,そうしたドキュメントはないか,という質問と思われますが,どうでしょう -- 2003-07-18 (金) 12:40:40
  • 補足ありがとうございます。そのようなことです、上記のようにスクリプトを書かずにRで読み込めればいいのですが、、、 -- 2003-07-18 (金) 15:53:33
  • UNIXで列を選ぶだけなら、pipeコマンドを使って awk をR内部から呼び出せばよいのではないでしょうか。たとえば foo.dat の3、5カラムだけを取り出したい場合は、read.table(pipe("awk '{print $3,$5}' foo.dat"))とか。 -- wisteria? 2003-07-18 (金) 16:45:18
  • R に読み込めるデータの限界はどの程度なのでしょうか? テキストで保存されているとして. -- 2003-07-18 (金) 17:56:56
  • Rに読み込めるデータ量は、R起動時に --max-vsize とか --max-nsize オプションで指定できます。メモリがたくさんあるマシンなら大量に読み込みできるでしょう。 -- 2003-07-18 (金) 18:36:54
  • help("Memory") and help("memory.profile") を参考に調整してみてください -- 2003-07-19 (土) 05:37:57
  • scan() を使うのかなぁ? -- 2003-07-20 (日) 00:51:31
  • ありがとうございます。?scanに書いてあるようにskipやnlinesを使えば
scan("ex.data", skip = 1, nlines=1)# only 1 line after the skipped one

のように読み込みたい(途中の)複数行を選択できますね、--SASから移行

  • ?read.table読み返したらskipはread.tableでも使えます。大変失礼しました。

[質問] perlからRの関数を呼ぶ方法は? -> とりあえず解決?

福重貴雄? (2003-07-17 (木) 18:48:03)


(j)perlを使っていますが、perlからRの関数を呼べるようにするにはどうすればいいのでしょうか? 
RSperlというものがあるらしいのですが、ネットで検索してもよく分かりませんでした。
具体的には qbeta()を呼び出したいのですが。
よろしくお願いします。

  • こういう時は CRAN の検索エンジンで R の ML の過去記事から、適当なキーワードで検索するのが第一です。私は Perl と R を同時に使うなど考えたこともないので、提案はありませんが、世界には同じようなことを考える人が必ずいます。今少し眺めてみたら、R 内部から Perl を呼ぶ、R をコマンドラインで使用(おそらく Perl から)、等方法はいろいろありそうです。RSPerl のことも話題にありました。 -- 2003-07-17 (木) 20:21:10
  • Tips 集 PerlスクリプトからRを起動する が参考になりますか?
  • Rとインターフェースのあるアプリ?に"RSperl"のリンク張って起きました -- 2003-07-17 (木) 23:54:26
  • ありがとうございました。実行時間は急がないのですが、コーディングは急ぐので、まずはスクリプトを書いてRをバッチで動かす方法をやってみます。その後PSPerlにも挑戦してみようと思います。 -- 福重貴雄? 2003-07-18 (金) 17:26:45

SAS JMP

(2003-07-17 (木) 17:27:21)


http://www.jmp.com/japan/news_and_event/jmp_press_releases_2003_07_17.shtml

[[Rを動かしているプラットフォーム]]が影響ってことは流石にないか。~
  • そもそもRを使う動機は、Linux上で統計パッケージを使いたかったから。JMP for Linuxのβテスト参加の申し込みをしました。 -- 2003-07-23 (水) 17:06:09

[質問] それぞれのステップにかかった時間を知る方法は? -> 解決済み

SASから移行です。? (2003-07-17 (木) 03:08:27)


SASのようにプラグラムを走らせるのにかかった時間を出す関数はあるのでしょうか?




トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Google
WWW を検索 OKADAJP.ORG を検索
Last-modified: 2015-03-01 (日) 01:15:59 (1719d)