RjpWiki自体へのコメントでも、雑談でもOKな掲示板です

注意:新規記事用の入力欄は以下の目次の直後にあります。各記事への追加コメントの入力欄は、各記事の後にあります。


過去の記事のアーカイブ 。アーカイブ中の記事への追加コメントは自由です。ただしあまり古い記事の場合は、最新の「なんでも掲示板」に新規に項目を立てられた方が良いかも知れません。



回答を期待する記事は原則 質問コーナー Q&A にお願いします。「なんでも掲示板」はそれ以外の本来の(長めの)コメント専用にすることを提案したいと思います。


R ユーザー会まとめ

間瀬茂 (2005-12-11 (日) 07:12:32)

 計数理研究所の中野先生の御世話でRに関する講演会が開かれました。ご参考までに講演のごく簡単な内容紹介を。

今回(10日)の講演は主に RjpWiki の常連寄稿者によるものでが、狭い部屋でしたが一杯になる熱気でした。次回の話もでました。どんな内容にしたら良いか、より広範囲なユーザーに参加してもらうための方策なども。

平成17年度統計数理研究所共同利用研究集会

「データ解析環境Rの整備と利用」

プログラム

開催場所:東京都港区麻布4−6−7 統計数理研究所新館2階研修室
日  : 2005年12月9(金),10(土)日

12月9日(金) (使用言語:英語)
Talks by Simon Urbanek (AT&T Research Labs), a member of the R core development team
これは都合で聞けませんでしたが、聞いた方の感想では非常に面白い話だったとか。

12月10日(土) (使用言語:日本語)

10:00-10:30 舟尾 暢男 (武田薬品)R 初心者からみた R 初心者の現況
Rtips 作者。Rtips 執筆に至る経緯や、Rtips 精選版出版のニュースも。 製薬業界での統計解析の話も紹介されました。

10:40-11:10 中間 栄治 (COM-ONE)私的R利用方法
R の日本語化の話かと思いましたが、内容は初めて聞く、 namazu の姉妹ソフト gonzui を使ったソースコード検索システム開発の話でした。R ドキュメント検索システムは既にありますが、確かにこうしたものがあれば参考コードを見つけるのに便利そう。すでに中間さんのサイトで試験公開中ですのでお試しあれ。

11:20-11:50 岡田 昌史 (筑波大学)RjpWikiのこれまでとこれから
RjpWiki 管理者による苦労話、および今後の RjpWiki 運営・仕様に関する話 。次世代 R user (岡田ジュニア) の紹介も。

13:30-14:00 久保 拓弥 (北海道大学)生態学分野での R の使われかた紹介
生態学研究者の生態に関するサーベイと、生態学分野での統計の使われかたに関する紹介。glm (一般化線形モデル)の有用性。より詳細は癖になりそうなちかごろのぎょーむ日誌 をどうぞ。

14:10-14:40 中澤 港 (群馬大学)医学統計教育におけるRの利用
医学部生に対する統計学教育の苦労話。時間数の少なさは確かに問題。

14:50-15:20 中野 純司 (統計数理研究所)統計数理研究所でのR
自ら統計解析システム開発にも携わる研究者の話。研究所自慢のグリッド計算機に並列計算 R を組み込んだ話(噂では中間さんが業務で活躍)。共同利用機関ですから、「早すぎる R」を試して見たい方はコンタクトを。

15:30-16:00 間瀬 茂 (東京工業大学)R の S4 クラスとメソッド入門
気になるけど今一意味不明な S4 (S 言語第四版)クラスとメソッドの私的紹介。一般ユーザーには取り敢えず不要な知識ですが、概略を知っておくとドキュメントを読むとき役に立つ(かな)。

16:10-16:40 谷村 晋 (長崎大学)Thematic Cartography with R
疫学研究者による R を用いた主題地図の表現法いくつかの紹介。


ちょっと面白いかも

QDU (2005-12-03 (土) 22:32:30)

こんな記事みつけました


統計解析システム Ox

間瀬茂 (2005-12-03 (土) 06:24:52)

京都でひらかれている統計の集会に参加していて、経済関係の人が使っている Ox というソフトのことを耳にしました。調べてみると商用ソフトですが Academic use に限っては使用自由というライセンスのようです。C 風のシンタックスのコンパイラ型統計言語のようです。うわさではかなり早いとのこと。R では遅すぎるという方(& C 風のプログラミングに抵抗の無い方)はためされては。以下のサイトからダウンロードできます。多くのプラットフォームで動くようです。東大の大森先生による日本語の簡単な使用法へのリンクもあります。`
Ox公式サイトはここ
私は R が大好きですが、ただし R だけが唯一無二のソフトでないのは当然のこと、好敵手が無ければどんなソフトもいずれ退化するのがダーウィンの教え。


R ユーザー会御案内

間瀬茂 (2005-11-21 (月) 16:01:50)

統計数理研究所の中野先生の御世話でRに関する講演会が下記の要領(一部変更の可能性あり)で開かれることになりました。特に二日目は RjpWiki でもおなじみの顔ぶれがほとんどの、実質的な R ユーザー会になりますので、御参加のほどよろしくおねがいします。参加は自由でもちろん無料です。

私も S 言語第4版のクラスとメソッドについて、自分の勉強がてらお話する予定です。本当は私の専門分野での R の使われ方を紹介するところですが、よくよく考えてみると私はそんなに R を使っていないことに気付きました(笑)。なお、このユーザー会は中間さんの「IPA プロジェクト」が無事終了した祝賀会を勝手に兼ねる予定です。

以下中野先生からのメイルを転載:

みなさま

フリーの統計解析システムRに関する下記の共同利用研究会を開催します。参加
は自由で,一日だけの参加も歓迎します。多くの方のご参加をお待ちしています。中野純司@統計数理研究所


平成17年度統計数理研究所共同利用研究集会

「データ解析環境Rの整備と利用」

プログラム

開催場所:東京都港区麻布4−6−7 統計数理研究所新館2階研修室
日  : 2005年12月9(金),10(土)日

12月9日(金) (使用言語:英語)

Talks by Simon Urbanek (AT&T Research Labs),
           a member of the R core development team

13:30-14:30 Talk 1:
   iPlots - Interactive Graphics for Data Analysis in R

14:45-15:45 Talk 2:
   JGR - Java GUI for R and Java/R interfaces

16:00-17:00
   Parallel computing in R - Top Trees models space exploration

      (それぞれの talk の abstract が下のほうにあります)

12月10日(土) (使用言語:日本語)

10:00-10:30  舟尾 暢男 (武田薬品)
   R 初心者からみた R 初心者の現況
10:40-11:10  中間 栄治 (COM-ONE)
   私的R利用方法
11:20-11:50  岡田 昌史 (筑波大学)
   RjpWikiのこれまでとこれから
12:00-13:30  昼食
13:30-14:00 久保 拓弥 (北海道大学)
   生態学分野での R の使われかた紹介
14:10-14:40 中澤 港 (群馬大学)
   医学統計教育におけるRの利用
14:50-15:20  中野 純司 (統計数理研究所)
   統計数理研究所でのR
15:30-16:00  間瀬 茂 (東京工業大学)
   R の S4 クラスとメソッド入門
16:10-16:40  谷村 晋 (長崎大学)
   Thematic Cartography with R
16:50-17:20  総合討論
18:00-       懇親会(広尾近辺)




Abstract of talk 1:

 R is a very flexible and powerful software for statistical computing.
It extensibility is leveraged by hundreds of packages offering a wide
variety of tools in many areas in applied sciences. However, the is
one aspect that covered only partially and that is graphics. R
produces high-quality static graphics for publication purposes, but
it lacks interactive graphics for explorative data analysis.

 iPlots attempt to remedy this shortcoming by providing platform-
independent interactive graphics for R. The iPlots package offers a
wide range of fully interactive graphics including scatterplots,
histograms, barchars, mosaic plots, parallel coordinates plots and
many others. Moreover iPlots are based on a very flexible and
extensible engine for creation of arbitrary interactive graphics: iBase.

 In this talk we will demonstrate the use of iPlots as a tool for
exploratory data analysis and discuss the basic concepts of iPlots.
We will also provide insights into the iBase framework for creating
new interactive graphics. All this will demonstrated on practical
real-word examples.

Abstract of talk 2:

 R can be made accessible to a broader range of users by using
graphical user interface (GUI) to provide additional support for the
user. JGR - Java GUI for R is a cross-platoform GUI for R. It
flattens the learning curve, is valuable for teaching statistics, but
also includes features that will be welcome even by power-users.

 In this talk we will demonstrate various features of JGR, such as the
intelligent console, code editor, object browser, help system and
package installer. In addition we will discuss integration of iPlots
(interactive graphics for R) and iWidgets (custom user interface
elements in R) in JGR.

 We will also look behind the scenes and consider several R/Java
interfaces, their differences and applications. Furthermore we will
show how to integrate own Java code into R and use R function from
within Java.

Abstract of talk 3:

 For historical reasons, R is a single-threaded application. Nevertheless,
in this talk we will show how can R be successfully
leveraged for parallel computing. Most common approaches involve
running several R processes using various kinds of inter-process
communications.

 In this talk we will discuss several different methods of parallel
computing in R. We will also show step by stop how parallel computing
can be made easy using the snow package for R. In addition, we will
present in detail a practical example of model space exploration of
tree models that we performed using massive parallel computing.

WinXPとLinuxの速度比較

msasaki→佐々木 (2005-10-25 (火) 23:53:42)

WinXPとLinux(FC4)を同一マシン(Athlon64,3200つまり2GHz,memory2G)でどちらか早いか比較しました(?)。課題は行列Tipsにある2900の正方行列の逆行列を求めるというものです。結果は、Wondows100秒、Linux101秒で大差ありませんでした。Windowsとは意外と早いものだったのですね。


生物統計ハンドブック

濱マイク (2005-10-25 (火) 21:12:09)

S-PLUS本なのですが,「実用S-PLUS生物統計ハンドブック」が発行になるらしい.数理システムユーザーコンファレンス2005開催案内より.


R の入門的講義

間瀬 (2005-10-18 (火) 15:24:21)

統計数理研究所の公開講座(有料)で R の(入門的)講義が開かれるようです。詳しくは URL
http://www.ism.ac.jp/lectures/1711-1.html を御覧下さい。


確率分布同士の演算の信頼区間

takahashi (2005-10-11 (火) 20:54:48)

Rとは直接関係ないのでここに書いてみます(説明はRでしてみます).

Windows R-2.1.1 etc folder の rgb.txt

mitsu5 (2005-10-05 (水) 12:57:41)

version 2.1,1 を Windows にインストールしてみてしばらくまごまごしました。
R window の background color を前に使用している色に戻せなかったことです。
しばらく試行錯誤をしていて、etc folder に rgb.txt file がないことに気付き、これを別の所からもって来て解決しました。
どの version からこうなったのでしょうか。私のような人のために書いておきます。


R ユーザー会?

間瀬 (2005-09-21 (水) 09:57:24)

統計数理研究所の中野先生が中心となり R をテーマにした研究会が開かれる予定です。海外からの招聘者の話と、日本の R ユーザーによる肩の張らないお話の二本立て(2日間の予定?)になる予定のようです。現在日程調査中です。もうすこしはっきりしたらお知らせします。

RjpWiki の常連投稿メンバーと ROM メンバー多数の参加を期待しています。


Rの普及

匿名 (2005-09-21 (水) 02:21:01)

結城先生がRを紹介していますね
http://www.hyuki.com/d/200509.html#i20050921

Rの裾野がちょっと広がった気がします


Knoppix 4.0

間瀬 (2005-09-17 (土) 13:11:37)

Knoppix 4.0 が公開されています。Unix user 誌の10月号付録に DVD 版がついています。R 2.1.0 日本語版が収録されています。 MS Windows 領域にインストールするバッチファイル付き( 起動時に grub で MSW と  Knoppix を起動し分けます)です。ただ、HD の Linux 領域にインストールすると日本語表示がおかしくなるのはなぜ?


マハラノビスの汎距離

g (2005-09-16 (金) 17:03:36)

Rの操作そのものについてのことではないので,ここに投稿します.マハラノビスの汎距離を求めるときに,分散共分散行列が特異となったので,逆行列が求まらず,代わりに一般化逆行列を用いて,マハラノビスの汎距離(この時点でそう呼んでいいのかわかりませんが…)を求めました.この結果をマハラノビスの汎距離として用いてよいのでしょうか?体験談や参考文献がありましたらご教授いただけると幸いです.


記事に協力していただける方を探しています

石塚朝生 (2005-09-09 (金) 16:14:58)

弊社のホームページでRを使って、比較言語学の二項検定をやっていただける方を探しています。
このプロジェクトは元産業能率大の安本美典先生が考案された比較言語学の統計学的手法を使って、検定を行うものです。
この記事は現在開発中のWikiに掲載される予定です。
詳細にご興味ある方は、asao.ishizuka@gmail.comまでご連絡ください


Statistics with R

間瀬 (2005-09-03 (土) 10:22:12)

最初 RjpWiki そして r-help で紹介されたとき、その華麗なグラフィックスで衝撃をあたえた "Statitique avec R " の著者 Zoonekind 氏による英訳版が 公開されました。Statistics with R


c 関数の,こんな使い方

青木繁伸 (2005-08-31 (水) 23:23:34)

関数から数個の値をベクトルで返すとき,それぞれの要素の名前も付けるには,今まで

a <- 1.23; b <- sqrt(a) # 等を定義するとして
result <- c(a, b)
names(result) <- c("a", "sqrt(a)")
return(result)

等としていたが,

return(c("a"=a, "sqrt(a)"=b)

でよい。
しかし,ときどき(?)変なことが生じる。"foo"=bar 等としているのに,ラベルが foo.1 等となることがある。なぜ,余計な ".1" が付くのだろうか。


Rは統計解析をする人々の支持を受けているのか

谷村 (2005-08-24 (水) 12:04:18)

連日の書き込みを申し訳ありません。Rに関連する解説記事を書いているのですが、「統計計算とグラフィックの言語・環境であるRは、マルチプラットフォームかつオープンソースであるため、多くの統計解析者の支持を受けている。」という一文を入れたいと希望しています。しかし、嘘を書きたくない。そこで、このargumentを支持するevidenceを探しています。何かないでしょうか。マルチプラットフォームだから、オープンソースだから支持を受けているというissueの方は削っても、多くの人から支持を受けているという方のissueは何とか加えたいと思っています。よろしくお願いします。


THE STATISTICAL LAB

g (2005-08-09 (火) 20:28:29)

"The Statistical Lab"なるRベースの統計教育ツールがあるようです.(The Statistical Lab)ただし,R1.4.1でないと動かないようなので,"RCommander"の方が勝ちかなというのが正直な感想です.


CRAN のパッケージ数

MKR (2005-08-07 (日) 00:29:03)

暇なので CRAN にあるパッケージの数を数えてみました。プロジェクト関連のパッケージは除きます。総計 569 でした。ただし、パッケージ集がいくつかあるので、それを入れて数えると、580 でした。「だからどうした」ですが、丹念に探せば、必要なものはどこかに見つかりそう。すでに多すぎて困る贅沢な状況になりつつあるようです。


実行しないで,考えましょう!

間瀬 (2005-08-04 (木) 21:34:11)

r-help を見ていてしばらく首をかしげてしまった例(解答を書かないで -> お節介な人)。

> sum = 0; for(i in 5:1){ sum[i] = i }; sum
[1] 1 2 3 4 5
> sum = 0; for(i in 5:0){ sum[i] = i }; sum
[1] 1 2 3 4 5
> sum = 0; for(i in 5:-1){ sum[i] = i }; sum
[1]  1 -1 -1 -1 -1
> sum = 0; for(i in 5:-2){ sum[i] = i }; sum
[1] -2 -1 -2 -2 -2
> sum = 0; for(i in 5:-5){ sum[i] = i }; sum
[1] -5 -5 -5 -5 -4
> sum = 0; for(i in 5:-6){ sum[i] = i }; sum
エラー:添え字が許される範囲外です

Rの早見表(リファレンスカード)

谷村 (2005-08-04 (木) 18:15:58)

こんなものを見つけました。すでにRjpWikiのどこかに報告されていたらすみません。


Rの中からWeb検索

谷村 (2005-08-04 (木) 17:53:46)

R 2.1.0からhttp://search.r-project.orgを検索するコマンドRSiteSearch()が 追加されたのですが、あまり話題に上りませんね。私個人的には、ものすごく 便利で大助かりなコマンドなのですが。。。ひょっとしてWinじゃ使えないコマ ンド?


「R-Tips」のPDF版とその原稿 (05/08/01 修正版)

舟尾 (2005-08-03 (水) 23:47:22)

竹澤さん(中央農業総合研究センター)のウェブスペースに置かせてもらっております R-Tips の PDF ですが,これまでに様々な貴重なご意見を頂戴しました.おかげ様でこの度,改訂版を公開することと相成りました.
http://cse.naro.affrc.go.jp/takezawa/r-tips.pdf(3Mb・200頁)

  • 今までに R-Tips について戴いたご意見・間違いのご報告を反映致しました.
  • 「印刷出来ない!」という不具合を解消致しました(多分…です).
  • R 2.1.0(とR 2.1.1)に対応しました.
    よろしかったら御覧下さい.もし,ご意見・間違いのご報告をいただける場合は ご意見板 に書き込んでいただけましたら幸いです.


「なんでも」といってもね

間瀬茂 (2005-07-29 (金) 18:21:16)

一件(真面目だけど)頓珍漢な投稿があったので、消去しました。ところで gmail (google web mail service) 使いたい方いらっしゃいますか。スパムメールブロック機能が抜群で、使い始めてまだ半月ですが、手放せなくなっています。ユーザーがある日突然届く招待権利を知人に配布するという独特の紹介方法なので、いまだに知名度は高くないか、耳にしていても使う機会が無い人が多いようです。私のところにも50件分の招待権利が早速舞い込み、20人ほどに紹介しましたが、使っても使ってもまた50人分に戻っています。これは、どんどん広めてくれという google 社の希望と思うので、使ってみたい方は私までメイルください。一応先着50人ということにしておきます(なお、当選通知は商品発送をもって替えさせて頂きますので、返事が無ければ枠が無くなったと考えてください)。メイルアドレスは 

maseshigeru@gmail.com 

でお願いします。(一応、RjpWiki の読者だけにとどめておいてくださいね。)なお、これは無料で、2GB の容量が使えるという気前の良さと、先端的な仕様で、これまで使ったいくつかのメーラーや Yahoo mail よりも気に入っています。 


Rに関する演題を出しませんか

谷村 (2005-07-26 (火) 16:43:50)

第22回日本コンピュータサイエンス学会学術集会が2005年10月29日(土)大阪で開催されます。Rの地図表現に関する演題を出そうかやめようか迷っています。学術集会のメインテーマからかなり離れているので1人で浮いてしまうかもという心配もあり、どなたか10/29に関西圏で余裕がある方でR関連の演題を私も出そうという方がいらっしゃれば、是非、ここに名乗りを上げて、演題申し込みページから申込みをよろしくお願いします。私は学会員ですが、学会員でなくても申込みできるらしいです。


useR! 2006 お知らせ (r-help より)

間瀬茂 (2005-07-23 (土) 06:10:45)

We are happy to announce that the second R user conference

                      useR! 2006


is scheduled for June 15-17 2006 and will take place at the Vienna
University of Economics and Business Administration.

This second world-meeting of the R user community will focus on

- R as the `lingua franca' of data analysis and statistical computing,
- providing a platform for R users to discuss and exchange ideas how R can
  be used to do statistical computations, data analysis, visualization and
  exciting applications in various fields,
- giving an overview of the new features of the rapidly evolving R
  project.


As for the predecessor conference, the program will consist of two parts:
keynote lectures and user-contributed sessions (abstract submission will be
available online starting from October 2005). Prior to the conference, there
will be tutorials on R (proposals for tutorials should be sent before
2005-09-30).


KEYNOTE LECTURES

R becomes the standard computing engine in more and more disciplines, both
in academia and the business world. How R is used in different areas will be
presented in keynote lectures addressing hot topics including

- Marketing
- Teaching
- R on Different Platforms
- Graphics
- History of S and R


Speakers will include John M. Chambers, John Fox, Stefan Iacus, Uwe
Ligges, Paul Murrell, Peter Rossi, Simon Urbanek and Sanford Weisberg.


USER-CONTRIBUTED SESSIONS

The sessions will be a platform to bring together R users, contributers,
package maintainers and developers in the S spirit that `users are developers'.
People from different fields will show us how they solve problems
with R in fascinating applications. The sessions are organized by
members of the program committee, including Claudio Agostinelli, Roger
Bivand, Peter Buehlmann, Ram醇pn D醇^az-Uriarte, Sandrine Dudoit, Dirk
Eddelbuettel, Frank Harrell, Simon Jackman, Roger Koenker, Uwe Ligges, Andrew
Martin, Balasubramanian Narasimhan, Peter Rossi, Anthony Rossini, Gerhard
Tutz and Antony Unwin and will cover topics such as

- Applied Statistics & Biostatistics
- Bayesian Statistics
- Bioinformatics
- Econometrics & Finance
- Machine Learning
- Marketing
- Robust Statistics
- Spatial Statistics
- Statistics in the Social and Political Sciences
- Teaching
- Visualization & Graphics
- and many more.



PRE-CONFERENCE TUTORIALS

Before the start of the official program, half-day tutorials will be offered
on Wednesday, June 14th, including a lecture on R graphics by Paul Murrell.
We invite R users to submit proposals for three hour tutorials on special
topics on R. The proposals should give a brief description of the tutorial,
including goals, detailed outline, justification why the tutorial is
important, background knowledge required and potential attendees. The
proposals should be sent before 2005-09-30 to useR-2006@R-project.org.



After the official presentations, Vienna's famous wine and beer pubs, cafes
and restaurants proofed to be a very stimulating environment for fruitful
discussions at previous meetings of the R community like last year's `useR!
2004'.

We invite all R users to submit abstracts on topics presenting innovations or
exciting applications of R. A web page offering more information on the `useR!'
conference, abstract submission, registration and Vienna is available at

http://www.R-project.org/useR-2006/



IMPORTANT DATES

- registration: starting October 2005
- online abstract submission: starting October 2005
- submission deadline of tutorial proposals: 2005-09-30
- early registration deadline: 2006-01-31
- submission deadline of abstracts: 2006-02-28
- registration deadline: 2006-05-31



We hope to meet you in Vienna!


The organizing committee:

Torsten Hothorn, Achim Zeileis, David Meyer, Bettina Gruen,
Kurt Hornik and Friedrich Leisch


ちょっとした正規表現関数

takahashi (2005-07-15 (金) 04:30:03)

sregex<-function(s,ex,f=NULL,extended=T,...){
  ret<-list(m=-1,s=-1)
  gm<-regexpr(ex,s,extended=extended,...)
  if(gm==-1){return(ret)}
  ret$m=substring(s,gm,gm+attr(gm,"match.length")-1)
  ret$p=ifelse(gm==1,"",substring(s,1,gm-1))
  ret$n=ifelse((gm+attr(gm,"match.length")-1)==nchar(s),"",
     substring(s,gm+attr(gm,"match.length"),nchar(s)))
  ps<-0;exs<-strsplit(ex,"")[[1]]
  for(i in 1:(length(exs)-1)){if(ifelse(extended,
         exs[i]!="??",exs[i]=="??")
         && exs[i+1]=="("){ps<-ps+1}}
  if(ps!=0){ret$s=as.character(lapply(1:ps,function(i){
        sub(ex,sprintf("??%d",i),ret$m,extended=extended,...)}))}
  return(ret)
}
###############
> sregex("xxabcdefgyy","a((bc)(d(ef))g)")
$m
[1] "abcdefg"
$s
[1] "bcdefg" "bc"     "def"    "ef"    
$p
[1] "xx"
$n
[1] "yy"

sub-matchを扱うマッチング関数ってありますか? sub,gsub以外に見当たらないので作ってみましたが... mはマッチ全体,sはsub-matchの文字ベクトル,pはマッチ以前,nはマッチ以後,のリストを返します. まあ,普通の正規表現ライブラリなんかによくあるやつです.


実行しないで予想しましょうシリーズ(3)

青木繁伸 (2005-07-11 (月) 18:41:29)

as.integer(factor(c("aa","AA","bb","BB")))

教訓:知っているつもりの関数こそ,help をよく読むべし。


統計関連学会連合大会のチュートリアル

間瀬 (2005-06-29 (水) 22:09:53)

9月の統計関連学会連合大会で以下の
チュートリアルが開かれます。ただし確か参加費が必要だったかな? 参加費は千円(テキスト代)だそうです。

日時: 2005年9月12日(月) 13:30〜16:30
* 「Rによる経済・経営データの分析」
         o オーガナイザ: 西郷 浩 (早稲田大学)
         o 講演者: 山本義郎 (東海大),安川武彦 (金融工学研究所)

新しい R 本

間瀬茂 (2005-06-19 (日) 20:52:31)

つい最近ある方から新しい R 本の出版計画(秋頃?)を聞きました。話を要約すると "(統計無しの)計算機言語 R "、"C 落ちこぼれの人のための計算機言語 R 入門"とでもいった内容の本だそうです。確かに R は完全な計算機言語ですし、 C 等の"低水準"言語に比べればはるかに気が効いた高水準ラクチン命令がいっぱいあり、コーディングがとてもしやすいから、C 等の言語では敷居が高い文系等の方には、統計機能を全く無視した計算機言語としての利用もありうるかもしれませんね。そのうち「R って統計解析もできるんだ、知らなかった〜」という人が登場する?その際著者から聞かれたのは、「R でプロトタイプを書いたコードを C 等に移植するとどの程度早くなるか?」でした。私はそうした経験が無いので返答できませんでしたが、参考例をご存知の方は教えて下さい。もちろん、下手な C コードよりも、上手な R コードの方がかえって早いことは十分あるでしょうが。私は「統計抜きの R」という発想にはやっぱり抵抗を感じましたが。


「フリーソフトウェアRによる統計的品質管理入門」

舟尾 (2005-06-09 (木) 21:34:39)

R commander の日本語化といえば関西大学の荒木先生ですが、荒木先生が中心となって執筆された R の本が近日出版されます!

「フリーソフトウェアRによる統計的品質管理入門」フリーソフトウェア R のページ(『フリーソフトウェアRによる統計的品質管理入門』サポート情報)

タイトルは統計的品質管理入門となっておりますが、R のインストール方法から R commander のセットアップ方法、R commander の使用方法が載っております(非常に分かりやすく説明されています!)。そして勿論!品質管理についても説明されておりまして、品質管理と統計について非常に分かりやすい解説がなされております!!


google で R コードを見つける tips

MKR (2005-05-26 (木) 17:37:26)

R 関連の URL をインターネット検索するのが困難なことはよくしられていますが r-help に google で R コードの掲載された URL を見つける Tips が紹介されていました。コツはキーワード

filetype:R optim
filetype:R boxplot

等を使うことだそうです。確かにたくさん見つかります。お試しあれ。


R パッケージの作者による解説論文

MKR (2005-05-26 (木) 17:20:54)

R パッケージの作者による解説論文多数が J. Statistical Software に掲載されています。論文は自由にダウンロードできるようです。

Firth
Bradley-Terry Models in R
Volume 12, Issue 01

Sturtz, Ligges, and Gelman
R2WinBUGS: A Package for Running WinBUGS from R
Volume 12, Issue 03

Mineo and Ruggieri
A Software Tool for the Exponential Power Distribution: The normalp  Package
Volume 12, Issue 04

Ritz and Streibig
Bioassay Analysis Using R
Volume 12, Issue 05

Baddeley and Turner
spatstat: An R Package for Analyzing Spatial Point Patterns
Volume 12, Issue 06

Johnstone and Silverman
EbayesThresh: R Programs for Empirical Bayes Thresholding
Volume 12, Issue 08

Nason
pinktoe: Semi-automatic Traversal of Trees
Volume 14, Issue 01

Imai and Van Dyk
MNP: R Package for Fitting the Multinomial Probit Model
Volume 14, Issue 03

Buttrey
Calling the lp_solve Linear Program Software from R, S-PLUS and Excel
Volume 14, Issue 04

Zeileis and Grothendieck
zoo: S3 Infrastructure for Regular and Irregular Time Series
Volume 14, Issue 06

Terpstra and McKean
Rank-Based Analyses of Linear Models using R
Volume 14, Issue 07

実行しないで予想しましょうシリーズ(2)

青木繁伸 (2005-05-25 (水) 15:00:16)

勝手にシリーズ化したりして

以下のプログラム実行するとどうなるでしょう

n <- length(1:1000000)
n*n
n^2
n*(n+1)
#class(n)
n <- 1000000
n*n
#class(n)

ヒント:注釈行を活かせば違いが分かる
あるライブラリ(fBasic)のプログラムをハッキングしていて行き当たった


R グラフィックス ギャラリ

間瀬 (2005-05-20 (金) 06:18:50)

R グラフィックス ギャラリ がかなり本格的に整備され始めました。


掲示板のアーカイブをダウンロードできますか?

ハマちゃん (2005-05-17 (火) 12:51:06)

このHPでいつも勉強させていただいてありがとうございます。中途半端な知識を持っていると、到底全部の記事を読んでも分からないので、よくQ&Aで必要な部分だけを参考しています。しかし、上級者に当たり前のことと思われたかもしれないですが、Q&Aの内容は結構消されたりしますよね。どうせオープンなHPなので、もし掲示板のアカイブを圧縮形式でダウンロードできればと、ありがたいなと思いますが、(例えば青木先生のHPの掲示板のように)、この要望は無理なんでしょうか?あるいは単に技術的に難しいのでしょうか?


R 壁紙

間瀬 (2005-05-11 (水) 17:25:51)

R 壁紙 を作った人がいます。使う気になりますか?


CRAN Task Views

間瀬 (2005-05-09 (月) 16:38:54)

最新 R News に CRAN のパッケージ(現在 500 あまりだそうです)のカテゴリー別紹介の試みが記載されていました。まだカテゴリーは4つだけですが、必要なパッケージを見つけるのに便利そうです。CRAN Task Views


「R for Mac OS X」 from Apple.COM

舟尾 (2005-05-03 (火) 11:17:48)

最近 Mac デビューした舟尾です.「R for Mac OS X」というタイトルで,R が Apple のサイトで紹介されていますね.Mac OS X 2.1.0 もダウンロードできるようです.
http://www.apple.com/downloads/macosx/math_science/rformacosx.html


今ならもれなく R3.1.0 が??

青木繁伸 (2005-04-29 (金) 12:25:40)

http://cran.md.tsukuba.ac.jp/bin/macosx/R-2.1.0.dmg からダウンロード中に,「R-3.1.0.dmg をダウンロード中」と表示されます。。。(^_^)
実際にダウンロードされたファイル名も R-3.1.0.dmg なのですが,展開すると,R-2.1.0 というボリューム名になってしまいます。。。残念


VineLinux用のR-2.1.0-0vl1.i386.rpmができました

谷村 (2005-04-27 (水) 15:17:09)

R-2.1.0-0vl1.i386.rpm
R-devel-2.1.0-0vl1.i386.rpm
libRmath-2.1.0-0vl1.i386.rpm
libRmath-devel-2.1.0-0vl1.i386.rpm
をputしました。しばらくしたら、CRANに反映されるでしょう。
なかまさんの「make checkはLANG=Cにしろ」というアドバイスは大変参考になりました。今回からパッケージが若干分離しています。私は分離する必要性をあまり感じていないのですが、他のディストリと歩調を合わせました。
ちなみに、

$ rpm -qpl R-devel-2.1.0-0vl1.i386.rpm
/usr/share/doc/R-devel-2.1.0
/usr/share/doc/R-devel-2.1.0/R-exts.pdf
$ rpm -qpl libRmath-2.1.0-0vl1.i386.rpm
/usr/lib/libRmath.so
$ rpm -qpl libRmath-devel-2.1.0-0vl1.i386.rpm
/usr/include/Rmath.h
/usr/lib/libRmath.a

となっています。Descriptionの日本語訳がおかしいときにはどうぞご指摘ください。次バージョンで修正します。
国際化もされたことだし、そろそろVinePlusへ本家版をそのままputしてもよいのではと思うのですが、みなさまいかがでしょう。VinePlus (extras)に収録されると、extrasを有効にしているマシンでは、

# apt-get R

で、最新版のRをインストールできるようになります。


gcc-4.0.0

なかま (2005-04-23 (土) 15:24:49)

えー,gcc-4.0.0を入れてRのコンパイルを行ってみました.
実行速度が非常に早くなりました.boot-Exなんかで20%程.
先頃まで人間オプィマイズしていたrnorm等は60%も高速になりました.
手元の環境はアレゲなので,なにか影響があるとなんですので,追試して
いただければ.(^_^;


英語版baseのインストーラーの不具合について

Y (2005-04-22 (金) 15:46:16)

日本のサーバーからbaseのインストーラーをダウンロードして、Windowsに組み込むとうまく起動しました。メニューが日本語であったので、私の所望する英語版ではなかったようで、それを消して、改めてアメリカやカナダのサイトからbase版のインストーラーをダウンロードして、組み込もうとすると、どのサイトからダウンロードしたインストーラーも、Rconsoleの箇所で、corruptと表示されて組みこみ自体がストップしてしまいます。

どうすればよいのでしょう。

私自身、パソコンの初心者ではないのですが、この事態には困り果てております。

Postscript出力における日本語の文字化けと対処

谷村 (2005-04-22 (金) 11:38:58)

皆様のご尽力のより、R 2.1.0から、本家版でも日本語メッセージの表示や日本語の出力ができるようになりました。しかし、Postscriptに出力すると日本語部分が文字化けしてしまいます。

> あ <- runif(10)
> い <- runif(10)
> plot(あ,い,main="日本語タイトル")


結果は、

&ref(): File not found: "Screenshot-R2.1.0-x.png" at page "なんでも掲示板アーカイブ(5)";
&ref(): File not found: "Screenshot-R2.1.0-gv1.png" at page "なんでも掲示板アーカイブ(5)";

上側のように正しく日本語が表示されています。しかし、これをeps形式で 保存すると、下側のgvでの表示のように文字化けします。

対処方法

この文字化けの原因は、日本語の字句自体は正しく処理されているが、それらの字句のフォント指定が日本語フォントになっていないからです。従って、この対処方法は、大変場当たり的な方法ですが、epsファイルをemacs*1など適当なテキストエディタで開き、 日本語で記述されている箇所のフォントを日本語Postscriptフォントに変えてやることです。もっとスマートな方法をあみ出された方は、是非、紹介してください。

#ref(): File not found: "Screenshot-R2.1.0-gv2.png" at page "なんでも掲示板アーカイブ(5)"


このように日本語が正しく表示されます。

具体的な方法は、例えば上記の例で説明すると、epsファイルの最後部分に

0.00 0.00 503.60 503.29 cl
/ps 14 def /Font2 findfont 14 s
0 0 0 rgb
266.20 468.75 (日本語タイトル) .5 0 0 t
/ps 12 def /Font1 findfont 12 s
266.20 18.72 (あ) .5 0 0 t
12.96 258.85 (い) .5 0 90 t

とあるのを

0.00 0.00 503.60 503.29 cl
/ps 14 def /Ryumin-Light-EUC-H findfont 14 s
0 0 0 rgb
266.20 468.75 (日本語タイトル) .5 0 0 t
/ps 12 def /Ryumin-Light-EUC-H findfont 12 s
266.20 18.72 (あ) .5 0 0 t
12.96 258.85 (い) .5 0 90 t

とします。Ryumin-Light-EUC-Hは明朝体の日本語標準Postscriptフォントです。ゴシック体がよい場合は、GothicBBB-Medium-EUC-Hにすればよいでしょう。この例では、編集するepsファイルが日本語EUCなので、Ryumin-Light-EUC-Hとしましたが、もし、Shift-JISなら、Ryumin-Light-RKSJ-Hとします。JISなら、Ryumin-Light-HでOKです。

おまけ

上記例をさらにこんな風に編集すると

0.00 0.00 503.60 503.29 cl
/ps 14 def /GothicBBB-Medium-EUC-H findfont 14 s
0 0 0 rgb
266.20 468.75 (日本語タイトル) .5 0 0 t
/ps 12 def /Ryumin-Light-EUC-H findfont 12 s
266.20 18.72 (横書きテスト) .5 0 0 t
243 300 (アメリカ) .5 0 0 t
315 225 (日本国) .5 0 0 t
/ps 12 def /Ryumin-Light-EUC-V findfont 12 s
12.96 290 (縦書きテスト) .5 0 0 t

#ref(): File not found: "Screenshot-R2.1.0-gv3.png" at page "なんでも掲示板アーカイブ(5)"

こんな風に自由自在。Ryumin-Light-EUC-Vは縦書きフォント。日本語のy軸ラベルは縦書きにすることも多いと思う。単純に、縦書きフォントに変えるだけだと、向きと位置が不自然なので、微調整する。

gvを使うと、マウスポインタの位置座標を表示してくれるので、その数値を読み取ってepsファイルを編集することにより効率的にPostscript上にテキストを配置していけます。もっとも、Rグラフィックス上でidentify(x,y,label)やtext(locator(1),text)を使う方が楽だけど、後付でも自由にできるということで。


CRAN のサイズ

MKR (2005-04-22 (金) 06:53:02)

単なる好奇心ですが、r-help に CRAN のコンテンツの総サイズの調べ方が紹介されていました。それによると現在約 5G byte だそうです。

$ rsync -nrtlvz cran.r-project.org::CRAN | grep "total"
total size is 5114784835  speedup is 13170.59

2×2分割表のイエーツの補正

青木繁伸 (2005-04-20 (水) 17:07:43)

9  10
9  11

のときに,R でイェーツの補正をしてカイ二乗検定すると,間違った答えを出す。

>  chisq.test(matrix(c(9,10,9,11),2,2))
	Pearson's Chi-squared test with Yates' continuity correction
data:  matrix(c(9, 10, 9, 11), 2, 2) 
X-squared = 0.0299, df = 1, p-value = 0.8626

正しい答えは

X-squared = 0, df = 1, p-value = 1

と思われる。

#           if (correct && nrow(x) == 2 && ncol(x) == 2) {
#               YATES <- 0.5
#               METHOD <- paste(METHOD, "with Yates' continuity correction")
#           }
#           else YATES <- 0
#           STATISTIC <- sum((abs(x - E) - YATES)^2/E)
## replace begin
            if (correct && nrow(x) == 2 && ncol(x) == 2) {
                STATISTIC <- if (abs(x[1,1]*x[2,2]-x[1,2]*x[2,1]) < sum(x)/2) 0    
                             else sum((abs(x - E) - 0.5)^2/E)
                METHOD <- paste(METHOD, "with Yates' continuity correction")
            }
            else STATISTIC <- sum((abs(x - E))^2/E)
## replace end
 ~

R. Tierney 氏の R バイトコンパイラー

間瀬 (2005-04-19 (火) 06:28:58)

以前から噂になっている R のバイトコンパイラーですが、すでに公開されているようですね。おそらくまだ機能は限定的だと思いますが、どんな感じでしょうか。新しもの好きな人は試してみられたら。URL R byte compiler
ソースコードに附属の例を実行してみました。それなりに早くなっているようですね。試してみる価値はあるかも。

> source("cmp.R")
> # old R version of lapply
> la1 <- function(X, FUN, ...) {
+     FUN <- match.fun(FUN)
+     if (!is.list(X))
+         X <- as.list(X)
+     rval <- vector("list", length(X))
+     for(i in seq(along = X))
+         rval[i] <- list(FUN(X[[i]], ...))
+     names(rval) <- names(X)               # keep `names' !
+     return(rval)
+ }
> # a small variation
> la2 <- function(X, FUN, ...) {
+     FUN <- match.fun(FUN)
+     if (!is.list(X))
+         X <- as.list(X)
+     rval <- vector("list", length(X))
+     for(i in seq(along = X)) {
+         v <- FUN(X[[i]], ...)
+         if (is.null(v)) rval[i] <- list(v)
+         else rval[[i]] <- v
+     }
+     names(rval) <- names(X)               # keep `names' !
+     return(rval)
+ }
> # Compiled versions
> la1c <- cmpfun(la1)                       # la1 をバイトコンパイル
Note: local functions used: FUN 
> la2c <- cmpfun(la2)                       # la2 をバイトコンパイル
Note: local functions used: FUN 
> # some timings
> x<-1:10
> y<-1:100
> system.time(for (i in 1:10000) lapply(x, is.null))
[1] 7.13 0.00 7.12 0.00 0.00
> system.time(for (i in 1:10000) la1(x, is.null))
[1] 13.68  0.01 13.68  0.00  0.00
> system.time(for (i in 1:10000) la1c(x, is.null))  # 1.556314 倍
[1] 8.79 0.00 8.79 0.00 0.00
> system.time(for (i in 1:10000) la2(x, is.null))
[1] 13.89  0.00 13.89  0.00  0.00
> system.time(for (i in 1:10000) la2c(x, is.null))  # 1.587429 倍
[1] 8.75 0.00 8.75 0.00 0.00
> system.time(for (i in 1:1000) lapply(y, is.null))
[1] 0.93 0.00 0.93 0.00 0.00
> system.time(for (i in 1:1000) la1(y, is.null))
[1] 5.57 0.00 5.58 0.00 0.00
> system.time(for (i in 1:1000) la1c(y, is.null))   # 4.565574 倍 (y が大きいと効果が大)
[1] 1.22 0.00 1.23 0.00 0.00
> system.time(for (i in 1:1000) la2(y, is.null))
[1] 5.72 0.00 5.71 0.00 0.00
> system.time(for (i in 1:1000) la2c(y, is.null))   # 4.727273 倍  (y が大きいと効果が大)
[1] 1.21 0.00 1.21 0.00 0.00

ちなみにコンパイル済みのコードは次のようになります。実体は(当然かも知れませんが)隠されているようです。

>  la1c
function (X, FUN, ...) 
{
    FUN <- match.fun(FUN)
    if (!is.list(X)) 
        X <- as.list(X)
    rval <- vector("list", length(X))
    for (i in seq(along = X)) rval[i] <- list(FUN(X[[i]], ...))
    names(rval) <- names(X)
    return(rval)
}
<bytecode: 0x8b84878>

「データサイエンス入門」中の qiuck 関数で検査。必ずしもいつも早くなるとは限らないようだ。

> qiuckc <- cmpfun(quick)
> set.seed(1123); system.time(x <- quick(runif(10000)))
[1] 3.92 0.00 3.92 0.00 0.00
> set.seed(1123); system.time(x <- quickc(runif(10000)))
[1] 3.91 0.00 3.92 0.00 0.00                               # ほぼ同じ

> set.seed(1123); system.time(x <- quick(runif(100000)))
[1] 180.98  43.33 229.42   0.00   0.00
> set.seed(1123); system.time(x <- quickc(runif(100000)))
[1] 163.52  29.56 193.31   0.00   0.00                     # 1.11倍
> disassemble(la1c)
list(.Code, list(4, GETSYMFUN.OP, 1, MAKEPROM.OP, 2, CALL.OP, 
   3, SETVAR.OP, 4, POP.OP, GETBUILTIN.OP, 5, GETVAR.OP, 6, 
   PUSHARG.OP, CALLBUILTIN.OP, 7, NOT.OP, BRIFNOT.OP, 30, GETSYMFUN.OP, 
   8, MAKEPROM.OP, 9, CALL.OP, 10, SETVAR.OP, 6, GOTO.OP, 31, 
   LDNULL.OP, POP.OP, GETINTLBUILTIN.OP, 11, PUSHCONSTARG.OP, 
   12, GETBUILTIN.OP, 13, GETVAR.OP, 6, PUSHARG.OP, CALLBUILTIN.OP, 
   14, PUSHARG.OP, CALLBUILTIN.OP, 15, SETVAR.OP, 16, POP.OP, 
   GETSYMFUN.OP, 17, MAKEPROM.OP, 18, SETTAG.OP, 19, CALL.OP, 
   20, STARTFOR.OP, 21, 93, GETBUILTIN.OP, 22, GETFUN.OP, 4, 
   MAKEPROM.OP, 23, DODOTS.OP, CALL.OP, 24, PUSHARG.OP, CALLBUILTIN.OP, 
   25, STARTASSIGN.OP, 16, 26, GETVAR.OP, 16, STARTSUBASSIGN.OP, 
   27, 89, GETVAR.OP, 21, PUSHARG.OP, GETVAR.OP, 26, PUSHARG.OP, 
   SETTAG.OP, 28, DFLTSUBASSIGN.OP, ENDASSIGN.OP, 16, 26, SETLOOPVAL.OP, 
   STEPFOR.OP, 60, ENDFOR.OP, POP.OP, GETSYMFUN.OP, 29, MAKEPROM.OP, 
   30, CALL.OP, 31, STARTASSIGN.OP, 16, 26, GETSYMFUN.OP, 32, 
   MAKEPROM.OP, 33, MAKEPROM.OP, 34, SETTAG.OP, 28, CALL.OP, 
   35, ENDASSIGN.OP, 16, 26, POP.OP, CALLSPECIAL.OP, 36, RETURN.OP), 
   list({
       FUN <- match.fun(FUN)
       if (!is.list(X)) 
           X <- as.list(X)
       rval <- vector("list", length(X))
       for (i in seq(along = X)) rval[i] <- list(FUN(X[[i]], 
           ...))
       names(rval) <- names(X)
       return(rval)
   }, match.fun, list(.Code, list(4, GETVAR.OP, 0, RETURN.OP), 
       list(FUN)), match.fun(FUN), FUN, is.list, X, is.list(X), 
       as.list, list(.Code, list(4, GETVAR.OP, 0, RETURN.OP), 
           list(X)), as.list(X), vector, "list", length, length(X), 
       vector("list", length(X)), rval, seq, list(.Code, list(
           4, GETVAR.OP, 0, RETURN.OP), list(X)), along, seq(along = X), 
       i, list, list(.Code, list(4, GETVAR.OP, 1, STARTSUBSET2.OP, 
           2, 10, GETVAR.OP, 3, PUSHARG.OP, DFLTSUBSET2.OP, 
           RETURN.OP), list(X[[i]], X, X[[i]], i)), FUN(X[[i]], 
           ...), list(FUN(X[[i]], ...)), `*ctmp*`, "[<-"(rval, 
           i, value = `*ctmp*`), value, names, list(.Code, list(
           4, GETVAR.OP, 0, RETURN.OP), list(X)), names(X), 
       `names<-`, list(.Code, list(4, GETVAR.OP, 0, RETURN.OP), 
           list(rval)), list(.Code, list(4, GETVAR.OP, 0, RETURN.OP), 
           list(`*ctmp*`)), "names<-"(rval, value = `*ctmp*`), 
       return(rval)))
>  test44 <- function (repl) {
               x <- matrixc(0, nrow = 10, ncol=repl) 
               a <- repc(0:3,13)
               for (i in 1:repl) x[,i] <- samplec(a, 10)
               y <- matrixc(x, nrow=5)
               z <- y - matrixc(y[1,], nrow=5, ncol=2*repl, byrow=TRUE)
               w <- matrix(colSumsc(abs(z)), nrow=2)
               pass <- sumc(w[1,]*w[2,]==0)
               pass/repl
            }
> test44c <- cmpfun(test44)                   # 本体もバイトコンパイル 
> set.seed(1111); system.time(test4(10000))   # オリジナルバージョン
[1] 1.11 0.01 1.11 0.00 0.00
> set.seed(1111); system.time(test44c(10000))  # バイトコンパイルバージョン
[1] 0.58 0.01 0.59 0.00 0.00
> set.seed(1111); system.time(test4(100000))   # オリジナルバージョン
[1] 10.66  0.08 10.74  0.00  0.00
> set.seed(1111); system.time(test44c(100000)) # バイトコンパイルバージョン
[1] 5.71 0.07 5.79 0.00 0.00

R 2.1.0 リリース

間瀬 (2005-04-18 (月) 21:52:59)

本日 R 2.1.0 がリリースされたようです。目玉はなんといっても UTF-8 対応、エラーメッセージも各国語版(もしメッセージの翻訳版が提供されていれば)が選択できるようになります。アナウンスの一部を引用します。中間さんの貢献が明記されていて嬉しいですね。

INTERNATIONALIZATION

o Unix-alike versions of R can now be used in UTF-8 and other
  multi-byte locales on suitably equipped OSes if configured
  with option --enable-mbcs (which is the default).  [The
  changes to font handling in the X11 module are based on the
  Japanization patches of Eiji Nakama.]

というエラーが出てしまった。でも動いてます。 -- たか 2005-04-19 (火) 14:23:40


R Graphic Gallery

間瀬 (2005-04-18 (月) 21:29:41)

先にお知らせした R Graphic Gallery が新装オープンしたようです。 R Graphic Gallery


nls と lm における formula で factor を使うこと

青木繁伸 (2005-04-18 (月) 18:59:52)

nls では,formula 中に factor は使えないというのが,別記事であった。
lm では,使えるしかも,ちゃんとランクを調整してくれる。

> x1 <- c("c","b","b","c","c","a","b","a","c","a","c","b","b","b","c")
> x2 <- c("M","M","F","M","M","M","F","F","M","M","F","M","F","F","F")
> y <- c(7,6,7,7,7,5,7,6,7,5,8,6,7,7,8)
> lm(y ~ x1+x2) # これはエラーになる【あ】
Error in model.frame(formula, rownames, variables, varnames, extras, extranames,  : 
	invalid variable type
> lm(y  ~ as.factor(x1)+as.factor(x2)) # factor にするとちゃんとできる【い】

Call:
lm(formula = y ~ as.factor(x1) + as.factor(x2))

Coefficients:
   (Intercept)  as.factor(x1)b  as.factor(x1)c  
             6               1               2  
as.factor(x2)M  
            -1  

x1, x2 が文字列の値を取るとき,それをそのまま使ってもエラーになるだけ(【あ】参照) as.factor(x1) のように使うとちゃんと解が得られる(【い】参照)。事前に factor にしておいて formula に指定することも当然 ok
ところで,x1 が a,b,c のいずれを採るかについて3つの二値変数,同じくx2についても2つの二値変数に対応させる。

> x1a <- as.integer(x1=="a")
> x1b <- as.integer(x1=="b")
> x1c <- as.integer(x1=="c")
> x2F <- as.integer(x2=="F")
> x2M <- as.integer(x2=="M")

このうち,x1b, x1c, x2M を使うと,【い】と同じ結果【う】が得られる(あたりまえだが,【い】のようにするのが簡単便利と言うこと)

> lm(y ~ x1b+x1c+x2M) # 【う】

Call:
lm(formula = y ~ x1b + x1c + x2M)

Coefficients:
(Intercept)          x1b          x1c          x2M  
          6            1            2           -1  

もし,5つの変数全部を使うと,ランク落ちがあるので,結果は【え】のようになる。実際には使われない変数の係数は NA になっている。
実際に使われる変数が【い】と異なるので,別の結果のように見えるが,これは実は【い】と全く同じ予測値を与える。

> lm(y ~ x1a+x1b+x1c+x2F+x2M) # 【え】

Call:
lm(formula = y ~ x1a + x1b + x1c + x2F + x2M)

Coefficients:
(Intercept)          x1a          x1b          x1c  
          7           -2           -1           NA  
        x2F          x2M  
          1           NA  

使う変数のセットによって,係数も違うが,本質的に全部同じ予測式である。

> lm(y ~ x1a+x1b+x2F) # 【え'】

Call:
lm(formula = y ~ x1a + x1b + x2F)

Coefficients:
(Intercept)          x1a          x1b          x2F  
          7           -2           -1            1  

ところで,lsfit という関数もある。この使い方は

> lsfit(cbind(x1b,x1c,x2M), y) # 【お】
$coefficients
Intercept       x1b       x1c       x2M 
        6         1         2        -1 

用いる変数を同じにすれば,【い】と同じになる。
もし,5つの変数全部を使うようにしても同じ結果が得られそうだが,出力結果の見た目は【え】と同じようなのだが,変数名と係数の対応に誤りがある。

> lsfit(cbind(x1a,x1b,x1c,x2F,x2M), y)
$coefficients
Intercept       x1a       x1b       x1c       x2F 
        7        -2        -1         1         0 
      x2M 
        0 

lsfit はこのような事態を想定していないのだな。
あれこれ書いたが,lm で factor をつかうのは,小細工をしないで,そのまま使えばよい(【い】のように)ということ。
ちなみに,一般化逆行列を使って重回帰分析を行えば,5つの変数全部を使って,解を求めることができる。

const    x1a    x1b   x1c x2F  x2M
6.625 -1.125 -0.125 0.875 0.5 -0.5

プログラムにおける「名前」の意味するもの

青木繁伸 (2005-04-08 (金) 22:12:38)

list(... foo=bar ...)
とか,
lm(y ~ x,....)
などのとき,foo, bar, y, x が,単なる文字定数(文字変数)なのかそうではない別物なのかの区別ができない人がいるみたいですね。
関数の作者によっては,単なる文字列が指定されたときにも,適切な解釈をして,ユーザのやりたかったことを実現させてやろうという,心優しさがある場合も有るのかも。以下,架空例というかなんというか,こんなインプリメンテーションもありかという例をでっち上げて。こういうアプローチは親切なのでしょうか??そうは思えない(反語。。。)

> a <- "2"
> sqrt(a) # こういうエラーをする人はあまりいないだろう
Error in sqrt(a) : Non-numeric argument to mathematical function
> sqrt(as.numeric(a)) # こういう風にすれば,意図していたであろう計算はできるのだから
[1] 1.414214
> my.sqrt <- function(x) # こういう風に関数を定義してくれていれば,
+ {
+ sqrt(as.numeric(x))
+ }
> my.sqrt("2") # おっちょこちょいでも,救われる(^_^;)
[1] 1.414214
> my.sqrt(2) # 当然,ちゃんと使っても,ちゃんと使える(^_^;)
[1] 1.414214
> my.sqrt("abc") # さすがにこれはだめ。

 # でも,abc は16進整数の可能性が有るからと救ってやるのは自由? いやいや,おんぶにだっこにならされたユーザが,厳しい(面倒見の悪い)プログラムで怒られたら,パニクル・ワケワカメになる・切れる。。。怖い。


メッセージ翻訳作業中の皆様へ

なかま (2005-03-24 (木) 22:03:45)


                      -- snip --
Thanks.  I have merged these, but please note that I had to make some 
changes for msgfmt -c to work:

- Some of the RGui-ja.po ones were missing a final ?n.
- When the order of the formats is changed, the %2$s form must be used. 
(I had to guess the order in one class, so please check these.)

                      -- snip --

Could you also please at some point give us a list of names for the 
po/THANKS file?

と言うわけで,名前(英名) メールアドレスを書き込んでください.

ex. MEI SEI <hoge_at_foo.bar.jp>

尚,SPAMが沢山来るようになっても一切の責任は負いませんので御了承ください.


R のマニュアル日本語訳が CRAN に登録されました

間瀬茂 (2005-03-17 (木) 23:05:39)

岡田さんが英語ページにメモして頂いたのが、このところメッセージの多言語化に邁進されている R 教授の目に止まり、お勧めで私の訳が先ほど CRAN に登録されましたのでお知らせします。私がさっさとアップロードすれば良かったのですが、何せドメスティックな利用者しか念頭になかったので、控えていました。R 教授のメイルでは、海外にいる(そして英語が下苦手な、いつもながら一言多い方)日本人も多いから、とのことでした。PS ファイルと、森さんによる PDF ファイルも登録されました。お断り無く提供したことをお詫びします。なにか不具合があればお知らせ下さい。


統計数理研究所のワークショップ

間瀬 (2005-03-17 (木) 00:55:35)

表記の集会に参加された方はいらっしゃいますか?私は用事で出かけられませんでした。もう一人の R 氏に会ってみたかったんですが。もし出かけられた方は、簡単な印象などお願いします。


RjpWiki のスポンサー?

MKR (2005-03-14 (月) 20:27:57)

いつごろからか、google で RjpWiki をキーワード検索すると以下のコマーシャルが表示されるようになりましたね。RjpWiki を後援しているわけでもないのに紛らわしい。

 	スポンサー
R、S-PLUS、SAS連携機能~
汎用データマイニング、最新技術搭載~
バイオ、医療、製造、通信、金融、CRM~
www.msi.co.jp/vmstudio/~

Translations progress

なかま (2005-03-14 (月) 19:41:04)

With the release of 2.1.0 scheduled for April 18, just over a
month away, 
I thought I would give an update on the progress of translations
known to me.  (`fuzzy' translations are ignored, and are either
due to small 
changes in the messages or wild guesses by msgmerge.)

Translators are continually pointing out small problems in
messages (or we spot them), so the templates are updated
frequently.  However, I believe that all the major changes
(to use quotes more consistently and to use 
gettextf to make the messages more translatable) are now
finished for 2.1.0.
Updating seems to work well (see po/README for how to do this).

R.pot (the C-level messages)
de: 148 translated messages, 49 fuzzy translations, 1450 untranslated messages.
it: 886 translated messages, 761 untranslated messages.
pt_BR: 1638 translated messages, 4 fuzzy translations, 5 untranslated messages.
zh_CN: 1644 translated messages, 3 untranslated messages.

RGui.pot:
it: 169 translated messages, 7 fuzzy translations, 88 untranslated messages.

R-base.pot:
it: 335 translated messages, 64 fuzzy translations, 15 untranslated messages.
R-zh_CN: 411 translated messages, 3 untranslated messages.

R-grDevices.pot:
it: 58 translated messages, 2 fuzzy translations, 2 untranslated messages.

grDevices.pot:
it: 107 translated messages.

R-graphics.pot:
it: 69 translated messages, 44 fuzzy translations, 1 untranslated message.
[I can resolve a lot of these as they are just missing quotes.]

To give you some idea of the size of the package catalogs:

base/po/R-en@quot.po: 414 translated messages.
grDevices/po/R-en@quot.po: 62 translated messages.
grDevices/po/en@quot.po: 107 translated messages.
graphics/po/R-en@quot.po: 114 translated messages.
grid/po/R-en@quot.po: 130 translated messages.
grid/po/en@quot.po: 13 translated messages.
methods/po/R-en@quot.po: 216 translated messages.
methods/po/en@quot.po: 26 translated messages.
splines/po/R-en@quot.po: 19 translated messages.
splines/po/en@quot.po: 1 translated message.
stats/po/R-en@quot.po: 632 translated messages.
stats/po/en@quot.po: 40 translated messages.
stats4/po/R-en@quot.po: 6 translated messages.
tcltk/po/R-en@quot.po: 5 translated messages.
tools/po/R-en@quot.po: 87 translated messages.
tools/po/en@quot.po: 3 translated messages.
utils/po/R-en@quot.po: 189 translated messages.

For the MacOS X GUI I see de, it and ja translations in the SVN archive.


I see from http://www.okada.jp.org/RWiki/index.php?RJapaneseTranslation
that Japanese translations of R.pot and RGui.pot are in progress, and 
ja.po seems substantially complete (1601 translated messages against a 
version of a couple of weeks ago).

We now have the concept of `translation packages' (described on the 
developer.r-project.org/Translations.html page once it gets updated and in 
`Writing R Extensions'): please let me know if you would like Japanese 
translations to be part of the main tarball or to distribute them 
separately as a package.

I think we should aim to finalize translations to be distributed with  R 
2.1.0 by code freeze on April 11th.

Brian Ripley

Rwww

okinawa (2005-03-11 (金) 16:29:52)

RwwwというRをWebで簡単に使うためのCGIのページ作りました。興味のある方は、Rwwwのページを見てください。


日本人修士が作った R パッケージ

間瀬茂 (2005-02-25 (金) 19:33:45)

東工大の大学院修士課程を今度修了する鈴木了太さん(一ツ橋大学卒業という変わった経歴のもち主です)が、修論の一部として作成した R パッケージ pvclust が CRAN に本日登録されたそうです。彼の指導教官の下平先生が開発したマルチスケールブートストラップ法(スケールを何段階かに変えたブートストラップ法で検定・推定の精度を向上させる)を用いてクラスター分析を改良、実装したものです。分子系統学への応用を見込んでいるのだと思います。以下彼の学内向けお知らせメールを無断転載します。

下平研の鈴木です.本日,修論で作成したRパッケージpvclustがCRANに登録されました
ので,そのお知らせです.
http://cran.r-project.org/src/contrib/Descriptions/pvclust.html
マルチスケール・ブートストラップ法を用いた階層型クラスター分析の信頼性評価(確率
値計算)を行うプログラムです.よろしければお使いいただいて,バグレポートなどいた
だければ幸いです.すでにinstall.packages("pvclust")でインストール可能なよう
です.使用例はexample(pvclust)をご覧くださ い.実行結果は以下のURLから見るこ
とができます.
http://www.is.titech.ac.jp/~shimo/prog/pvclust/
よろしくお願いします.

疫学分析パッケージepiのLinux版が公開されました

谷村 (2005-02-24 (木) 11:24:31)

Dr. Mark Stevensonが公開している疫学パッケージepi はWindows版しかありませんでしたが、リクエストしたところLinux版も作成・公開していただくことができました。KNOPPIXに入れて疫学KNOPPIXの構築も視野に入れながら、epiを試用してみたいと思います。


R の検索を容易にするために別名(alias)を決めません?

[[澤田石 順<jsawa@attglobal.net>]] (2005-02-24 (木) 00:51:21)

R の情報はたくさんあり、容易に見つかりますが、それでも一文字の R を
キーワードにするほかなく不便だと思います。皆様はいかが?
アルファベットで表記されたエイリアスがあれば、検索がずっと容易になると
思います。日本国内のみで通用するエイリアスでなく、世界レベルで定義する
のがよいと思います。どうでしょう。そのための手続きのことはまた別のこと
として考えてみようではありませんか。

 r_statistics_environment、r_stat_envとか.
P.S. 2/19-20 のリハビリテーション関係の学会ではじめて R を使用しての
    解析に基づいて発表しました。スライドには R の web page を明記し
    十数名の方々に Windowsなどやめて R with Linux or Mac にすべし
    と強調した次第。

OS/2 に R 2.0.1 を移植中です。関心のある方は?

澤田石 順 (2005-02-23 (水) 22:58:04)

澤田石と申します。Microsoftが嫌いで、ずっとOS/2を使い続けております。 Linux/FreeBSDも使い易いのですが、OS/2に比べるといま一つ。Freesoftwareでメジャーなものは自分でOS/2に移植したり既に移植されたものを使用したりで、仕事や趣味でOS/2で不足するものはほとんどないのですが(たとえばteTeX 3.0は既に自分でOS/2に移植して使用中)、R の移植がまだ不完全で少し困っているところです。postscript(), pdf() デバイスはうまく動作してますが、x11()などどうもうまくいかなくて。
非常にマイナーなOS/2ということでなかなか一緒に移植作業をしてくれる人はいないかも知れませんが、もしもいらっしいましたらOS/2への移植を一緒にやりましょう。


ユリウス日,などなど

青木繁伸 (2005-02-23 (水) 22:13:02)

昔(5年ほど前だと思うのだが。。。と思っていたが,実はもっともっと前だった),
「1582 年の 10 月の 5 日から 13 日までは存在しません」
ということで,UNIX の cal コマンドを使うとそれが確認できたと記憶しているのだが,今やってみると,

 > cal 10 1582
    October 1582
 S  M Tu  W Th  F  S
    1  2  3  4  5  6
 7  8  9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31

みたいな結果しか表示されない。
う〜〜ん。勘違いだったのかなぁ。

その当時作ったページで,
・ 西暦1年1月1日は何曜日かという問題はかなり難しいものがあります(週刊朝日 '90/02/23)。
(あ,1990年だったんだ)
・前のプログラムのアルゴリズムでは「月曜日」と表示されます。他の多くのコンピュータも同じ答えを出すかも知れません。
・富士通のコンピュータやワープロの中には,「日曜日」だと表示するものがあるそうです。
・東京天文台は「土曜日」であるとしているそうです。
と書いたのだが。
今日の,中澤さんのページで,R には chron というライブラリもあるということを読んで(date というライブラリがあるのは検索して,date というライブラリはなんて使い勝手の悪いライブラリだ,と,思っていたのだが),その中には julian という関数があった。天文に興味があれば「おお,ユリウス日を計算するのか」と思うわけだが,これは,1970年1月1日を基準日とする経過日数を返すものと書いてある。仕様に書いてあること以上のことは望むべくもないのだが。
私のページに書いているアルゴリズムは昔々の bit に書かれていたものに基づいているのでユリウス日を計算するが,残念ながら先に書いた存在しない西暦年には対応していないらしい。
定義が変われば観察される(解釈される)データが変わるというのはありふれたことではあるが,日付のような,誰もがこれほど確かなものはないと思っている(誤解に過ぎないのだが)ものも,かくも不確かなものであるとは。。。。

> julian(1,1,1970)
[1] 0  # 1970/1/1が基準日ということ

> J.day(1,1,1970)
[1] 1723395 # 天文学上のユリウス日

> julian(1,1,1)
[1] -719162 # 当然といえば当然

> day.of.week(1,1,1)
[1] 1 # 何曜日かな?

> day.of.week(2,23,2005)
[1] 3 # 水曜日が 3 なら,1 は月曜日か。。。

> dw(J.day(1,1,1))
[1] "Mon" # 同じだな。。。。

maptoolsでshapefileの切り出し

okinawa (2005-02-22 (火) 17:19:37)

maptoolsでshapefileの切り出しに成功したので、ご報告。
R2.0.1です。

library(maptools)
jpn<-read.shape("japan_jdg.shp")
jpn_poly<-Map2poly(jpn,raw=FALSE)
jpn_df<-jpn$att.data
hokkaido_poly<-subset(jpn_poly,jpn_df$PREF=="北海道")
hokkaido_df<-subset(jpn_df,jpn_df$PREF=="北海道")
hokkaido_df$CITY2<-ifelse(is.na(hokkaido_df$CITY2)," ",as.character(hokkaido_df$CITY2))
hokkaido_df$CITY1<-ifelse(is.na(hokkaido_df$CITY1)," ",as.character(hokkaido_df$CITY1))
hokkaido_df$TOWN1<-ifelse(is.na(hokkaido_df$TOWN1)," ",as.character(hokkaido_df$TOWN1))
hokkaido_df$TOWN2<-ifelse(is.na(hokkaido_df$TOWN2)," ",as.character(hokkaido_df$TOWN2))
write.polylistShape(hokkaido_poly,hokkaido_df,"hokkaido")

注1)・・・is.na(hokkaido_df$TOWN2)," "<=ここは全角空白です。
注2)当方環境WIN2000SP4では、writeするとRが時々こけます。

実行環境:WINXPSP2,R2.0.1J,maptools v0.4-13


R グラッフィクスライブラリ

QDU (2005-02-21 (月) 19:12:41)

数日前から r-help で R のグラフィックスを集めたサイトを作ろうという提案がされ、すでに試行作業が行なわれています。読者投稿サイトになるようです。同様なものは RjpWiki がすでにありますが、対象が全世界になりますから、短期間で充実したものになりそうで、楽しみです。試験的サイト


未承認広告 in r-help

間瀬 (2005-02-18 (金) 06:47:11)

本日 r-help に長い日本語による未承認広告が投稿されていました。どうしてか spam fileter を潜り抜けてしまったようです。日本人読者はそんなには多いと思わないのですが、何を考えているのでしょうか?


不適切記事

QDU (2005-02-17 (木) 18:13:32)

Wiki は皆の共同作業で成り立っています。明らかに不適切な記事は見つけ次第削除しましょう。その分、余計なものを目にする人が減ります。


書籍「The R Tips」が出来上がりました

舟尾 (2005-02-09 (水) 09:34:10)

おかげ様で拙著「The R Tips」が出来上がりましたので、ご報告させていただきます。
タイトルは「The R Tips - データ解析環境 R の基本技・グラフィックス活用集 -」で、 出版社は九天社さん、値段は3675円で、2月10日発売予定です。「THE R Book」のときと同様、amazon などのネット書店で売り出されるのは2月10日よりも少し後、 一般の書店に並ぶのは半月 〜 1ヶ月ほど後になるのではないかな、と予想しております。
表紙、目次等の情報は The R Tips サポートページ をご覧下さい。誤植指摘・間違い報告・ご指導・ご鞭撻いただく用の掲示板も用意しておりますので、ご意見をいただけますと幸いです。
本を書くにあたって、この「RjpWiki」がもの凄く役に立ちました。運営されている岡田先生、ならびに有益な情報を紹介して下さった皆様に深くお礼申し上げます。そして、PDF 版「R-Tips」について誤植指摘・間違い報告・ご指導下さった皆様にも、この場を借りて深くお礼申し上げます。


RMatlab パッケージ

MKR (2005-02-08 (火) 20:11:24)

r-help 記事で RMatlab という R と Matlab の「対話」を可能にするというパッケージのことを知りました。確かに両方を使って見たい人もいるかもしれませんね。

# r-help 記事を引用
> I came across recently to the Rmatlab package
> (http://www.omegahat.org/RMatlab/) that allows R and Matlab
> to "talk" to each other. I made several attempts to install
> it on my Mac but without any success as some headers seem
> to miss. I am just wondering if anyone has already tried
> and successfully used RMatlab. According to the website,
> this should run on unix machines and I was surprised that
> it couldn't be true for Mac as the OS X, Linux and Unix
> MATLAB architectures are pretty much similar.

Pretend we can't see your screen and include the error messages
in your post. Can we assume you are running 10.3.7 and have
XCode 1.5 loaded as well?

P. Murrel さんのグラフィックス集

MKR (2005-02-04 (金) 19:03:39)

R コアメンバーの P. Murrel さんが グラフィックス集を公開されています。八月に Chapman & Hall/CRC から出版予定の ”R Graphics” という本に掲載のグラフィックス集のようです。

  • こ、これはもの凄いことになっていますねぇ…。Figure 1.11 は「ホントに R で書いたの?」と疑いたくなるような作品です。8 月に出版される P. Murrel さんの本は、是非手元に置いておきたい一冊になりそうです。 -- 舟尾 2005-02-09 (水) 09:44:55

wavelet

しいたけ (2005-01-31 (月) 21:27:09)

 Rのwavelet解析のプログラムとかで公表されているのはあるのでしょうか?
 古いmathematicaを使っているのですが,しょぼい趣味に利用している程度ですので価格の高さに付き合えず,OctaveかRに乗り換えさせてもらおうと思っています。よろしくお願いいたします。


本日の笑える r-help 記事

間瀬 (2005-01-29 (土) 10:27:08)

r-help 記事をみている人なら必ず笑える記事がありましたから紹介します。sarcasm とは「厭味、当てこすり」という意味です。笑えなかった人はごめんなさい。Dalgaard さんは R core チームの一員です。

"Marc R. Feldesman" <feldesmanm@pdx.edu> writes:

> At the risk of being flamed for mortal stupidity, I'm trying to figure
> out what could have possibly changed (at my end almost certainly) that
> make Brian Ripley's posts (in particular) not show up on my mail
> server (at least not on the one where I receive my email). 

Did you remember to turn off the Oxford-sarcasm filter? ;-)

        -p
-- 
Peter Dalgaard 

Rmap

Tappy (2005-01-28 (金) 16:43:53)

 R初心者です。Rmapなるものに興味を抱き、ダウンロードしたのですが、インストールの仕方がわかりません。ファイルをどのように移動したらいいのでしょうか?詳しく教えていただけないでしょうか?よろしくお願いします。


TeXwiki

QDU (2005-01-25 (火) 09:09:19)

日本の TeX 界のドン奥村先生が TeX 用の Wiki を開設されていることを最近気づきました。やはり PukiWiki を使っており、RjpWiki ファンには馴染みやすい体裁です。まだ始まったばかりのようですが、いずれ巨大な Wiki に成長するのは必至ですね。現在のところ見やすさの点では RjpWiki の方が格段に良いような気がします。岡田さんのこれまでの工夫に感謝します。


統計数理研究所のワークショップの案内

統計数理研究所のワークショップの案内を転載します。 -- 間瀬茂 2005-01-19 (水) 20:04:29

みなさま(重複して受け取られた方はご容赦ください),

"Workshop by Dr. Robert Gentleman and Dr. Martin Theus"のご案内です。

3月11日(金),12日(土)に統計数理研究所 講堂において,

Workshop "Modern statistical visualization and related topics (5):
Recent developments in Mondrian and R"

を開催いたします。

講演者は,
  Dr. Robert Gentleman (Fred Hutchinson Cancer Research Center, USA)
  Dr. Martin Theus (Augsburg University, Germany)
のお二人です。

Dr. Gentleman は R の作成者のひとりであり、近年は R に基づいたバイオイ
ンフォマティックスのためのシステム Bioconductor の作成を進めていますの
で、それらの講演をお願いしました。 
 
Dr. Theus はJavaによる対話型データビジュアライゼーションシステム 
Mondrianの作成者であり、そのシステムに関する講演をしていただきます。

なお、R に関して、その並列化に関する講演があります。

どうぞ,ご参加ください。

なお,参加は無料ですが,準備の都合上,参加予定の方は以下の申込書をメー
ルで,中野(nakanoj@ism.ac.jp)までお送りいただけると幸いです。

--------------  申込書  ---------------------------------------------
"Workshop by Dr. Martin Theus and Dr. Robert Gentleman" に参加します。 

       お名前:
       所属  :
       e-mail:
       11日の懇親会に参加:  します or しません (どちらか削除)
---------------  申込書  終わり  ---------------------------------

このワークショップは,昨年,当研究所で開催された2回の Workshop
"Modern statistical visualization and related topics" の続きであり,今
年度に3回予定しているワークショップの最後のものです。今年度の第1回は,
 2004年11月19-20日
   Workshop(3) by Dr. Chun-houh Chen 
第2回は,
 2004年 12月9-10日
   Workshop(4) by Professor Dan Carr and Dr. Juergen Symanzik 
でした。

なお、各回の内容は独立です。

                         中野純司(統計数理研究所)
                             nakanoj@ism.ac.jp

「人工知能学会誌」に R の紹介記事

間瀬茂 (2005-01-11 (火) 10:10:41)

編集者からのお勧めで「人工知能学会誌」 Vol.20, No.1, 67-75 (2005.1) に院生(坂口、多賀君)と一緒に R の紹介記事を書きました。チュートリアル形式の9ページの短いものです。同誌の「研究のツールボックス」というフリーのソフト紹介シリーズの一つです。


表計算ソフト利用の危険性を検証する団体 EuSpRIG

MKR (2005-01-04 (火) 00:04:09)

(あえて Excel とは限らないでしょうが)表計算ソフト利用の危険性を検証する団体
European Spreadsheet Risks Interest Group があるようです。研究者と企業内利用者双方を対象にしているようで、国際集会も予定されているようです。 表計算ソフトがもたらした損失に関する数十の報告も面白い(?)です。統計利用者だけの問題では無いわけですね。


CRAN 登録パッケージ数

間瀬茂 (2004-12-30 (木) 22:36:01)

今年も残るところ25時間あまり。CRAN に登録されているパッケージの数を数えてみましたら何と 433。5月に数えたら 349 で一年間で 120 あまり増加しているのに驚いたものですが。登録プロジェクトの Bioconductor には 98。Omegahat は 34 でした。皆さん良いお年をお迎え下さい。


パッケージ spdep

間瀬茂 (2004-12-16 (木) 10:18:24)

本日更新情報がでたパッケージ spdep の著者の一人に Hisaji Ono (尾野久二)さんの名前を見つけました。もちろん The R Book の著者のお一人の尾野さんですよね。


r-help 記事

間瀬茂 (2004-12-14 (火) 23:52:21)

r-help 記事を無断引用。無知でしたが slashdot の英語板があったんですね(こちらが本家?)。新しい R/S 本の情報も。
Greetings all,

Just a quick heads up that there is a Slashdot thread this morning on Open Source Math Software for Education, which includes references to R and Dirk's Quantian distribution (among others). The thread is at: slashdot The OP's query was targeted for high school to first year college age students, but as is typical with Slashdot, the scope of the dialog tends to wander....

Also, I was reading the latest issue of Amstat News and noted that there is a new book from Springer on R/S-PLUS pending by Professor Brian Everitt called "An R And S-Plus Companion To Multivariate Analysis". The book appears to be due to be release next month. The link for the Springer site is: An R And S-Plus Companion To Multivariate Analysis

and the Amazon.com link is: An R And S-Plus Companion To Multivariate Analysis

Professor Everitt's prior related work, co-authored with Dr. Sophia Rabe-Hesketh, is "Analyzing Medical Data Using S-PLUS" also from Springer, which along with the other related books that I have, provided a solid reference when I started using R a few years ago.

HTH,
Marc Schwartz


R国際化

なかま (2004-12-14 (火) 18:17:55)

御公儀より密命が下りました.
http://www.ipa.go.jp/software/open/2004/result.html#shimoki


「R 統計関数マニュアル」

間瀬茂 (2004-12-09 (木) 22:17:08)

間瀬です。R 統計関数マニュアルの件ですが、その後強力な助っ人が現れ、状況がいささか変わってきました。現在「すこしやる気をなくしていた」校正作業を鋭意進めていますので、公開までもう少しお待ち下さい。


Robert Gentleman 氏によるワークショップ

間瀬茂 (2004-12-08 (水) 21:41:46)

統計数理研究所の中野さんから統計関係 ML に流された情報の一部を転載します。

このワークショップは,昨年,当研究所で開催された2回の Workshop 
"Modern statistical visualization and related topics" の続きであ
り,今年度に3回予定しているワークショップの2回目のものです.
第3回は, 2005年 3月11-12日
   Workshop(5) by Dr. Robert Gentleman and Dr. Martin Theus
の予定です。

R のマスコットキャラクタ

間瀬茂 (2004-12-04 (土) 11:21:58)

昨日の R-help は R のマスコットキャラクターの話題で盛り上がりました。Linux のペンギンマーク(ちなみにこれは Linus がペンギンが好きだとどこかで喋ったのが起源だそうです)みたいなものです。さまざまな提案がされました、曰く Ram (O'Reilly 本から)、R-madillo, Kangaroo (Roo という省略形があるようです), Racoon (洗いぐま)、marmott (冬眠中のイビキが RRRRRR...RRR だからだそうです), inch-worm (尺取り虫、移動中の形状が正規曲線に似ているいるから)、 Rooster (おんどり、R Object Oriented Statistical EnviRonment にかける), Ray (魚のえい)、はては映画の主人公 Ripley (そういう映画があるらしい)の似顔絵はどうだという提案まで。R の故郷 New Zealand の動植物にすべきだとの正論も。はて、マスコットが誕生することになるのか?現在の R ロゴよりはましかもしれませんね。

思い出したのでついでにメモしておきます。Linux の生みの親 Linus Torvalds の母方の祖父は、ヘルシンキ大学教授でフィンランドでは著名な統計家だったそうです。10歳の Linus に自分のフィンランドでももっとも初期の PC (Commodore VIC-20) で basic プログラムの ABC を教え、自分の仕事の手伝いをさせたのはこの祖父だそうです。当然統計解析ソフトも書いたと思われます。


「R 統計関数マニュアル」近日公開

間瀬茂 (2004-11-24 (水) 00:47:14)

R の基本パッケージ base, stats に含まれる「ほとんどすべての統計解析関連の関数」のヘルプドキュメントを、カテゴリー化した上で、ほぼ忠実(up to misunderstandings)に翻訳したものを、近日中に私の WWW 頁で公開予定ですので、お知らせします。近日中とはいつを指すのかは、私の暇しだいですので、正確にはわかりかねます。全部で 560 頁ほどになります。example コードには理解を助けるために簡潔なコメントが付けてあり、グラフィックス出力も出来るだけ掲載しました。R は本来統計解析環境で、その中心はやはり言語機能以上に、統計解析機能のはずですが、R の base, stats パッケージ中にどのような統計解析関数があるのか、全貌を知るのはなかなか困難(私も今回始めて全体を把握し、改めて開発者の途方もない努力に、ひたすら脱帽しております)ですので、お役に立つのではと思います。実は二つの出版社に出版を提案してみたのですが、一社からは GNU ライセンス関連で敬遠(?)され、もう一社は逆にそのへんの理解が今いちの雰囲気なので、こちらから辞退することになりました。結局、オープンソースの R のドキュメントの翻訳として WWW 頁での公開が一番適切だろうということになりました。私としては、コピーもいいが、やはり正式な書籍の形での利用がユーザーには使い易いのではと考えていたので、少し残念ではありますが。あらかじめお断りしておきますが、いっぱい誤解、誤植、誤訳があると思いますが、私に知らせていただく労をとられても、おそらく修正する元気は当分(もしかすると永久に)ないと思います。したがって私個人に知らせていただく必要はありません。欠陥承知で使っていただくか、一切使わないか、または(これが一番建設的ですが)より良い訳を自分で公開して下さい。当然ですが、その際私の訳を下敷にしていただければ嬉しいです。私の WWW 頁に公開完了しましたらまたお知らせします。



*1 emacsにはPostScriptモードがあるので便利です。emacsを知らない方に分かるように説明すると、psファイルやepsファイルをemacsに読み込むと、emacsはPostScript専用エディタに変身します。

トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2023-03-25 (土) 11:19:16