RjpWiki自体へのコメントでも、雑談でもOKな掲示板です

注意:新規記事用の入力欄は以下の目次の直後にあります。各記事への追加コメントの入力欄は、各記事の後にあります。


過去の記事のアーカイブ 。アーカイブ中の記事への追加コメントは自由です。ただしあまり古い記事の場合は、最新の「なんでも掲示板」に新規に項目を立てられた方が良いかも知れません。



回答を期待する記事は原則 質問コーナー Q&A にお願いします。「なんでも掲示板」はそれ以外の本来の(長めの)コメント専用にすることを提案したいと思います。


R ユーザー会まとめ

間瀬茂 (2005-12-11 (日) 07:12:32)

 計数理研究所の中野先生の御世話でRに関する講演会が開かれました。ご参考までに講演のごく簡単な内容紹介を。

今回(10日)の講演は主に RjpWiki の常連寄稿者によるものでが、狭い部屋でしたが一杯になる熱気でした。次回の話もでました。どんな内容にしたら良いか、より広範囲なユーザーに参加してもらうための方策なども。

平成17年度統計数理研究所共同利用研究集会

「データ解析環境Rの整備と利用」

プログラム

開催場所:東京都港区麻布4−6−7 統計数理研究所新館2階研修室
日  : 2005年12月9(金),10(土)日

12月9日(金) (使用言語:英語)
Talks by Simon Urbanek (AT&T Research Labs), a member of the R core development team
これは都合で聞けませんでしたが、聞いた方の感想では非常に面白い話だったとか。

12月10日(土) (使用言語:日本語)

10:00-10:30 舟尾 暢男 (武田薬品)R 初心者からみた R 初心者の現況
Rtips 作者。Rtips 執筆に至る経緯や、Rtips 精選版出版のニュースも。 製薬業界での統計解析の話も紹介されました。

10:40-11:10 中間 栄治 (COM-ONE)私的R利用方法
R の日本語化の話かと思いましたが、内容は初めて聞く、 namazu の姉妹ソフト gonzui を使ったソースコード検索システム開発の話でした。R ドキュメント検索システムは既にありますが、確かにこうしたものがあれば参考コードを見つけるのに便利そう。すでに中間さんのサイトで試験公開中ですのでお試しあれ。

11:20-11:50 岡田 昌史 (筑波大学)RjpWikiのこれまでとこれから
RjpWiki 管理者による苦労話、および今後の RjpWiki 運営・仕様に関する話 。次世代 R user (岡田ジュニア) の紹介も。

13:30-14:00 久保 拓弥 (北海道大学)生態学分野での R の使われかた紹介
生態学研究者の生態に関するサーベイと、生態学分野での統計の使われかたに関する紹介。glm (一般化線形モデル)の有用性。より詳細は癖になりそうなちかごろのぎょーむ日誌 をどうぞ。

14:10-14:40 中澤 港 (群馬大学)医学統計教育におけるRの利用
医学部生に対する統計学教育の苦労話。時間数の少なさは確かに問題。

14:50-15:20 中野 純司 (統計数理研究所)統計数理研究所でのR
自ら統計解析システム開発にも携わる研究者の話。研究所自慢のグリッド計算機に並列計算 R を組み込んだ話(噂では中間さんが業務で活躍)。共同利用機関ですから、「早すぎる R」を試して見たい方はコンタクトを。

15:30-16:00 間瀬 茂 (東京工業大学)R の S4 クラスとメソッド入門
気になるけど今一意味不明な S4 (S 言語第四版)クラスとメソッドの私的紹介。一般ユーザーには取り敢えず不要な知識ですが、概略を知っておくとドキュメントを読むとき役に立つ(かな)。

16:10-16:40 谷村 晋 (長崎大学)Thematic Cartography with R
疫学研究者による R を用いた主題地図の表現法いくつかの紹介。

  • 皆さんお疲れ様でした。非常に面白い内容ばっかりでした。特に間瀬先生のものはSpObject?の構造解析をしておりましたので、非常に役立ちました。(とくにSlot)飲み会には参加できませんでしたが、中野先生の隣できょろきょろしていたのは私です。 -- okinawa 2005-12-11 (日) 09:15:21
  • おやまあ。さすがに沖縄から御参加とは思いませんでした。次回は是非ご講演どうぞ。懇親会で中野先生から聞いて驚いた話の一つが、過剰な(お役所)個人情報保護意識から出席者の名前・所属をメモしていただく長年の慣例を控える(少なくとも統計数理研究所)ことになっているのだそうです。他にもハンドル名ではお馴染みの方もいらっしゃったかとおもいます。 -- 間瀬茂 2005-12-11 (日) 12:42:37
  • あぁ、okinawaさんいらしたのに何故声をかけてくださいませんでしたか。地図の話をしたかったのに。間瀬先生にも話しましたが、私もspの理解をすすめるのに間瀬先生の話は大変有用でした。私の話も聞いていらしたのなら連続カルトグラムに挑戦して頂けると嬉しいです。> okinawaさん -- 谷村 2005-12-13 (火) 12:42:31
  • JGRの発表などのまとめがあればいいのですが。 -- 金曜日行けなかった者? 2005-12-13 (火) 15:46:09
  • 谷村先生ごめんなさい.先生があまりにアクティブに質問されてたので、ひるんでしまいました.でも皆さんディスカッションを楽しんでましたね. -- okinawa 2005-12-13 (火) 22:33:45

ちょっと面白いかも

QDU? (2005-12-03 (土) 22:32:30)

こんな記事みつけました


統計解析システム Ox

間瀬茂 (2005-12-03 (土) 06:24:52)

京都でひらかれている統計の集会に参加していて、経済関係の人が使っている Ox というソフトのことを耳にしました。調べてみると商用ソフトですが Academic use に限っては使用自由というライセンスのようです。C 風のシンタックスのコンパイラ型統計言語のようです。うわさではかなり早いとのこと。R では遅すぎるという方(& C 風のプログラミングに抵抗の無い方)はためされては。以下のサイトからダウンロードできます。多くのプラットフォームで動くようです。東大の大森先生による日本語の簡単な使用法へのリンクもあります。`
Ox公式サイトはここ
私は R が大好きですが、ただし R だけが唯一無二のソフトでないのは当然のこと、好敵手が無ければどんなソフトもいずれ退化するのがダーウィンの教え。


R ユーザー会御案内

間瀬茂 (2005-11-21 (月) 16:01:50)

統計数理研究所の中野先生の御世話でRに関する講演会が下記の要領(一部変更の可能性あり)で開かれることになりました。特に二日目は RjpWiki でもおなじみの顔ぶれがほとんどの、実質的な R ユーザー会になりますので、御参加のほどよろしくおねがいします。参加は自由でもちろん無料です。

私も S 言語第4版のクラスとメソッドについて、自分の勉強がてらお話する予定です。本当は私の専門分野での R の使われ方を紹介するところですが、よくよく考えてみると私はそんなに R を使っていないことに気付きました(笑)。なお、このユーザー会は中間さんの「IPA プロジェクト」が無事終了した祝賀会を勝手に兼ねる予定です。

以下中野先生からのメイルを転載:

みなさま

フリーの統計解析システムRに関する下記の共同利用研究会を開催します。参加
は自由で,一日だけの参加も歓迎します。多くの方のご参加をお待ちしています。中野純司@統計数理研究所


平成17年度統計数理研究所共同利用研究集会

「データ解析環境Rの整備と利用」

プログラム

開催場所:東京都港区麻布4−6−7 統計数理研究所新館2階研修室
日  : 2005年12月9(金),10(土)日

12月9日(金) (使用言語:英語)

Talks by Simon Urbanek (AT&T Research Labs),
           a member of the R core development team

13:30-14:30 Talk 1:
   iPlots - Interactive Graphics for Data Analysis in R

14:45-15:45 Talk 2:
   JGR - Java GUI for R and Java/R interfaces

16:00-17:00
   Parallel computing in R - Top Trees models space exploration

      (それぞれの talk の abstract が下のほうにあります)

12月10日(土) (使用言語:日本語)

10:00-10:30  舟尾 暢男 (武田薬品)
   R 初心者からみた R 初心者の現況
10:40-11:10  中間 栄治 (COM-ONE)
   私的R利用方法
11:20-11:50  岡田 昌史 (筑波大学)
   RjpWikiのこれまでとこれから
12:00-13:30  昼食
13:30-14:00 久保 拓弥 (北海道大学)
   生態学分野での R の使われかた紹介
14:10-14:40 中澤 港 (群馬大学)
   医学統計教育におけるRの利用
14:50-15:20  中野 純司 (統計数理研究所)
   統計数理研究所でのR
15:30-16:00  間瀬 茂 (東京工業大学)
   R の S4 クラスとメソッド入門
16:10-16:40  谷村 晋 (長崎大学)
   Thematic Cartography with R
16:50-17:20  総合討論
18:00-       懇親会(広尾近辺)




Abstract of talk 1:

 R is a very flexible and powerful software for statistical computing.
It extensibility is leveraged by hundreds of packages offering a wide
variety of tools in many areas in applied sciences. However, the is
one aspect that covered only partially and that is graphics. R
produces high-quality static graphics for publication purposes, but
it lacks interactive graphics for explorative data analysis.

 iPlots attempt to remedy this shortcoming by providing platform-
independent interactive graphics for R. The iPlots package offers a
wide range of fully interactive graphics including scatterplots,
histograms, barchars, mosaic plots, parallel coordinates plots and
many others. Moreover iPlots are based on a very flexible and
extensible engine for creation of arbitrary interactive graphics: iBase.

 In this talk we will demonstrate the use of iPlots as a tool for
exploratory data analysis and discuss the basic concepts of iPlots.
We will also provide insights into the iBase framework for creating
new interactive graphics. All this will demonstrated on practical
real-word examples.

Abstract of talk 2:

 R can be made accessible to a broader range of users by using
graphical user interface (GUI) to provide additional support for the
user. JGR - Java GUI for R is a cross-platoform GUI for R. It
flattens the learning curve, is valuable for teaching statistics, but
also includes features that will be welcome even by power-users.

 In this talk we will demonstrate various features of JGR, such as the
intelligent console, code editor, object browser, help system and
package installer. In addition we will discuss integration of iPlots
(interactive graphics for R) and iWidgets (custom user interface
elements in R) in JGR.

 We will also look behind the scenes and consider several R/Java
interfaces, their differences and applications. Furthermore we will
show how to integrate own Java code into R and use R function from
within Java.

Abstract of talk 3:

 For historical reasons, R is a single-threaded application. Nevertheless,
in this talk we will show how can R be successfully
leveraged for parallel computing. Most common approaches involve
running several R processes using various kinds of inter-process
communications.

 In this talk we will discuss several different methods of parallel
computing in R. We will also show step by stop how parallel computing
can be made easy using the snow package for R. In addition, we will
present in detail a practical example of model space exploration of
tree models that we performed using massive parallel computing.
  • ユーザー会は事前の参加申し込みが必要なのでしょうか? -- 平平凡凡? 2005-11-21 (月) 16:58:33
  • 不用と思いますが、中野先生から参加人数の把握のために事前調査の指示があれば改めておしらせします。懇親会については詳細は不明ですが、もしかすると事前登録が必要かも。これも、はっきりしたらまたおしらせします。 -- 間瀬茂 2005-11-21 (月) 18:34:24
  • ぜひ参加したいです。 -- okinawa 2005-11-22 (火) 13:53:45
  • okinawa さんも成果物を来年お時間があれば発表されたらどうでしょうか?または、CRANに登録かされるか? -- 平平凡凡? 2005-11-22 (火) 15:18:42
  • そうですね。他の先生方と分野が被らなければいいのですが・・・。 -- okinawa 2005-11-22 (火) 17:37:42
  • 懇親会はとくに事前に予約するのではなく、その場で有志を募り近くの適当なところに出かける、という感じだそうです。 -- 間瀬? 2005-11-25 (金) 12:58:13

WinXPとLinuxの速度比較

msasaki→佐々木? (2005-10-25 (火) 23:53:42)

WinXPとLinux(FC4)を同一マシン(Athlon64,3200つまり2GHz,memory2G)でどちらか早いか比較しました(?)。課題は行列Tipsにある2900の正方行列の逆行列を求めるというものです。結果は、Wondows100秒、Linux101秒で大差ありませんでした。Windowsとは意外と早いものだったのですね。

  • ↑こうした数値計算は基本的に C/FORTRAN サブルーティンに丸投げしているので、違いはさほど出るはずは無いのでは(?) -- 2005-10-26 (水) 00:34:20
  • おお!!ということは,RをLinuxでお使いの先生方は。特定の計算でおいしいを経験されているのですね!! -- 佐々木? 2005-10-26 (水) 00:52:16
  • WinXPとFedoraを比較といっても、双方の常駐サービス・デーモンなどによっても変化しますし、Rのビルド方法によっても変わるでしょう。その辺りを書いていただけないと比較にあまり意味は無いですよ。個人的にはLinuxの方がチューニングの限界は上だと思います。何せOSのコンパイルからできるんですから。 -- aki 2005-10-26 (水) 22:35:27
  • WinXP(SP2)でパッチはすべて+ソフト少し vs FC4のワークステーション・インストール、開発ツールで何も追加デーモン・アプリ無しの状態です。RはCRANのrpmからです。高速化のためには、余分なサービス削除、カーネルインストール、ソースをコンパイルなのですね。それにしても、tipsにある30秒の結果はすごいような・・・素人には到達できない天空の域であると思われました。 -- 佐々木? 2005-10-27 (木) 08:41:34
  • libgotoやATLASは入れてますか? 行列演算に劇的な違いが出ますよ。ちなみに、私のAthlon 64 X2 4400+ / Gentoo Linux / R-2.2.0 / libgotoなマシンでは10秒程度で終わります。行列TipsにはAthlon XP 2500+で30秒とのことですから、佐々木さんのマシンなら少なくとも25秒は切れる力はあるのではないでしょうか。 -- aki 2005-10-27 (木) 09:53:54
  • 例えば ある r-help 記事 など参考になりますか。もっとも私の印象では、Linux, FreeBSD, WinXP 派、それぞれ R だけのために OS 変える人は少ない(?)から、こうした比較は無意味かも。 -- MKR? 2005-10-27 (木) 16:29:23
  • はい、初心者の佐々木としては、TACCでユーザー登録したのですが、Athlon64用のlibgotoが見つからず、Opteron用をダウンロードしました。中を見るとPentim4というようなことが・・・からくりを理解できぬまま、今日はATLASに挑戦します。それと、windows版とlinux版が存在して、TACCには両者があることが書かれているのですが、なぜかlinux版しかないような・・・う・う・う -- 佐々木? 2005-10-28 (金) 09:14:10
  • まだLinux版しかTACCには登録されていないのでは。Athlon 64ならOpteron用で問題ありません。「中を見ると」の意味が分かりませんが。バイナリファイルの中を見ても仕方ないと思うんですけど。 -- aki 2005-10-28 (金) 10:05:16

生物統計ハンドブック

濱マイク? (2005-10-25 (火) 21:12:09)

S-PLUS本なのですが,「実用S-PLUS生物統計ハンドブック」が発行になるらしい.数理システムユーザーコンファレンス2005開催案内より.


R の入門的講義

間瀬? (2005-10-18 (火) 15:24:21)

統計数理研究所の公開講座(有料)で R の(入門的)講義が開かれるようです。詳しくは URL
http://www.ism.ac.jp/lectures/1711-1.html を御覧下さい。

  • その他にも「R を使った...」 という講義が幾つか。 -- 2005-10-18 (火) 15:27:18

確率分布同士の演算の信頼区間

takahashi? (2005-10-11 (火) 20:54:48)

Rとは直接関係ないのでここに書いてみます(説明はRでしてみます).

  • お願いですから、(初級)Q&A コーナーに移動してください。 -- 2005-10-13 (木) 16:15:00
  • だそうなので,移しておきましたよ。あっちでやってね。統計学のお話なんで,R とは無関係なんだけど。

Windows R-2.1.1 etc folder の rgb.txt

mitsu5? (2005-10-05 (水) 12:57:41)

version 2.1,1 を Windows にインストールしてみてしばらくまごまごしました。
R window の background color を前に使用している色に戻せなかったことです。
しばらく試行錯誤をしていて、etc folder に rgb.txt file がないことに気付き、これを別の所からもって来て解決しました。
どの version からこうなったのでしょうか。私のような人のために書いておきます。


R ユーザー会?

間瀬? (2005-09-21 (水) 09:57:24)

統計数理研究所の中野先生が中心となり R をテーマにした研究会が開かれる予定です。海外からの招聘者の話と、日本の R ユーザーによる肩の張らないお話の二本立て(2日間の予定?)になる予定のようです。現在日程調査中です。もうすこしはっきりしたらお知らせします。

RjpWiki の常連投稿メンバーと ROM メンバー多数の参加を期待しています。

  • WOW!関東圏でしたらぜひ参加したいですね。 -- okinawa 2005-09-28 (水) 12:30:00
  • 浅野家下屋敷付近なれば,いざ主君Rの仇を打つべく...(あのへんでしたよね?) -- なかま 2005-09-28 (水) 13:52:22
  • へー、長年通いなれた場所でしたが知らなかった。研究所所員もほとんど知らないのでは。ところで赤穂四十七士には二人間瀬がいるのご存知ですか(私の先祖ではありません)。叔父と甥ですが、子どものころから映画、TVで一度も名前が出ないのがずっと口惜しかった。史跡見物もかねておいで下さい。研究所と公園の間にある「南部坂」は忠臣蔵で有名なそれとは違うと掲示があったような。-- [[ 間瀬]] 2005-09-28 (水) 15:24:22
    日本庭園と広場のある「有栖川宮記念公園」(研究所の真ん前です)

    区境にある日比谷線広尾駅から、港区側にある有栖川宮記念公園へ行ってみた。
    公園名でわかるように、昭和9年に高松宮家から都に寄贈される前は、有栖川宮家
    の御用地だった。さらには盛岡藩南部家の下屋敷、忠臣蔵で有名な浅野家の下屋敷
    と公園の歴史は江戸時代にまで遡る。

  • あの坂は南部坂(忠臣蔵の南部坂は赤坂の方)ですけど、有栖川宮公園は旧南部藩下屋敷でこれは忠臣蔵以前に赤穂浅野藩下屋敷と交換して赤坂から移ってきたものだそうですが、研究所の方も下屋敷に含まれるのでしょうか? -- 2005-09-28 (水) 15:38:57
  • 表題の集会ですがとりあえず12月10日(土)に決まったとの連絡がありました。場所は統計数理研究所です。どなたでも参加自由になると思います。現在海外からの講演者は参加の返事が無いそうです。プログラムの詳細はいずれまた。-- 間瀬? 2005-09-28 (水) 19:56:48

Rの普及

匿名? (2005-09-21 (水) 02:21:01)

結城先生がRを紹介していますね
http://www.hyuki.com/d/200509.html#i20050921

Rの裾野がちょっと広がった気がします


Knoppix 4.0

間瀬? (2005-09-17 (土) 13:11:37)

Knoppix 4.0 が公開されています。Unix user 誌の10月号付録に DVD 版がついています。R 2.1.0 日本語版が収録されています。 MS Windows 領域にインストールするバッチファイル付き( 起動時に grub で MSW と  Knoppix を起動し分けます)です。ただ、HD の Linux 領域にインストールすると日本語表示がおかしくなるのはなぜ?

  • KNOPPIXは使ってないのでなんですが,ちかごろのglibcの風習から考えると,/usr/lib/locale/locale-archive が無いもしくは壊れていると言うケースではないかと.そういった場合なら localedef -i ja_JP -c -f EUC-JP ja_JP.EUC-JP で直るかも. -- なかま 2005-09-18 (日) 21:28:07
  • いつもながら、なかまさんの博識にはおどろかされます。せっかくのアドバイスでしたが、実は原因はもっと単純だったことがネットを漁っていてわかりました。原因はIPフォントがコピーされていなかった(!!!)ことでした。ほかから持ってきて入れたら無事に表示されました。とはいうもののPPOEがうまく働かずいまだ悪戦苦闘中(いえ、なにもまた虫のよいアドバイスを期待しているわけでは)。いままでは何もしなくてもつながっていたのに。古いバージョンで何も不都合はなかったのに、単に新しいほうがなんだかよさげというだけでバージョンアップし、いつも余計な苦労をしています。スイカと同じであたりはずれがあるようで。 -- 間瀬? 2005-09-19 (月) 16:53:06
  • あっ,いえ,一知半解な混乱を招いたかも...IPAフォント(ライセンスって結局どうなんでしたっけ?)が原因(もしかして意図的?)とは思いも(やってみればわかるんでしょうが...)よらず.PPPOEなら焦らずログを見ればさほど難しい問題は無いのではないか(dhcpcdでeth0がアクティブになり,それにIPを振ろうとエラーになる位か?)などと,更なる薄識(苦笑)ぶりを披露し,もうすぐアマリにアレゲなコードをcontributeしようとして顰蹙をかうのでは無いかと苦悩の日々を過ごしつつ... -- なかま 2005-09-19 (月) 21:27:22
  • 原因は単なるインストールスクリプトのバグのようです。すでに産総研には報告済みで次回には修正されるということです。 MSW パーティション居候版は何も問題ありませんので、かえって不思議でした。Knoppix はしばらく前から既定で IPA フォント使用になり、見栄えが格段によくなりました。 おかげで今のように MSW を使うと、フォントの汚さが目に付きます。商品なんだろ、おい、と言いたくなります。PPOE の件もう少し格闘してみます。なに、かって無印 Debian 版のころは、無事に X Windows が動くまで丸々半年かかりましたから、それを思えば数週間ぐらいなんのことはない(笑)。 -- 間瀬? 2005-09-20 (火) 00:03:03

マハラノビスの汎距離

g? (2005-09-16 (金) 17:03:36)

Rの操作そのものについてのことではないので,ここに投稿します.マハラノビスの汎距離を求めるときに,分散共分散行列が特異となったので,逆行列が求まらず,代わりに一般化逆行列を用いて,マハラノビスの汎距離(この時点でそう呼んでいいのかわかりませんが…)を求めました.この結果をマハラノビスの汎距離として用いてよいのでしょうか?体験談や参考文献がありましたらご教授いただけると幸いです.

  • R に固有の問題ではないですが。。さて。。そもそも,特異行列にならないように変数を選択して用いるべきではないかとも思います。ようするに,なぜ特異行列になったかを吟味せずに数学的にそれを回避することの意義の問題ですが。 -- 青木繁伸 2005-09-16 (金) 20:47:27
  • ご回答ありがとうございました.そうですね.データを再検討してみます. -- g? 2005-09-17 (土) 21:26:29

記事に協力していただける方を探しています

石塚朝生? (2005-09-09 (金) 16:14:58)

弊社のホームページでRを使って、比較言語学の二項検定をやっていただける方を探しています。
このプロジェクトは元産業能率大の安本美典先生が考案された比較言語学の統計学的手法を使って、検定を行うものです。
この記事は現在開発中のWikiに掲載される予定です。
詳細にご興味ある方は、asao.ishizuka@gmail.comまでご連絡ください。


Statistics with R

間瀬? (2005-09-03 (土) 10:22:12)

最初 RjpWiki そして r-help で紹介されたとき、その華麗なグラフィックスで衝撃をあたえた "Statitique avec R " の著者 Zoonekind 氏による英訳版が 公開されました。Statistics with R

  • これはありがたいです!「Customizing graphics」の章も勿論素晴らしいですが,「Programming in R」や「From Data to Graphics」の章にもマニアックかつ有益な内容が書かれていますねぇ(英語になって初めて気付きました).PDF版は,エラーが出て表示できない頁があるのが残念です・・・.どこかの出版社から出版してくれないですかねぇ. -- 舟尾? 2005-09-05 (月) 00:15:42
  • pdf ダウンロードしましたが,1085ページもあるんですね。とても,読めそうにないですが,最初の方を早送りしていて,2.22.4 IEEE arithmetic のところで,121 が2 進数では近似値になるというのが書いてありましたが,これは間違いですね。整数は浮動小数点表示でも正確に表されます。 -- 2005-09-05 (月) 11:06:45
  • >整数は浮動小数点表示でも正確に表されます
    これは本当? -- 2005-09-05 (月) 18:16:17
  • IEEEの浮動小数点表示は,例えば 121 は .1111001 × 2^7 (7乗も2 進数で 111 と表示)これを1ワードの中に [(111)(1111001)]のように詰め込んであったはず。件の pdf の説明は 121 が 1.21 × 10^2 乗という10進数で表されるが,ここで 1.21 という10進小数を2 進小数になおして説明しようとしたところが間違い。 -- 青木繁伸 2005-09-05 (月) 19:53:28

c 関数の,こんな使い方

青木繁伸 (2005-08-31 (水) 23:23:34)

関数から数個の値をベクトルで返すとき,それぞれの要素の名前も付けるには,今まで

a <- 1.23; b <- sqrt(a) # 等を定義するとして
result <- c(a, b)
names(result) <- c("a", "sqrt(a)")
return(result)

等としていたが,

return(c("a"=a, "sqrt(a)"=b)

でよい。
しかし,ときどき(?)変なことが生じる。"foo"=bar 等としているのに,ラベルが foo.1 等となることがある。なぜ,余計な ".1" が付くのだろうか。

  • data.frame()のなかで同じ名前の奴が複数あると.1 .2とsuffixがつきますよね -- takahashi? 2005-09-01 (木) 00:08:45
  • ソウでもないようなので,首をひねっているところです。
    Gen.Wil <- function(group, event, time)
    {
         途中略
    +     Z <- W/sqrt(Var.W)
    +     p <- pnorm(abs(Z), lower=F)*2
    +     c("W"=W, "Var(W)"=Var.W, "Z value"=Z, "P value"=p)
    + }
    >  Gen.Wil(group, event, time)
               W     Var(W).1    Z value.1    P value.1 
    6.300000e+01 1.320313e+03 1.733813e+00 8.295134e-02 
    とまあ,こんな具合なのです。 -- 青木繁伸 2005-09-01 (木) 10:45:23
  • 上のコードだと再現できない(変数に適当な数値を入れてみたらラベルに.1がつかなかった)ので宜しかったら再現できるコードを見せて頂けないですか? -- takahashi? 2005-09-01 (木) 11:05:20
  • そうなんですよ。普通はうまくいくのですが。http://aoki2.si.gunma-u.ac.jp/R/Gen-Wil.html に今挙げたバージョンとテストデータでは再現できますか?ちなみに,私はMacintosh(OS 10.4) の R 2.1.1 です。 -- 青木繁伸 2005-09-01 (木) 11:22:41
  • 再現しました@winxp.R2.1.1.何故でしょうかね?(バグでしょうけど).ソースのぞきにいってみようかな. -- takahashi? 2005-09-01 (木) 11:32:20
  • わかりました.多少ややこしいですが,table()が生成したラベルがna,nb経由でVar.Wに,それがZ,pに,とわたってるんですね.ということでc()内でラベルをつけるとき中の変数がもともとラベルを持っていると.でペーストされるということなのでしょう.バグか仕様かはわかりませんが. -- takahashi? 2005-09-01 (木) 11:40:29
  • nb <- (n <- length(group))-(na <- table(group)[1]) の時点で,na と nb が 名前 "1" を持っています。同じように定義されている n は名前なし(NULL)。 -- 青木繁伸 2005-09-01 (木) 11:40:45
  • 同じ頃書き込んだようで。。。ソウですね。これは,まあ,仕様ですね。しようがない。。。(^_^;) -- 青木繁伸 2005-09-01 (木) 11:42:56
  • おかげさまで,すっきりしました。Q & A みたいになってしまいました。すみません。 -- 青木繁伸 2005-09-01 (木) 11:45:32
  • ラベルtipsとしてラベルあれこれ作っておきました.いろいろ調べるとかなりややこしいですね. -- takahashi? 2005-09-01 (木) 14:15:03

Rは統計解析をする人々の支持を受けているのか

谷村 (2005-08-24 (水) 12:04:18)

連日の書き込みを申し訳ありません。Rに関連する解説記事を書いているのですが、「統計計算とグラフィックの言語・環境であるRは、マルチプラットフォームかつオープンソースであるため、多くの統計解析者の支持を受けている。」という一文を入れたいと希望しています。しかし、嘘を書きたくない。そこで、このargumentを支持するevidenceを探しています。何かないでしょうか。マルチプラットフォームだから、オープンソースだから支持を受けているというissueの方は削っても、多くの人から支持を受けているという方のissueは何とか加えたいと思っています。よろしくお願いします。

  • bioconductorのHPにRを使う理由が書いてありました。
    Use of R. R and the R package system are the main vehicles for designing and
    releasing software. R (www.r-project.org) is a widely used open source language
    and environment for statistical computing and graphics - GNU's S-Plus. It
    provides a high-level programming environment together with a sophisticated
    packaging and testing paradigm. It has a number of mechanisms that allow it to
    interact directly with software that has been written in many different
    languages (see Omega Project). These tools allow users to incorporate modules
    based on other work. Viewed in that context, adopting R as a vehicle does not
    exclude other development environments and paradigms. R can, in those cases,
    provide a glue or connectivity linking what might otherwise be different
    products. Finally, R is under very active development by a dedicated team of
    researchers with a strong commitment to good documentation and software design.
    お役に立ちますでしょうか? -- Akira? 2005-08-24 (水) 13:23:37
  • 大変りがとうございました。感謝します。> Akiraさん。特に"widely used"というくだりは大変有り難いです。しかし、文献として引用するには印刷物の方がありがたいです。このWebページは書籍化したりとか、記事にされたりとかしていませんでしょうか。他の情報も引き続きお待ちしていますm(__)m -- 谷村 2005-08-24 (水) 17:02:10
  • お役に立てて光栄です。今分かる範囲ですとBiotechniques. 2003 Mar;Suppl:45-51. にreviewが掲載されていました。オープンソースに対する重要性が書いてありますが、Rについても「Bioconductor: Statistical analysis tools developed in R」の項に利点が書いてあります。
    著作権の関係もあると思いますので原文のリンクはやめておきます。すみません。
    ただ、論文のtitle「Open Source Software for the Analysis of Microarray Data」でgoogleにかけると本人のHPからdownloadできます。 -- Akira? 2005-08-24 (水) 18:39:19
  • 少なくとも日本に限れば「広く使われている」というのは恐らく嘘。一つの確実なソースは中間さんのHPに紹介されているダウンロード数統計でしょうか。「日本語化 R だけに関してもこれだけの関心を集めている」ということですが。既存パッケージ数は(世界全体で見れば)広くつかわれているという証拠でしょうね。大事な点は「どのような人に」使われているかだと思うのですが、これは調べるのは難しい。かって、r-help で R がどれくらい使われているか、議論になったことがありますが、数で示すのは難しい、というのが結論だったような気がします。 -- 間瀬? 2005-08-24 (水) 19:49:03
  • 皆さん、ありがとうございます。Dudoitの論文をさらっと拝見しました。Here we review three of the most widely used and comprehensive systems,と書いて、その3つのうちの1つがRだと書いていますね。間瀬先生のご指摘はよく分かります。「広く使われている」とか「支持されている」ではなくて、「関心を集めている」とか「将来が期待される」とか「高い可能性を秘めている」とか程度にしておいて方がよいかも、と思い始めました。 -- 谷村 2005-08-24 (水) 22:37:23

THE STATISTICAL LAB

g? (2005-08-09 (火) 20:28:29)

"The Statistical Lab"なるRベースの統計教育ツールがあるようです.(The Statistical Lab)ただし,R1.4.1でないと動かないようなので,"RCommander"の方が勝ちかなというのが正直な感想です.

  • 最後のかっこがURLに入っていたので修正しておきます -- 2005-08-09 (火) 21:10:28
  • R1.4.1のバイナリは入手可能でしょうか? -- 通りすがりの者? 2005-08-18 (木) 15:00:42
  • ソースならCRANに0.49からありますが、バイナリは現在CRANにある最も古いものはWindowsの1.6.2ですね。 -- 2005-08-29 (月) 16:17:48
  • The Statistical LabのサイトにR1.4.1もおいてあります.ただ,今見たところ,英語バージョンのページには,ダウンロードページが表示されない(存在しない?)ので,ドイツ語バージョンのページからダウンロードしてみてください. -- g? 2005-08-30 (火) 09:48:58
  • ver3.0が出てました。R2.0.1に対応してるようです。インストールして無事動きました・・・が、ドイツ語わからねえ〜。 -- okinawa 2005-11-01 (火) 15:05:11

CRAN のパッケージ数

MKR? (2005-08-07 (日) 00:29:03)

暇なので CRAN にあるパッケージの数を数えてみました。プロジェクト関連のパッケージは除きます。総計 569 でした。ただし、パッケージ集がいくつかあるので、それを入れて数えると、580 でした。「だからどうした」ですが、丹念に探せば、必要なものはどこかに見つかりそう。すでに多すぎて困る贅沢な状況になりつつあるようです。


実行しないで,考えましょう!

間瀬? (2005-08-04 (木) 21:34:11)

r-help を見ていてしばらく首をかしげてしまった例(解答を書かないで -> お節介な人)。

> sum = 0; for(i in 5:1){ sum[i] = i }; sum
[1] 1 2 3 4 5
> sum = 0; for(i in 5:0){ sum[i] = i }; sum
[1] 1 2 3 4 5
> sum = 0; for(i in 5:-1){ sum[i] = i }; sum
[1]  1 -1 -1 -1 -1
> sum = 0; for(i in 5:-2){ sum[i] = i }; sum
[1] -2 -1 -2 -2 -2
> sum = 0; for(i in 5:-5){ sum[i] = i }; sum
[1] -5 -5 -5 -5 -4
> sum = 0; for(i in 5:-6){ sum[i] = i }; sum
エラー:添え字が許される範囲外です
  • これは、Rにおけるベクトル操作の基本中の基本ですね。しかしながら、あらためてテストを受けると、意外にまごついちゃいますね。 -- 2005-08-18 (木) 08:47:09

Rの早見表(リファレンスカード)

谷村 (2005-08-04 (木) 18:15:58)

こんなものを見つけました。すでにRjpWikiのどこかに報告されていたらすみません。


Rの中からWeb検索

谷村 (2005-08-04 (木) 17:53:46)

R 2.1.0からhttp://search.r-project.orgを検索するコマンドRSiteSearch()?が 追加されたのですが、あまり話題に上りませんね。私個人的には、ものすごく 便利で大助かりなコマンドなのですが。。。ひょっとしてWinじゃ使えないコマ ンド?

  • こんな関数があったのですか!素晴らしいっ!!Windows でも問題なく使えます. -- 舟尾? 2005-08-04 (木) 22:55:18

「R-Tips」のPDF版とその原稿 (05/08/01 修正版)

舟尾? (2005-08-03 (水) 23:47:22)

竹澤さん(中央農業総合研究センター)のウェブスペースに置かせてもらっております R-Tips の PDF ですが,これまでに様々な貴重なご意見を頂戴しました.おかげ様でこの度,改訂版を公開することと相成りました.
http://cse.naro.affrc.go.jp/takezawa/r-tips.pdf(3Mb・200頁)

  • 今までに R-Tips について戴いたご意見・間違いのご報告を反映致しました.
  • 「印刷出来ない!」という不具合を解消致しました(多分…です).
  • R 2.1.0(とR 2.1.1)に対応しました.
    よろしかったら御覧下さい.もし,ご意見・間違いのご報告をいただける場合は ご意見板 に書き込んでいただけましたら幸いです.


「なんでも」といってもね

間瀬茂 (2005-07-29 (金) 18:21:16)

一件(真面目だけど)頓珍漢な投稿があったので、消去しました。ところで gmail (google web mail service) 使いたい方いらっしゃいますか。スパムメールブロック機能が抜群で、使い始めてまだ半月ですが、手放せなくなっています。ユーザーがある日突然届く招待権利を知人に配布するという独特の紹介方法なので、いまだに知名度は高くないか、耳にしていても使う機会が無い人が多いようです。私のところにも50件分の招待権利が早速舞い込み、20人ほどに紹介しましたが、使っても使ってもまた50人分に戻っています。これは、どんどん広めてくれという google 社の希望と思うので、使ってみたい方は私までメイルください。一応先着50人ということにしておきます(なお、当選通知は商品発送をもって替えさせて頂きますので、返事が無ければ枠が無くなったと考えてください)。メイルアドレスは 

maseshigeru@gmail.com 

でお願いします。(一応、RjpWiki の読者だけにとどめておいてくださいね。)なお、これは無料で、2GB の容量が使えるという気前の良さと、先端的な仕様で、これまで使ったいくつかのメーラーや Yahoo mail よりも気に入っています。 

  • SPAMブロックの精度を信じつつも,全角文字で書いてしまうあたりが,心理的に昨今のSPAMの酷さを物語っていると言いますか.(^-^; gmailありがとうございました. -- [[なかま <eiji.nakama@gmail.com>]] 2005-07-29 (金) 21:29:05
  • ↑一瞬の精神的葛藤を見抜かれましたね。スパムをブロックするよりも、スパムメールを出させないほうが建設的だと思いましたので。gmail のスパムブロック方法は単純明解、全世界のユーザーからの垂れこみデータベースとお得意の全文検索技術でピンポイントで摘出しているようです。そのせいか、ほやほやのスパムメールは見逃してしまうようですが、これまでの経験では95%以上で、しかも false negative は一件もない(こちらの方が嬉しい)です。HP 等でメールアドレスを公開されている方にお勧めです。フィッシングメールも警告が出ます(つい先日も UFJ 銀行をかたるメールが届きました)。 -- 間瀬? 2005-07-29 (金) 23:01:59
  • The free gmail inviterというページからもGmailのアドレスを入手可能ですよ。 -- matsut 2005-07-29 (金) 23:45:08
  • このスレッドは「なんでも」の範囲なんですか。 -- 2005-07-31 (日) 23:19:57
  • R に限りませんが、ウェッブで情報を公開していると、メールアドレス等がしばしば公開されることになり、スパムメールの洪水で本業に差し支える程悩まされることになります。というわけで、スパムメール対策情報も重要になります(少し強引なこじつけ?) 少なくとも私以外の R のおかげ(?)でスパムメールに悩まされている RjpWiki 主要関係者二名には感謝されましたよ。 -- 間瀬? 2005-07-31 (日) 23:45:58
  • 詳しくないのにネタふりで申し訳ないんですが、最近のスパム対策ソフトに使われているベイジアンフィルタリングのRでの実装とかはないんでしょうかね。 -- 2005-08-03 (水) 01:31:03

Rに関する演題を出しませんか

谷村 (2005-07-26 (火) 16:43:50)

第22回日本コンピュータサイエンス学会学術集会が2005年10月29日(土)大阪で開催されます。Rの地図表現に関する演題を出そうかやめようか迷っています。学術集会のメインテーマからかなり離れているので1人で浮いてしまうかもという心配もあり、どなたか10/29に関西圏で余裕がある方でR関連の演題を私も出そうという方がいらっしゃれば、是非、ここに名乗りを上げて、演題申し込みページから申込みをよろしくお願いします。私は学会員ですが、学会員でなくても申込みできるらしいです。

  • 「地図表現」ですか、こちらの学会では「GIS」とか「GeoComputation?」ではピンとこないのでしょうか? -- Fleischmann? 2005-07-27 (水) 02:20:18
  • 私以外にもいままでGISに言及する演題もあったように思いますので、ピンとこないということはないと思います。しかし、この学会の中心は医療情報学でRもGISも限りなくマイナーであるのは確かです。 -- 谷村 2005-07-28 (木) 10:10:32
  • コンピュータサイエンス学会は実装寄りの話もわりと好まれる場ですよね。malloc()の関係で64ビット版を使わなければ計算できなかったloess fitの例の紹介と、できれば32ビット版でも計算可能にするパッチの紹介とか出しましょうか。 -- 岡田 2005-07-29 (金) 12:11:22
  • おぉ、ありがたいです。是非是非。64ビット版を使わないと計算できないとかそんなことがあるんですね。。。 -- 谷村 2005-07-29 (金) 14:37:36
  • 演題登録の締め切りは明日(9月30日)です。登録はこちらから。 -- 谷村 2005-09-29 (木) 13:20:26

useR! 2006 お知らせ (r-help より)

間瀬茂 (2005-07-23 (土) 06:10:45)

We are happy to announce that the second R user conference

                      useR! 2006


is scheduled for June 15-17 2006 and will take place at the Vienna
University of Economics and Business Administration.

This second world-meeting of the R user community will focus on

- R as the `lingua franca' of data analysis and statistical computing,
- providing a platform for R users to discuss and exchange ideas how R can
  be used to do statistical computations, data analysis, visualization and
  exciting applications in various fields,
- giving an overview of the new features of the rapidly evolving R
  project.


As for the predecessor conference, the program will consist of two parts:
keynote lectures and user-contributed sessions (abstract submission will be
available online starting from October 2005). Prior to the conference, there
will be tutorials on R (proposals for tutorials should be sent before
2005-09-30).


KEYNOTE LECTURES

R becomes the standard computing engine in more and more disciplines, both
in academia and the business world. How R is used in different areas will be
presented in keynote lectures addressing hot topics including

- Marketing
- Teaching
- R on Different Platforms
- Graphics
- History of S and R


Speakers will include John M. Chambers, John Fox, Stefan Iacus, Uwe
Ligges, Paul Murrell, Peter Rossi, Simon Urbanek and Sanford Weisberg.


USER-CONTRIBUTED SESSIONS

The sessions will be a platform to bring together R users, contributers,
package maintainers and developers in the S spirit that `users are developers'.
People from different fields will show us how they solve problems
with R in fascinating applications. The sessions are organized by
members of the program committee, including Claudio Agostinelli, Roger
Bivand, Peter Buehlmann, Ram醇pn D醇^az-Uriarte, Sandrine Dudoit, Dirk
Eddelbuettel, Frank Harrell, Simon Jackman, Roger Koenker, Uwe Ligges, Andrew
Martin, Balasubramanian Narasimhan, Peter Rossi, Anthony Rossini, Gerhard
Tutz and Antony Unwin and will cover topics such as

- Applied Statistics & Biostatistics
- Bayesian Statistics
- Bioinformatics
- Econometrics & Finance
- Machine Learning
- Marketing
- Robust Statistics
- Spatial Statistics
- Statistics in the Social and Political Sciences
- Teaching
- Visualization & Graphics
- and many more.



PRE-CONFERENCE TUTORIALS

Before the start of the official program, half-day tutorials will be offered
on Wednesday, June 14th, including a lecture on R graphics by Paul Murrell.
We invite R users to submit proposals for three hour tutorials on special
topics on R. The proposals should give a brief description of the tutorial,
including goals, detailed outline, justification why the tutorial is
important, background knowledge required and potential attendees. The
proposals should be sent before 2005-09-30 to useR-2006@R-project.org.



After the official presentations, Vienna's famous wine and beer pubs, cafes
and restaurants proofed to be a very stimulating environment for fruitful
discussions at previous meetings of the R community like last year's `useR!
2004'.

We invite all R users to submit abstracts on topics presenting innovations or
exciting applications of R. A web page offering more information on the `useR!'
conference, abstract submission, registration and Vienna is available at

http://www.R-project.org/useR-2006/



IMPORTANT DATES

- registration: starting October 2005
- online abstract submission: starting October 2005
- submission deadline of tutorial proposals: 2005-09-30
- early registration deadline: 2006-01-31
- submission deadline of abstracts: 2006-02-28
- registration deadline: 2006-05-31



We hope to meet you in Vienna!


The organizing committee:

Torsten Hothorn, Achim Zeileis, David Meyer, Bettina Gruen,
Kurt Hornik and Friedrich Leisch


ちょっとした正規表現関数

takahashi? (2005-07-15 (金) 04:30:03)

sregex<-function(s,ex,f=NULL,extended=T,...){
  ret<-list(m=-1,s=-1)
  gm<-regexpr(ex,s,extended=extended,...)
  if(gm==-1){return(ret)}
  ret$m=substring(s,gm,gm+attr(gm,"match.length")-1)
  ret$p=ifelse(gm==1,"",substring(s,1,gm-1))
  ret$n=ifelse((gm+attr(gm,"match.length")-1)==nchar(s),"",
     substring(s,gm+attr(gm,"match.length"),nchar(s)))
  ps<-0;exs<-strsplit(ex,"")[[1]]
  for(i in 1:(length(exs)-1)){if(ifelse(extended,
         exs[i]!="??",exs[i]=="??")
         && exs[i+1]=="("){ps<-ps+1}}
  if(ps!=0){ret$s=as.character(lapply(1:ps,function(i){
        sub(ex,sprintf("??%d",i),ret$m,extended=extended,...)}))}
  return(ret)
}
###############
> sregex("xxabcdefgyy","a((bc)(d(ef))g)")
$m
[1] "abcdefg"
$s
[1] "bcdefg" "bc"     "def"    "ef"    
$p
[1] "xx"
$n
[1] "yy"

sub-matchを扱うマッチング関数ってありますか? sub,gsub以外に見当たらないので作ってみましたが... mはマッチ全体,sはsub-matchの文字ベクトル,pはマッチ以前,nはマッチ以後,のリストを返します. まあ,普通の正規表現ライブラリなんかによくあるやつです.


実行しないで予想しましょうシリーズ(3)

青木繁伸 (2005-07-11 (月) 18:41:29)

as.integer(factor(c("aa","AA","bb","BB")))

教訓:知っているつもりの関数こそ,help をよく読むべし。

  • ASCIIコード順じゃなくて、sort()なんですね... -- 2005-07-29 (金) 23:04:23

統計関連学会連合大会のチュートリアル

間瀬? (2005-06-29 (水) 22:09:53)

9月の統計関連学会連合大会で以下の
チュートリアルが開かれます。ただし確か参加費が必要だったかな? 参加費は千円(テキスト代)だそうです。

日時: 2005年9月12日(月) 13:30〜16:30
* 「Rによる経済・経営データの分析」
         o オーガナイザ: 西郷 浩 (早稲田大学)
         o 講演者: 山本義郎 (東海大),安川武彦 (金融工学研究所)

新しい R 本

間瀬茂 (2005-06-19 (日) 20:52:31)

つい最近ある方から新しい R 本の出版計画(秋頃?)を聞きました。話を要約すると "(統計無しの)計算機言語 R "、"C 落ちこぼれの人のための計算機言語 R 入門"とでもいった内容の本だそうです。確かに R は完全な計算機言語ですし、 C 等の"低水準"言語に比べればはるかに気が効いた高水準ラクチン命令がいっぱいあり、コーディングがとてもしやすいから、C 等の言語では敷居が高い文系等の方には、統計機能を全く無視した計算機言語としての利用もありうるかもしれませんね。そのうち「R って統計解析もできるんだ、知らなかった〜」という人が登場する?その際著者から聞かれたのは、「R でプロトタイプを書いたコードを C 等に移植するとどの程度早くなるか?」でした。私はそうした経験が無いので返答できませんでしたが、参考例をご存知の方は教えて下さい。もちろん、下手な C コードよりも、上手な R コードの方がかえって早いことは十分あるでしょうが。私は「統計抜きの R」という発想にはやっぱり抵抗を感じましたが。

  • Cの落ちこぼれと言えば代表的なものはポインタでしょうか,さすれば因子の理解も困難なのではないか等と,素人的には考えます.RtoCに関しては「そんな複雑なものをCでは書きたくない!」というベクトルが一番大きいのではないかと.それ以外にもデバイスにおけるグラフィック処理を個別でCで書くのは実際しんどいですし. -- なかま 2005-06-19 (日) 22:16:02
  • 不正確でした。その本は R 本というよりは、S 言語本らしい(S-plus も並列紹介するらしい)。 -- 間瀬? 2005-06-19 (日) 23:34:44

「フリーソフトウェアRによる統計的品質管理入門」

舟尾? (2005-06-09 (木) 21:34:39)

R commander の日本語化といえば関西大学の荒木先生ですが、荒木先生が中心となって執筆された R の本が近日出版されます!

「フリーソフトウェアRによる統計的品質管理入門」フリーソフトウェア R のページ(『フリーソフトウェアRによる統計的品質管理入門』サポート情報)

タイトルは統計的品質管理入門となっておりますが、R のインストール方法から R commander のセットアップ方法、R commander の使用方法が載っております(非常に分かりやすく説明されています!)。そして勿論!品質管理についても説明されておりまして、品質管理と統計について非常に分かりやすい解説がなされております!!


google で R コードを見つける tips

MKR? (2005-05-26 (木) 17:37:26)

R 関連の URL をインターネット検索するのが困難なことはよくしられていますが r-help に google で R コードの掲載された URL を見つける Tips が紹介されていました。コツはキーワード

filetype:R optim
filetype:R boxplot

等を使うことだそうです。確かにたくさん見つかります。お試しあれ。


R パッケージの作者による解説論文

MKR? (2005-05-26 (木) 17:20:54)

R パッケージの作者による解説論文多数が J. Statistical Software に掲載されています。論文は自由にダウンロードできるようです。

Firth
Bradley-Terry Models in R
Volume 12, Issue 01

Sturtz, Ligges, and Gelman
R2WinBUGS: A Package for Running WinBUGS from R
Volume 12, Issue 03

Mineo and Ruggieri
A Software Tool for the Exponential Power Distribution: The normalp  Package
Volume 12, Issue 04

Ritz and Streibig
Bioassay Analysis Using R
Volume 12, Issue 05

Baddeley and Turner
spatstat: An R Package for Analyzing Spatial Point Patterns
Volume 12, Issue 06

Johnstone and Silverman
EbayesThresh: R Programs for Empirical Bayes Thresholding
Volume 12, Issue 08

Nason
pinktoe: Semi-automatic Traversal of Trees
Volume 14, Issue 01

Imai and Van Dyk
MNP: R Package for Fitting the Multinomial Probit Model
Volume 14, Issue 03

Buttrey
Calling the lp_solve Linear Program Software from R, S-PLUS and Excel
Volume 14, Issue 04

Zeileis and Grothendieck
zoo: S3 Infrastructure for Regular and Irregular Time Series
Volume 14, Issue 06

Terpstra and McKean
Rank-Based Analyses of Linear Models using R
Volume 14, Issue 07

実行しないで予想しましょうシリーズ(2)

青木繁伸 (2005-05-25 (水) 15:00:16)

勝手にシリーズ化したりして

以下のプログラム実行するとどうなるでしょう

n <- length(1:1000000)
n*n
n^2
n*(n+1)
#class(n)
n <- 1000000
n*n
#class(n)

ヒント:注釈行を活かせば違いが分かる
あるライブラリ(fBasic)のプログラムをハッキングしていて行き当たった

  • lengthの知らなくても良い話
    # これはベクトルを生成出来ない
    a<-1:2^31
    # ベクトルは生成出来るがlengthはNAになる(添字の扱いの問題:境界の設定はアバウト)
    a<-1:(2^31-1)
    length(a)
    # 長さはちゃんと帰ってくる
    a<-1:(2^31-2)
    length(a)
    バグなのか仕様なのか...謎は多い.-- なかま 2005-05-25 (水) 16:21:02
  • Macintosh版 R2.1.0a だと,a<-1:(2^31-1) も a<-1:(2^31-2) も同じ結果になります。 -- 青木繁伸 2005-05-25 (水) 17:37:02
  • すみません、64bit-Rじゃないと出来ません.(^_^; 将来はintでは無くsize_tに改めるようです。Win64,LONG64とか書いてあるし(でもR_int_t型と言う名前ですが) -- なかま 2005-05-25 (水) 19:36:56

R グラフィックス ギャラリ

間瀬? (2005-05-20 (金) 06:18:50)

R グラフィックス ギャラリ がかなり本格的に整備され始めました。


掲示板のアーカイブをダウンロードできますか?

ハマちゃん? (2005-05-17 (火) 12:51:06)

このHPでいつも勉強させていただいてありがとうございます。中途半端な知識を持っていると、到底全部の記事を読んでも分からないので、よくQ&Aで必要な部分だけを参考しています。しかし、上級者に当たり前のことと思われたかもしれないですが、Q&Aの内容は結構消されたりしますよね。どうせオープンなHPなので、もし掲示板のアカイブを圧縮形式でダウンロードできればと、ありがたいなと思いますが、(例えば青木先生のHPの掲示板のように)、この要望は無理なんでしょうか?あるいは単に技術的に難しいのでしょうか?

  • 「Q&Aの内容は結構消されたりしますよね」 =>普通そんなことは稀です。画像が含まれますから、結構面倒では?テキストだけなら、編集モードからマウススクロールで全範囲指定、カット&ペーストでエディター画面に簡単にコピーできます。 -- 2005-05-17 (火) 17:42:05
  • 失礼。カット&ペーストはしないで下さい。コピー&ペーストです。 -- 2005-05-17 (火) 17:45:06
  • こんなのでのすたるじーに浸るとか -- 2005-05-17 (火) 18:29:41
  • おお、なつかしい>Web Archive. 質問の件は、もしMacでTigerならばSafariのWeb Archive保存機能を使えば自分でオフライン閲覧用のアーカイブを作ることができます。 -- 2005-05-17 (火) 23:27:40

R 壁紙

間瀬? (2005-05-11 (水) 17:25:51)

R 壁紙 を作った人がいます。使う気になりますか?

  • r-project-2-1280.jpg あたりを壁紙にしてみます♪ -- 舟尾? 2005-05-11 (水) 18:29:59

CRAN Task Views

間瀬? (2005-05-09 (月) 16:38:54)

最新 R News に CRAN のパッケージ(現在 500 あまりだそうです)のカテゴリー別紹介の試みが記載されていました。まだカテゴリーは4つだけですが、必要なパッケージを見つけるのに便利そうです。CRAN Task Views

  • さらにパッケージ ctv というのを使うと R からこれが覗けるようです。 -- 2005-05-09 (月) 23:29:32

「R for Mac OS X」 from Apple.COM

舟尾? (2005-05-03 (火) 11:17:48)

最近 Mac デビューした舟尾です.「R for Mac OS X」というタイトルで,R が Apple のサイトで紹介されていますね.Mac OS X 2.1.0 もダウンロードできるようです.
http://www.apple.com/downloads/macosx/math_science/rformacosx.html

  • おお^^驚きました。Tigerはまだ未入手ですが、動作していますか?gcc-4.0がデフォルトになったようなので、早く試してみたいです。 -- 岡田 2005-05-03 (火) 19:20:34
  • Tiger は,29日14時頃に届き,即,インストールしました。R 2.1.0 は Tiger でも,ちゃんと動いています。 -- 青木繁伸 2005-05-03 (火) 21:07:08
  • Tiger で行列計算をさせると,かなり速そうですねぇ〜!逆に,R 2.1.0 を Jaguar に入れることは出来ないのですね・・・.Windows で云えば Windows2000 に対応していないってことですから,少し不親切ですねぇ^^; -- 舟尾? 2005-05-04 (水) 00:03:20
  • 全く関係のない話しですが面白かったので披露しておきます。友人の勤めるA社がB社と先頃大型合併をしたのですが、A社は Mac 派、B 社は MSW 派で、合併会社は MSW で統一されることになり、友人は MSW に乗り換えるために大変苦労したそうです。私も最近は事務が当たり前のように MSW でしか処理できない添付ファイルを続々送りつけてくるので、しぶしぶ時々 MSW を HD の片隅から甦らせて使っています。皆さん将来に備えて Mac, MSW , Linux の三刀使いになっておきましょう :-) -- 間瀬? 2005-05-04 (水) 00:34:54
  • いや〜,サラリーマンな私にとっては他人事ではないお話です^^; .Mac が一通り使えるようになりましたら,自宅に Linux 環境を構築しようかと…. -- 舟尾? 2005-05-04 (水) 01:16:48
  • B・S・D! B・S・D! -- aki 2005-05-04 (水) 03:17:52
  • うちは,(恥ずかしいので内緒の話ですが,)事務部門(いろいろ)が一太郎のファイルを送ってくることがあります。なんだかなぁ〜。
    MSWでしか処理できないファイルというのも,少なくなりましたね。Mac でも日常生活では全然不自由はしません。ウイルスのことなど気にしなくて良いので,精神衛生的にはス極楽です。 -- 青木繁伸 2005-05-04 (水) 09:15:24
  • 三刀流になるために,AのとなりはCTRLに統一しました. Noteはレジストリやキーマップの変更. デスクトップはHHKにしました. -- なかま 2005-05-04 (水) 22:38:12
  • アプリの対応待ちでまだTigerにできないのでお教えてほしいのですが,こちらのバイナリはTigerで動かすと64-bitで動作しましたでしょうか?メモリの壁に悩まされずに大きな行列を特異値分解できると期待しているのですが,http://cran.r-project.org/bin/macosx/RMacOSX-FAQ.htmlとかを見るとCRANのバイナリは64-bitじゃないようなので… -- 神嶌? 2005-05-09 (月) 14:48:47
  • 自分で64bitコンパイルするしか今のところないかと. -- なかま 2005-05-09 (月) 15:25:19
  • お返事,どうもです.Tigerにしたらがんばってみます. -- 神嶌? 2005-05-09 (月) 17:21:55
  • gcc-4.0によるG5最適化ビルドとか64bitビルドとかについては、TigeRが参考になります -- 岡田 2005-05-09 (月) 22:02:07
  • Panther (10.3.9) 上の R-GUI ですが、環境設定の変更が反映されなかったり、ワークスペースブラウザを起動するとエラーメッセージが出てコマンドプロンプトが出なくなったり、まだちょっとバギーなんですかね。これは Daily build でも今のところ変わらないようです。 -- soysoy? 2005-05-09 (月) 23:20:02
  • あと、起動後にフォントを拡大しようとすると、1回めは必ずフォントサイズが極小になったり。 -- soysoy? 2005-05-09 (月) 23:23:33
  • フォントは確かに最初は極小になりますね。ワークスペースブラウザは私のMacOS X Server 10.3.9/MacOS X 10.3.9上では問題ないようです。 -- 2005-05-10 (火) 14:17:32
  • ワークスペースを消去してみたら件のエラーは出なくなりました。ファイルが壊れていたんですかね。フォント極小問題はバグとして挙がってました。 -- soysoy? 2005-05-11 (水) 00:22:25

今ならもれなく R3.1.0 が??

青木繁伸 (2005-04-29 (金) 12:25:40)

http://cran.md.tsukuba.ac.jp/bin/macosx/R-2.1.0.dmg からダウンロード中に,「R-3.1.0.dmg をダウンロード中」と表示されます。。。(^_^)
実際にダウンロードされたファイル名も R-3.1.0.dmg なのですが,展開すると,R-2.1.0 というボリューム名になってしまいます。。。残念

  • いつの間にか,R 2.1.0 に戻っていました(^_^) -- 青木繁伸 2005-05-03 (火) 21:07:41
  • プリントスクリーンをして記念に取っておこうと思ったのですが,一足遅かったです^^; -- 舟尾? 2005-05-03 (火) 23:53:30

VineLinux用のR-2.1.0-0vl1.i386.rpmができました

谷村 (2005-04-27 (水) 15:17:09)

R-2.1.0-0vl1.i386.rpm
R-devel-2.1.0-0vl1.i386.rpm
libRmath-2.1.0-0vl1.i386.rpm
libRmath-devel-2.1.0-0vl1.i386.rpm
をputしました。しばらくしたら、CRANに反映されるでしょう。
なかまさんの「make checkはLANG=Cにしろ」というアドバイスは大変参考になりました。今回からパッケージが若干分離しています。私は分離する必要性をあまり感じていないのですが、他のディストリと歩調を合わせました。
ちなみに、

$ rpm -qpl R-devel-2.1.0-0vl1.i386.rpm
/usr/share/doc/R-devel-2.1.0
/usr/share/doc/R-devel-2.1.0/R-exts.pdf
$ rpm -qpl libRmath-2.1.0-0vl1.i386.rpm
/usr/lib/libRmath.so
$ rpm -qpl libRmath-devel-2.1.0-0vl1.i386.rpm
/usr/include/Rmath.h
/usr/lib/libRmath.a

となっています。Descriptionの日本語訳がおかしいときにはどうぞご指摘ください。次バージョンで修正します。
国際化もされたことだし、そろそろVinePlus?へ本家版をそのままputしてもよいのではと思うのですが、みなさまいかがでしょう。VinePlus? (extras)に収録されると、extrasを有効にしているマシンでは、

# apt-get R

で、最新版のRをインストールできるようになります。

  • 問題は無いと思いますが,安定系で使いたい人は2.1.1まで入れたくないかも.(^_^; -- なかま 2005-04-27 (水) 16:37:15

gcc-4.0.0

なかま (2005-04-23 (土) 15:24:49)

えー,gcc-4.0.0を入れてRのコンパイルを行ってみました.
実行速度が非常に早くなりました.boot-Exなんかで20%程.
先頃まで人間オプィマイズしていたrnorm等は60%も高速になりました.
手元の環境はアレゲなので,なにか影響があるとなんですので,追試して
いただければ.(^_^;

  • gcc 4 * libgoto * Tierney byte compile -> どこまで早くなるのだろうと夢は膨らみますが、実際は今のままで十分間に合う程度の作業しかしていないのが本当の話。 -- 2005-04-23 (土) 16:03:47
  • 書斎*ガレージ*サンルーム => どんな家に住もうか夢は膨らみますが、実際は3LDKもあれば十分に間に合う程度の生活しかしてないのが本当の話。いやだぁ〜(笑) -- なかま 2005-04-23 (土) 19:02:12

英語版baseのインストーラーの不具合について

Y? (2005-04-22 (金) 15:46:16)

日本のサーバーからbaseのインストーラーをダウンロードして、Windowsに組み込むとうまく起動しました。メニューが日本語であったので、私の所望する英語版ではなかったようで、それを消して、改めてアメリカやカナダのサイトからbase版のインストーラーをダウンロードして、組み込もうとすると、どのサイトからダウンロードしたインストーラーも、Rconsoleの箇所で、corruptと表示されて組みこみ自体がストップしてしまいます。

どうすればよいのでしょう。

私自身、パソコンの初心者ではないのですが、この事態には困り果てております。

  • インストールが出来ない? インストール後の実行がおかしい?
    後者なら cmd.exe を実行し、
    set LC_ALL=C
    C:?Program Files?R?rw2010?bin?RGui.exe
    -- [[なかま]] &new{2005-04-22 (金) 16:34:03};
  • あ、インストールの経過表示でRconsoleで止まると言う意味でしょうか。だとしたらディスクを疑うべきでしょう。 -- [[ なかま]] 2005-04-22 (金) 16:55:35
  • そうです。インストール経過表示でRconsoleあたりで止まるのです。日本語版を消した後に英語版をインストールしようとするとです。 -- Y? 2005-04-22 (金) 17:49:30
  • 念のため, R-2.1.0では日本語版と言うのは存在しません. Windows版においては,R.dllの仕様を2通り(msvcp60.dllを必要とするものと、そうでない物)をインストール時に選択させる(例の極東言語のチェックはこの為です)だけです. バイナリが正常にダウンロード出来たかはmd5sumでチェック可能です.(md5sumが必要なのはブラウザが腐ってたり、透過型プロキシが腐ってたりしないかのチェックです.メモリが腐ってて壊れたり,ディスクが腐ってる場合も...) オフィス製品とは異なり,インストール時に高度な(こざかしい)事は行ってません.ただアーカイブを解凍してコピーするだけのインストーラですので. -- なかま 2005-04-22 (金) 18:49:44
  • 解決いたしました。「ディスクが腐っている」のではなくて、ディスクが最適化のために分割されていたりする場合、同一ディスク上にインストールできない場合やインストローラー自体が仮想上に存在する場合、このような問題が起きるようです。要は、ディスクを広く開ければよいということでした。 -- Y? 2005-04-24 (日) 16:06:39 インストローラーってなんじゃらほい

Postscript出力における日本語の文字化けと対処

谷村 (2005-04-22 (金) 11:38:58)

皆様のご尽力のより、R 2.1.0から、本家版でも日本語メッセージの表示や日本語の出力ができるようになりました。しかし、Postscriptに出力すると日本語部分が文字化けしてしまいます。

> あ <- runif(10)
> い <- runif(10)
> plot(あ,い,main="日本語タイトル")


結果は、

&ref(): File not found: "Screenshot-R2.1.0-x.png" at page "なんでも掲示板アーカイブ(5)";
&ref(): File not found: "Screenshot-R2.1.0-gv1.png" at page "なんでも掲示板アーカイブ(5)";

上側のように正しく日本語が表示されています。しかし、これをeps形式で 保存すると、下側のgvでの表示のように文字化けします。

対処方法

この文字化けの原因は、日本語の字句自体は正しく処理されているが、それらの字句のフォント指定が日本語フォントになっていないからです。従って、この対処方法は、大変場当たり的な方法ですが、epsファイルをemacs*1など適当なテキストエディタで開き、 日本語で記述されている箇所のフォントを日本語Postscriptフォントに変えてやることです。もっとスマートな方法をあみ出された方は、是非、紹介してください。

#ref(): File not found: "Screenshot-R2.1.0-gv2.png" at page "なんでも掲示板アーカイブ(5)"


このように日本語が正しく表示されます。

具体的な方法は、例えば上記の例で説明すると、epsファイルの最後部分に

0.00 0.00 503.60 503.29 cl
/ps 14 def /Font2 findfont 14 s
0 0 0 rgb
266.20 468.75 (日本語タイトル) .5 0 0 t
/ps 12 def /Font1 findfont 12 s
266.20 18.72 (あ) .5 0 0 t
12.96 258.85 (い) .5 0 90 t

とあるのを

0.00 0.00 503.60 503.29 cl
/ps 14 def /Ryumin-Light-EUC-H findfont 14 s
0 0 0 rgb
266.20 468.75 (日本語タイトル) .5 0 0 t
/ps 12 def /Ryumin-Light-EUC-H findfont 12 s
266.20 18.72 (あ) .5 0 0 t
12.96 258.85 (い) .5 0 90 t

とします。Ryumin-Light-EUC-Hは明朝体の日本語標準Postscriptフォントです。ゴシック体がよい場合は、GothicBBB-Medium-EUC-Hにすればよいでしょう。この例では、編集するepsファイルが日本語EUCなので、Ryumin-Light-EUC-Hとしましたが、もし、Shift-JISなら、Ryumin-Light-RKSJ-Hとします。JISなら、Ryumin-Light-HでOKです。

おまけ

上記例をさらにこんな風に編集すると

0.00 0.00 503.60 503.29 cl
/ps 14 def /GothicBBB-Medium-EUC-H findfont 14 s
0 0 0 rgb
266.20 468.75 (日本語タイトル) .5 0 0 t
/ps 12 def /Ryumin-Light-EUC-H findfont 12 s
266.20 18.72 (横書きテスト) .5 0 0 t
243 300 (アメリカ) .5 0 0 t
315 225 (日本国) .5 0 0 t
/ps 12 def /Ryumin-Light-EUC-V findfont 12 s
12.96 290 (縦書きテスト) .5 0 0 t

#ref(): File not found: "Screenshot-R2.1.0-gv3.png" at page "なんでも掲示板アーカイブ(5)"

こんな風に自由自在。Ryumin-Light-EUC-Vは縦書きフォント。日本語のy軸ラベルは縦書きにすることも多いと思う。単純に、縦書きフォントに変えるだけだと、向きと位置が不自然なので、微調整する。

gvを使うと、マウスポインタの位置座標を表示してくれるので、その数値を読み取ってepsファイルを編集することにより効率的にPostscript上にテキストを配置していけます。もっとも、Rグラフィックス上でidentify(x,y,label)やtext(locator(1),text)を使う方が楽だけど、後付でも自由にできるということで。

  • 長くなりすぎました。なんでも掲示板じゃなくて、独立したページの方がよかったのかな。もし不都合があれば、強制移動をお願いします. -- 谷村 2005-04-22 (金) 14:55:10

CRAN のサイズ

MKR? (2005-04-22 (金) 06:53:02)

単なる好奇心ですが、r-help に CRAN のコンテンツの総サイズの調べ方が紹介されていました。それによると現在約 5G byte だそうです。

$ rsync -nrtlvz cran.r-project.org::CRAN | grep "total"
total size is 5114784835  speedup is 13170.59
  • あれれ、cran.okada.jp.org は 9601056 kB, cran.md.tsukuba.ac.jp は 9848360 kB ... いろいろ余計なファイルがあるのかも ^^;; -- 2005-04-22 (金) 12:26:49

2×2分割表のイエーツの補正

青木繁伸 (2005-04-20 (水) 17:07:43)

9  10
9  11

のときに,R でイェーツの補正をしてカイ二乗検定すると,間違った答えを出す。

>  chisq.test(matrix(c(9,10,9,11),2,2))
	Pearson's Chi-squared test with Yates' continuity correction
data:  matrix(c(9, 10, 9, 11), 2, 2) 
X-squared = 0.0299, df = 1, p-value = 0.8626

正しい答えは

X-squared = 0, df = 1, p-value = 1

と思われる。

#           if (correct && nrow(x) == 2 && ncol(x) == 2) {
#               YATES <- 0.5
#               METHOD <- paste(METHOD, "with Yates' continuity correction")
#           }
#           else YATES <- 0
#           STATISTIC <- sum((abs(x - E) - YATES)^2/E)
## replace begin
            if (correct && nrow(x) == 2 && ncol(x) == 2) {
                STATISTIC <- if (abs(x[1,1]*x[2,2]-x[1,2]*x[2,1]) < sum(x)/2) 0    
                             else sum((abs(x - E) - 0.5)^2/E)
                METHOD <- paste(METHOD, "with Yates' continuity correction")
            }
            else STATISTIC <- sum((abs(x - E))^2/E)
## replace end
 ~
  • 彼(ら)は,Yates の原典に従っているのだから,これで良いのだと言っています。イエーツの補正(連続性の修正)を取り上げたどのような文献・資料でも,そのような取り扱いはないと言っております。原典にどう書いてあるかというのとは問題の質が違うように思うのだが。
    同じ答えを返すはずの prop.test が以下のような答えを返すのだが?という問いかけをしても,その意図を理解してくれない。prop.test の方を修正しそうな雰囲気だ。
    > prop.test(matrix(c(9, 10, 9, 11), 2, 2)) # chisq.test と同じデータ
    	2-sample test for equality of proportions with
    	continuity correction
    data:  matrix(c(9, 10, 9, 11), 2, 2) 
    X-squared = 0, df = 1, p-value = 1
    alternative hypothesis: two.sided 
        以下略
    ちなみに,SPSS も,このような場合にはカイ二乗値として 0,対応する P 値として 1 を返すんだけどと言う指摘は,はなから無視のようで。
    イェーツの補正(連続性の修正)は,しない方が良いという議論の方が優勢なようなのと,このような違いは実質上たいした違いではないというのは議論するつもりはない。 -- 青木繁伸 2005-12-25 (日) 17:30:53
  • おそるおそる...出典(コードを書いた人とか)が明らかでないと, マージしたくてもし憎い(後でそれは僕の著作物だとか匿名では難しい問題が生まれる場合もあるので)というのもあるんじゃないかなと思う今日このごろ...そういうのも考慮頂ければとか... -- なかま 2005-12-26 (月) 10:43:46
  • 話が長くなってきたので,続きは別のところへ引き取りたいと思います。 -- 青木繁伸 2005-12-26 (月) 18:28:34
  • R-2.15.1 から修正されました。問題のような場合には「カイ二乗値として 0,対応する P 値として 1 を返す」ようになっています。 -- 青木繁伸 2013-12-17 (火) 19:39:45

R. Tierney 氏の R バイトコンパイラー

間瀬? (2005-04-19 (火) 06:28:58)

以前から噂になっている R のバイトコンパイラーですが、すでに公開されているようですね。おそらくまだ機能は限定的だと思いますが、どんな感じでしょうか。新しもの好きな人は試してみられたら。URL R byte compiler
ソースコードに附属の例を実行してみました。それなりに早くなっているようですね。試してみる価値はあるかも。

> source("cmp.R")
> # old R version of lapply
> la1 <- function(X, FUN, ...) {
+     FUN <- match.fun(FUN)
+     if (!is.list(X))
+         X <- as.list(X)
+     rval <- vector("list", length(X))
+     for(i in seq(along = X))
+         rval[i] <- list(FUN(X[[i]], ...))
+     names(rval) <- names(X)               # keep `names' !
+     return(rval)
+ }
> # a small variation
> la2 <- function(X, FUN, ...) {
+     FUN <- match.fun(FUN)
+     if (!is.list(X))
+         X <- as.list(X)
+     rval <- vector("list", length(X))
+     for(i in seq(along = X)) {
+         v <- FUN(X[[i]], ...)
+         if (is.null(v)) rval[i] <- list(v)
+         else rval[[i]] <- v
+     }
+     names(rval) <- names(X)               # keep `names' !
+     return(rval)
+ }
> # Compiled versions
> la1c <- cmpfun(la1)                       # la1 をバイトコンパイル
Note: local functions used: FUN 
> la2c <- cmpfun(la2)                       # la2 をバイトコンパイル
Note: local functions used: FUN 
> # some timings
> x<-1:10
> y<-1:100
> system.time(for (i in 1:10000) lapply(x, is.null))
[1] 7.13 0.00 7.12 0.00 0.00
> system.time(for (i in 1:10000) la1(x, is.null))
[1] 13.68  0.01 13.68  0.00  0.00
> system.time(for (i in 1:10000) la1c(x, is.null))  # 1.556314 倍
[1] 8.79 0.00 8.79 0.00 0.00
> system.time(for (i in 1:10000) la2(x, is.null))
[1] 13.89  0.00 13.89  0.00  0.00
> system.time(for (i in 1:10000) la2c(x, is.null))  # 1.587429 倍
[1] 8.75 0.00 8.75 0.00 0.00
> system.time(for (i in 1:1000) lapply(y, is.null))
[1] 0.93 0.00 0.93 0.00 0.00
> system.time(for (i in 1:1000) la1(y, is.null))
[1] 5.57 0.00 5.58 0.00 0.00
> system.time(for (i in 1:1000) la1c(y, is.null))   # 4.565574 倍 (y が大きいと効果が大)
[1] 1.22 0.00 1.23 0.00 0.00
> system.time(for (i in 1:1000) la2(y, is.null))
[1] 5.72 0.00 5.71 0.00 0.00
> system.time(for (i in 1:1000) la2c(y, is.null))   # 4.727273 倍  (y が大きいと効果が大)
[1] 1.21 0.00 1.21 0.00 0.00

ちなみにコンパイル済みのコードは次のようになります。実体は(当然かも知れませんが)隠されているようです。

>  la1c
function (X, FUN, ...) 
{
    FUN <- match.fun(FUN)
    if (!is.list(X)) 
        X <- as.list(X)
    rval <- vector("list", length(X))
    for (i in seq(along = X)) rval[i] <- list(FUN(X[[i]], ...))
    names(rval) <- names(X)
    return(rval)
}
<bytecode: 0x8b84878>

「データサイエンス入門」中の qiuck 関数で検査。必ずしもいつも早くなるとは限らないようだ。

> qiuckc <- cmpfun(quick)
> set.seed(1123); system.time(x <- quick(runif(10000)))
[1] 3.92 0.00 3.92 0.00 0.00
> set.seed(1123); system.time(x <- quickc(runif(10000)))
[1] 3.91 0.00 3.92 0.00 0.00                               # ほぼ同じ

> set.seed(1123); system.time(x <- quick(runif(100000)))
[1] 180.98  43.33 229.42   0.00   0.00
> set.seed(1123); system.time(x <- quickc(runif(100000)))
[1] 163.52  29.56 193.31   0.00   0.00                     # 1.11倍
  • disassemble(la1c)で覗けば, パース(構文解析)後のデータになっているのがわかるかと思います.fun1から何度もfun2を呼ぶ場合はfun2をバイトコンパイルすればfun2の構文解析時間が稼げます.半面, function()1:10^9 みたいなのは展開されてしまいますから、超巨大オブジェクトになってしまいます. 使いかたとしては八方美人の小股の切れ上がった演算ルーチン等をバイトコンパイルして使うのが嬉しいのではないかと思います. -- なかま 2005-04-19 (火) 22:49:27
  • FORTRAN や C のような構文でバリバリにかいたものなら早くなるのかな?
    関数引用をつなげたものなら,早くなりようがない。FORTRAN や C で書かれた関数を呼ぶだけだから,呼ぶのが早いだけという。。。原理的にそうですよね。。。
    というか,プログラミング言語的に作った R プログラムってのは,早くなりそうもないという見方も。だって,たとえば,固有値固有ベクトルを求めるFORTRANなりCのプログラムをRの文法で書いても,早くなりようがない(ベクトル演算,行列演算を使ったとしたら,上と同じ原理で,Rと同じより早くなりようがない)。
    結局,どんな場合も,たいした効果はないというのがオチ? -- 2005-04-19 (火) 22:48:26
  • なるほど、かなり意味不明のコードに変わっていますね。構文解析の手間を省くわけですか。 -- 間瀬? 2005-04-19 (火) 23:31:30
> disassemble(la1c)
list(.Code, list(4, GETSYMFUN.OP, 1, MAKEPROM.OP, 2, CALL.OP, 
   3, SETVAR.OP, 4, POP.OP, GETBUILTIN.OP, 5, GETVAR.OP, 6, 
   PUSHARG.OP, CALLBUILTIN.OP, 7, NOT.OP, BRIFNOT.OP, 30, GETSYMFUN.OP, 
   8, MAKEPROM.OP, 9, CALL.OP, 10, SETVAR.OP, 6, GOTO.OP, 31, 
   LDNULL.OP, POP.OP, GETINTLBUILTIN.OP, 11, PUSHCONSTARG.OP, 
   12, GETBUILTIN.OP, 13, GETVAR.OP, 6, PUSHARG.OP, CALLBUILTIN.OP, 
   14, PUSHARG.OP, CALLBUILTIN.OP, 15, SETVAR.OP, 16, POP.OP, 
   GETSYMFUN.OP, 17, MAKEPROM.OP, 18, SETTAG.OP, 19, CALL.OP, 
   20, STARTFOR.OP, 21, 93, GETBUILTIN.OP, 22, GETFUN.OP, 4, 
   MAKEPROM.OP, 23, DODOTS.OP, CALL.OP, 24, PUSHARG.OP, CALLBUILTIN.OP, 
   25, STARTASSIGN.OP, 16, 26, GETVAR.OP, 16, STARTSUBASSIGN.OP, 
   27, 89, GETVAR.OP, 21, PUSHARG.OP, GETVAR.OP, 26, PUSHARG.OP, 
   SETTAG.OP, 28, DFLTSUBASSIGN.OP, ENDASSIGN.OP, 16, 26, SETLOOPVAL.OP, 
   STEPFOR.OP, 60, ENDFOR.OP, POP.OP, GETSYMFUN.OP, 29, MAKEPROM.OP, 
   30, CALL.OP, 31, STARTASSIGN.OP, 16, 26, GETSYMFUN.OP, 32, 
   MAKEPROM.OP, 33, MAKEPROM.OP, 34, SETTAG.OP, 28, CALL.OP, 
   35, ENDASSIGN.OP, 16, 26, POP.OP, CALLSPECIAL.OP, 36, RETURN.OP), 
   list({
       FUN <- match.fun(FUN)
       if (!is.list(X)) 
           X <- as.list(X)
       rval <- vector("list", length(X))
       for (i in seq(along = X)) rval[i] <- list(FUN(X[[i]], 
           ...))
       names(rval) <- names(X)
       return(rval)
   }, match.fun, list(.Code, list(4, GETVAR.OP, 0, RETURN.OP), 
       list(FUN)), match.fun(FUN), FUN, is.list, X, is.list(X), 
       as.list, list(.Code, list(4, GETVAR.OP, 0, RETURN.OP), 
           list(X)), as.list(X), vector, "list", length, length(X), 
       vector("list", length(X)), rval, seq, list(.Code, list(
           4, GETVAR.OP, 0, RETURN.OP), list(X)), along, seq(along = X), 
       i, list, list(.Code, list(4, GETVAR.OP, 1, STARTSUBSET2.OP, 
           2, 10, GETVAR.OP, 3, PUSHARG.OP, DFLTSUBSET2.OP, 
           RETURN.OP), list(X[[i]], X, X[[i]], i)), FUN(X[[i]], 
           ...), list(FUN(X[[i]], ...)), `*ctmp*`, "[<-"(rval, 
           i, value = `*ctmp*`), value, names, list(.Code, list(
           4, GETVAR.OP, 0, RETURN.OP), list(X)), names(X), 
       `names<-`, list(.Code, list(4, GETVAR.OP, 0, RETURN.OP), 
           list(rval)), list(.Code, list(4, GETVAR.OP, 0, RETURN.OP), 
           list(`*ctmp*`)), "names<-"(rval, value = `*ctmp*`), 
       return(rval)))
  • インタープリタとコンパイラという関係なら,圧倒的に早くなるだろう。しかし,Rはインタープリタ的に動いているのではない,よって,バイトコンパイルしたって早くなるわけがない。早くなるようなプログラムは,もともと「R 的ではないプログラム」なのでは?? -- 2005-04-19 (火) 23:53:25
  • R は C 、Fortran サブルーティン集ではありません。「Rはインタープリタ的に動いているのではない」というのは一面的な誇張では。「R 的なプログラム」とはどういうものをさすのでしょうか? C, Fortran サブルーティンの呼出だけで成り立つコードのことを指すのでしょうか。それなら、全部 C、Fortran で書いた方が賢いのでは? -- 間瀬? 2005-04-20 (水) 06:41:56
  • 固有値・固有ベクトルを求める eigen の心臓部は, z <- .Fortran("rg", n, n, x, values = dbl.n, ivalues = dbl.n,  ですしね。サブルーチンというのは,それがソースとして用意されるときもコンパイル済みのものもある。後者は,ライブラリと呼ばれることもある。固有値・固有ベクトルを求めるプログラムをRで書くこともできるが,長いし,たぶん遅いだろう。そんなの書くなら,Cで書く方がましということだ。それには賛成。しかし,誰もがCプログラムを一から書く必要はない。ソースをどこから持ってきて,自分でコンパイルする必要もないし,コンパイル済みのオブジェクトコードを自分のCプログラムにリンクさせる必要もない。単に eigen(foo,...) と書くだけで良いのだから。用意されているものを使わないのは,賢くはない。 -- 2005-04-20 (水) 08:57:18
  • eigenの"rg"はEISPACK(appl/eigen.f)の物です. デフォルトだと,La_rg(modules/lapack/rgeev=LAPACK3.0のdgeev)で処理が行われます.--with-lapackを指定した場合はそのライブラリのdgeevを使います.SUN等のBLASではLAPACK等と一体化したライブラリになり,--with-blasを指定した場合,dgeevもロードされてしまい,嬉しくない演算(主に誤差)を行ってしまいます.その為,rgeevとして個別に定義しています.積極的にLAPACK(ライブラリ次第)を使いたい(Cの外部プログラムと連動さる場合など)場合はこれらの点に注意する必要があります. -- なかま 2005-04-20 (水) 10:25:58
  • R最適化Tips 中のトランプシミュレーションプログラム test4 中の使用関数をすべてバイトコンパイルして試してみると、ほぼ二倍の速度向上。R のシステム関数をすべてバイトコンパイルしたバージョンを作れば、幸せになれる?もちろん eigen 等の C, Fortran ライブラリを単に呼び出すだけの関数の単独使用ではほとんど速度は変わりません。 -- 間瀬
>  test44 <- function (repl) {
               x <- matrixc(0, nrow = 10, ncol=repl) 
               a <- repc(0:3,13)
               for (i in 1:repl) x[,i] <- samplec(a, 10)
               y <- matrixc(x, nrow=5)
               z <- y - matrixc(y[1,], nrow=5, ncol=2*repl, byrow=TRUE)
               w <- matrix(colSumsc(abs(z)), nrow=2)
               pass <- sumc(w[1,]*w[2,]==0)
               pass/repl
            }
> test44c <- cmpfun(test44)                   # 本体もバイトコンパイル 
> set.seed(1111); system.time(test4(10000))   # オリジナルバージョン
[1] 1.11 0.01 1.11 0.00 0.00
> set.seed(1111); system.time(test44c(10000))  # バイトコンパイルバージョン
[1] 0.58 0.01 0.59 0.00 0.00
> set.seed(1111); system.time(test4(100000))   # オリジナルバージョン
[1] 10.66  0.08 10.74  0.00  0.00
> set.seed(1111); system.time(test44c(100000)) # バイトコンパイルバージョン
[1] 5.71 0.07 5.79 0.00 0.00
  • しつっこく実験。不思議なことに気づきました。中で使うシステム関数を前もってバイトコンパイルすると当然早くなるかと思ったらそうでもない。システム関数はすでに十分高速化されているようです。 -- 間瀬? 2005-04-21 (木) 22:33:54
    > gc(); set.seed(1111); system.time(test4(10000))  # オリジナル
    [1] 1.07 0.02 1.09 0.00 0.00
    > gc(); set.seed(1111); system.time(test4c(10000)) # それをバイトコンパイル
    [1] 0.61 0.01 0.62 0.00 0.00
    > gc(); set.seed(1111); system.time(test44(10000)) #  中で使う関数全部をバイトコンパイル
    [1] 1.02 0.00 1.02 0.00 0.00
    > gc(); set.seed(1111); system.time(test44c(10000)) # それを更にバイトコンパイル
    [1] 0.57 0.00 0.57 0.00 0.00
  • apply()wo -- 2005-12-29 (木) 17:34:26
  • すみません。先のコメントは誤りです。Q&Aコーナーで質問させて頂きますので削除して頂けましたら幸いです。 -- 2005-12-29 (木) 17:38:41

R 2.1.0 リリース

間瀬? (2005-04-18 (月) 21:52:59)

本日 R 2.1.0 がリリースされたようです。目玉はなんといっても UTF-8 対応、エラーメッセージも各国語版(もしメッセージの翻訳版が提供されていれば)が選択できるようになります。アナウンスの一部を引用します。中間さんの貢献が明記されていて嬉しいですね。

INTERNATIONALIZATION

o Unix-alike versions of R can now be used in UTF-8 and other
  multi-byte locales on suitably equipped OSes if configured
  with option --enable-mbcs (which is the default).  [The
  changes to font handling in the X11 module are based on the
  Japanization patches of Eiji Nakama.]
  • おー、神よ!。まだ作ってる最中なのにぃ〜。(X11間に合わなかった...) -- なかま 2005-04-18 (月) 22:28:06
  • 素晴らしいっ!なかまさんの名前が入っているっ!!早速、ダウンロードします!!! -- 舟尾? 2005-04-18 (月) 23:11:31
  • ESSのところにも書きましたが、ESS 2.5.6以前はR 2.1.0で正しく動作しないらしいので、注意してください。R 2.1.0のVine用のRPMは、specのひな形がまだ届いていないので、もうしばらく待ってください。 -- 谷村 2005-04-19 (火) 10:39:06
  • 飛びついてみました! でもRed Hat 7.3では、make checkで

    ## The following two examples use latin1 characters: these may not

    ## appear correctly (or be omitted entirely).

    plot(1:10, 1:10, main = "text(...) examples?n~~~~~~~~~~~~~~",

    + sub = "R is GNU , but not ...")

    エラー:mbcs_get_next 中に不正なマルチバイト文字列があります

    実行が停止されました

というエラーが出てしまった。でも動いてます。 -- たか? 2005-04-19 (火) 14:23:40

  • make check は LANG=C LC_ALL=C make check 等としましょう。間違っても日本語ローケル上(でもUTF-8ならいいか)でテストしてはいけません -- なかま 2005-04-19 (火) 15:25:07
  • ロケール変えたら、OKでした! ありがとうございます。 -- たか? 2005-04-19 (火) 16:08:41
  • Windows XP環境でインストールしてみたら,デフォルトフォントであるFixedFont?だとカーソル位置が若干ずれますね。フォントをMS Gothicにしてみたら直りました。もっとも,中間さんの設定ファイルではMS Gothicになっていますね。 -- 中澤? 2005-04-19 (火) 17:15:01
  • 2.1.0にアップデートしたら、
    > update.packages(ask=FALSE, checkBuilt=TRUE)
    を実行してパッケージの再インストールをした方がよい? -- 谷村 2005-04-19 (火) 17:15:38
  • えー,フォント回りは改善せなあきません. *nix系のパッケージの再インストールはlocale Cなどでしておいた方が良いかもしれません. -- なかま 2005-04-19 (火) 23:12:04
  • R-2.1.0を 'FreeBSD 4.8-RELEASE' でコンパイルしようとしたら,エラーメッセージがでて,完了できませんでした。こんなの,初めてです。ウルウル -- 2005-04-20 (水) 00:43:53
  • エラーメッセージの内容は? -- なかま 2005-04-20 (水) 01:04:47
  • FreeBSD 4.9-Rでコンソールから試してみたところ,表示されたエラーメッセージは
    character.c: In function `do_tolower':
    character.c:1300: syntax error before `tr'
    character.c:1313: `tr' undeclared (first use in this function)
    character.c:1313: (Each undeclared identifier is reported only once
    character.c:1313: for each function it appears in.)
    *** Error code 1
    となりました。gccのバージョンは2.95.4 20020320です。これが古すぎ? -- 中澤? 2005-04-20 (水) 11:25:43
  • gcc-2.95.3でも大丈夫でした. glibcかな? 以下でお茶を濁せば旨くいくかも. -- なかま 2005-04-20 (水) 14:28:51
    --- character.c.orig    2005-04-19 06:30:01.000000000 +0900
    +++ character.c 2005-04-20 14:25:22.000000000 +0900
    @@ -1297,7 +1297,7 @@
     #ifdef SUPPORT_MBCS
         if(mbcslocale) {
            int nb, nc, j;
    -       wctrans_t tr = wctrans(ul ? "toupper" : "tolower");
    +       const int* tr = wctrans(ul ? "toupper" : "tolower");
            wchar_t * wc;
            /* the translated string need not be the same length in bytes */
            for(i = 0; i < n; i++) {
  • なかまさんのご教示があったとおり変更したら*.cのコンパイルまでは通ったのですが,character.oをリンクする段階で,mbrtowcとかiswdigitとかiswalphaとかiswalnumとかその他たくさんの関数への未定義参照(undefined reference)エラーが出てとまります。R-2.1.0が必要としているライブラリがリンクできていないのでしょうか。 -- 中澤? 2005-04-20 (水) 15:14:00
  • もしかして等と調べると, http://www.freebsd.org/projects/c99/index.html 要するに5.0以上じゃないとC99な国際化関数が使えませんと言う事のようでして...(^_~; -- なかま 2005-04-20 (水) 16:00:41
  • ./configure --disable-mbcs ではダメでしょうか? (((^-^; -- なかま 2005-04-20 (水) 17:59:24
  • R教授より.解決する(4.xで動く)訳ではないけれど
    OK, thanks, we need to add a test for wctrans_t and not just wctrans.
    I checked the C99 standard and we got it right according to the standard.
    となりまいた. -- なかま 2005-04-20 (水) 20:40:03
  • なかまさん,ありがとうございます。./configure --disable-mbcsとしてからmakeしたら,FreeBSD 4.9-Rでも最後までBuildできました。 -- 中澤? 2005-04-21 (木) 01:22:17
  • なお,これでBuildしたRを起動するときは,setenv LANG Cとしてからでないと文字化けしますね(setenv LANG jaとなっていると,--disable-mbcsでBuildしたRでも日本語メッセージを表示しようとするので)。 -- 中澤? 2005-04-22 (金) 16:22:15
  • shareの下のlocaleをlocale.notuseとかでrenameしとけば,メッセージの問題は出ないのではないかと思います.(ばあたり的ですが) -- なかま 2005-04-22 (金) 19:08:30

R Graphic Gallery

間瀬? (2005-04-18 (月) 21:29:41)

先にお知らせした R Graphic Gallery が新装オープンしたようです。 R Graphic Gallery


nls と lm における formula で factor を使うこと

青木繁伸 (2005-04-18 (月) 18:59:52)

nls では,formula 中に factor は使えないというのが,別記事であった。
lm では,使えるしかも,ちゃんとランクを調整してくれる。

> x1 <- c("c","b","b","c","c","a","b","a","c","a","c","b","b","b","c")
> x2 <- c("M","M","F","M","M","M","F","F","M","M","F","M","F","F","F")
> y <- c(7,6,7,7,7,5,7,6,7,5,8,6,7,7,8)
> lm(y ~ x1+x2) # これはエラーになる【あ】
Error in model.frame(formula, rownames, variables, varnames, extras, extranames,  : 
	invalid variable type
> lm(y  ~ as.factor(x1)+as.factor(x2)) # factor にするとちゃんとできる【い】

Call:
lm(formula = y ~ as.factor(x1) + as.factor(x2))

Coefficients:
   (Intercept)  as.factor(x1)b  as.factor(x1)c  
             6               1               2  
as.factor(x2)M  
            -1  

x1, x2 が文字列の値を取るとき,それをそのまま使ってもエラーになるだけ(【あ】参照) as.factor(x1) のように使うとちゃんと解が得られる(【い】参照)。事前に factor にしておいて formula に指定することも当然 ok
ところで,x1 が a,b,c のいずれを採るかについて3つの二値変数,同じくx2についても2つの二値変数に対応させる。

> x1a <- as.integer(x1=="a")
> x1b <- as.integer(x1=="b")
> x1c <- as.integer(x1=="c")
> x2F <- as.integer(x2=="F")
> x2M <- as.integer(x2=="M")

このうち,x1b, x1c, x2M を使うと,【い】と同じ結果【う】が得られる(あたりまえだが,【い】のようにするのが簡単便利と言うこと)

> lm(y ~ x1b+x1c+x2M) # 【う】

Call:
lm(formula = y ~ x1b + x1c + x2M)

Coefficients:
(Intercept)          x1b          x1c          x2M  
          6            1            2           -1  

もし,5つの変数全部を使うと,ランク落ちがあるので,結果は【え】のようになる。実際には使われない変数の係数は NA になっている。
実際に使われる変数が【い】と異なるので,別の結果のように見えるが,これは実は【い】と全く同じ予測値を与える。

> lm(y ~ x1a+x1b+x1c+x2F+x2M) # 【え】

Call:
lm(formula = y ~ x1a + x1b + x1c + x2F + x2M)

Coefficients:
(Intercept)          x1a          x1b          x1c  
          7           -2           -1           NA  
        x2F          x2M  
          1           NA  

使う変数のセットによって,係数も違うが,本質的に全部同じ予測式である。

> lm(y ~ x1a+x1b+x2F) # 【え'】

Call:
lm(formula = y ~ x1a + x1b + x2F)

Coefficients:
(Intercept)          x1a          x1b          x2F  
          7           -2           -1            1  

ところで,lsfit という関数もある。この使い方は

> lsfit(cbind(x1b,x1c,x2M), y) # 【お】
$coefficients
Intercept       x1b       x1c       x2M 
        6         1         2        -1 

用いる変数を同じにすれば,【い】と同じになる。
もし,5つの変数全部を使うようにしても同じ結果が得られそうだが,出力結果の見た目は【え】と同じようなのだが,変数名と係数の対応に誤りがある。

> lsfit(cbind(x1a,x1b,x1c,x2F,x2M), y)
$coefficients
Intercept       x1a       x1b       x1c       x2F 
        7        -2        -1         1         0 
      x2M 
        0 

lsfit はこのような事態を想定していないのだな。
あれこれ書いたが,lm で factor をつかうのは,小細工をしないで,そのまま使えばよい(【い】のように)ということ。
ちなみに,一般化逆行列を使って重回帰分析を行えば,5つの変数全部を使って,解を求めることができる。

const    x1a    x1b   x1c x2F  x2M
6.625 -1.125 -0.125 0.875 0.5 -0.5

プログラムにおける「名前」の意味するもの

青木繁伸 (2005-04-08 (金) 22:12:38)

list(... foo=bar ...)
とか,
lm(y ~ x,....)
などのとき,foo, bar, y, x が,単なる文字定数(文字変数)なのかそうではない別物なのかの区別ができない人がいるみたいですね。
関数の作者によっては,単なる文字列が指定されたときにも,適切な解釈をして,ユーザのやりたかったことを実現させてやろうという,心優しさがある場合も有るのかも。以下,架空例というかなんというか,こんなインプリメンテーションもありかという例をでっち上げて。こういうアプローチは親切なのでしょうか??そうは思えない(反語。。。)

> a <- "2"
> sqrt(a) # こういうエラーをする人はあまりいないだろう
Error in sqrt(a) : Non-numeric argument to mathematical function
> sqrt(as.numeric(a)) # こういう風にすれば,意図していたであろう計算はできるのだから
[1] 1.414214
> my.sqrt <- function(x) # こういう風に関数を定義してくれていれば,
+ {
+ sqrt(as.numeric(x))
+ }
> my.sqrt("2") # おっちょこちょいでも,救われる(^_^;)
[1] 1.414214
> my.sqrt(2) # 当然,ちゃんと使っても,ちゃんと使える(^_^;)
[1] 1.414214
> my.sqrt("abc") # さすがにこれはだめ。

 # でも,abc は16進整数の可能性が有るからと救ってやるのは自由? いやいや,おんぶにだっこにならされたユーザが,厳しい(面倒見の悪い)プログラムで怒られたら,パニクル・ワケワカメになる・切れる。。。怖い。

  • my.sqrt("0xabc"). my.sqrt(charToRaw?("abc")) もうなんでも有です.?(^o^)/ -- なかま 2005-04-09 (土) 00:46:43

メッセージ翻訳作業中の皆様へ

なかま (2005-03-24 (木) 22:03:45)


                      -- snip --
Thanks.  I have merged these, but please note that I had to make some 
changes for msgfmt -c to work:

- Some of the RGui-ja.po ones were missing a final ?n.
- When the order of the formats is changed, the %2$s form must be used. 
(I had to guess the order in one class, so please check these.)

                      -- snip --

Could you also please at some point give us a list of names for the 
po/THANKS file?

と言うわけで,名前(英名) メールアドレスを書き込んでください.

ex. MEI SEI <hoge_at_foo.bar.jp>

尚,SPAMが沢山来るようになっても一切の責任は負いませんので御了承ください.

  • お譲りします(^_^;) -- 青木繁伸 2005-03-24 (木) 22:21:14
  • 参考までに私の過去1年分のSPAM国別?ランキングです. -- なかま 2005-03-24 (木) 23:11:16
     10764 com
      2500 net
      2111 jp
       675 de
       575 uk
       351 ru
       223 ca
       217 fr
       209 it
       200 nl
       191 cn
       181 ????
       169 au
       161 br
       157
       153 ch
       136 org
       133 pl
       115 se
       109 cz
       104 es
  • 最近私宛に差出人が私のスパムメールが大量に届くようになり困っています。これはスパムフィルターにかかりにくいようです。進化している! -- 間瀬? 2005-03-24 (木) 23:52:24
  • エンベローブ(ほんとの差出人と言うか)を偽られてまだ回線が256kの頃,10万越えのエラーメールを延べ3日間に渡り受け取った事がございます. -- なかま 2005-03-25 (金) 00:26:56
  • po/THANKS(オレオレ認証書ですので御覧になられる方は自己責任でお願い致します)は名前だけでも良いようです. -- なかま 2005-03-25 (金) 23:00:42
  • おっと,私の名前が^^.名前を載せていただいたからには頑張らねば! -- 舟尾? 2005-03-26 (土) 13:56:20

R のマニュアル日本語訳が CRAN に登録されました

間瀬茂 (2005-03-17 (木) 23:05:39)

岡田さんが英語ページにメモして頂いたのが、このところメッセージの多言語化に邁進されている R 教授の目に止まり、お勧めで私の訳が先ほど CRAN に登録されましたのでお知らせします。私がさっさとアップロードすれば良かったのですが、何せドメスティックな利用者しか念頭になかったので、控えていました。R 教授のメイルでは、海外にいる(そして英語が下苦手な、いつもながら一言多い方)日本人も多いから、とのことでした。PS ファイルと、森さんによる PDF ファイルも登録されました。お断り無く提供したことをお詫びします。なにか不具合があればお知らせ下さい。


統計数理研究所のワークショップ

間瀬? (2005-03-17 (木) 00:55:35)

表記の集会に参加された方はいらっしゃいますか?私は用事で出かけられませんでした。もう一人の R 氏に会ってみたかったんですが。もし出かけられた方は、簡単な印象などお願いします。

  • すみません,私も私用のため出席できませんでした….情報をいただけましたら幸いです. -- 舟尾? 2005-03-17 (木) 02:07:21

RjpWiki のスポンサー?

MKR? (2005-03-14 (月) 20:27:57)

いつごろからか、google で RjpWiki をキーワード検索すると以下のコマーシャルが表示されるようになりましたね。RjpWiki を後援しているわけでもないのに紛らわしい。

 	スポンサー
R、S-PLUS、SAS連携機能~
汎用データマイニング、最新技術搭載~
バイオ、医療、製造、通信、金融、CRM~
www.msi.co.jp/vmstudio/~
  • クリックすると広告主に請求が行くシステムなのでは...msiさん太っ腹(おもうにRユーザって竹の子のように増えてる気がするんで).:-) -- なかま 2005-03-14 (月) 20:46:00
  • これは,検索したものに近い,しかも google に何らかの契約金を払っている広告主のサイトを検索結果とともに表示して,あわよくば漁夫の利を得ようと(得させようと)しているものですよ。興味なければ無視すればよいし,興味のある人はなんて便利なと思ってクリックして,本来のものから離れていくとか,ま,そう言うことをねらっているしくみですね。 -- 青木繁伸 2005-03-14 (月) 21:08:49
  • googleの貴重な収益源の一つと言うことで.:-):-) -- なかま 2005-03-14 (月) 23:32:09
  • キーワード "S-PLUS" でもやはり同じ会社の広告が表示されるいっぽう、”SAS” では表示されない。msi 社はどのキーワード(サイト)と関連させるか選別しているのでしょうか?紛らわしい、しかも怪しい、とんでもないサイトと一緒に表示されたらどうするのか、などと余計な心配を。いつか、"RjpWiki" で検索すると金沢在住の某企業のコマーシャルがでてくるようになるといいですね。 -- MKR? 2005-03-15 (火) 07:53:19
  • 頻繁に使われるキーワードが多いので検索エンジンにはなかなかかからないのではないかと.(狙った訳ではないのですが...) -- なかま 2005-03-15 (火) 11:07:43

Translations progress

なかま (2005-03-14 (月) 19:41:04)

With the release of 2.1.0 scheduled for April 18, just over a
month away, 
I thought I would give an update on the progress of translations
known to me.  (`fuzzy' translations are ignored, and are either
due to small 
changes in the messages or wild guesses by msgmerge.)

Translators are continually pointing out small problems in
messages (or we spot them), so the templates are updated
frequently.  However, I believe that all the major changes
(to use quotes more consistently and to use 
gettextf to make the messages more translatable) are now
finished for 2.1.0.
Updating seems to work well (see po/README for how to do this).

R.pot (the C-level messages)
de: 148 translated messages, 49 fuzzy translations, 1450 untranslated messages.
it: 886 translated messages, 761 untranslated messages.
pt_BR: 1638 translated messages, 4 fuzzy translations, 5 untranslated messages.
zh_CN: 1644 translated messages, 3 untranslated messages.

RGui.pot:
it: 169 translated messages, 7 fuzzy translations, 88 untranslated messages.

R-base.pot:
it: 335 translated messages, 64 fuzzy translations, 15 untranslated messages.
R-zh_CN: 411 translated messages, 3 untranslated messages.

R-grDevices.pot:
it: 58 translated messages, 2 fuzzy translations, 2 untranslated messages.

grDevices.pot:
it: 107 translated messages.

R-graphics.pot:
it: 69 translated messages, 44 fuzzy translations, 1 untranslated message.
[I can resolve a lot of these as they are just missing quotes.]

To give you some idea of the size of the package catalogs:

base/po/R-en@quot.po: 414 translated messages.
grDevices/po/R-en@quot.po: 62 translated messages.
grDevices/po/en@quot.po: 107 translated messages.
graphics/po/R-en@quot.po: 114 translated messages.
grid/po/R-en@quot.po: 130 translated messages.
grid/po/en@quot.po: 13 translated messages.
methods/po/R-en@quot.po: 216 translated messages.
methods/po/en@quot.po: 26 translated messages.
splines/po/R-en@quot.po: 19 translated messages.
splines/po/en@quot.po: 1 translated message.
stats/po/R-en@quot.po: 632 translated messages.
stats/po/en@quot.po: 40 translated messages.
stats4/po/R-en@quot.po: 6 translated messages.
tcltk/po/R-en@quot.po: 5 translated messages.
tools/po/R-en@quot.po: 87 translated messages.
tools/po/en@quot.po: 3 translated messages.
utils/po/R-en@quot.po: 189 translated messages.

For the MacOS X GUI I see de, it and ja translations in the SVN archive.


I see from http://www.okada.jp.org/RWiki/index.php?RJapaneseTranslation
that Japanese translations of R.pot and RGui.pot are in progress, and 
ja.po seems substantially complete (1601 translated messages against a 
version of a couple of weeks ago).

We now have the concept of `translation packages' (described on the 
developer.r-project.org/Translations.html page once it gets updated and in 
`Writing R Extensions'): please let me know if you would like Japanese 
translations to be part of the main tarball or to distribute them 
separately as a package.

I think we should aim to finalize translations to be distributed with  R 
2.1.0 by code freeze on April 11th.

Brian Ripley
  • 3/9時点のメッセージを取り込んでWindowsで確認したところ,ショートカットキーのマルチバイト処理に問題があり,現在デバッグ中です.メッセージ等はやはり打ち込んで見ると違和感があるものがあります.メニューが化け化け(プログラムサイドの問題です)でも確認しやすければと思いますので,ここ(自己責任)に置いてみます.インストール時にはコンポーネントの選択で"Version for East Asian languages"を忘れずに選択してください. -- なかま 2005-03-14 (月) 19:58:00
  • etc/Rconsole,etc/Rdevga のフォントは手動で(FixedFont?がいいかな?)お願いします -- なかま 2005-03-14 (月) 20:03:50
  • R.pot と RGui.pot 以外のメッセージ訳はまだ未着手ですね?いずれまた岡田さんの手を煩わせて、専用入力ページを用意し頂くことにしますか。それとも、あんまり量がない場合は、個人請負制で一気に訳しましょうか? -- 2005-03-14 (月) 20:24:48
  • うっかりこちらに書いてしまいましたが,R メッセージ日本語化?の方で宣言して作業するのがいいかと思います. -- なかま 2005-03-14 (月) 20:30:15
  • なかまさん,ご尽力ありがとうございます!早速インストールしてみましたが,いや〜,完全日本語化にまた一歩近づいたんだなぁ〜と思うと嬉しくなりますねぇ^^. -- 舟尾? 2005-03-15 (火) 00:02:56
  • 日本語化では無く国際化です.:-) -- なかま 2005-03-15 (火) 01:02:53
  • ついででなんですが、nmath系の関数の速度はいかがでしょうか -- なかま 2005-03-15 (火) 01:11:38
  • baseとstatsが大きいですね...4月に間に合うかな? -- 岡田 2005-03-15 (火) 07:19:59
  • 大きめの R-stats.pot の素訳を私が作ります(もしかしてどなたかすでに着手されてますか)。諸事繁忙の折、全部完成は自信・責任持てませんので、ギブアップしたところで、岡田さんに送りますので、あとは皆でよってたかって完成させましょう。nakama.pl が役に立ちそうです。google さんこんな使い方想定しているのかな。 -- 間瀬? 2005-03-15 (火) 09:28:44
  • 国際化作業のほうがまだまだかかりますんで,メッセージもゆっくりして頂けると,プレッシャーが減ります.(^_^; -- なかま 2005-03-15 (火) 11:02:31
  • 日本語化では無く国際化でしたか!!これは失礼致しました^^; 。nmath系の速度ですが、以下のような実験をしてみました。「pgamma() と qgamma() を 10000 回計算する」ことを100回やった平均時間を求めています。
    n <- 100; mean <- 0; p <- 1:n^2/n^2
    for (i in 1:n) mean <- mean + system.time(x <- pgamma(qgamma(p,shape=2), shape=2))[3]
    mean/n            # R 2.0.1で実行
    [1] 0.1208
    mean/n            # R 2.1.0 devel(国際化版)で実行
    [1] 0.0843
    メチャメチャ速くなってますねぇ〜。あと、翻訳作業はお手伝いさせていただきますので、よろしくお願い致します。 -- 舟尾? 2005-03-15 (火) 12:38:55
  • Prof.Riplayメールの最後に、「日本語訳はR本体に最初から組み込んだほうがいいか?それとも別パッケージとして配布したほうがいいか?」という質問があります。敷居を下げるという観点からは、とりあえず多少不完全だったとしても本体に最初から組み込んでもらったほうがいいかなと思いますが, いかがでしょう? -- 岡田 2005-03-15 (火) 13:00:26
  • 組み込んでもらうに一票. -- なかま 2005-03-15 (火) 13:44:52
  • 人柱ビルドなどのご用命がございましたら御申しつけください。 -- なかま 2005-03-15 (火) 13:54:46
  • 起動メッセージが日本語化されていないとの R 教授の注がありましたが、どのファイルをいじくれば良いのでしょうか?それと、どうせ不完全でもそれが分かるのは日本人ぐらいですから気にしないで入れてもらえば良いのでは (^^)。 -- 間瀬? 2005-03-17 (木) 00:59:16
  • 起動メッセージは現在はメッセージ翻訳ページに入っています。素訳もつけておきました -- 岡田 2005-03-17 (木) 08:10:52
  • 意味がわからん -- マニア? 2005-03-17 (木) 14:41:39

Rwww

okinawa (2005-03-11 (金) 16:29:52)

RwwwというRをWebで簡単に使うためのCGIのページ作りました。興味のある方は、Rwwwのページを見てください。

  • バージョンアップしました。かなり高速化しました。 -- okinawa 2005-03-14 (月) 18:36:23
  • デモサイトはないのでしょうか? -- 2005-03-17 (木) 17:03:22
  • 申し訳ございません。サーバーにできそうな筐体もってないです。必要だという方が多ければなんとかしますが・・・。 -- okinawa 2005-03-17 (木) 20:45:56
  • デモサイトみてみたいです。 -- たかの? 2005-06-17 (金) 16:53:48
  • お返事おそくなりました.デモサイトの件、考えてみます. -- okinawa 2005-07-07 (木) 08:22:36

日本人修士が作った R パッケージ

間瀬茂 (2005-02-25 (金) 19:33:45)

東工大の大学院修士課程を今度修了する鈴木了太さん(一ツ橋大学卒業という変わった経歴のもち主です)が、修論の一部として作成した R パッケージ pvclust が CRAN に本日登録されたそうです。彼の指導教官の下平先生が開発したマルチスケールブートストラップ法(スケールを何段階かに変えたブートストラップ法で検定・推定の精度を向上させる)を用いてクラスター分析を改良、実装したものです。分子系統学への応用を見込んでいるのだと思います。以下彼の学内向けお知らせメールを無断転載します。

下平研の鈴木です.本日,修論で作成したRパッケージpvclustがCRANに登録されました
ので,そのお知らせです.
http://cran.r-project.org/src/contrib/Descriptions/pvclust.html
マルチスケール・ブートストラップ法を用いた階層型クラスター分析の信頼性評価(確率
値計算)を行うプログラムです.よろしければお使いいただいて,バグレポートなどいた
だければ幸いです.すでにinstall.packages("pvclust")でインストール可能なよう
です.使用例はexample(pvclust)をご覧くださ い.実行結果は以下のURLから見るこ
とができます.
http://www.is.titech.ac.jp/~shimo/prog/pvclust/
よろしくお願いします.
  • 間瀬先生,転載ありがとうございます.パッケージpvclustは,階層型クラスター分析で得られるクラスターそれぞれに対して,マルチスケール・ブートストラップ法を用いて確率値を計算します.例えば,確率値が95%以上のクラスターは,それが「存在しない」という仮説を水準5%で棄却できます.詳しくは上記URLをご覧ください.この方法は間瀬先生のおっしゃる通り分子系統学に応用されてきましたが,このパッケージは更に一般的なデータ解析への適用をめざしたものです. -- 鈴木? 2005-02-26 (土) 22:02:24
  • この方法について3月に講演をさせていただけることになりました.以下URLをご参照のうえ,よろしければお越しください. http://www.is.titech.ac.jp/~sadayosi/msforum/forum050309.html -- 鈴木? 2005-02-26 (土) 22:05:07

疫学分析パッケージepiのLinux版が公開されました

谷村 (2005-02-24 (木) 11:24:31)

Dr. Mark Stevensonが公開している疫学パッケージepi はWindows版しかありませんでしたが、リクエストしたところLinux版も作成・公開していただくことができました。KNOPPIXに入れて疫学KNOPPIXの構築も視野に入れながら、epiを試用してみたいと思います。


R の検索を容易にするために別名(alias)を決めません?

[[澤田石 順<jsawa@attglobal.net>]] (2005-02-24 (木) 00:51:21)

R の情報はたくさんあり、容易に見つかりますが、それでも一文字の R を
キーワードにするほかなく不便だと思います。皆様はいかが?
アルファベットで表記されたエイリアスがあれば、検索がずっと容易になると
思います。日本国内のみで通用するエイリアスでなく、世界レベルで定義する
のがよいと思います。どうでしょう。そのための手続きのことはまた別のこと
として考えてみようではありませんか。

 r_statistics_environment、r_stat_envとか.
P.S. 2/19-20 のリハビリテーション関係の学会ではじめて R を使用しての
    解析に基づいて発表しました。スライドには R の web page を明記し
    十数名の方々に Windowsなどやめて R with Linux or Mac にすべし
    と強調した次第。
  • 賛成です. -- 2005-02-24 (木) 18:30:47
  • 賛同者がありまして嬉しいです。 -- 澤田石 順? 2005-02-27 (日) 21:45:23

OS/2 に R 2.0.1 を移植中です。関心のある方は?

澤田石 順? (2005-02-23 (水) 22:58:04)

澤田石と申します。Microsoftが嫌いで、ずっとOS/2を使い続けております。 Linux/FreeBSDも使い易いのですが、OS/2に比べるといま一つ。Freesoftwareでメジャーなものは自分でOS/2に移植したり既に移植されたものを使用したりで、仕事や趣味でOS/2で不足するものはほとんどないのですが(たとえばteTeX 3.0は既に自分でOS/2に移植して使用中)、R の移植がまだ不完全で少し困っているところです。postscript(), pdf() デバイスはうまく動作してますが、x11()などどうもうまくいかなくて。
非常にマイナーなOS/2ということでなかなか一緒に移植作業をしてくれる人はいないかも知れませんが、もしもいらっしいましたらOS/2への移植を一緒にやりましょう。

  • OS/2は見たことすらないのですが,X11が動くんでしょうか? -- なかま 2005-02-23 (水) 23:28:33
  • はい。XFree86 3.x, 4.x とも移植されており、軽快に使えますよ。Virus の心配はないし、Win系のソフトが必要ない方々ならば十分に実用になります。TeX(teTeX)の環境も最新ですよ -- [[澤田石 順<jsawa@attglobal.net>]] 2005-02-24 (木) 00:23:06
  • Xが上手くいかないとは具体的にはどんな状態でしょうか? -- なかま 2005-02-24 (木) 10:02:16
  • いわゆるDLLの読み込み[dlopen()]のOS/2のgcc(emx)ではうまく行かないことです。これはgccのOS/2への実装の問題なので、私のごときCの初心者では厳しいです。cygwinのソースコードでもみて研究するほかなかいも知れません。 -- 澤田石 順? 2005-02-27 (日) 21:43:35
  • OS2はとんと存じませんのでなんですが、これとかの話とは違うんでしょうか. -- なかま 2005-02-28 (月) 13:19:09
  • 「それ」とは関係ないのです。 -- 澤田石 順? 2005-02-28 (月) 23:33:24
  • すると,例えばsolve(1,0)等lapack.soを読む部分等も不都合があるんでしょうか,Xだけならunix/X11.c:R_X11_Initの該当部分をコメントにしてmodules/X11配架のモジュールを静的にリンクしてみてはいかがでしょう. -- なかま 2005-03-01 (火) 09:15:50
  • モジュールはすべて静的にリンクしているのですが、... gdb でもう一度しこしこと debug しようと思います。いろいろと助言いただきありがとうございます。 -- 澤田石 順? 2005-03-05 (土) 01:58:16

ユリウス日,などなど

青木繁伸 (2005-02-23 (水) 22:13:02)

昔(5年ほど前だと思うのだが。。。と思っていたが,実はもっともっと前だった),
「1582 年の 10 月の 5 日から 13 日までは存在しません」
ということで,UNIX の cal コマンドを使うとそれが確認できたと記憶しているのだが,今やってみると,

 > cal 10 1582
    October 1582
 S  M Tu  W Th  F  S
    1  2  3  4  5  6
 7  8  9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31

みたいな結果しか表示されない。
う〜〜ん。勘違いだったのかなぁ。

その当時作ったページで,
・ 西暦1年1月1日は何曜日かという問題はかなり難しいものがあります(週刊朝日 '90/02/23)。
(あ,1990年だったんだ)
・前のプログラムのアルゴリズムでは「月曜日」と表示されます。他の多くのコンピュータも同じ答えを出すかも知れません。
・富士通のコンピュータやワープロの中には,「日曜日」だと表示するものがあるそうです。
・東京天文台は「土曜日」であるとしているそうです。
と書いたのだが。
今日の,中澤さんのページで,R には chron というライブラリもあるということを読んで(date というライブラリがあるのは検索して,date というライブラリはなんて使い勝手の悪いライブラリだ,と,思っていたのだが),その中には julian という関数があった。天文に興味があれば「おお,ユリウス日を計算するのか」と思うわけだが,これは,1970年1月1日を基準日とする経過日数を返すものと書いてある。仕様に書いてあること以上のことは望むべくもないのだが。
私のページに書いているアルゴリズムは昔々の bit に書かれていたものに基づいているのでユリウス日を計算するが,残念ながら先に書いた存在しない西暦年には対応していないらしい。
定義が変われば観察される(解釈される)データが変わるというのはありふれたことではあるが,日付のような,誰もがこれほど確かなものはないと思っている(誤解に過ぎないのだが)ものも,かくも不確かなものであるとは。。。。

> julian(1,1,1970)
[1] 0  # 1970/1/1が基準日ということ

> J.day(1,1,1970)
[1] 1723395 # 天文学上のユリウス日

> julian(1,1,1)
[1] -719162 # 当然といえば当然

> day.of.week(1,1,1)
[1] 1 # 何曜日かな?

> day.of.week(2,23,2005)
[1] 3 # 水曜日が 3 なら,1 は月曜日か。。。

> dw(J.day(1,1,1))
[1] "Mon" # 同じだな。。。。
  • cal 9 1752 では? 本来は地域毎にグレゴリオ暦?の採用時期が異なりますから,なんです.私も昔し良く西暦和暦変換とか作りましたが,閏月を調べるのが大変で明治5年12月3日?だったっけ?あたりより昔はエラーになるよう作ったら昭和1年1月1日がエラーになるだのバグレポートがあがって来て,ひどい目にあいました。某商用データベースには西暦0年があったり,日付に関してはunixtimeを越えると信頼性は極端に低いのではないかと思います. -- なかま 2005-02-23 (水) 22:42:33
  • おっしゃるとおり。なんか,間違えて記憶していたみたいです。何でかな??
    というわけで,
    > cal 9 1752
       September 1752
     S  M Tu  W Th  F  S
           1  2 14 15 16
    17 18 19 20 21 22 23
    24 25 26 27 28 29 30
    そうそう,これこれ! 青木繁伸 2005-02-23 (水) 22:47:23
  • debianのbsdmainutils より
    $ ncal -p
    AL Albania        1912-11-30      IT Italy          1582-10-04
    AT Austria        1583-10-05     *JP Japan          1918-12-18
    AU Australia      1752-09-02      LI Lithuania      1918-02-01
    BE Belgium        1582-12-14      LN Latin          9999-05-31
    BG Bulgaria       1916-03-18      LU Luxembourg     1582-12-14
    CA Canada         1752-09-02      LV Latvia         1918-02-01
    CH Switzerland    1655-02-28      NL Netherlands    1582-12-14
    CN China          1911-12-18      NO Norway         1700-02-18
    CZ Czech Republic 1584-01-06      PL Poland         1582-10-04
    DE Germany        1700-02-18      PT Portugal       1582-10-04
    DK Denmark        1700-02-18      RO Romania        1919-03-31
    ES Spain          1582-10-04      RU Russia         1918-01-31
    FI Finland        1753-02-17      SI Slovenia       1919-03-04
    FR France         1582-12-09      SE Sweden         1753-02-17
    GB United Kingdom 1752-09-02      TR Turkey         1926-12-18
    GR Greece         1924-03-09      US United States  1752-09-02
    HU Hungary        1587-10-21      YU Yugoslavia     1919-03-04
    IS Iceland        1700-11-16
    日本の日付が違うのは西部標準時の名残か?
    $ ncal -s ES 10 1582
        10月 1582
    月  1 18 25
    火  2 19 26
    水  3 20 27
    木  4 21 28
    金 15 22 29
    土 16 23 30
    日 17 24 31
    お昼休みでした。 -- なかま 2005-02-24 (木) 12:56:13

maptoolsでshapefileの切り出し

okinawa (2005-02-22 (火) 17:19:37)

maptoolsでshapefileの切り出しに成功したので、ご報告。
R2.0.1です。

library(maptools)
jpn<-read.shape("japan_jdg.shp")
jpn_poly<-Map2poly(jpn,raw=FALSE)
jpn_df<-jpn$att.data
hokkaido_poly<-subset(jpn_poly,jpn_df$PREF=="北海道")
hokkaido_df<-subset(jpn_df,jpn_df$PREF=="北海道")
hokkaido_df$CITY2<-ifelse(is.na(hokkaido_df$CITY2)," ",as.character(hokkaido_df$CITY2))
hokkaido_df$CITY1<-ifelse(is.na(hokkaido_df$CITY1)," ",as.character(hokkaido_df$CITY1))
hokkaido_df$TOWN1<-ifelse(is.na(hokkaido_df$TOWN1)," ",as.character(hokkaido_df$TOWN1))
hokkaido_df$TOWN2<-ifelse(is.na(hokkaido_df$TOWN2)," ",as.character(hokkaido_df$TOWN2))
write.polylistShape(hokkaido_poly,hokkaido_df,"hokkaido")

注1)・・・is.na(hokkaido_df$TOWN2)," "<=ここは全角空白です。
注2)当方環境WIN2000SP4では、writeするとRが時々こけます。

  • 素晴らしいです。Epi Infoによる塗り分け地図の作り方の末尾に書きましたが,これは,ぼくもやろうと思って随分いろいろ試したのですが成功しなかったんです。後で群馬県でもこのやり方を試してみようと思います。 -- 中澤? 2005-02-22 (火) 19:13:22
  • あっ。7行目にattach(hokkaido_df)を入れないと動かないかも。 -- okinawa 2005-02-22 (火) 22:25:19
  • 「北海道」を「群馬県」に変えて試すと,Windows XP+SP2環境では,writeのときに100%,Rがこけます。polyをplotさせると地図は表示できるんですが。もう少し調べてみます。 -- 中澤? 2005-02-24 (木) 10:57:03
  • 書き出しはできませんでしたが,塗り分け地図の作成には成功しました(EpiInfo?による……の末尾に追記しました)。貴重な情報,ありがとうございました。 -- 中澤? 2005-02-24 (木) 12:31:22
  • ちなみに,同じ環境でも「北海道」のまま実行すると,落ちないでうまくいきます。それと,attachは不要でした。 -- 中澤? 2005-02-24 (木) 15:08:56
  • 当方の環境では、群馬県も「何度かやると」うまくいきました。(ワーニングが出ますができていました)-- okinawa 2005-02-25 (金) 10:15:30
  • XPでは完璧にこけますね。msvcrt.dllでこけているので、dllのバージョン依存(OS依存)でしょうか? -- okinawa 2005-02-25 (金) 11:25:08
  • どうも県によって上記の方法がうまくいくとは限らないようです。三重県だと、NAを全角空白に変換している部分がない方がうまくいくようです。微妙。 -- okinawa 2005-02-25 (金) 15:31:00
  • ひととおり、全都道府県別のshapefileの作成に成功しました。・・・でもこれって公開できないですよね。たぶん。 -- okinawa 2005-02-26 (土) 11:23:40
  • ESRIJapan様から公開の許可をいただきました。後日、このサイトに登録させていただきます。 -- okinawa 2005-03-03 (木) 13:47:52
  • おお,それは素晴らしいです。楽しみにしています。ESRIJapanは太っ腹ですね。 -- 中澤? 2005-03-03 (木) 14:45:33
  • Shapefileライブラリという名前でアップしました。が、他のページとのリンクの仕方が勉強不足でわからない・・・。 -- okinawa 2005-03-04 (金) 09:58:27
  • ページ名を"["と"]"で二重に括ればWikiの名前として機能するはずなので,ShapeFileライブラリでいいと思います。 -- 中澤? 2005-03-04 (金) 12:58:40
  • ありがとうございました。Tips紹介に登録させていただきました。 -- okinawa 2005-03-04 (金) 13:45:14
  • R2.0.1J,maptoolsv0.4-13でShapeFileの作成に成功しました。WriteしてもRが落ちなくなりました。 -- okinawa 2005-06-07 (火) 14:38:55
    library(maptools)
    jpn<-read.shape("japan_jdg.shp")
    jpn_poly<-Map2poly(jpn)
    jpn_df<-jpn$att.data
    hokkaido_poly<-subset(jpn_poly,jpn_df$PREF=="北海道")
    hokkaido_df<-subset(jpn_df,jpn_df$PREF=="北海道")
    write.polylistShape(hokkaido_poly,hokkaido_df,"hokkaido")

実行環境:WINXPSP2,R2.0.1J,maptools v0.4-13


R グラッフィクスライブラリ

QDU? (2005-02-21 (月) 19:12:41)

数日前から r-help で R のグラフィックスを集めたサイトを作ろうという提案がされ、すでに試行作業が行なわれています。読者投稿サイトになるようです。同様なものは RjpWiki がすでにありますが、対象が全世界になりますから、短期間で充実したものになりそうで、楽しみです。試験的サイト


未承認広告 in r-help

間瀬? (2005-02-18 (金) 06:47:11)

本日 r-help に長い日本語による未承認広告が投稿されていました。どうしてか spam fileter を潜り抜けてしまったようです。日本人読者はそんなには多いと思わないのですが、何を考えているのでしょうか?

  • SpamAssassin? はデフォルトでは日本語がひっかかりません。通常iso-2022-jp,utf-8をeuc等に変換して個別に対応していますから... -- なかま 2005-02-18 (金) 10:53:17
  • ああ!日本発の悪戯が今後増えないといいですが。 -- 間瀬? 2005-02-18 (金) 12:20:07

不適切記事

QDU? (2005-02-17 (木) 18:13:32)

Wiki は皆の共同作業で成り立っています。明らかに不適切な記事は見つけ次第削除しましょう。その分、余計なものを目にする人が減ります。


書籍「The R Tips」が出来上がりました

舟尾? (2005-02-09 (水) 09:34:10)

おかげ様で拙著「The R Tips」が出来上がりましたので、ご報告させていただきます。
タイトルは「The R Tips - データ解析環境 R の基本技・グラフィックス活用集 -」で、 出版社は九天社さん、値段は3675円で、2月10日発売予定です。「THE R Book」のときと同様、amazon などのネット書店で売り出されるのは2月10日よりも少し後、 一般の書店に並ぶのは半月 〜 1ヶ月ほど後になるのではないかな、と予想しております。
表紙、目次等の情報は The R Tips サポートページ をご覧下さい。誤植指摘・間違い報告・ご指導・ご鞭撻いただく用の掲示板も用意しておりますので、ご意見をいただけますと幸いです。
本を書くにあたって、この「RjpWiki」がもの凄く役に立ちました。運営されている岡田先生、ならびに有益な情報を紹介して下さった皆様に深くお礼申し上げます。そして、PDF 版「R-Tips」について誤植指摘・間違い報告・ご指導下さった皆様にも、この場を借りて深くお礼申し上げます。

  • おめでとうございます。数日前から自分のメモページからはリンクして紹介していますが,ネット書店に出るのが楽しみです。 -- 中澤? 2005-02-09 (水) 12:38:28
  • 完成おめでとうございます!amazonを毎日チェックしなくては。 -- 岡田 2005-02-09 (水) 22:41:18
  • 嬉しいお言葉,本当にありがとうございます.書籍の方は一段落つきましたが,これに懲りずにRの普及に貢献できるようなドキュメント・「RjpWiki」のコンテンツが作れるよう,日々精進したいと思っております. -- 舟尾? 2005-02-10 (木) 02:12:01
  • 完成おめでとうございます。早速注文しなければ。 -- 矢野? 2005-02-10 (木) 12:21:25
  • 今日発売ですよね。おめでとうございます。注文したいのですが、九天社さんのWebにもまだ掲載されていませんね。ISBNだけでも分かると注文できるのですけれども。 -- 谷村 2005-02-10 (木) 20:07:37
  • ISBN4-86167-039-Xです。奥付によると3月1日初版発行となっています。amazonではまだ駄目ですが,bk1ではもう扱っているみたいです。 -- 中澤? 2005-02-10 (木) 20:28:12
  • 嬉しいお言葉,重ね重ねありがとうございます.そして中澤さん,ISBN ナンバーを紹介していただきましてありがとうございます.手元に本が無く,ISBN が分からなくて弱っていたところでした ^ ^ ; .(出版社から届いた本を,一冊残らず周りの人にプレゼントしてしまったもので…) -- 舟尾? 2005-02-11 (金) 07:32:56
  • 関連学会のMLなどで割引販売とかする予定はありませんか? 業界向けの宣伝としてはかなり効果があると思うのですが。 -- aki 2005-02-11 (金) 15:56:08
  • まだ在庫切れですが、Amazonにも出ましたね -- 2005-02-11 (金) 18:10:09
  • 出版界には著者割引制度というのがあるようです。あまり大々的でなければ、舟尾さんに割引購入してもらうという手もあるかも?九天社さんには内緒 :-) -- 2005-02-11 (金) 19:50:26
  • aki 様,アドバイスありがとうございます.残念ながら「関連学会のMLで割引販売をする」予定はございません.折角アドバイスをいただいたのですが,ご期待に添えず申し訳ございません.
    「あまり大々的でなければ、舟尾さんに割引購入してもらうという手もあるかも?」 → それとなくメールを送信下さい(冗談…^ ^) -- 舟尾? 2005-02-12 (土) 20:19:34
  • ジュンク堂大阪本店では既に売っておりましたので早速購入しました.The R Bookの横に並んでおります. -- 濱マイク? 2005-02-12 (土) 20:33:56
  • 濱マイク様,ご報告・ご購入ありがとうございます! -- 舟尾? 2005-02-13 (日) 01:52:03
  • 横浜の有隣堂にて購入しました。これから読んでみます。 -- MS? 2005-02-17 (木) 17:17:00
  • MS様,ご購入ありがとうございます!いや〜,非常に嬉しいです!! -- 舟尾? 2005-02-18 (金) 08:02:11
  • 地元(厚木)の本屋で見かけ、即購入。Amazonの注文はキャンセルしました。^^) -- Nautilus? 2005-02-18 (金) 22:09:10
  • Nautilus様,御報告・御購入,誠にありがとうございます!ボチボチ間違いが見つかり始めておりますので(すみません・・・),拙著のサポートページの方もよろしくお願い致します. -- 舟尾? 2005-02-19 (土) 00:03:54
  • いよいよ「間違い報告地獄」が始まりますね。経験からご忠告すると、再版(意外に早い?)の訂正時にうっかり余計な間違いを再生産することがありますのでくれぐれも気をつけて下さい。 -- データサイエンス入門著者? 2005-02-19 (土) 00:24:02
  • 貴重なアドバイスをありがとうございます!うっかりするところでした.修正しようとする箇所はしっかり調査・動作確認をした上で行いたいと思います. -- 舟尾? 2005-02-19 (土) 11:53:16

RMatlab パッケージ

MKR? (2005-02-08 (火) 20:11:24)

r-help 記事で RMatlab という R と Matlab の「対話」を可能にするというパッケージのことを知りました。確かに両方を使って見たい人もいるかもしれませんね。

# r-help 記事を引用
> I came across recently to the Rmatlab package
> (http://www.omegahat.org/RMatlab/) that allows R and Matlab
> to "talk" to each other. I made several attempts to install
> it on my Mac but without any success as some headers seem
> to miss. I am just wondering if anyone has already tried
> and successfully used RMatlab. According to the website,
> this should run on unix machines and I was surprised that
> it couldn't be true for Mac as the OS X, Linux and Unix
> MATLAB architectures are pretty much similar.

Pretend we can't see your screen and include the error messages
in your post. Can we assume you are running 10.3.7 and have
XCode 1.5 loaded as well?

P. Murrel さんのグラフィックス集

MKR? (2005-02-04 (金) 19:03:39)

R コアメンバーの P. Murrel さんが グラフィックス集を公開されています。八月に Chapman & Hall/CRC から出版予定の ”R Graphics” という本に掲載のグラフィックス集のようです。

  • こ、これはもの凄いことになっていますねぇ…。Figure 1.11 は「ホントに R で書いたの?」と疑いたくなるような作品です。8 月に出版される P. Murrel さんの本は、是非手元に置いておきたい一冊になりそうです。 -- 舟尾? 2005-02-09 (水) 09:44:55

wavelet

しいたけ? (2005-01-31 (月) 21:27:09)

 Rのwavelet解析のプログラムとかで公表されているのはあるのでしょうか?
 古いmathematicaを使っているのですが,しょぼい趣味に利用している程度ですので価格の高さに付き合えず,OctaveかRに乗り換えさせてもらおうと思っています。よろしくお願いいたします。

  • トップページの R site search を使って、例えばキーワード wavelet package で検索してみて下さい。200以上のヒットがあります。 -- 2005-01-31 (月) 23:55:40
  • ありがとうございました。m(__)m -- しいたけ? 2005-02-01 (火) 14:18:39

本日の笑える r-help 記事

間瀬? (2005-01-29 (土) 10:27:08)

r-help 記事をみている人なら必ず笑える記事がありましたから紹介します。sarcasm とは「厭味、当てこすり」という意味です。笑えなかった人はごめんなさい。Dalgaard さんは R core チームの一員です。

"Marc R. Feldesman" <feldesmanm@pdx.edu> writes:

> At the risk of being flamed for mortal stupidity, I'm trying to figure
> out what could have possibly changed (at my end almost certainly) that
> make Brian Ripley's posts (in particular) not show up on my mail
> server (at least not on the one where I receive my email). 

Did you remember to turn off the Oxford-sarcasm filter? ;-)

        -p
-- 
Peter Dalgaard 

Rmap

Tappy? (2005-01-28 (金) 16:43:53)

 R初心者です。Rmapなるものに興味を抱き、ダウンロードしたのですが、インストールの仕方がわかりません。ファイルをどのように移動したらいいのでしょうか?詳しく教えていただけないでしょうか?よろしくお願いします。

  • 「初心者です」という印籠は,水戸黄門の印籠ほどは怖れられません。
    初心者だからどうだと言うんでしょうかというような感じ。
    お願いですからやさしくしてくださいということでしょうね。
    Rmapを使った地図表示などを見た上での質問でしょうか。
    プラットフォームは,なんですか(といっても難しいでしょうか。Windows ですか?と聞けば十分かな)
    今日は(も?),いささか機嫌が悪いんで(^_^;)
    こういう間の悪い時期に巡り会った初心者様にはお気の毒様です。 -- 青木繁伸 2005-01-28 (金) 21:37:12
  • パッケージのインストールは、別途ダウンロードしないで、スーパーユーザ権限でinstall.packages("Rmap") とすると自動的にネットワークインストールされますよ。この方法はWindows/UNIX共通なので覚えておいて損はないです。コマンドを実行する前に、PCをネットワークに接続しておくことをお忘れなく。あと、Rmapの場合はshapelibやprojのような外部プログラムを必要としますので、別途インストールする必要があります。 -- 谷村 2005-02-01 (火) 14:24:58

TeXwiki?

QDU? (2005-01-25 (火) 09:09:19)

日本の TeX 界のドン奥村先生が TeX 用の Wiki を開設されていることを最近気づきました。やはり PukiWiki を使っており、RjpWiki ファンには馴染みやすい体裁です。まだ始まったばかりのようですが、いずれ巨大な Wiki に成長するのは必至ですね。現在のところ見やすさの点では RjpWiki の方が格段に良いような気がします。岡田さんのこれまでの工夫に感謝します。

  • 今日の奥村さんの日記によると,Rをインストールされた模様です。 -- 中澤? 2005-01-28 (金) 18:43:51
  • TexWiki? でもコメント欄にスパム書き込みが絶えないので、公開パスワードを設けたようです。ほかのサイトでは、連絡用電子アドレスを画像で表示しているのを見かけました。機械的に書き込み、収集を行なうふらちなやからが多いようですね。私も mozilla のジャンク(スパム)フィルタ機能(なかなか効果あり、90%以上駆除)が無いと暮らしていけない有り様です。 -- 間瀬茂 2005-01-29 (土) 07:52:00

統計数理研究所のワークショップの案内

統計数理研究所のワークショップの案内を転載します。 -- 間瀬茂 2005-01-19 (水) 20:04:29

みなさま(重複して受け取られた方はご容赦ください),

"Workshop by Dr. Robert Gentleman and Dr. Martin Theus"のご案内です。

3月11日(金),12日(土)に統計数理研究所 講堂において,

Workshop "Modern statistical visualization and related topics (5):
Recent developments in Mondrian and R"

を開催いたします。

講演者は,
  Dr. Robert Gentleman (Fred Hutchinson Cancer Research Center, USA)
  Dr. Martin Theus (Augsburg University, Germany)
のお二人です。

Dr. Gentleman は R の作成者のひとりであり、近年は R に基づいたバイオイ
ンフォマティックスのためのシステム Bioconductor の作成を進めていますの
で、それらの講演をお願いしました。 
 
Dr. Theus はJavaによる対話型データビジュアライゼーションシステム 
Mondrianの作成者であり、そのシステムに関する講演をしていただきます。

なお、R に関して、その並列化に関する講演があります。

どうぞ,ご参加ください。

なお,参加は無料ですが,準備の都合上,参加予定の方は以下の申込書をメー
ルで,中野(nakanoj@ism.ac.jp)までお送りいただけると幸いです。

--------------  申込書  ---------------------------------------------
"Workshop by Dr. Martin Theus and Dr. Robert Gentleman" に参加します。 

       お名前:
       所属  :
       e-mail:
       11日の懇親会に参加:  します or しません (どちらか削除)
---------------  申込書  終わり  ---------------------------------

このワークショップは,昨年,当研究所で開催された2回の Workshop
"Modern statistical visualization and related topics" の続きであり,今
年度に3回予定しているワークショップの最後のものです。今年度の第1回は,
 2004年11月19-20日
   Workshop(3) by Dr. Chun-houh Chen 
第2回は,
 2004年 12月9-10日
   Workshop(4) by Professor Dan Carr and Dr. Juergen Symanzik 
でした。

なお、各回の内容は独立です。

                         中野純司(統計数理研究所)
                             nakanoj@ism.ac.jp

「人工知能学会誌」に R の紹介記事

間瀬茂 (2005-01-11 (火) 10:10:41)

編集者からのお勧めで「人工知能学会誌」 Vol.20, No.1, 67-75 (2005.1) に院生(坂口、多賀君)と一緒に R の紹介記事を書きました。チュートリアル形式の9ページの短いものです。同誌の「研究のツールボックス」というフリーのソフト紹介シリーズの一つです。

  • これは必見ですねぇ〜。「研究のツールボックス」のサポートページ を見て非常に興味をそそられました。統計情報研究開発センター から出ている「ESTRELA」という雑誌にも、札幌学院大学の金先生が「フリーソフトによるデータ解析・マイニング」という連載をされていますし、R に関する記事がいろいろな雑誌で見ることが出来るようになって本当に嬉しいです。 -- 舟尾? 2005-01-11 (火) 12:39:18

表計算ソフト利用の危険性を検証する団体 EuSpRIG

MKR? (2005-01-04 (火) 00:04:09)

(あえて Excel とは限らないでしょうが)表計算ソフト利用の危険性を検証する団体
European Spreadsheet Risks Interest Group があるようです。研究者と企業内利用者双方を対象にしているようで、国際集会も予定されているようです。 表計算ソフトがもたらした損失に関する数十の報告も面白い(?)です。統計利用者だけの問題では無いわけですね。


CRAN 登録パッケージ数

間瀬茂 (2004-12-30 (木) 22:36:01)

今年も残るところ25時間あまり。CRAN に登録されているパッケージの数を数えてみましたら何と 433。5月に数えたら 349 で一年間で 120 あまり増加しているのに驚いたものですが。登録プロジェクトの Bioconductor には 98。Omegahat は 34 でした。皆さん良いお年をお迎え下さい。


パッケージ spdep

間瀬茂 (2004-12-16 (木) 10:18:24)

本日更新情報がでたパッケージ spdep の著者の一人に Hisaji Ono (尾野久二)さんの名前を見つけました。もちろん The R Book の著者のお一人の尾野さんですよね。


r-help 記事

間瀬茂 (2004-12-14 (火) 23:52:21)

r-help 記事を無断引用。無知でしたが slashdot の英語板があったんですね(こちらが本家?)。新しい R/S 本の情報も。
Greetings all,

Just a quick heads up that there is a Slashdot thread this morning on Open Source Math Software for Education, which includes references to R and Dirk's Quantian distribution (among others). The thread is at: slashdot The OP's query was targeted for high school to first year college age students, but as is typical with Slashdot, the scope of the dialog tends to wander....

Also, I was reading the latest issue of Amstat News and noted that there is a new book from Springer on R/S-PLUS pending by Professor Brian Everitt called "An R And S-Plus Companion To Multivariate Analysis". The book appears to be due to be release next month. The link for the Springer site is: An R And S-Plus Companion To Multivariate Analysis

and the Amazon.com link is: An R And S-Plus Companion To Multivariate Analysis

Professor Everitt's prior related work, co-authored with Dr. Sophia Rabe-Hesketh, is "Analyzing Medical Data Using S-PLUS" also from Springer, which along with the other related books that I have, provided a solid reference when I started using R a few years ago.

HTH,
Marc Schwartz


R国際化

なかま (2004-12-14 (火) 18:17:55)

御公儀より密命が下りました.
http://www.ipa.go.jp/software/open/2004/result.html#shimoki

  • なかまさんは、この「株式会社COM‐ONE」とはコンタクトがあるのですか? -- 謎の東洋人? 2004-12-14 (火) 18:54:18
  • おめでとうございます。「なかま」さんは先頃よりこの会社の社員です。フリーではなくなりましたが、結構フリーにやっている様子 (?!) 。 -- 2004-12-14 (火) 19:03:28
  • そうですか、ということは、これまでの日本語化Rの知的所有権はCOM-ONEさんに移るわけですか? -- 謎の東洋人? 2004-12-14 (火) 19:17:36
  • 無知的所有権は私に帰属します. もし,何らかの特許侵害があった場合は会社に贈呈します.B) -- なかま 2004-12-14 (火) 19:34:47
  • 基本的にアルバイトに手伝ってもらった場合にでも個人の著作を尊重します -- なかま 2004-12-14 (火) 19:36:41
  • そもそも,何らかの権利を主張するつもりもありません.主張するとすれば「難しい事は聞かないで...」とだけ主張します. -- なかま 2004-12-14 (火) 19:47:28
  • おめでとうございます。この快挙が日本の(小さい小さい -> 世界の) R 普及に取って重要な一里塚になるといいですね。 -- 2004-12-14 (火) 23:41:56
  • 無駄な公共事業と揶揄されぬよう勤めまする. -- なかま 2004-12-15 (水) 11:16:02
  • OX方面のあの方が12/28頃より私の中途半端な(すみません...後悔ひとしお...)国際化パッチを基?にUTF-8化(でも西欧なのだが)を「通常の3倍!」くらいの速度でマージ中... -- なかま 2005-01-06 (木) 05:36:05
  • なかま弁を訳注。Ripley 教授らは R に Western European UTF-8 ロケール(多バイト文字を含む)をサポートする作業を Nakama パッチを元に進行中のようです。4月の R 2.1.0 での公開を目指しているようです。我々が一番気になる日本語を含む(?) CJK ロケールに対するサポートも10月の R 2.2.0 公開を目標にサポートする当面の計画があるようです。いよいよ R の国際化が本家でも進行することになりそうな雰囲気です。なかま, 岡田 さんのこれまでの作業が大いに貢献することになりそうです。これからは、金沢だけでなく、Oxford の方角にも手を合わせて祈りましょう。 -- 外野? 2005-01-06 (木) 08:49:44

「R 統計関数マニュアル」

間瀬茂 (2004-12-09 (木) 22:17:08)

間瀬です。R 統計関数マニュアルの件ですが、その後強力な助っ人が現れ、状況がいささか変わってきました。現在「すこしやる気をなくしていた」校正作業を鋭意進めていますので、公開までもう少しお待ち下さい。

  • はい!いつまででも待ち続けます! -- 2004-12-10 (金) 00:58:20
  • たった一行へのこだわりが,出版を妨げました.その一行は見付けにくい一行ですが,非常に大きな一歩となるかもしれません.微力ながらお手伝い出来ればと思います. -- 助っ人? 2004-12-12 (日) 13:30:13
  • 「プロジェクトX」並みの苦労話が隠れているのでは?と推察いたしますが,「R 統計関数マニュアル」公開を楽しみに待っております. -- 舟尾? 2004-12-12 (日) 21:40:30
  • いかん、mean 関数や var 関数たちのことをすっかり忘れていた。やっぱり、入れないとまずいだろうな。しかし、一章増えてしまう! -- 間瀬茂 2004-12-13 (月) 17:54:57

Robert Gentleman 氏によるワークショップ

間瀬茂 (2004-12-08 (水) 21:41:46)

統計数理研究所の中野さんから統計関係 ML に流された情報の一部を転載します。

このワークショップは,昨年,当研究所で開催された2回の Workshop 
"Modern statistical visualization and related topics" の続きであ
り,今年度に3回予定しているワークショップの2回目のものです.
第3回は, 2005年 3月11-12日
   Workshop(5) by Dr. Robert Gentleman and Dr. Martin Theus
の予定です。

R のマスコットキャラクタ

間瀬茂 (2004-12-04 (土) 11:21:58)

昨日の R-help は R のマスコットキャラクターの話題で盛り上がりました。Linux のペンギンマーク(ちなみにこれは Linus がペンギンが好きだとどこかで喋ったのが起源だそうです)みたいなものです。さまざまな提案がされました、曰く Ram (O'Reilly 本から)、R-madillo, Kangaroo (Roo という省略形があるようです), Racoon (洗いぐま)、marmott (冬眠中のイビキが RRRRRR...RRR だからだそうです), inch-worm (尺取り虫、移動中の形状が正規曲線に似ているいるから)、 Rooster (おんどり、R Object Oriented Statistical EnviRonment? にかける), Ray (魚のえい)、はては映画の主人公 Ripley (そういう映画があるらしい)の似顔絵はどうだという提案まで。R の故郷 New Zealand の動植物にすべきだとの正論も。はて、マスコットが誕生することになるのか?現在の R ロゴよりはましかもしれませんね。

思い出したのでついでにメモしておきます。Linux の生みの親 Linus Torvalds の母方の祖父は、ヘルシンキ大学教授でフィンランドでは著名な統計家だったそうです。10歳の Linus に自分のフィンランドでももっとも初期の PC (Commodore VIC-20) で basic プログラムの ABC を教え、自分の仕事の手伝いをさせたのはこの祖父だそうです。当然統計解析ソフトも書いたと思われます。

  • 追加情報。R. Gentleman 氏が r-help に投稿したところによれば、関係者で議論がされているようで、NZ 原産の二つの動物が有力候補にあがっているそうです。一つはトカゲに良く似た生きた化石の爬虫類 TUATARA、もう一つは NZ とアフリカだけに存在する 90mm にも達する種がいるという巨大なバッタ(というより外観はエンマコオロギ風) WETA だそうです。どうやら本当にマスコットが誕生しそうな雰囲気です。いずれ投票とデザイン募集がされるかも知れません。絵心がある方は今から準備しておくと R 史に名前を残す絶好の機会になりそうです。 -- 間瀬茂 2004-12-08 (水) 02:16:17
  • WETA だと、同じNZ産のデータマイニングツール WEKA があるから、紛らわしいのではないでしょうか? -- 2004-12-08 (水) 04:40:37
  • マスコット騒ぎが収まったかなとおもったら、実は管理者の設定ミスで昨日は r-help 投稿記事がうまく処理されなかったようです。新たに画像付きの提案 Raven がありました。絵を見ればすぐわかるように、Raven とはカラス(ワタリガラス、大型のカラスの種)のことです。なかなか cute。小賢しく、ゴミ(ランダム誤差)を飽きることなく漁っているところなど、R (統計)ユーザーの戯画としてぴったりかも知れませんね。 -- 間瀬茂 2004-12-09 (木) 07:23:54

「R 統計関数マニュアル」近日公開

間瀬茂 (2004-11-24 (水) 00:47:14)

R の基本パッケージ base, stats に含まれる「ほとんどすべての統計解析関連の関数」のヘルプドキュメントを、カテゴリー化した上で、ほぼ忠実(up to misunderstandings)に翻訳したものを、近日中に私の WWW 頁で公開予定ですので、お知らせします。近日中とはいつを指すのかは、私の暇しだいですので、正確にはわかりかねます。全部で 560 頁ほどになります。example コードには理解を助けるために簡潔なコメントが付けてあり、グラフィックス出力も出来るだけ掲載しました。R は本来統計解析環境で、その中心はやはり言語機能以上に、統計解析機能のはずですが、R の base, stats パッケージ中にどのような統計解析関数があるのか、全貌を知るのはなかなか困難(私も今回始めて全体を把握し、改めて開発者の途方もない努力に、ひたすら脱帽しております)ですので、お役に立つのではと思います。実は二つの出版社に出版を提案してみたのですが、一社からは GNU ライセンス関連で敬遠(?)され、もう一社は逆にそのへんの理解が今いちの雰囲気なので、こちらから辞退することになりました。結局、オープンソースの R のドキュメントの翻訳として WWW 頁での公開が一番適切だろうということになりました。私としては、コピーもいいが、やはり正式な書籍の形での利用がユーザーには使い易いのではと考えていたので、少し残念ではありますが。あらかじめお断りしておきますが、いっぱい誤解、誤植、誤訳があると思いますが、私に知らせていただく労をとられても、おそらく修正する元気は当分(もしかすると永久に)ないと思います。したがって私個人に知らせていただく必要はありません。欠陥承知で使っていただくか、一切使わないか、または(これが一番建設的ですが)より良い訳を自分で公開して下さい。当然ですが、その際私の訳を下敷にしていただければ嬉しいです。私の WWW 頁に公開完了しましたらまたお知らせします。

  • ご尽力ありがとうございます!統計自体の勉強も含めまして、ぜひ熟読させていただきます! -- 舟尾? 2004-11-24 (水) 11:00:19
  • Webもいいですが、やはり印刷メディアのものもいいので、船尾さんの本も期待しております。 -- 2004-11-25 (木) 17:54:00
  • 私の拙筆活動は、ただいま校正段階に入っております。残念ながら「統計関係を詳しく書いたらそれだけで1冊分(以上)の頁数になってしまう」「私が書くより、もっと統計を知っている方が書いた方が有益」という点から統計に関する内容は詳しく書いておりません(もっとも、半分以上が R-Tips そのまんまの内容です…)。期待されていた方、申し訳ございません…。(いつかリベンジします)
    さすがに The R Reference Manual - Base Package - を読む元気はありませんので、パッケージ base, stats に含まれるヘルプドキュメントを「カテゴリー化されたものを」読むことが出来るのは非常にありがたいです!example の説明を載せていただいているということで、自分でひとつひとつコマンドを入力しなくても何をやっているのかが分かるというのが素晴らしいじゃないですか!-- 舟尾? 2004-11-25 (木) 20:02:18
  • あんまり期待されるとビビリますね。例により、誤植、誤解の山でしょうから。ついでに、この場を借りて「データサイエンス入門」の間違いを親切かつ厳しく指摘下さった数多くの方にお礼を申し上げます。おかげで先日第2刷にこぎ着けました。これで間違いは無くなったと言い切る自信は、到底ありませんが。舟尾さんも今から覚悟した方が良いですよ。 -- 間瀬茂 2004-11-25 (木) 23:53:28
  • か、覚悟致します。何度見直しても、見直す度に間違いが見つかりますねぇ…。校正作業と並行して、誤植・指摘用掲示板を作成しております(既に弱気です…)。 -- 舟尾? 2004-11-26 (金) 12:38:28
  • ユニバーサルバイナリ -- まさひと? 2006-01-28 (土) 21:38:17


*1 emacsにはPostScript?モードがあるので便利です。emacsを知らない方に分かるように説明すると、psファイルやepsファイルをemacsに読み込むと、emacsはPostScript?専用エディタに変身します。

トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Google
WWW を検索 OKADAJP.ORG を検索
Last-modified: 2015-03-01 (日) 01:15:59 (997d)