RjpWiki自体へのコメントでも、R に関連する雑談でもOKな掲示板です

注意:新規記事用の入力欄は以下の目次の直後にあります。各記事への追加コメントの入力欄は、各記事の後にあります。


過去の記事のアーカイブ 。アーカイブ中の記事への追加コメントは自由です。ただしあまり古い記事の場合は、最新の R掲示板 に新規に項目を立てられた方が良いかも知れません。



回答を期待する記事は原則 質問コーナー Q&A にお願いします。「R 掲示板」はそれ以外の本来の(長めの)コメント専用にすることを提案したいと思います。




第1回ナニワデータサイエンス研究会のお知らせ

ナニワデータサイエンス研究会? (2015-12-28 (月) 22:05:42)

ナニワ発・関西発の研究会が要るなぁ~,ということで ナニワデータサイエンス研究会 という研究会が立ち上がりました. 第 1 回の研究会は 2016/3/10(木)に大阪・淀屋橋にて開催予定(無料です).定期的なカンファレンスを開催し,医薬品開発におけるデータサイエンスの最前線を発信すべく, でもユル~く活動していく予定です.奮ってご参加ください.
☆ご案内及びお申し込みはこちらよりアクセス下さい☆

開催日時:2016 年 3 月 10 日(木)13:00 ~ 17:40 (受付開始:12:30 ) 
開催場所:武田薬品工業 大阪本社 御堂筋ビル 11 階大ホール (地図は上記案内に記載)
参加費用:無料(消費税込)
主   催:ナニワデータサイエンス研究会
企   画:武田薬品工業株式会社、塩野義製薬株式会社
プログラム(開場:12:30 ):
13:00 :開会挨拶

第一部:CDISC セッション
13:05 :「もしも,日米で申請電子データ提出するとしたら…」高浪 洋平(武田薬品工業)
13:45 :「もしも,とある開発品目 X を申請電子データ提出するとしたら…」坂井 絵理(塩野義製薬)
14:25 :休憩(1)

第二部:統計解析セッション(Missing Data on Clinical Trials)
14:40 :「もしも,この機に統計担当者が NAS レポートを振り返ったら…(前編)」藤原 正和(塩野義製薬)
15:20 :「もしも,この機に統計担当者が NAS レポートを振り返ったら…(後編)」黒田 晋吾(武田薬品工業)
16:00 :休憩(2)

第三部:グラフ頂上決戦
16:15 :「もしも,SAS の sgplot と R の ggplot2 を比較したら…」舟尾 暢男(武田薬品工業)
16:55 :「もしも,Spotfire と Visual Analytics で OpenData を眺めてみたら」北西 由武(塩野義製薬)
17:35 :閉会挨拶
  • ご参加いただける方が 50名を突破しました!まだまだ受付中ですので、どしどしご参加願います。 -- ナニワデータサイエンス研究会? 2016-01-18 (月) 21:36:50
  • ご参加いただける方が100名を突破しました!まだまだ受付中ですので、どしどしご参加願います。 -- ナニワデータサイエンス研究会? 2016-02-06 (土) 13:44:36
  • ご参加いただける方が150名を突破しました!受付〆切まであと1週間(2/29〆)ですので、どしどしご参加願います。 -- ナニワデータサイエンス研究会? 2016-02-23 (火) 08:30:40
  • 私も参加予定です,よろしくお願いします -- 岡田 2016-02-25 (木) 22:58:52
  • 岡田先生、お忙しいところご参加いただきましてありがとうございます! -- ナニワデータサイエンス研究会? 2016-02-26 (金) 10:47:10
  • 皆様のお陰で会は大盛況となりました! 参加いただいた方々に厚く御礼申し上げます. -- ナニワデータサイエンス研究会? 2016-03-11 (金) 22:44:53

{cran,bioc}.ism.ac.jp のミラーについて

cran.ism.ac.jp? (2015-12-10 (木) 12:02:40)

現在, {cran,bioc}.ism.ac.jpにおいて従来のhttpと, httpsにての運用を開始しております.
USER_AGENTにMozillaが含まれる場合は, httpへの要求の場合でもhttpsに転送(余計なお世話ですが)しております.
一方で, 一寸環境の古いLinuxのディストリビューションやPROXY等の環境によってhttpsのミラーがアクセス出来ない方のために従来のhttpもそのまま運用しております.
お手元のRがパッケージのダウンロードをHTTPSで可能か(libcurlに依存しているので)調べるには,

> capabilities("libcurl")
libcurl 
   TRUE 

等としてTRUEであれば対応しています.
現在のRはlibcurlのバージョン7.28.0以上を要求しますので, これ以前のlibcurlの入っている環境でビルドを行っている場合は, HTTPでの運用を従来通り行えばよいでしょう.
本来は公衆WiFi?などでHTTPでCRANのミラーを使うのは危険(インストールしますから)過ぎると言うお話ですので, クラスターを運用されてる方が直ちに対応に迫られると言う訳ではないです.

  • 毎週日曜の早朝からcronでwgetでローカルミラーを作成されてる方にご提案です. CRAN Mirror HOWTO/FAQをご覧頂いてrsyncに移行されては如何でしょうか. -- cran.ism.ac.jp? 2015-12-22 (火) 13:05:58

統計数理研究所 R研究集会(第10回 Rユーザ会)のお知らせ

ふじの? (2015-11-04 (水) 15:27:07)

本年度も、下記の要領で統計数理研究所 R研究集会を開催することとなりました。ぜひご参加ください。どうぞご自由に転送・転載をお願いします。変更や追加情報は、原則としてR研究集会HPにアナウンスしますので、そちらをご覧下さい。
なお、Ustreamライブ配信今年もやります。http://www.ustream.tv/channel/rlangism


2015年度統計数理研究所共同研究集会

「データ解析環境Rの整備と利用」 開催のお知らせ

2015年度統計数理研究所共同研究集会「データ解析環境Rの整備と利用」を、下記の日程で開催致します。興味のある方は、ぜひご参加ください。

日程:2015年12月5日(土)
場所:統計数理研究所(東京都立川市)3階 セミナー室1
参加費:無料
参加登録:不要
研究集会HP:<https://prs.ism.ac.jp/useRjp/>

プログラム

09:55-10:00
  開会挨拶および緒連絡

10:00-10:30 鈴木了太(ef-prime)
  「データ解析のためのGUI: R AnalyticFlow 3(仮)」
10:30-11:00 岡田昌史(東京大)
  「RとIoT」
11:00-11:30 中澤港(神戸大)
  「エコポイントチェックのweb調査結果に対してsemとlavaanパッケージを用いた構造方程式モデル(仮)」
11:30-12:00 谷村晋(三重大)
  「RとTikZを組み合わせた統計データのインフォグラフィック」

□□12:00-13:00 昼休み□□

13:00-13:30 福島真太朗(株式会社トヨタIT開発センター)
  「Python,Juliaとの比較によるRの特徴に関する考察(仮)」
13:30-14:00 中間栄治(Com-One)・中野純司(統数研)
  「パッケージ Rhpc の状況(仮)」
14:00-14:30 山本義郎・船山貴光(東海大)
  「Rを利用した災害情報の収集と解析・可視化(仮)」
14:30-15:00 久保田貴文(多摩大)
  「Rによるデータ視覚化のための動的グラフの利活用」

□□15:00-15:30 休憩□□

15:30-16:00 服部恒太(徳島大)
  「Where are good hitchhiking points? - Data analysis and visualization of Hitchwiki」
16:00-16:30 石田基広(徳島大)
  「API(周り)の話」
16:30-17:00 樋口千洋(東京医科歯科大)
  「Bioconductor update」

17:00- 総合討論

詳細は、研究集会HP:<https://prs.ism.ac.jp/useRjp/>の2015年度分をご覧下さい。
本案内はご自由に転載・転送していただいてかまいません。

藤野 友和(福岡女子大学)、中野 純司(統計数理研究所)

10/11-12 ISM HPC on R Workshop開催のお知らせ

本多? (2015-08-28 (金) 15:32:06)

統数研本多です。

10月11日(日)-12日(月 祝日)にRにおけるHPCの取り組みを議論するWorkshopとして
[[HPC on R Workshop:http://ura3.c.ism.ac.jp/hpccon/index.html#hprws_day1]
を開催します。

RcppのDirk Eddelbuettel (Debian)や
pbdRのGeorge Ostrouchov (Oak Ridge National Laboratory)
らによるセッションを予定しております。
皆様の参加をお待ちしております。

統数研ではISM HPC Week(10/8-12)としてHigh Peformance Computingに関するイベントを
予定しております。本Wokshopもこの一環です。

10月8日(木) ISM HPCプログラミングセミナー
10月9日(金)-10日(土) 国際研究集会ISM High Peformance Computing Conference (HPCCON)
10月11日(日)-12日(月 祝日) HPC on R Workshop

Webサイト
HPCCON / HPC on R Workshop

http://ura3.c.ism.ac.jp/hpccon/index.html
http://ura3.c.ism.ac.jp/hpccon/regist.html

HPCプログラミングセミナー

http://www.ism.ac.jp/events/2015/meeting1008.html

translation.R プロジェクト

岡田 (2015-07-29 (水) 17:33:06)

R-help メーリングリストをチェックされている方は既にご存知と思いますが、Chel Hee Lee氏により、Rのマニュアル(FAQ, extensions, data import/export, language definitionsなど) の多国語翻訳を行おうとするプロジェクトが提案されています。日本語は既に間瀬先生の翻訳されたものが公開されていますので、ご紹介しておきましたが、下記のページで翻訳をされているようです。HTMLの文書は1画面を2分割して対話的に翻訳を進めることができるWebアプリを使われているので、作業しやすそうに思えました。

http://homepage.usask.ca/~chl948/
http://translate-r.r-forge.r-project.org


統計数理研究所 R研究集会(第9回 Rユーザ会)のお知らせ

なかたに? (2014-10-16 (木) 18:53:53)

本年度も、下記の要領で統計数理研究所 R研究集会(通称「Rユーザー会」第9回)を開催することとなりました。ぜひご参加ください。どうぞご自由に転送・転載をお願いします。変更や追加情報は、原則としてR研究集会HPにアナウンスしますので、そちらをご覧下さい。


2014年度統計数理研究所共同研究集会

「データ解析環境Rの整備と利用」 開催のお知らせ

2014年度統計数理研究所共同研究集会「データ解析環境Rの整備と利用」を、下記の日程で開催致します。興味のある方は、ぜひご参加ください。

日程:2014年11月29日(土)(本年度は、都合により1日だけの開催となります)
場所:統計数理研究所(東京都立川市)3階 セミナー室1
参加費:無料
参加登録:不要
研究集会HP:<https://prs.ism.ac.jp/useRjp/>

◯11月29日(土) 国内ユーザによる報告
場所:3階 セミナー室1

 10時00分−10時30分    樋口千洋(東京医科歯科大)
  Rとゲノムワイド関連解析(GWAS)

10時30分−11時00分    岡田昌史(筑波大学)
  RとCDISC

11時00分−11時30分    中澤港(神戸大)
  『Rで学ぶ人口分析』とfmsbパッケージ

11時30分−12時00分    谷村晋(兵庫医科大)
  Rによる数理疫学

12時00分−13時00分    昼食

13時00分−13時30分    中間栄治(Com-One)・中野純司(統数研)
  RdRand on R

13時30分−14時00分    中野康人(関西学院大)
  Reproducible Social Research Environment with DDIR and dlcm

14時00分−14時30分    合崎英男(北海道大)・中谷朋昭(北海道大)・佐藤和夫 (酪農学園大)
  Rによる表明選好法

14時30分−15時00分    藤野友和(福岡女子大)
  vdmR:ggplot2グラフによるMultiple Linked Viewの実現

15時30分−16時00分    休憩

15時30分−16時00分    鈴木了太(ef-prime)
  R AnalyticFlow3: A Real GUI for R

16時00分−16時30分    中野純司(統数研)・中間栄治(Com-One)
  Rと統計数理研究所のスーパーコンピュータ

16時30分−17時00分    石田基広(徳島大)
  『Rの基礎とプログラミング技法』改訂に見るRの進化

17時00分−    総合討論

統計数理研立川キャンパスについて
アクセスなどはホームページ <http://www.ism.ac.jp/> をご覧ください。
近隣にはレストラン、コンビニなどはほとんどありません。
昼食は立川駅などで買ってこられることをお勧めします。
本案内はご自由に転載・転送していただいてかまいません。

----------------------------------------------------------
中谷 朋昭(北海道大学)、中野 純司(統計数理研究所)
  • 本年度の研究集会も、無事に終了しました。ありがとうございました。 -- なかたに? 2014-11-29 (土) 17:55:38
  • 昨日の集会でset.seedで設定しても端末によっては結果が異なった事がある件ですが, 多分誰か(人もしくはパッケージ)がRNGkindで乱数を変更し, それ(.Random.seed)を保存(.RDataに)して終了したからでは無いかと思います. RNGkind("default");set.seed(123) のように必ずRNGkindとset.seedをペアで実行すれば青ざめる事は無くなるのではないかと思います. -- なかま 2014-11-30 (日) 09:25:27
  • 中間さん、ありがとうございました。終了時に無意識にワークスペースを保存して、次回立ち上げたときに.RDataが自動的に読み込まれると、起こりうる可能性がありますね。機会を見て確認してみます。 -- なかたに? 2014-12-01 (月) 08:45:23

Rの公式マニュアルの翻訳

間瀬茂 (2014-06-30 (月) 20:22:01)

間瀬@元東工大です。定年退職し、毎日が日曜日の生活を楽しんでいます。家事、愛犬の世話、野菜作り(私の真の情熱の対象)に勤しんでいますが、いかんせんそれだけでは少々暇を持て余し気味なので、「晴耕雨DOC」をモットーにRの公式ドキュメントの翻訳を始めました。かれこれ10年(?)前に一度訳したことがあり、CRANにも登録されていますが、最新版はすっかり内容を一新していました。私が読んでも参考になる内容が幾つも有ります。

とりあえず R-FAQ と R-intro の訳が完成しましたので、私の Google Doc に一般公開扱いでアップロードしました。参考になれば幸いです。オリジナルと同じ条件で利用、配布が可能です。今後他のマニュアルの翻訳も予定しています。またバグが見つかれば随時更新していく予定です。またいずれCRANにも登録を依頼する予定です。

URLは以下の通りですが、問題なく覗けるでしょうか?

R-manulas

  • そうそう、R-FAQによれば R+ という商用バージョンが存在しているんだそうです(笑)。 -- 間瀬茂 2014-06-30 (月) 20:24:39
  • 梅雨の雨続きで翻訳作業がはかどります。今回はWindows版専用のFAQ集のrw-FAQの訳(rw-FAQ.3.10.jp.pdf)を上と同じ場所にアップロードしました。元々Linux用に開発されているRをWindowsで動かすのは大変らしく、開発者の苦心(と腹立ち)が行間から読み取れるようです。Windowsを使わない私には全ての質問に落語の葛根湯医者のように「Windows使うのやめなはれ」とだけ回答しておけば良いのではと思ったりします(笑)。Windowsを使わない、そしてWindowsが動く機械が無いもので、誤訳や勘違いが必ずあると変な自信が有りますので、自己責任で利用をおねがいします。 -- 間瀬茂 2014-07-06 (日) 07:23:29
  • 拙速気味ですが、マニュアル R Language(The R Language Definition)を訳しましたので上と同じ場所にアップロードしました。これはRの言語仕様を紹介したものです。ヘルプ文章だけではわかりにくい点がいろいろまとめて解説して有ります。しかしながらところどころ曖昧だったり、冗長だったりします。クラスとメソッドの解説はS3方式のみで、S4方式の説明は皆無です(S4方式の導入前に書かれたものだからとの言い訳)。私も実のところ理解できないでいる点も数多く有り、一応それらしく訳しておきましたが、誤訳の可能性が有ります。例によって利用は自己責任でおねがいします。 -- 間瀬茂 2014-07-18 (金) 08:01:23
  • Mac OS X用のFAQ(バージョン3.1.1)の翻訳を上と同じ場所にアップロードしました.私はMacは敬して遠ざけることにしていますので、正直なところこの世界で常識なことがわかりません.ですからかなりの部分が機械翻訳レベルと考えてください.Mac OS Xの実態はLinuxだと聞いていますが、それにしては様子が全く異なるようですね. -- 間瀬茂 2014-08-04 (月) 21:33:04
  • LinuxではなくFreeBSDが実装されていました。http://www.atmarkit.co.jp/fcoding/articles/macosx/macosxb.html -- 2014-08-05 (火) 09:25:46
  • 公式マニュアル「Writing R Extensions」の訳が出来ましたので、上と同じ場所に置きました.これは特に公開用のパッケージを作りたい人向けのアドバイス集です.Rのアドオンパッケージは公開されているだけでも恐らく万近くになると思いますが、それぞれがプラットフォーム(Linux, Windows,Mac OS X)毎に動くようにするためにはそれなりの作法が要るようです.OSのバージョン、Rのバージョン、外部言語の種類とバージョン、等の組み合わせは膨大なものになりますが、それぞれについてマニアックとも思える詳しい既述があり、うんざり(笑)します.CRANにあるパッケージの多くはLinux用のソースのターボール以外に、Windows, OS X用のバイナリが普通提供されています.私はこれは管理者が個別に用意しているものと思っていましたが、どうやらCRANにある計算機で自動生成しているようで、その際のノウハウの集積のようです.自分で公開パッケージを作りたい人には必須の文献ですが、そうでない人にも参考になることがあちこちに書いてあります.翻訳は多くの場所で機械翻訳レベルと考えてください.必要に応じて原文を参考することが必須です.多くの誤字と誤解が含まれていると思いますが、とりあえず通読する役には立つかと思います. -- 間瀬茂 2014-09-11 (木) 18:40:25
  • 公式マニュアル「R Data Import/Export」の訳が完成しましたので上と同じ場所に置きました.このマニュアルはRと外部アプリケーションの間でデータをやりとりする方法を紹介しています.特にリレーショナルデータベースの利用、コネクション、バイナリデータに重点が置かれています.エクセルのスプレッドシートとのやりとりについてもまとめてあります.実例が沢山あるというよりはポインタが豊富に紹介されていると考えてください.公式マニュアルにはもう一つ「R internals」というRの解体新書がありますが、これは中間さんレベルのプログラミング知識が無いと手が付けられないなと感じています.一度手を付けて挫折しました(笑).余生をかけて作業をしてみますが、期待はしないでください.なお、PDFファイルを作った元のLaTeXファイルもいずれアップロードしますから、俺のほうが上手に訳せるという人はぜひ挑戦してみてください.また今後マニュアルのバージョンアップごとに、いずれ体力・気力が追いつかなくなるまでは随時更新していくつもりでいます. -- 間瀬茂 2014-09-17 (水) 21:38:09
  • もうひとつの公式マニュアル「R Installation and Administration」を忘れていました.次はこれを訳します. -- 間瀬茂 2014-09-19 (金) 07:23:24
  • R-admin(R Installation and Administration)の訳が完成しましので、いつものところに置いておきます.これは様々なプラットフォーム、OS、アーキテクチャの下でR(とその他パッケージ)をソースからコンパイルするノウハウをまとめたものです.私のようにお仕着せのシステムをお気軽に使っているものには想像できませんが、世の中には様々な状況があるようで、それぞれにRのコアメンバーやボランティアが苦心惨憺してRを動くようにしているようです.特にメイリングリスト R-devel にこうした質問や報告があるようですね.翻訳していて中間さんの名前が感謝と共にあげられている箇所が幾つもあるのに気づきました.素晴らしい! -- 間瀬茂 2014-10-06 (月) 16:09:08

R で物理乱数 お手軽編

なかま (2014-06-17 (火) 10:20:44)

最近のIntelCPU(Ivy bridge以降)にはRdRand?と言う物理乱数が付いているので,
比較的新しい(ここ1〜2年)ハードをお持ちの方は物理乱数を使えるかもしれません.
RdRand?自体は1CPUで40MB/s(手元のマシン)の生成速度をもっており, 物理CPU数までの並列取得で150MB/s程度は生成出来ました.
物理CPU以上になると, 一時的に生成速度は向上しますが, 論理CPUまで増やすと完全にエラーのレートの方が高くなって生成速度が低下しました.
Rの場合は, "user-supplied"と言うユーザー定義の乱数が利用出来るのですが
オーバーヘッドが大きい為に, 並列取得しても効果が無いのと, ポータブルなスレッド処理を書くのが手間だったので, シングルタスクのみにして, Rrdrandと言うパッケージにしてCRANに上げました.
もし, 動作しなかったらお知らせください(そんなに沢山のマシンは持ってないので)

$ R -q
> library(Rrdrand)
> hasRDRAND()                       # このマシンがRdRandを利用可能か
[1] TRUE
> RNGkind()
[1] "user-supplied" "Inversion"    
> system.time(runif(3e3^2))
   ユーザ   システム       経過  
     1.018      0.000      1.017 
> RNGkind("default")               # Mersenne-Twister に変更
> system.time(runif(3e3^2))
   ユーザ   システム       経過  
     0.236      0.005      0.242

もし, RdRand?が使えないマシンだと

$ R -q
> library(Rrdrand)
 警告メッセージ: 
This CPU does not support RDRAND:  RNGkind has not been changed.
> hasRDRAND()
[1] FALSE

となって, RNGkindはそのままです.

  • なかまさん!素晴らしいです。なかまさんへの支援になるかどうか分かりませんが、事前に自分のIntelCPUがRdRand?をサポートしているかどうかを調べる方法をここに書いておきます。Rrdrandパッケージを実際にインストールしてチェックするのももちろんよいのですが、作業コスト低減と言うことで。なお、私はRdRand?が使えるマシンを持っていないようです。 -- 谷村 2014-06-19 (木) 12:25:35
    Linuxマシンの場合
    $ grep flags /proc/cpuinfo |uniq
    flags		: fpu vme de pse tsc msr pae mce [以降省略]
    flagの中にrdrandという文字列があれば、RdRand?を使えます。なければ使えません。
    MacOSXの場合
    $ sysctl machdep.cpu.features
    machdep.cpu.features: FPU VME DE PSE [以降省略]
    featuresの中にRDRANDという文字列があれば、RdRand?を使えます。なければ使えません。
  • 谷村先生、ありがとうございます。次回新しいマシンを購入されましたら、そのついでにでもお試し下さいませ^^; -- なかま 2014-06-19 (木) 23:09:55

統計数理研究所 R研究集会(第8回 Rユーザ会)のお知らせ

なかたに? (2013-10-18 (金) 17:29:48)

本年度も、下記の要領で統計数理研究所 R研究集会(通称「Rユーザー会」第8回)を開催することとなりました。ぜひご参加ください。また、スケジュールの拡散もよろしくお願いします。変更や追加情報は、原則として研究集会HPにアナウンスしますので、そちらをご覧下さい。


2013年度統計数理研究所共同研究集会

「データ解析環境Rの整備と利用」 開催のお知らせ

2013年度統計数理研究所共同研究集会「データ解析環境Rの整備と利用」を、下記の日程で開催致します。興味のある方は、ぜひご参加ください。

日程:2013年11月29日(金)- 30日(土)
場所:統計数理研究所(東京都立川市)3階 セミナー室1
参加費:無料
参加登録:不要
研究集会HP:<https://prs.ism.ac.jp/useRjp/>

◯11月29日(土) 国内ユーザによる報告
場所:3階 セミナー室1

09:25-09:30    開会挨拶および諸連絡

09:30-09:55    合崎英男(農村工学研究所)
  RによるBest-Worst Scaling

09:55-10:20    中間栄治(Com-One)・中野純司(統数研)
  ハイパフォーマンスコンピューティングのためのRhpcパッケージ

10:20-10:45    奥村晴彦(三重大)
  TeX Liveと美文書第6版とR

10:45-11:00    休憩

11:00-11:25    中谷朋昭(北海道大)
  仮想状況評価法のためのパッケージDCchoice

11:25-11:50    小池祐太・野村亮介(東京大院)
  Rによる確率過程の統計解析

11:50-13:00    昼食

13:00-13:25    谷村晋(兵庫医科大)
  Rによる多変量疾病地図

13:25-13:50    中澤港(神戸大)
  人口モデルに基づくウクライナの人口予測

13:50-14:15    中野康人(関西学院大)
  日刊新聞読者投稿欄の計量テキスト分析

14:15-14:30    休憩

14:30-14:55    藤野友和(福岡女子大)
  Rによるインタラクティブグラフ生成とその応用

14:55-15:20    鈴木了太(ef-prime)
  データ解析のためのR GUIフロントエンド

15:20-15:45    神田善伸(自治医科大)
  Rコマンダーに多彩な解析メニューを追加したEZR(Easy R)の開発

15:45-16:00    休憩

16:00-17:00    Japan.R Lightning Talk 大会
  Japan.Rから5名の若手による実践報告

17:00-        総合討論・閉会挨拶

統計数理研立川キャンパスについて
アクセスなどはホームページ <http://www.ism.ac.jp/> をご覧ください。
近隣にはレストラン、コンビニなどはほとんどありません。
昼食は立川駅などで買ってこられることをお勧めします。
本案内はご自由に転載・転送していただいてかまいません。

----------------------------------------------------------
中谷 朋昭(北海道大学)、中野 純司(統計数理研究所)
  • 研究集会のページ2013年度に、Duncan Murdoch先生のチュートリアルのスケジュールと内容をアップしました。 -- なかたに? 2013-10-20 (日) 17:43:53
  • 第一報告と第四報告が、当初のスケジュールから変更になりました。 また、研究集会のページ2013年度から、Duncan Murdoch先生のチュートリアル資料が入手可能となりました。その他の報告資料も、随時アップしていく予定です。 -- なかたに? 2013-11-25 (月) 18:19:52
  • 30日のセッションは、統数研のUstreamアカウントから生中継の予定です。録画はありません。 -- なかたに? 2013-11-25 (月) 18:20:59
  • 本年度の研究集会も、無事に閉会しました。皆様のご協力に感謝いたします。 -- なかたに? 2013-11-30 (土) 21:56:56

Rによる統計教育ケーススタディ分析システム説明会のご案内

wada? (2013-03-05 (火) 09:18:03)

説明会のお知らせを代理投稿させていただきます。

統計教育用にフリーで授業に活用できるStatistics Lab. は、ドイツの統計教育大学間連携プロジェクト"New Statistics"で開発・利用されているシステムです。
 今回、日本の統計教育大学間連携ネットワークでその主要メンバーであるUlrich教授を招聘し、実際の操作や授業利用・試験での活用の実際を解説していただくことになりました。
 ーーーーーーーーーーーーーーーーー 
Rによる統計教育ケーススタディ分析システム
   Statistics Lab. 操作および授業利用説明会

 日時:3月6日午後5時から1時間程度
 場所:立教大学11号館A301教室
 講師:Ulrich Rendtel教授
     (ベルリン自由大学統計・計量経済学研究所)
 主催:立教大学社会情報教育研究センター
     (統計教育大学間連携ネットワーク)
ーーーーーーーーーーーーーーーーーーー
[ご参考]
Statistics Labのダウンロードページ
http://www.statistiklabor.de/en/Download/SetupAndInstallation/index.html

 Stat Labは、デフォルト環境としてドイツ語を使用している。
プルダウンメニューを、ドイツ語から英語に切り替えるには、以下の操作を行う。
1.プルダウンメニュー左から2番目の"Bearbeiten"(ドイツ語で「編集」)をクリック
2.その一番下にある"Sprachen"(ドイツ語で「話す」)をクリックして、そこで英語を選択



なお、説明会は、登録不要・無料で、使用言語は英語、Stat LabはWindowsのみ対応です。


商業出版物へのRjpWikiスクリーンショットの掲載について

wakakumo? (2013-02-13 (水) 16:15:58)

お世話になっております。商業出版物(研修教材)において、RjpWikiの紹介の目的でトップページのスクリーンショットを掲載したいと考えています。利用(引用、転載)規約を見つけることができませんでしたので、念のため確認させてください。

「Web上の情報は英語が多いが、RjpWikiに日本語の情報が集約されている」という文脈で、本サイトのトップページのスクリーンショットを掲載したいのですが、問題ありませんでしょうか。

  • Wikiという性質上、コンテンツは多くの方々の手によるもので、個々の記事を編集された方を追跡することはできませんが、皆様一般に公開することを目的として書かれた文章であることは確かなので、スクリーンショットの掲載については問題ないと思います。 -- 岡田 2013-02-13 (水) 23:37:02
  • 岡田さん、ありがとうございます。では、掲載時のクレジットはURLを示し、(c) RjpWiki Projectというようなかたちにすればよいでしょうか。 -- wakakumo? 2013-02-15 (金) 15:36:40
  • (c)にすると著作権者がいるような感じになってしまうと思います。個々の文章には編集者の著作権が発生していますが、全体として著作権を保持している団体があるわけではないので、URLを明示していただければよいと思います。また、できれば紹介の文脈の中で、情報を集約したサイトというよりは、ユーザー同士の情報交換を行う交流場所である、という紹介のしかたをしていただいたほうが適切かと思います。 -- 岡田 2013-02-16 (土) 21:51:14
  • 岡田さん、ありがとうございます。ご指摘のように記載したいと思います。 -- wakakumo? 2013-02-17 (日) 23:29:01

統計数理研究所 R研究集会(第7回 Rユーザ会)のお知らせ

なかたに? (2012-10-19 (金) 11:46:57)

本年度も、下記の要領で統計数理研究所 R研究集会(通称「Rユーザー会」第7回)を開催することとなりました。ぜひご参加ください。また、スケジュールの拡散もよろしくお願いします。

2012年度統計数理研究所共同研究集会

「データ解析環境Rの整備と利用」 開催のお知らせ

2012年度統計数理研究所共同研究集会「データ解析環境Rの整備と利用」を、下記の日程で開催致します。興味のある方は、ぜひご参加ください。

日程:2012年11月29日(木)-12月1日(土)
場所:統計数理研究所(東京都立川市)3階 セミナー室2(D304)ほか
参加費:無料
参加登録:不要
研究集会URL:<http://jasp.ism.ac.jp/~nakanoj/workshop12/2012Rmeeting.htm>
Program:
◯11月29、30日: 海外ゲスト講師によるチュートリアル講演 (英語)
場所:3階 セミナー室2

Speaker: Professor John Fox (Department of Sociology, McMaster University, Canada)

29 November (Thu.)
10:30-12:00 : Structural Equation Modeling in R with the sem Package (1)

12:00-13:30 Lunch

13:30-15:00 : Structural Equation Modeling in R with the sem Package (2)
15:15-16:45 : Structural Equation Modeling in R with the sem Package (3)

30 November (Fri.)
10:00-11:00 : Visualizing Regression Models in R with the effects Package (1)
11:10-12:10 : Visualizing Regression Models in R with the effects Package (2)

12:10-13:30 Lunch

13:30-14:30 : Writing R Commander Plug-in Packages (1)
14:40-15:40 : Writing R Commander Plug-in Packages (2)
15:40-16:00 : Questions & Discussion

注意:アブストラクトは<http://jasp.ism.ac.jp/%7Enakanoj/workshop12/JohnFoxAbstracts.pdf>から入手可能です。
   講義室では持ち込んだノートパソコンが使えます。

◯12月1日(土) 国内ユーザによる報告
場所:2階 大会議室(変更になりました)

9:50-10:00 開会挨拶および諸連絡

10:00-10:30 奥村 晴彦(三重大学)
     Rによる大震災データ解析
10:30-11:00 牧山 文彦(名桜大学共同研究員)
     plotKMLとGoogleEarth
11:00-11:30 樋口 千洋(大日本住友製薬)
     オミックス研究とR

11:30-11:35 Japan.Rからのお知らせ
11:35-13:00 昼食

13:00-13:30 鈴木 了太(株式会社 ef-prime)
     データ解析のためのGUIフロントエンド
13:30-14:00 石倉 究(北海道大学大学院)
     新しいBayesデータ解析プログラムRStanの使い方
14:00-14:30 岡田 昌史(筑波大学)
      MPIクラスタとRstudioを併用した中規模データの分析レポート作成の実際
14:30-15:00 谷村 晋(兵庫医科大学)
      Rによるマルチエージェントシミュレーション

15:00-15:30 休憩

15:30-16:00 奥村泰之(国立精神・神経医療研究センター)
      臨床疫学におけるRの普及活動
16:00-16:30 中澤 港(神戸大学)
      人口予測の可視化
16:30-17:00 藤野 友和(福岡女子大学)
      Rによる人口動態・健康指標分析システムの構築

17:00-17:30 討論

統計数理研立川キャンパスについて
アクセスなどはホームページ <http://www.ism.ac.jp/> をご覧ください。
近隣にはレストラン、コンビニなどはほとんどありません。
昼食は立川駅などで買ってこられることをお勧めします。
なお、平日のお昼頃には、研究所の入口のところで弁当の出張販売があります。
本案内はご自由に転載・転送していただいてかまいません。

----------------------------------------------------------
中谷 朋昭(北海道大学)、中野 純司(統計数理研究所)
  • 12月1日の会場が変更になりました。12月1日の報告は、統計数理研究所のニコニコ生放送チャンネルを通じて配信する予定です。 -- なかたに? 2012-11-22 (木) 15:10:42
  • John Fox先生のチュートリアルは、盛況のうちに終了しました。報告のスライドやコマンドは、http://tinyurl.com/R-Japanよりダウンロード可能です。 --なかたに?
  • こちらだと、明日のすべてのニコニコ生放送の放送予定一覧が見れますね 、、システムがイマイチ理解できない。http://ch.nicovideo.jp/lives/tousuuken -- asap? 2012-11-30 (金) 21:08:03
  • ニコ動の録画は有料、UST の方がいい -- 2012-12-01 (土) 13:03:48
  • 本年度のR研究集会は、無事に閉会いたしました。皆様のご支援に感謝いたします。 --なかたに?
  • 一部の発表者は、コードを画面に一杯に見せるのではなく、要点だけを見せて解説する工夫をしてもらいたかった -- 2012-12-03 (月) 00:47:51
  • 配信が最後が途切れてしまい申し訳ありませんでした。統数研の設備をお借りするので、今回はニコ生としました。設備の状況がわかったので、来年は相談してみます。 -- 岡田 2012-12-03 (月) 06:17:55
  • 私のスライドは http://rpubs.com/mokjpn/mpirstudio に置きました -- 岡田 2012-12-03 (月) 06:18:33
  • plotKMLとGoogleEarth?のスライドへのリンクはこちらです。ご要望のあったデモプログラムも掲載しています。http://dl.dropbox.com/u/39515216/plotKML%E3%81%A8GoogleEarth.pdf -- 牧山? 2012-12-03 (月) 08:53:25
  • UseR!@Japan は、202X あたりに実現するかな -- 2012-12-03 (月) 13:11:55
  • 谷村先生へ>plotKMLはKMLのアルファーチャンネルにちゃんと対応しておりました。透明化も可能です。ご報告まで。 -- 牧山? 2012-12-03 (月) 13:16:06
  • 中澤のスライド,コード,メモを次のURLで公開しています。http://minato.sip21c.org/RWS2012/index.html -- 中澤? 2012-12-04 (火) 06:59:02
  • 今年もありがとうございました。リリースまでもう少々お待ちください。資料は以下からご覧いただけます。 http://www.ef-prime.com/news/121201/R_user_20121201.pdf -- 鈴木@ef-prime? 2012-12-04 (火) 19:22:50
  • 本年度の報告資料などを統数研内のHPhttps://prs.ism.ac.jp/useRjp/にまとめました。今後は、過去の分も含め、上記ページにR研究集会の情報を集約する予定です。 -- なかたに? 2012-12-13 (木) 15:03:58
  • Japan.R の方の資料もどこかでまとめて公開していただけると,ありがたいのですが -- 2012-12-13 (木) 18:32:17

fmsbパッケージ0.3.0公開

中澤 港? (2011-12-29 (木) 20:40:16)

拙著『Rによる保健医療データ解析演習』のサポートパッケージとして開発したfmsbですが,この度日本の人口関係のデータや人口分析関連の関数を追加して0.3.0としました。CRANに登録したというメールが届いたので,そのうちミラーにも入ると思います。

自分で作ったものではありますが,オプションを覚えきれないので,日本語訳も含むマニュアルページを作成中です。まだ不備だらけですが,例えばJpoplのページの下の方などは面白いかもしれません。
まだ開発途上なので,コメントなどいただければ幸いです。

  • 2012年1月5日にDennyの死亡モデルをコードしたDenny()関数のバグフィックスをして0.3.1にアップデートし,2月6日にradarchart()関数でデータにNAが多いときの処理を改善して0.3.2にアップデートしました。 -- 中澤? 2012-02-07 (火) 10:04:50
  • 4月にマニュアルページを含めサイト移転したのにともなってバージョンアップし,2012年12月11日に第21回完全生命表から2010年の男女のqxをJlifeに追加して0.3.5にアップデートしました。 -- 中澤? 2012-12-14 (金) 06:45:34
  • radarchart()関数について,海外から,塗りつぶしたいとか最小値を中心の1点から始めたいという要望があったのでオプションにより機能追加しました。また,Rothman KJ (2012)を参照し,率比,率差,リスク差とその信頼区間を計算する関数を実装し,0.3.7としました。本日CRANに載ったらしいです。 -- 中澤? 2013-02-07 (木) 17:57:28

ShapeFileデータ

とある者? (2011-11-24 (木) 11:47:00)

StdMesh05_JGD_21_SHP.zipをダウンロードしたいのですが、リンク切れのようでした。どうしたらよいでしょうか?

  • Rで自分で作る -- 2011-11-24 (木) 13:11:36
  • ここは質問をするところではない。 -- 2011-11-24 (木) 14:27:56
  • こちらに移転されたようです -- 2011-11-25 (金) 21:27:05
  • ↑を書いたものですが、質問された方へ。もしこれで問題が解決されたなら、お手数ですがShapeFileライブラリのリンクを張り直しておいていただけませんか? -- 2011-11-25 (金) 21:28:45
  • だから伸ばすなって -- 2011-11-25 (金) 22:04:01

統計数理研究所 R研究集会(第6回 Rユーザ会)のお知らせ

なかたに? (2011-09-30 (金) 23:51:38)

本年度も、下記の要領で統計数理研究所 R研究集会(通称「Rユーザー会」第6回)を開催することとなりました。ぜひご参加ください。

2011年度 統計数理研究所共同研究集会
「データ解析環境Rの整備と利用」開催のお知らせ

2011年度の統計数理研究所共同研究集会「データ解析環境Rの整備と利用」
を、下記の日程で開催いたします。興味のある方は、ぜひご参加ください。

日程:2011年11月24日(木)− 11月26日(土)
場所:統計数理研究所(東京都立川市) 3階 セミナー室 2 (D304)ほか
参加費:無料
参加登録:不要

スケジュール:

○11月24、25日: 海外ゲスト講師によるチュートリアル講演 (英語)
  場所:3階 セミナー室2
  Speakers:
    Dr. Martin Maechler (ETH Zurich, Switzerland)
     <http://stat.ethz.ch/people/maechler>

    Prof. Wayne Oldford  (University of Waterloo, Canada)
     <http://sas.uwaterloo.ca/~rwoldfor/>

 Program:
 24 November (Thu) "Research seminar"
   13:30-15:00 Talk by Wayne Oldford
     Visual clustering and ensemble clustering methods
     (joint work with Adrian Waddell and Wu Zhou)

   15:00-15:15 Discussion

   15:30-17:00 Talk by Martin Maechler
     Modelling Hieracrhival Dependencies with Copulas
     (joint work with Marius Hofert)

 25 November (Fri) "R related tutorial"
   10:00-11:00 Tutorial(a1) by Martin Maechler
     R Package Authoring - Why and How NAMESPACES in R
 
   11:00-12:00 Tutorial(b1) by Wayne Oldford
     Graph-theoretic methods for Data Visualization I:
     Pairwise display and the PairViz R package

   12:00-13:30 Lunch

   13:30-15:00 Tutorial(a2) by Martin Maechler
     The Matrix Package in R - Using S4 Classes in R:
     The Matrix Classes and Sparse Matrices.

   15:15-16:45 Tutorial(b2) by Wayne Oldford
     Graph-theoretic methods for Data Visualization II:
     Navigating high-dimensional spaces and RnavGraph R
     package

注意: 1. ラップトップコンピュータを持ち込み可能です。
        2. アブストラクトは
           < http://jasp.ism.ac.jp/~nakanoj/workshop11/2011Rmeeting.html >
           に掲載します。

○11月26日 国内ユーザによる報告
  場所:3階 セミナー室1
プログラム
 11月26日(土) 9:50 - 17:30
    9:50-10:00    開会挨拶および諸連絡
   10:00-10:30    鈴木 了太(株式会社ef-prime)
                    データ解析のためのGUIフロントエンド
   10:30-11:00    鈴木 由美子(北里大学)
                    Rとリモートセンシングを用いた農地環境のモニタリング
   11:00-11:30    奥村 晴彦(三重大学)
                    Rによる震災データ処理
   11:30-13:00  昼食
   13:00-13:30    中澤 港(群馬大学)
                    Rのoptim()関数を使った死亡モデルの当てはめ
   13:30-14:00    合崎 英男(農村工学研究所)
                    Rによる選択実験/選択型コンジョイント分析
   14:00-14:30    土居 主尚(放射線医学総合研究所)
                    RによるGPUを用いた行列演算を行うパッケージ
   14:30-15:00    岡田 昌史(筑波大学)
                    doc/NEWS.Rdより ― 最近の新機能抄出
   15:00-15:30    休憩
   15:30-16:00    里 洋平(Japan.R)ほか
                    2011年 x.Rの活動報告
   16:00-16:30    荒引 健(株式会社ディー・エヌ・エー)
                    RではじめるTwitter解析
   16:30-17:00    谷村 晋(兵庫医科大学)
                    Sweaveを用いた統計解析プロセスの可視化と再現性の保証
   17:00-17:30    討論

 研究集会に関する追加情報や、プログラムに変更のある場合は
 < http://jasp.ism.ac.jp/~nakanoj/workshop11/2011Rmeeting.html >
 に掲載します。
 
 なお、26日(土)9:50-17:30 に 3階セミナー室 2 において、全国の
 Rコミュニティ合同集会「Japan.R」が開催されます。
 詳細は< http://www.japanr.org/ >をご覧ください。
 
統計数理研立川キャンパスについて
   アクセスなどはホームページ < http://www.ism.ac.jp/ > をご覧ください。
   近隣にはレストラン、コンビニなどはほとんどありません。
   昼食は立川駅などで買ってこられることをお勧めします。
   平日のお昼頃、研究所入り口のところで弁当の出張販売がありますが、
   売り切れることも多いです。

本案内はご自由に転載・転送ください。
-------------------------------------------------
中谷朋昭(北海道大学)、中野純司(統計数理研究所)
  • Ust 中継ありますか? -- 2011-10-01 (土) 01:52:50
  • ネットを通じた配信は特に検討しておりません。 -- なかたに? 2011-10-01 (土) 11:26:17
  • 研究集会のURLを変更しました。 -- なかたに? 2011-10-03 (月) 11:11:15
  • もしご許可いただければUst中継担当します。開始時刻から遅れての到着になるかもしれませんが... -- 岡田 2011-10-11 (火) 13:17:04
  • 岡田先生の報告タイトルを確定しました。Ust中継の可否については、少し時間をいただきたいと思います。 -- なかたに? 2011-10-11 (火) 14:27:05
  • 海外ゲスト講師の報告タイトルを掲載しました。アブストラクトは、統数研のページでご確認下さい。 -- なかたに? 2011-11-11 (金) 15:14:28
  • 明日の「国内ユーザによる報告」は、Ust中継いたします(画質はあまりよくないかもしれません)。 配信URLは http://ustre.am/Fcwg , Twitterハッシュタグは #rjpusers でいかがでしょう -- 岡田 2011-11-25 (金) 21:58:02
  • 中継とハッシュタグのお知らせ、ありがたいです。 -- 2011-11-25 (金) 23:34:06
  • R研究集会は無事に終了いたしました。皆様のご支援ありがとうございました。 -- なかたに? 2011-11-27 (日) 15:13:55

第1回 Japan.R

里 洋平 (2010-11-13 (土) 00:29:09)

すぐ下のスレッドでも紹介してもらっていますが、第1回 Japan.Rを開催いたします。

開催要領は、下記の通りです。

日時:11/27 (土) 10:00-16:00
場所:統計数理研立川キャンパス(セミナー室 2 (D304) )
概要:
午前の部(10:00-12:30):初心者向けワークショップ
午後の部(13:00-16:00):R 利用者の交流を目的とした各種企画
費用:無料
申込:(下記サイトよりお申込ください)
午前の部:http://atnd.org/events/9223
午後の部:http://atnd.org/events/9806
--
「Japan.R」は、Tsukuba.R、Tokyo.R、Osaka.R、Nagoya.R など、全国各地の
R コミュニティが集まって行われる勉強会です。
午前は、「はじめての『R』」と題し、R の入門者・初心者向けワークショップを開催いたします。
午後は、各地域コミュニティの活動紹介、R の活用事例の紹介を目的として、
各種ブースが設けられ、研究や業務で R をお使いの方々と情報交換が直接できる場が提供されます。

以上、どうぞよろしくお願いいたします。

  • 楽しみにしています。同僚にも宣伝しましたよ! -- akira? 2010-11-13 (土) 06:39:08

第5回 Rユーザー会のご案内

なかたに (2010-10-15 (金) 17:24:09)

本年度も、下記の要領でRユーザー会を開催することとなりました。すぐ下のスレッドで里さんが提案している「Japan.R」も併せて開催されますので、皆様、ぜひご参加ください。

2010年度 統計数理研究所共同研究集会
「データ解析環境Rの整備と利用」開催のお知らせ

2010年度の統計数理研究所共同研究集会「データ解析環境Rの整備と利用」
を、下記の日程で開催いたします。興味のある方は、ぜひご参加ください。

日程:2010年11月25日(木)− 11月27日(土)
場所:統計数理研究所(東京都立川市) 2階 セミナー室1 (D305) 
                                    ( 25日のみ セミナー室 2 (D304) ) 
参加費:無料
参加登録:不要

スケジュール:

○11月25、26日: 海外ゲスト講師によるチュートリアル講演 (英語)
  Speakers:
     Prof. Hadley Wickham (Rice University, USA) 
                     < http://had.co.nz/ >
     Prof. Uwe Ligges, (Technische Universitat Dortmund, Germany)
                     < http://www.statistik.tu-dortmund.de/ligges.html >

Program:

25 November (Thu)  10:30 - 17:00
   10:30-12:00 Tutorial of ggplot2 (1)   by Hadley Wickham
   12:00-13:00 Lunch
   13:00-14:00 Tutorial of ggplot2 (2)   by Hadley Wickham
   14:10-15:10 Prospects and Challenges for CRAN - with a glance on 
                             64-bit Windows binaries   by Uwe Ligges
   15:10-15:30 Break
   15:30-16:30 Tutorial of ggplot2 (3)   by Hadley Wickham
   16:30-17:00 Discussion

26 November (Fri)  10:30 - 17:00
   10:30-12:00 My first R package (1)    by Uwe Ligges
   12:00-13:00 Lunch
   13:00-14:00 My first R package (2)    by Uwe Ligges
   14:10-15:10 One future of interactive graphics in R   by Hadley Wickham
   15:10-15:30 Break
   15:30-16:30 My first R package (3)    by Uwe Ligges
   16:30-17:00 Discussion

注意: 1. ラップトップコンピュータを持ち込み可能です。
        2. アブストラクトが
           < http://jasp.ism.ac.jp/~nakanoj/workshop10/2010Rmeeting-e.htm >
           にあります。

○11月27日 国内ユーザによる報告(Rユーザー会)

プログラム

 11月27日(土) 9:50 - 17:30
    9:50-10:00    開会挨拶および諸連絡
   10:00-10:30    鈴木 了太(株式会社ef-prime)
                     Rによるデータ解析ツールの新提案
   10:30-11:00    長島 健悟(城西大学)
                     Rパッケージの開発・登録とメンテナンス
   11:00-11:30    青木 繁伸(群馬大学)
                     統計学・データ解析におけるRの活用
   11:30-11:40    岡田 昌史(筑波大学)
                    『Rパッケージ本』プロジェクトのご紹介 
   11:40-13:00   昼食
   13:00-13:30    村井 潤一郎(文京学院大学)
                     心理統計教育におけるRの利用
   13:30-14:00    里 洋平(Tokyo.R)
                     地域コミュニティ「x.R」の活動とJapan.R
   14:00-14:30    牧山 文彦(データキューブ株式会社)
                     今更ながらのrcom/DCOM解説
   14:30-15:00    合崎 英男(農村工学研究所)
                     RExcelによるデータ解析
   15:00-15:30    休憩
   15:30-16:00    奥村 晴彦(三重大学)
                     TeX+Rによる美文書・美グラフ作成
   16:00-16:30    山本 義郎(東海大学)
                     Rによるデータの視覚化について
   16:30-17:00    谷村 晋(兵庫医科大学)
                     Rを用いたデータ分析における再現性の保証
   17:00-17:30    討論

 なお、27日(土)10:00-16:00 に セミナー室 2 (D304) において、
 全国のRコミュニティ合同集会「Japan.R」< http://lab.sakaue.info/wiki.cgi/JapanR2010 >が開催されます。

 研究集会に関する追加情報や、プログラムに変更のある場合は
 < http://jasp.ism.ac.jp/~nakanoj/workshop10/2010Rmeeting.htm >
 に掲載します。

統計数理研立川キャンパスについて
   アクセスなどはホームページ < http://www.ism.ac.jp/ > をご覧ください。
   近隣にはレストラン、コンビニなどはほとんどありません。
   昼食は立川駅などで買ってこられることをお勧めします。
   平日のお昼頃、研究所入り口のところで弁当の出張販売がありますが、
   売り切れることも多いです。


本案内はご自由に転送ください。
-------------------------------------------------
中谷朋昭(北海道大学)、中野純司(統計数理研究所)
  • とうとう念願のJapan.Rが開催されますね! -- okinawa 2010-10-19 (火) 08:39:15
  • 都合により、午前の山本さんと、午後の長島さんの報告順序が入れ替わりました。また、午前11時30分より、岡田さんによる「『Rパッケージ本』プロジェクトのご紹介」が追加になりました。スケジュールも新しいものに修正してあります。 -- なかたに? 2010-11-08 (月) 19:37:21
  • 今回は都合つきそうです。初めて参加しますので、沢山の方と沢山お話したいです。よろしくお願いします。 -- akira? 2010-11-11 (木) 12:46:09
  • おかげさまで無事に終了いたしました。報告者の方々、お集まりいただいた方々に御礼申し上げます。至らない面も多々ありましたが、ご容赦いただければ幸いです。 -- なかたに? 2010-11-29 (月) 09:56:09

Japan.Rの提案

里 洋平 (2010-05-10 (月) 22:55:36)

はじめまして。
Tokyo.R( http://groups.google.co.jp/group/r-study-tokyo )というR勉強会を主催してる里 洋平と申します。

いつもRjpWikiで勉強させてもらっております。



さて、表題の件ですが、最近、各地でRコミュニティが出来てきており、Rが盛り上がってきているように感じます。


そこで、全国のRコミュニティ合同でJapan.Rというイベントを開催したいと考えております。

まだ、詳細は全く決まってないのですが、開催する際には、是非Rユーザー会の皆さんともご一緒に出来たらなと思い、こちらに書かせていただきました。



もし宜しければご検討の程、よろしくお願いします。

  • 可能であれば、統数研のR研究集会と合同で、研究発表会と前後してコミュニティデイを設けるような形ではいかがでしょう。昨年のFOSS4Gはそのような形で大変盛り上がっていました。 -- 岡田 2010-05-10 (月) 23:17:51
  • 賛成! -- okinawa 2010-05-11 (火) 00:33:35
  • 賛同します。 -- 樋口? 2010-05-11 (火) 04:32:04

rpsychiパッケージがCRANに登録されました

奥村泰之? (2010-02-07 (日) 22:07:46)

中澤先生に倣い,開発・報告いたします。

現在,画面左の「本日更新パッケージ」に表示されているrpsychiというパッケージは,拙作のものです。以前から徐々に開発・公開していた関数を,ようやく,パッケージという形で纏めることができました (早速,バグが見つかっており修正版をCRANに登録しております)。また,開発過程等は拙Webサイト内で後日報告いたしたく存じます。


pyramidパッケージがCRANに登録されました

中澤? (2010-01-08 (金) 18:22:29)

久々の書きこみが宣伝で恐縮ですが,現在,画面左の「本日更新パッケージ」の一番下に表示されているpyramidというパッケージは,拙作のものです。
数年前に間に合わせで作ったものの,うまくパッケージ化できずにいたのですが,最近ふとアイディアが浮かんで,満足のいく形にできたので,調子に乗ってパッケージ化を試みたら,いつの間にか自分のWindows XP Professional (SP3)環境でもちゃんとパッケージ化が成功するようになっていて,さらに調子に乗ってCRANへの登録申請をしたら通ったのです。
人口ピラミッドを描画したい方は,お使いいただければ幸いです。
なお,開発過程や使用例などは,自分のサイト内にメモしてありますので,そちらも併せてご覧いただければ幸いです。


第4回Rユーザー会のご案内

なかま (2009-10-30 (金) 14:54:23)
統数研さんにおいて, 2005年度〜2007年度にかけて間瀬先生が主催されました「Rユーザ会」を本年度も開催する運びとなりました.
今年は日程の関係で英語の日と日本語の日が連続して行われませんので都圏以外の方にはご不便をおかけします.
また, 前回いらした方はご注意頂きたいのですが, 統数研さんが引っ越されましたので, 地図をご確認の上お越しください.

本年度の研究集会「データ解析環境Rの整備と利用」を11月27日(金)、
12月5日(土)の2回に分けて開催します。興味のある方はご自由にご参加く
ださい。

なお、開催場所は統計数理研究所ですが、統数研は10月に東京都港区広尾か
ら東京都立川市緑町に移転しました。それに付随して、このメールの最後にいく
つかご注意させていただきますので、参加予定のかたは必ずご覧ください。


研究集会「データ解析環境Rの整備と利用」(1)

  英語でのチュートリアル講演
  "Introduction to High-Performance Computing with R"

    Speaker:  Dirk Eddelbuettel <edd@debian.org>

    Date and time: 27th (Fri.) November, 2009     9:50-16:15
    Place: Seminar room 2, ISM, Tachikawa, Tokyo

    Program:
        9:50-10:45: Introduction + Motivation leading Profiling to
                  identify bottlenecks
       10:50-11:45: An overview of useful tools: Scripting extension
                  and profiling
         Lunch

       13:00-13:55: Performance enhancements using vectorisation and
                  compiled code
       14:00-14:55: An overview of Parallel computing with R
       15:00-15:55: Extending memory limits using packages biglm, ff
                  and bigmemory
       15:55-16:15: Discussion.

      Abstract:
          R users are often limited by available memory, cpu power or
        both. The tutorial will cover a number of available options
        to enhance or accelerate R processing. We will cover
        profiling approaches to identify bottlenecks. We will
        introduce scripting extensions to R which we will use
        throughout for our examples. Performance improvements from
        vectorisation as well as from compiled code will be studied
        using different packages.  Next, parallel computing using
        multicore, nws, Rmpi.  snow and schedulers like slurm will
        examined.  Another sections concerns out-of-memory / large
        memory computing.  
          This tutorial is based on the one given at UseR! 2009 in
        Rennes, France: http://bit.ly/1gXlV5


研究集会「データ解析環境Rの整備と利用」(2)
    日本の R ユーザによる講演(日本語)

    日時: 2009年12月5日(土) 9:50 - 17:20

    場所: セミナー室 5、統計数理研究所、東京都立川市

    プログラム:
 
         9:50- 9:55                 開会挨拶など
        9:55-10:25    牧山 文彦(データキューブ株式会社)  
                        KMLとR
      10:30-11:00    石田 基広(徳島大学) 
                        RとExcelのインターフェイス RExcel パッケージの紹介
      11:05-11:35    谷村 晋(兵庫医科大学)
                        Rによる環境疫学 -大気汚染の健康影響-

      11:35-13:00                  ランチ

      13:00-13:30    舟尾 暢男(武田薬品工業株式会社)
                        HTML アプリケーションを用いた簡易 R ツール
                        の作成方法
      13:35-14:05    鈴木 了太(株式会社ef-prime)
                        オープンなビジネスデータ分析環境
      14:10-14:40    岡田 昌史(筑波大学)
                         RとFOSS4G(仮題)
      14:45-14:55    岡田 昌史(筑波大学)
                         R running on mobile gadgets
      14:55-15:05    吉田 康久(筑波大学) 
                         Tsukuba.Rの活動(仮題)

      15:05-15:20                          休憩

      15:20-15:50    中谷 朋昭(北海道大学)
                         パッケージccgarchによる
                         多変量GARCHモデルの推定
      15:55-16:25    門脇 正史(エーザイ(株))
                         インタラクティブPDF作成ライブラリPDF2の紹介
      16:30-17:00    荒木 孝治(関西大学)
                          Rcmdrによる教育用パッケージの開発
                          品質管理の場合
      17:00-17:20                          討論
                       

統計数理研立川キャンパスについて
  アクセスなどはホームページ http://www.ism.ac.jp/ をご覧ください。
  近隣にはレストラン、コンビニなどはほとんどありません。
  昼食は立川駅などで買ってこられることをお勧めします。
     平日のお昼頃、研究所入り口のところで弁当の出張販売があります
     が、売り切れることも多いです。

本案内は転載可能です.

------------------------------------------------
               中野純司(統計数理研究所)、中間栄治(株式会社COM-ONE)
  • 明後日のFOSS4Gはいけないけれど、ユーザ会で岡田先生の話が聞けるのでよかった。 -- 2009-10-30 (金) 22:41:21
  • 昨年と違い無料であることは実にいい!! -- 2009-10-31 (土) 02:19:29
  • 無料とは何処にも書いておりませんが何かの見間違えでは?. 自由に参加していただければ幸です. -- なかま 2009-10-31 (土) 13:05:01
  • ↑では参加費はどこに書いてあるのですか?なんか、公的機関なのにひっかけがあるの? -- 2009-10-31 (土) 20:16:20
  • R だから free にということで,free をどう解釈するかは,あなたのセンスにお任せします(ただし,間違った解釈をするとちょっとね)という,しゃれなんですかね。 -- 2009-10-31 (土) 21:04:05
  • ↑「無料」とは参加費のことを言っているのですが、自由参加=参加費無料では?これを明記していないのはなにやら不安。やはり民間の方がイベントの開催にからむと話がおかしくなるのでは。 -- 2009-10-31 (土) 21:13:03
  • 多くの学術イベントでは、自由参加=参加費無料ではありません。経験上の話で調べたわけではないですが、Open/Closedの話と、有料・無料は直行していて、民間がからむ云々とは無相関でしょう。 -- 2009-10-31 (土) 22:45:59
  • 今回お越し頂くDirkさんも民間の方ですし, もともとユーザ会も民間の方でも話者として呼べるようにと私がお願いしまして(まあダメモトとは思いましたが, なんでダメモトと思ったかが壁だったんでしょう), 始めた物です. もちろん私の力では無く, 殆ど尊い先生方のお力添えのお陰です. ですので洒落ではなく大真面目に自由(いかなる障壁も無い)と言う意味です. R-2.10.0から翻訳の方も「フリーソフトウェア」も「自由なソフトウェア」に変更させて頂きました. ですので, 遠慮なく(ただし,弁当の心配はして下さい,本当に何もありません)ご参加頂ければと思います. -- なかま 2009-10-31 (土) 22:50:20
  • 金曜日と土曜日はぎゃくにしてもらいたかった。外人さんは宗教上の理由で土曜日だめなの? -- 2009-11-01 (日) 12:36:03
  • そのような失礼な質問にはお答えいたしかねますし, 話者全員(英語and日本語)に対して失礼な発言です. -- なかま 2009-11-01 (日) 21:02:52
  • 「失礼な質問」というか,不適切質問。全くその通りですね。「外人」という用語を使っていること自体不適切(外人という言葉を使わないようにという風潮はもう20数年前にあったはずだし)。外国人だから特定の曜日が駄目だということは,どの外国人のことを言っているのかもわからないし,極端なことを言えば,日本の公務員(?)が土日に公務じゃない事業に参加することにどのような制約があるの・ないのということにもかかわるので,あなたがいっていること以上の問題をはらんでいるのかもしれない。
    しかしまあ,疑問を持っている多くの人々に答えるために,「参加は自由」ということと参加料について,はっきり答えておけば,無用なトラブルは避けられると思いますが?
    参加が「自由」なことは,明らかになりました。
    参加料は必要なのですか?必要だとすればいくら?
    あるいは,参加料がいくらかも,参加者が自由に決めてよい(寄付みたいなもの?)ということ?
    それをはっきりすることは,free とは無関係では?(まあ,いずれにせよ,今回は私は参加できないけど(泣)
    ああだ,こうだ,書いたけど。今回の件について言えば,告知側に問題があるのではないかと思いますがどうでしょうか。
    参加料は必要なのですか?参加料いくらと書いていないからには,参加料は要らないと判断されるべきものではないでしょう。当日当所にていきなり百万円などと言われると困りますものね。10円なら,仕方ないかなということでしょ?書き足りなかったと言うことなら,そのように書き直せばよいだけではないでしょうか?
    何回かの告知者側からの答弁では,要領をえないなあというのが,大方の意見ではないかと思いますが,それは私の極端な解釈でしょうか。 -- 2009-11-01 (日) 21:43:24
  • 無料であることは実にいい、と書かれてしまうと、手弁当で準備をして話をする側としてはやっぱりちょっと複雑な気持ちがするので、最初にコメントされた方はそのあたりも配慮いただけるとよかったと思います。
    そして、いかなる障壁もない、と書かれているので、もちろんお金を払わないで入場するのも自由、ということですから、無料なのは確かでしょう。でも、もし寄付してくれる人がたくさんいれば、演者の旅費や懇親会費は出るようになるでしょうね。(寄付するのも、しないのもまた自由です) -- 2009-11-01 (日) 23:01:32
  • 今年は参加費は徴収致しません. 今回は運営側では無く私が勝手に騒動を起こしております. それは私の極端な行動によるものなのでご不快でしたら申し訳ございません. しかし, そうせざるを得ないくらいある意味酷い状態ですので, しょうがないので率先して馬鹿を行っています. -- なかま 2009-11-01 (日) 23:43:55
  • 石田先生の演題が「R で日本語テキスト処理(仮題)」から「RとExcelのインターフェイス RExcel パッケージの紹介」になりました. -- なかま 2009-11-16 (月) 13:58:08
  • 吉田の分の発表資料をあげました http://d.hatena.ne.jp/syou6162/20091206/1260035202
  • みなさんと楽しいひとときを過ごすことができて本当にありがとうございました。特に心に残ったのがTukuba.Rを紹介してくれた吉田さんの「楽しい」というスライドです。自分が「Rを楽しんでいるのか」考えさせられました。そしてコミュニティ活動の重要性というものを再認識した次第です。そういえば、(遠い昔の)学生の頃にPC8001を持ち寄ってパソ研をやってたことを思い出しました。沖縄でもなんかできないかな〜。 -- okinawa 2009-12-07 (月) 08:25:44
  • 土曜日はどうもお世話になりました!非常に有益で楽しいひとときを過ごさせていただきました。私の発表資料はこちらになります。どうかよろしくお願いいたします。 -- 舟尾? 2009-12-07 (月) 11:36:51
  • 皆様, お忙しい中お運びいただきありがとうございました. 来年(たぶんあるはず)もよろしくお願いします. 日程や運営方法など今年はいきあたってばったりしましたので, 至らぬ点もありましたがご容赦いただければ幸です. -- なかま 2009-12-07 (月) 14:35:15
  • 皆様ありがとうございました!ごく短時間の参加となってしまい、失礼いたしました。私の発表資料を弊社サイトの「NEWS」の欄に上げておきましたので、よろしければご覧ください。 http://www.ef-prime.com/ -- 鈴木@ef-prime? 2009-12-07 (月) 20:12:38
  • 発表スライドをUPしました。http://www.slideshare.net/fumihikomaki/kmlr-2694211 -- okinawa 2009-12-11 (金) 09:57:47

FOSS4G 2009 Tokyo / Osaka

岡田 (2009-09-25 (金) 14:52:46)

地理空間情報を扱うオープンソースツールの利用と開発の促進を目的に活動しているOSGeo財団 ( http://www.osgeo.jp ) が開催する年次カンファレンス、FOSS4G 2009 ( http://www.osgeo.jp/foss4g2009-in-tokyo/ , 11月1-2日) へ、Rコミュニティからも参加のお誘いをいただきました。

東京、大阪で開催されますが、東京での1日目のコミュニティデイでは、20分ほど時間をいただけるので、日本におけるRコミュニティについて僭越ながら私が紹介してまいりたいと考えています。
また、懇親会ではジオデータに関する5分間のライトニングトークの時間もいただけるということです。
共同発表をしていただける方、ライトニングトーク向きの話題を提供していただける方、ご興味をお持ちの方、ぜひ一緒にご参加いただければ大変嬉しく思います。

また、コミュニティからの協賛も無料で受け付けているそうです。RもGIS分野でのプレゼンスが大分高まってきていますし、オープンソースツールが好きな人々の集まりですから、個人的には「RjpWikiコミュニティ」のような名前で協賛させていただきたいなと考えています。ただ、RjpWikiは公開されているいちWebサイトにすぎないし、私は場所を提供しているにすぎないので、訪問してくださる方の中にはこの名前での協賛に賛成されない方もいらっしゃるのではと思います。これについては皆さんのご意見をいただきたいので、匿名でもかまいませんのでコメントをお寄せいただければ幸いです。
よろしくお願いいたします。

  • okinawaこと牧山です。私も岡田先生共々参加のお誘いをいただきました。参加したいのはやまやまなのですが、なにせ沖縄ということもあり手弁当での参加は難しいので、岡田先生にお願いいたしました。協賛名ですが、日本でのRコミュニティ活動はRjpwikiにかなり集約されていると思いますので、「Rjpコミュニティ」を標榜してもかまわないかと思います。 -- okinawa 2009-09-25 (金) 15:12:21
  • もう名前が出てますね。 -- 2009-09-30 (水) 01:03:14

ハイライト機能

hatener? (2009-09-22 (火) 06:05:45)

はてな使ってますが

>|r|
hoge <- function(x) cat("hogehoge")
||<


で自動的ハイライトされるのがとても便利です。

ここでも
http://beck.boo.jp/pukiwiki/pukiwiki.php/%A5%BD%A1%BC%A5%B9%A5%B3%A1%BC%A5%C9%A4%CE%A5%CF%A5%A4%A5%E9%A5%A4%A5%C8%C9%BD%BC%A8/

みたいなのを導入してほしいです。

  • R用に予約語定義とか作らないといけなさそうなので、すぐには難しそうですが、時間がとれたらやってみたいと思います。 -- 岡田 2009-09-23 (水) 11:06:31
  • SyntaxHighlighter3.0.83はまだRに対応していませんね。 -- 谷村 2011-04-15 (金) 09:47:30

日本統計学会活動賞

間瀬茂 (2009-09-15 (火) 00:47:57)

間瀬です。私事(?)ですが、7月に日本統計学会から突然、統計学会活動賞をあげるという連絡がありました。そんな賞があることも知りませんでした。日本におけるRの普及に貢献したという理由だそうです。ご存知の様に、Rの普及活動は私一人という個人レベルのものではなく、岡田さんを中心とした自然発生的コミュニティの成果です。というわけで、私個人が受賞するというのは気が引けましたが、Rが統計ユーザーの最初の(そしてもしかすると唯一の)選択になりつつある現在、日本のR普及に情熱を持ち邁進された多くの「同志」の活動を記憶に留めるためにも意味があるかと考えありがたく頂戴することにしましたのでこの場を借りてお知らせします。何よりも、日本統計学会がRの存在をいわば公認した証しとも考えられますね。私自身はこのWikiからはすでに引退状態ですが、変わらず活発なやりとりがされているようで安心もし、頼もしくも思っています。


秀丸エディタでR

山岡? (2009-08-13 (木) 03:43:32)

Rのプログラムを書くときに
秀丸エディタをお使いの方ってどのくらいいらっしゃいますか?

私は最近学生はタダなのを知り使うようになったのですが
(正確には学生かつ難儀(?)していなければならないらしいのですが)、
Rに直接文を渡すような
(例えばエディタ上でctrl+Rを押したら選択している部分が直接Rで実行される)
マクロがあったらみなさん使いますか?

emacs+ESSやtinn-Rでは実装されているみたいですが、
実際便利なのかと思いまして。

  • 使ってます! -- 2009-08-13 (木) 07:01:11

PDFビューアーからEmacs上のSweaveにカーソルジャンプする方法

せーだ? (2009-08-04 (火) 22:18:47)

Emacs上のSweave(Rnw)ファイル⇔PDFの相互連携のうち、PDFビューアをダブルクリックしてRnwの該当箇所にカーソルを飛ばす方法が判りました。Windows限定ですが、参考までにご紹介します。

  1. 最新の TeX Live または W32TeX をインストールすれば、LuaLaTeX で日本語 TeX ファイルが処理できる。
    フルインストールすれば OK。LuaLaTeX で日本語の TeX ファイルを処理する場合は LuaTeX-ja プロジェクト wiki の LuaTeX-jaの使い方 を参考にする。
  2. R-forgeからpatchDVIをRにインストールする
  3. SumatraPDF(高速軽量なフリーのPDFビューアー)をPATHの通った場所に置く
  4. Sweave.styの最後に次の記述を加えておく
    \newcommand{\Sconcordance}[1]{%
    \ifx\pdfoutput\undefined%
    \csname newcount\endcsname\pdfoutput\fi%
    \ifcase\pdfoutput\special{#1}%
    \else\immediate\pdfobj{#1}\fi}
  5. Sweaveファイルを編集し、LaTeXプリアンブル部に
    \usepackage{luatexja}
    \usepackage[ipaex]{luatexja-preset}
    \usepackage{Sweave}
    \SweaveOpts{concordance=TRUE}
    を入れる。
  6. R から Sweave の処理を行う(ファイル名:foo.Rnw)。この処理後に、LaTeX ファイルと図の PDF ファイルができる。
    Sweave("foo.Rnw")
  7. 上記の LaTeX ファイルを LuaLaTeX で -synctex=1 オプション付きでコンパイルする。foo.synctex.gz というファイルが同じ場所に作成されたことを確認する。foo.synctex.gz はそのままでは使えないので、別途同じ場所に解凍しておくこと。
    lualatex -synctex=1 foo.tex
  8. 出来上がったPDFファイルに、R側からパッチを当てる。
    library(patchDVI)
    patchSynctex("foo.synctex")
    ロケールの設定上、Warning が多数出るかもしれないが、処理には影響ない(はず)。
  9. これで foo.pdf ができたので、Windows PowerShell? またはコマンド プロンプトから SumatraPDF で開く。
    SumatraPDF.exe -inverse-search "gnuclientw.exe +%l %f" foo.pdf
  10. SumatraPDF 上でダブルクリックすると Emacs が起動し、該当する部分(行単位の精度)にカーソルが合った状態で foo.Rnw が表示される。

patchDVI は WinEdt+Miktex を前提としているため、LuaLaTeX を経由しないと、日本語を含む Rnw ファイルは正しく処理されないないようです。手順は結構複雑ですが、後からバッチファイル化しておけば良いでしょう。
~/.emacs.d/init.el で適切な関数を設定すれば、Emacs⇒ビューアーの移動も可能です。

【補足】現在の LuaLaTeX は、[u]j[s][article/report/book]などの 日本語 (u)pTeX 用クラスファイルでは動作しません。ltj[s][article/report/book] などの LuaTeX-ja のクラスファイルまたは [article/report/book].cls などの欧文用クラスファイルを使いましょう。

SweaveでエディタとDVIビューア間の相互移動参照


RスクリプトからR関数名の抽出

谷村 (2009-05-15 (金) 13:03:03)

myuheさんが書かれたauto-complete.elを拡張するR用のelispに自分が頻用するコマンドを追加することを目的として、日々残しているRスクリプトからR関数名を抽出するPerlをスクリプトを書きました。必要な方がいらっしゃればどうぞ使ってください。

#!/usr/bin/perl
# getRcommands.pl 

my %count;
while (<STDIN>) {
#   while(/[\w\.]+( ?)*\(/g){ push(@words, $&) } #関数名と()の間に空白を入れる人向け
    while(/[\w\.]+\(/g){ push(@words, $&) }
}
@words = grep {!$count{$_}++} @words; 
chop(@words);
foreach $i (@words) { print "$i\n" }
exit;


Rスクリプトを標準入力からこのgetRcommands.plに与えればR関数名のリストを標準出力に出します。


$ cat 20090326.R | perl getRcommands.pl
read.table
paste
rbind
names
c
coordinates
library
readShapePoly
readShapeLines
proj4string
CRS
spTransform
plot
points
text
as.character
point.in.polygon
rep
round
nrow
cbind
function
spDistsN1
return
which.min
row.names
head
for 
length
findps
findss
sample
sapply
if 
as.logical
sum
unname
unlist
findaf
write.csv
e00toavc
read.coverage

注意:自作の関数名を除く処理を入れていないため、上記の例だとfindaf、findps、findpsのようにRスクリプトの中で定義した自作関数も混ざります。

ホームディレクトリの全てのRスクリプトからR関数名を取り出してみます。

$ find ~/ -name "*.[r|R]" | wc -l
442

今、私のホームディレクトリには442個のRスクリプトがあるようです。getRcommands.plを使って、この全てから(重複を除いて)R関数名を取り出します。大量に出力される結果をこの掲示板に全て表示することは無理なので、先頭の10個を表示させます。

$ find ~/ -name "*.[r|R]" -exec cat {} \; | perl getRcommands.pl | head
function
epidemic.sim
save
if
print
sformat.output
write.table
return
cat
length

全部で何個あるのか数えてみると

$ find ~/ -name "*.[r|R]" -exec cat {} \; | perl getRcommands.pl | wc -l
4351

多いのか少ないのか分かりませんが、諸先輩方はもっと多いでしょう。


長崎観光はいかが

(2009-02-06 (金) 00:17:52)

日本行動計量学会 第12回春のセミナー

  • おっ、いいなー長崎大もがんばっていますね。沖縄の大学でRやってる先生いないのかしら?(シクシク) -- okinawa 2009-02-06 (金) 08:15:03
  • s/フリーのソフトウェア/フリーソフトウェア/ 前者は免費軟件(freeware)で後者は自由軟件(free software). -- なかま 2009-02-06 (金) 10:45:53

日本からのパッケージャーがあまり育って無いこと

okinawa (2009-01-08 (木) 08:46:06)

なかまさんが、おっしゃっていましたが、「日本からのパッケージャーがあまり育って無いこと」は、Rの国際化やメンテをされている方々の心配(もしくはやる気をそいでいる?)の種になっていると思います。
私もいろいろやっているわりにはパッケージを作っていないので、申し訳ないと思っているのですが、皆さん何が問題だと思いますか?

  • 個人的意見ですが、どこかにパッケージングの方法(OS別)の知識を集約できないでしょうか?海外のパッケージを見ても関数が1〜2個でもパッケージにしてるものもありますので、(英語でマニュアル作るという)心理的敷居が高いだけなのかもしれません。 -- okinawa 2009-01-08 (木) 08:50:22
  • 掲示板でするような問答ではないように思います. -- なかま 2009-01-08 (木) 22:35:47
  • 失礼しました。 -- okinawa 2009-01-09 (金) 06:52:34
  • では、どこでするのか。あるいは、しているのでしょうか。 -- 2009-02-03 (火) 13:25:02
  • 望ましくは宴の場など, 顔の見える所が良いように思います. 文章だけのコミュニケーションでは難しいでしょう(実際貴方の発言も匿名なので, 匿名2の方が出てきても本人以外わかりません). 2chによれば, ここは2chより雰囲気の悪い場所のようですし(笑). 場所はR関連の集会があればその後の宴会などが良いのではないでしょうか. -- なかま 2009-02-03 (火) 20:03:13

GEditのLaTeX pluginがデフォルトでR Sweaveをサポート

谷村 (2008-12-11 (木) 11:20:27)

GEditにLaTeX pluginがあるのですが、これがデフォルトでBuild LaTeX Documentメニューリストの中に「R Sweave PDF」メニューを持っていました。ユーザが自分でカスタマイズしてR+Sweaveを追加するのではなく、デフォルトで用意されていることに驚いたので、報告します。Sweaveの普及も進んだのでしょうか。Sweaveって何?という人は、The R Bookの第19章をご覧ください。The R Bookでは、Linux環境のときSweave.shを使うように書いていますが、最近のバージョンでは、

R CMD Sweave hoge.Rnw

でhoge.texと画像ファイルが作成されます。

gedit-latexplugin.png

ひながた氏にメモリ消費に関するレポートを投稿してほしい

(2008-12-06 (土) 23:49:58)

どんな内容だったのか激しく気になる

選択肢 投票
ぜひお願いします 11  
どっちでもいい 0  
興味ない 1  
このサイトには不適切 0  
この掲示板には不適切 1  
  • 今読むと、不親切な内容だと思ったので補足.なんでもひながた氏がR掲示板に64ビットマシン?(OSはLinux?)でRで2Gバイト以上を消費したというレポートを投稿したらしいのだが、消えてしまったらしい.個人的に非常に興味があったので、再度投稿してほしいと思った次第.是非再登場を願う. -- この記事の投稿者? 2008-12-07 (日) 17:20:49
  • わしが、この記事立てたときは「お願いします」「どっちでもいい」「このサイトには不適切」の3択だったんだが、下の画像のように増えていた.とんがった人がいるものだ.それでもできるだけ書き込んだ人間の考えを尊重しつつ、関係ないと思われる2つは削除した. -- この記事投稿者? 2008-12-07 (日) 21:11:27

    gazo.png

  • 選択肢というのは,他人が強要するモンでもないと思うけど?
    該当ゼロなら,その選択肢は意味がなかったというだけのことでしょう?
    自分はこう思うという選択肢を作っても,問題はないでしょうし。 -- 2008-12-07 (日) 21:45:10
  • めんどくさいやつがおるのう.自分で選択肢追加したいなら、新しく記事を投稿せい.チキン -- この記事投稿者? 2008-12-09 (火) 10:11:27
  • ここだろ?:-) http://phoenixx.sakura.ne.jp/R/wiki.cgi?page=BugTrack%2D%A3%D2%C8%F7%CB%BA%CF%BF%2F16 -- 影 2008-12-25 (木) 16:15:05

軽くしました(Q&A (初級者コース)/10からお引越し)

 ? (2008-11-26 (水) 22:05:34)

画像等も退避・復旧したつもりですが不具合があったらごめんなさい
前にもお願いしたけど,画像の退避・復旧等も含めて,一ユーザがやるのは面倒くさいんです
この記事はしばらくしたら消去しますので,不具合の指摘以外,コメント不要です

  • 質問掲示板的な運用とwikiの親和性が低いと感じているのは私だけだろうか・・・ -- 2008-11-27 (木) 09:42:54
  • 「Q&A (初級者コース) 雛形」というのを作ってみました.いまのページを「Q&A (初級者コース) (10)」にして、この番号を新しいページを作るたびに増やしていけば、画像の退避・復旧なんかはしなくて良いので、ずいぶん楽になるのではないでしょうか・・・?wikiにはrename機能もあるのですが、管理者しかできないので、それが不便ですよね.ちなみにURLの「cmd=」のところを「cmd=rename」にすると(「cmd=」がなければURLの最後に「&cmd=rename」をつける)、ページ名変更画面が出てきます.パスワードを求められるので、変更は出来ません. -- 2008-11-27 (木) 15:13:48
  • たぶん, 管理人さんは日本に居ないかもしれないので, 反応が当分無いと思います. が, そのようにしていただけるなら, そのようにしてしまいましょう. 管理が楽な方が良いでしょう. Wiki以外にもMLもあったと思いますが, まだあったかは? -- なかま 2008-11-27 (木) 21:15:22
  • まったく,不具合の指摘以外コメント無用と書いたのに(^_^;)
    「質問掲示板的な運用とwikiの親和性が低いと感じている」
    同感というか,Wiki というものの性格がそういうものでしょう。
    記事に追加があっても,それがどこなのか,「差分」を取って,目で探すしかない。
    この特性は,質疑応答掲示板に限らず,蓄積資料としても致命的。
    しかも,変更(追加)があったとわかっても,実際に見てみるとほんの些細な追加・誤字修正というのが重なると,最終更新でリストに上がっても,わざわざ確認してみようという気が起こらない。狼少年だね。タイムスタンプを変更しないという選択肢があるが,自分の更新は価値ある更新だと皆思っている。
    興味がないものは見なきゃ良いだろう?ごもっとも。
    Wikiの長所って何だろう。
    みんなが好き勝手に書き込めること?掲示板だって,みんなが好き勝手に書けるよ。
    ページを作るのも自由だということ?そのために,無駄なページがいっぱい出来る。
    量が質に転化する。。。だったらいいね
    なんでこれが,「Q&A (初級者コース)」やねん! -- 2008-11-27 (木) 21:40:05
  • 「まったく,不具合の指摘以外コメント無用と書いたのに」おっしゃるとおりで・・・(汗.□掲示板的な使い方だとbugtrackというプラグインがあります.でもちょっと敷居が高くなってしまうかも・・・?(この話題は別の場所がいいですかね・・・) -- 雛形を作った人? 2008-11-28 (金) 09:52:55
  • 言うは易し行うは難し. FAQは既にSAQになり果て. 簡単な質問の答え方も誰も読まないし. 嗚呼... -- なかま 2008-11-29 (土) 17:54:50
  • 一応国内にはいますが、ちょっと身動きがとれない状態です。掲示板に関しては使い勝手が悪くなってしまい申し訳ありません。掲示板は別システムで、phpBBみたいなのを導入したほうがよいでしょうか? -- 岡田 2008-12-03 (水) 02:55:17
  • DB利用の物は便利と言えば便利ですが, バックアップしないと無くした時の被害も大きいですし(価値があるか無いかは人によるかもしれませんが), いまの形態であれば, archive.org からの復旧も若干手をかければ可能ですし, Q&Aのアーカイブ問題も初心者誘導にも成功したので, このままで当面問題がなければ良いのではないでしょうか. Q&Aシステムを変えるのは「Q&Aを○○すべく新しくしました(ニヤリッ)--岡田 20xx-xx-xx (x) 0[^0-6]-xx-xx」など余裕のあるときの方が良いと思います. -- なかま 2008-12-03 (水) 10:28:01
  • PukiWiki公式サイトでも、質問掲示板にbugtrackを使っている模様 -- 2008-12-03 (水) 17:57:18

R Graphical Manualデータ更新

小笠原? (2008-11-18 (火) 19:23:21)

しました。年に一度になってしまってまして、申し訳なしです。(目に見えないところを改良したら、目に見える新しいバグが入ってしまってる ...)


recodingの訳について

モテキ ユタカ? (2008-11-01 (土) 21:04:34)

Dalgaardの翻訳の231頁についてです。
Recodingの訳は、直訳すれば「再コード化」になると思います。


アドバンスドRチュートリアル 平成20年12月5日(金) のおしらせ

なかま (2008-09-24 (水) 15:12:32)
このチュートリアルは有償(演者旅費支援の為)です

日時: 12月5日(金)  午前10:30(受付:10:00)〜午後5:00まで
場所: 横浜市中区日本大通11番地
       横浜情報文化センター
       (最寄り駅: みなとみらい線「日本大通り駅」 情文センター口)
参加費: 15,000円 <- でもUseR!より安い!

10:30 - 11:40
	 Peter Dalgaard
13:00 - 14:10
	 Duncan Murdoch
14:20 - 15:30
	 Thomas Lumley
15:40 - 16:50
	 Simon Urbanek


申込および詳細はhttp://jasp.ism.ac.jp/~iasc2008/tutorial.html からお願い致します.

  • チュートリアル後に, 懇親会も予定しております(詳細はまだ決まってません). あと, 今年度はRユーザ会は無いので, IASCのチュートリアルにフリーライドと言うことになります. -- なかま 2008-10-18 (土) 11:36:33
  • ありゃ,今年はRユーザ会は開催されないのですね.残念.. -- 2008-10-19 (日) 17:07:48
  • 出版社の協賛を得て土日開催とはいかあいかなぁ -- 2008-10-19 (日) 18:31:26
  • R言語がこれだけ世界的に活用されてきているわけですから、RjpWikiを含めRユーザー会もなんらかのステップアップが必要になるのかもしれませんね。(悟空の元気玉みたいに寄付を集めるようなことはできないのでしょうか?) -- okinawa 2008-10-19 (日) 19:17:34
  • 横浜情報文化センターの大ホールは空いているので, 本当にフリーライドするジョークは可能のようです. -- なかま 2008-10-19 (日) 20:39:52
  • ユーザー会は来年無料で土日開催にならないと、もう行けない。 -- 2008-10-20 (月) 10:38:10
  • 土曜日の午前はIASC2008のプログラムの方で, 「Statistical Computing with R」があります. 有償ですが... -- なかま 2008-10-20 (月) 20:32:18
  • ライトニングトークやハンズオンセッションとかがあればいいのに。 -- 2008-10-22 (水) 17:21:40
  • コアのメンバが4人も揃うことはあまり無いと思うので, R界隈でデビュー予定の方は是非いらして下さい. みなさん一見気難しい人に見えますが, ○○ですので安心していらして下さい. 15kも払う人も少ないでしょうから, チュートリアルも懇親会もゆっくり(ライトでは無い...)お話出来ると思います. -- なかま 2008-10-22 (水) 19:13:52
  • そろそろ、ユーザ会は発展解消して、useR! 2009 Japan に -- 2008-10-23 (木) 00:57:49
  • useR!にしたって, 有償平日開催なので, 今回どれだけ人が来たというのはいわゆる一つの指標になるような... -- なかま 2008-10-24 (金) 19:37:21
  • 参加者のみなさまお疲れさまでした. 当日の模様はぎょーむ日誌を御覧下さい. なかなか面白いチュートリアルでした. -- なかま 2008-12-06 (土) 21:03:03

SPSSからRが利用できる(@_@)??

  • SPSS Statistics 17でSPSSの開発環境からRのコードが実行できるようになるらしいです。(@_@)??更なる情報を求む! -- okinawa 2008-09-24 (水) 17:41:55
  • アメリカのサイトによるとSPSS16から対応していたようです。17はRのグラフィックパッケージをそのまま使えるらしく、デモ画面でもRでおなじみのグラフィックが表示されていました。しかし、これって有りなの?それとも、SPSSもRを無視できなくなった? -- okinawa 2008-09-25 (木) 08:53:01
  • SASからRが使えたら言う事無しなんだけどな。データ加工はSAS。分析はR. -- 2008-09-26 (金) 20:49:08
  • なんでそういう発想になるんだろうか。RでSASに優るとも劣らないデータ加工が出来るように(みんなで開発を進めていく)というように考えることが出来ないんだろうかなあ。もちろん,自分が出来るわけではないから,可能なサポートに徹するわけだけど。 -- 2008-09-26 (金) 22:15:55
  • 本気でRでSASに優るとも劣らないデータ加工が出来ると思いますか? -- 2008-09-26 (金) 22:30:52
  • データ加工の詳細は存じませんが, perlより(ここで既に大きく論点がずれてる気がするけど参考までに)優れているんですか?SASって? -- なかま 2008-09-26 (金) 23:14:59
  • SASからR,使えると思います. -- 2008-09-27 (土) 01:58:59
  • データ加工の中身より、やはりRの鬼門はGUIですね。SPSSもGUIをJavaですべて書き直していたので、結構いいかんじになってました。この部分はオープンソース開発の限界かも。 -- okinawa 2008-09-27 (土) 07:55:47
  • RとFDAのその他のところにも紹介していますが、STATISTICAからもRが使えます。プレゼンにもあるように、「RはFDAに認められている」ことを売り文句にしています。FDA絡みでR対応をうたう統計解析ソフトが増えてくるかもしれませんね。SASはFDA標準なのでR対応する必要は無いと。 -- okinawa 2008-09-27 (土) 08:08:30
  • 表から引っ越ししてきました。 -- okinawa 2008-09-27 (土) 09:04:32
  • 個人的には、Rでサンプルサイズ1億以上のデータを扱えるなら、SASなんか使いませんよ. -- 2008-09-27 (土) 10:11:36
  • ff packageとか使っても1億以上のデータは扱えないのでしょうか? -- okinawa 2008-09-27 (土) 17:19:05
  • サンプルサイズが1億とはいっても,変数の数がいくつかで可否は分かれるのでは。変数も1万とか1億じゃ無理でしょ(^_^;)まあ。計算時間はおいておくとしましょう。 -- 2008-09-27 (土) 18:01:45
  • 本当なら、Enterprise R とか Standard R とか、利用者のタイプでのランク分けが必要なんでしょうね。 -- okinawa 2008-09-27 (土) 18:38:23
  • UseR!2008でもGUI部分の発表がいくつもありましたが、決定打は、なかなかないですね。RのRによるRのためのGUIがでてこないかな〜。 -- okinawa 2008-09-27 (土) 18:42:07
  • どんな場合にもRを使いましょうということ自体硬直しているんで,目的・場合に応じて,ふさわしいものを使えばよいだけでしょう。自分の用途でRが使える使えないといっても,意味ない。あなたがRは駄目だと思えばそうなんだし,Rが最高と思えばそうなんだし。Rを支持する人の割合が重要なんでしょう。 -- 2008-09-27 (土) 20:06:43
  • そういう意味では、SPSSや他の統計分析ソフトででRが使えるようになるのは、R支持者を広めるのには役立つと思うのでOKと。お騒がせしました。 -- okinawa 2008-09-29 (月) 10:24:11
  • つまり, RにGUIを付けたとすれば, ヘルプ機能には冴子先生ならぬリプリー先生がついて来る訳ですね. わかります.:-) -- なかま 2008-10-03 (金) 12:19:28
  • うっ、偉すぎる。R女史っていないのでしょうか? -- 2008-10-03 (金) 18:01:49
  • 冴子先生 って誰? -- 2008-10-03 (金) 18:22:19
  • http://www.wdic.org/w/MOE/%E5%86%B4%E5%AD%90%E5%85%88%E7%94%9F -- 2008-10-03 (金) 18:42:23
  • SPSS17からRの使い方がいまひとつわからん。 -- 2008-10-04 (土) 18:04:25
  • SPSS17が手元にないので想像の域を出ませんが、R pluginを入れてカスタムダイアログビルダーで画面を作るんじゃないでしょうか。 -- okinawa 2008-10-05 (日) 08:49:08
  • SPSS17からRが使えました。図の出力等に便利です。コマンドの受け渡しはシンタックスから簡単におこなえます。これで、オプションの購入が必要なくなるかも? -- 2008-10-07 (火) 20:11:16
  • できましたら、利用方法などを公開していただけませんでしょうか?よろしくお願いします。 -- okinawa 2008-10-07 (火) 22:30:22
  • SPSS17からRの使い方簡単なまとめ  �SPSS Statistics Base via R pluginの対応するR2.7をインストール �http://www.spss.com/devcentral/にアクセスしSPSS Statistics Base via R pluginをダウンロードしインストール これで、SPSSのシンタックスから使えるようになります。 Rを呼び出すコマンドはSPSSのシンタックスに "BEGIN PROGRAM R. ・・・・ End PROGRAM" と記述することで可能です。 Rのコマンドは・・・・の所に記述することにより使用可能です。 使い始めたばかりですが、Rを呼び出すコマンドの前にspssのコマンドを記述することにより、高度な連携が可能です。もちろん、ダイアログに登録し使うことができます。Rを簡単にGUIで使用でき感動です。  -- SPSS with R? 2008-10-14 (火) 21:11:45
  • Oops! 信頼できない証明書を受け入れてはいけない... -- 匿名希望? 2008-10-15 (水) 00:16:31
  • ありがとうございました。 -- okinawa 2008-10-15 (水) 09:30:52
  • どうやら、対応するRのバージョンはプラグインをインストールする際にRのフォルダを指定すれば、2.70以外でも動きます。 -- SPSS with R? 2008-10-15 (水) 10:09:24
  • SPSSでRを作りました -- okinawa 2008-10-15 (水) 11:34:31

RjpWiki開設5周年記念公開座談会

(2008-07-07 (月) 09:27:15)

RjpWiki開設5周年を記念して公開座談会を開催したいと思います。Rのバージョンアップ・日本語化対応、ユーザー会の開催、R初心者の増加やR本出版ラッシュ等々、なにかと忙しい5年間だったのではないかと思います。

  • まず、このwiki(とサーバ)を裏で支え続けてくださった岡田先生からお言葉を賜りたいと存じますが、いかがでしょうか? -- okinawa 2008-07-07 (月) 09:39:00
  • まず、5年間の間続けることができたのは、何よりも各ページに投稿いただいたりやQ&Aに質問・解答いただいた皆様のおかげです。本当にありがとうございます。5年前に比べると、Rはすでにデータを取り扱う人にとってOSのような基本的ソフトウェア環境として、本当によく認知されるようになってきたと実感しています。公表されないような、手元でとりあえず計算してみるのに、Rを使ってる、という人は、おそらくこのWikiを訪問されない方にもかなり多いのではないでしょうか。私自身は、何かと統計手法が敷居の高いブラックボックスとして扱われることが多い業界で仕事をしていますから、Rの普及によって統計手法自体への敷居が下がってくれるといいなと思っています。ライバルはExcelです:-) -- 岡田 2008-07-07 (月) 13:42:38
  • ありがとうございました。ひきつづき、Rの日本語化の最大の功労者でいらっしゃる、なかまさんお願いいたします。 -- okinawa 2008-07-07 (月) 14:57:45
  • 私は大きなミスを侵したようです. それはフリーソフトウェアが自由ソフトウェアであることをちゃんと伝えなかった事です. オープンソースは異なるイデオロギーですが, それは共存可能です. しかし, 無料ソフトウェアは別です. それは受動的で政治が悪いと言うわりには選挙に行かない(行っても無駄と煽る)人達を増やしているのに似ています. あまつさえ, 被選挙権を奪う行為に等しいです. ほんの少し前の統計ソフトウェアがどうだったか(Rも含めて)知らせてあげてください. たぶん考えねばならない事がある筈です. -- なかま 2008-07-07 (月) 19:50:25
  • もちろん, わたし的には「日本語でたー!」と言うささやかな自由でも大変満足しています. -- なかま 2008-07-07 (月) 19:52:20
  • それは、「Rを使う人は増えてるけど、パッケージを自作したり、細かいメンテのところまで踏み込める人は全く増えていない。本当の面白さはそこなのに〜(アムロレイ風)」ということなのでしょうか?それとも、「神様、仏様、なかまさま」と唱える人が多すぎて、「他力本願もいいかげんにしないか!(ブライトさん風)」ということなのでしょうか?(ベタですみません) -- okinawa 2008-07-08 (火) 08:42:32
  • いいえ, パッケージャーやメンテナーは結果の一部にすぎません. GPLと言うと共産主義みたいに言われますが(かなり狭義な視点で), むしろRは民主主義的であることをもっともうまく表現できるGPLのソフトウェアであると思います. あとは適当に考えてください.(笑) -- なかま 2008-07-08 (火) 10:01:26
  • ありがとうございました。あと、Rユーザー会の世話役を長年やられていた間瀬先生に薀蓄を聞かせていただければと思います。どうぞよろしくお願いいたします。 -- okinawa 2008-07-08 (火) 13:38:48
  • 間瀬先生に連絡がつきませんので、これで一旦終わらせていただきます。岡田先生、なかまさんありがとうございました。 -- okinawa 2008-07-14 (月) 09:09:38

九天社ホームページより

(2008-06-12 (木) 00:49:01)

************
九天社は2008年06月10日に営業を停止しました。
************
このページは、元サイト管理者の判断により一時的にサーバーを移転して公開しています。書籍のデータのダウンロード等、必要な方はなるべくお早めにダウンロードしてください。


Rプログラミング&グラフィックス
[著]高階知巳 [価格]3,990 円(税込)


Rで学ぶデータマイニングII シミュレーションの視点から
[著]熊谷悦生、舟尾暢男 [価格]3,990 円(税込)


R Commander ハンドブック
[著]舟尾暢男 [価格]3,360 円(税込)


Rで学ぶデータマイニング I データ解析の視点から
[著]熊谷悦生、舟尾暢男 [価格]3,780 円(税込)


The R Tips データ解析環境 R の基本技・グラフィックス活用集
[著]舟尾 暢男 [価格]3,675 円(税込)


The R Book データ解析環境「R」の活用事例集
[著]岡田 昌史 [価格]3,990 円(税込)


  • http://www.9-ten.co.jp/ が更新されていました. それによると「平成20年6月10日付で東京地方裁判所民事20部に対し自己破産申立を行い、同日付で受理されました。」との事で, 管財人は選定中との事. 驚くべきは, この頁にはちゃんと, google-analyticsが入ってると言う... -- なかま 2008-06-13 (金) 12:38:03

BRugsのマニュアルをゆずってください

BRugsはどこへ行った?? (2008-06-07 (土) 08:27:02)

豊田先生の本を購入し、BRugsをいじって遊んでみようかと思っていたところBrugsのパッケージがCRANから取り除かれていました。私自身、BRugs自体はインストールしてあるのですがPDFのマニュアルを持っておりません。参照したいことがありますので、どなたかマニュアルをゆずっていただけないでしょうか。お願いします。


Rと民族愛

one of R users? (2008-05-25 (日) 01:40:02)

R本体の組み込みデータセット中の volcano は filled.contour() 関数の例としてRユーザーにはお馴染みですが、火山名 Maunga Whau を久しくハワイのマウナロア(Mauna Loa)火山のことと思い込んでいました(そんな粗忽者は私だけ?)。今回ヘルプ文章をじっくり眺めていてとんでもない勘違いと気づきました。これはニュージーランドのオークランド火山帯(50あまりの火山があるのだそうです)の中の(死?)火山のイーデン山(Mt. Eden)のことだそうです。Eden とはニュージーランドがイギリス植民地になった時の初代統治者オークランド伯爵の名前だそうです。一方 Maunga Whau とはこの山のマオリ族名で Whau tree の山という意味だそうです。地形図からこのデータセットを作ったのは Ross Ihaka 氏で、ご存知のようにマオリ族出身で、そのことを誇りに思っている人物です。このデータセットの解説には Mt. Eden という言葉は一切ありません。つまり彼の強い民族意識が背景にある(?)。~


参考:Maunga Whau。ちなみに whau tree とはマオリ族がその苦い葉をお茶代わりにしていた木なんだそうです。

  • てっきりハワイのと思っておりました。NZいきないなぁ。 -- 地理学齧っていた? 2008-05-25 (日) 10:46:14

GARCHオプション価格をRで求めるには?

田中? (2008-05-23 (金) 20:41:51)

RでDuanによる局所リスク中立によるオプション価格をもとめるサンプルプログラムを知っている方などいらしゃいますでしょうか。ぜひとも教えていただけませんでしょうか。

  • ここは,質問をするところではない。上に,「RjpWiki自体へのコメントでも、R に関連する雑談でもOKな掲示板です」って書いてあるでしょう? -- 2008-05-24 (土) 09:28:02
  • ここは、雑談等の掲示板であって、回答を期待する質問をする場所ではないようですよ.Q&Aで質問してみてはどうでしょうか?(と、コメントしたほうが、質問者だけでなく、これを見た人も、こわがらなくなる?なによりこれ見たただの閲覧者の自分が正直どきどきしましたが・・・こわいですよ・・・?) -- 別の人? 2008-06-06 (金) 16:47:30

RとFDA関連の情報求む

okinawa (2008-04-22 (火) 14:43:22)

仕事柄、FDA(アメリカ食品医薬品局)への薬の申請にかかわる資料を集めております。RとFDAの関係については、いくつかの資料を発見することができたのですが、もっと集めたいと思っております。また、それと関連して日本では薬の申請がどうなっているのかご存知の方がいらっしゃいましたら、教えていただけませんでしょうか?
ちなみに、FDA内部ではすでにRが使われており、2007年からはオフィシャルに利用されるようになったようです。
以前、トップページのコメントに出ていたRStatも、どうやらこの流れで発生したもののようですね。


R以外でベクトル演算ができる言語

okinawa (2008-03-17 (月) 18:56:45)

皆さんに相談があります。R以外のプログラム言語でベクトル演算ができる言語にはどのようなものがありますか。ご存知の方は、教えていただけませんでしょうか。(言語にはあまり明るくないので・・・)

  • 使ったことはありませんが、統計システムに限れば Ox、それと商用統計システムである Gauss もベクトル演算が基本と聞いたことがあります。 -- 2008-03-17 (月) 21:05:17
  • Octaveもできます。商用のMatlabも。OctaveはRと連携するパッケージがあるようですね。 -- 2008-03-17 (月) 21:09:59
  • SPSS, SAS もサポートしているのでは? -- 2008-03-17 (月) 23:03:10
  • Fortran(FORTRANじゃないほう) -- なかま 2008-03-18 (火) 00:34:53
  • 「R 以外」というのであれば S-plus :-) -- 2008-03-18 (火) 07:08:25
  • 最近のFortranって進化してるんですね。びっくり! -- okinawa 2008-03-18 (火) 09:06:57
  • APLを忘れないで! -- surg? 2008-03-18 (火) 09:18:47
  • Unicodeのサポートをもうちょっと真面目にすると, Miscellaneous Technical に含まれる文字を遜色無く使えるようになって, APL風の... -- なかま 2008-03-18 (火) 14:26:43
  • J言語はどうだ! -- 2008-03-28 (金) 23:06:19

Ra システム & jit (Just in time compiler)

(2008-03-08 (土) 12:30:02)

パッケージ jit。少し気になる、Tierney 氏の R byte compiler みたいなもの? R をこの機能用に拡張したという Raシステムの元で動くそうだ。

 
The Ra Extension to R
Ra is functionally identical to R but provides just-in-time  
compilation of loops and arithmetic expressions in loops. This usually  
makes Ra arithmetic much faster than R. Ra will also typically run 
faster than standard R even when just-in-time compilation is not enabled.
An example

   jit(1)                     # turn on just-in-time compilation
   for(i in 1:na)             # example convolution code 
     for(j in 1:nb)
       ab[i + j] <- ab[i + j] + a[i] * b[j]

With na and nb bigger than about 100, the loop runs about 30 times 
faster. With na and nb equal to 10, the loop runs about 10 times 
faster. See here for timing details.
 
The R code is compiled to byte code which is executed internally by 
an interpreter in C.
  • 面白い取り組み方法ですね。RaってR advance って感じでしょうか。jitがどれくらい効くのか色々試してみようと思います。(日本語RでもRaはそのまま動いています) -- okinawa 2008-03-09 (日) 11:11:59
  • Rコード最適化のコツと実例集の最初にある説明用コードで試してみました。(MacBookCore2Duo2G,VMWareFusion?&Win2000) 結果:純正R2.6.2=5.58sec Ra(R2.6.2)=0.58sec 純正R2.6.2(ベクトル化)=0.22sec Ra(R2.6.2)(ベクトル化)=0.18sec でベクトル化しても高速化されるようです。plotなどの描画関係の関数は利用できないようで、jitを停止「 jit(0) 」にしたあとplotさせるときちんと動きます。 -- okinawa 2008-03-09 (日) 15:35:40
  • 早速の使用報告ありがとうございます。こうした取り組みが将来的にR本体に取り込まれれば良いですね。 -- ものぐさな元記事投稿者? 2008-03-09 (日) 19:05:28
  • 使ってみて、私もそう思いました。(^_^) -- okinawa 2008-03-10 (月) 08:23:21

数学ソフトウェアとフリードキュメント VI

hamada? (2008-02-22 (金) 18:15:53)

3月22日に近畿大学でワークショップ「数学ソフトウェアとフリードキュメントVI」を開催します。
今回は、Mathematica6 の新機能に関する講演や、偏微分方程式境界値問題解析ツール FreeFem?++ 等についての講演を予定しております。皆様のお越しをお待ちしております。


「空間回帰分析による地価の予想」

風と落ち葉...? (2008-02-15 (金) 17:36:09)

地理情報システム学会 土地利用・地価GIS分科会
日時 平成20年2月29日(金)PM4:00〜6:00 受付開始PM3:30

場所 大阪NPOセンター 3階  会議室Fhttp://www016.upp.so-net.ne.jp/PtRights_Kansai/Osaka_NPO_Plaza.htm

予定ですが「R言語のGWRコマンド利用方法」が発表されるようです。
spgwr かな?それとも...

詳細は↓
http://www.gissoken.org/semina.html

  • 「R言語のGWRコマンド利用方法」とあるが正しくは、「GWR」関連パッケージの利用方法では? -- 2008-02-28 (木) 16:26:09

レーダーチャートを描く関数

中澤? (2008-02-13 (水) 16:04:01)

Rではstars()でレーダーチャートを描けますが,Excel風の(というか,通常イメージする)ものとは随分見栄えが違っていました。Excel風のレーダーチャートを描く関数を探したのですが見つからなかったので作ってみました。
http://phi.med.gunma-u.ac.jp/swtips/radarchart.R
においてありますので,同じ悩みをお持ちの方にお試しいただければと思い,勝手ながら紹介させていただきます。

  • ありがとうございます、さっそく試させていただきました。これは使えますね!1行目が全ての変数についての最大値を持っていないとはみ出てしまうようですので、for文の直前に max.vec <- apply(df, 2, max, na.rm=TRUE) として、scaleを計算する部分で scale <- df[i,]/max.vec としてみました。あとは欠損値をうまく扱えると嬉しいですが、ゼロでも代入してお茶を濁しています(polygonの使い方がよくわかっていないので…)。 -- 鈴木@ef-prime? 2008-02-13 (水) 19:45:03
  • 試用いただき,ありがとうございます,鈴木さん。説明不足でしたが,データフレームの1行目は,データではなく,チャートの一番外側の枠を決めるための値を入れるという仕様にしたのです。データの最大値を使うというコードも考えたのですが,軸の最大値はデータとは別に明示的に指定する方が実際の使用では多いと思いまして……。別の引数にすることも考えましたが,引数が多くなるのも嫌だったので,苦肉の策です。 -- 中澤? 2008-02-13 (水) 21:15:12
  • 中澤先生、ご回答ありがとうございます。なるほど、そういう意図だったのですね。「何も考えずにデータを放り込む」使い方をしてしまいがちですので、デフォルトでは軸が自動的に決まると嬉しいです。気が向いたら少しいじってみます! -- 鈴木@ef-prime? 2008-02-14 (木) 13:24:01
  • 時々リンクを辿って来られる方がいらっしゃいますが,ここからリンクされている関数はドキュメントもなく古いものです。多少仕様を変えて欠損値処理も改善したバージョンをfmsbパッケージに入れてあります。 -- 中澤? 2011-05-15 (日) 09:58:17

※未承認広告※ useR!2008

なかま (2008-02-04 (月) 19:59:31)

みなさま, useR!2008の宣伝です.(汗
みなさまの会社や研究室にPoster等張ってもらえるとうれしいです.
私で出来ることでしたら, なんなりと御申しつけ下さい.
abstractの登録と初期登録の〆切は3/末です.
以下,組織委員会からのメールです.

Dear useR! 2008 program committee members,
 
online registration and abstract submission are finally available
from the conference Web page at and we can start motivating useRs
to participate or (even better) give a presentation at the
conference.

 useR! 2008
 August 12-14, 2008
 Technische Universitaet Dortmund
 http://www.R-project.org/useR-2008/

As members of the PC, I would like to ask you to advertise the
conference: at your university, in your community/ies, on the
SIG (special interest group) mailing lists (if available), at
conferences and workshops etc. Also encourage useRs to present
their packages or applications at the conference.

If you want to organize a session focused on your area of
interest, we will try our best to provide a suitable platform
for that. Just ask the prospective participants of the session
to submit their abstracts as usual via the Web site. We will
organize the abstracts into sessions after the submission deadline
and you can simply indicate wich abstracts you have solicited
for your session. The deadline for submission (and early
registration) is

 Submission deadline: 2008-03-31

Some additional advertising material such as
 o a call for papers,
 o a poster (with your name on it :-)) that you can put
   up on your office door or within your department,
 o a flyer (two on one A4 page) that you can take to
   conferences/workshops you are attending,
 o the logo as a .png (in different resolutions) that you can
   use for hyperlinks on your homepage,
is available from the conference web page at
 http://www.R-project.org/useR-2008/

Thanks to all of you for your help in organizing this event.
If you have any questions, ideas, recommendations, don't hesitate to
contact us!

For the organizing committee,
Achim
  • なかまさん、お疲れさまです。R AnalyticFlow?の紹介を用意して参加させていただきたいと思い、検討中です。ちょうど繁忙期と重なるのが悩みどころです…。 -- 鈴木@ef-prime? 2008-02-06 (水) 16:46:57
  • ありがとうございます. 是非ご参加ください. -- なかま 2008-02-06 (水) 18:55:45
  • 参加登録しました!よろしくお願いいたします。 -- 鈴木@ef-prime? 2008-03-28 (金) 21:19:51
  • たいへん多数の登録ありがとうございました! -- なかま 2008-04-20 (日) 19:20:18

VineLinux用のRパッケージ

谷村 (2008-01-17 (木) 21:49:05)

皆さんに、相談があります。
CRANで配布されているVineLinux用のrpmパッケージの更新が、私の異動など諸事情によりR 2.4.1で止まっております(VinePlus?の方には別な方が2.6.0に更新してくれています)。先ほど、Rプロジェクトな方からメールをいただきまして、any chance for an update\?と尋ねられました。VineLinuxの現状と想像されるニーズを考えますと、CRANからVineLinuxのディレクトリを削除してもらってもよいのではと愚考いたします。
日本発のLinuxディストリビューションのディレクトリが削除されるのは、残念なことではありますが、もう潮時かと思います。
Vine用のrpmパッケージを作り続けて欲しいという方はいらっしゃいますか?
VinePlus?にあれば、CRANには不要とも思いますが、いかがでしょうか?
ご意見をお願いします。

  • 他のボランティアがいればともかく,メインになる方ができないならしかたないし,それ以外の対処はどうしようもない。誰か引き継いでくれますかというオファーならまだしも,どうとも答えようがないのでは?ボランティアでやっているのだから,これ以上は無理,誰か引き継いでくれないならこれでお仕舞い,ということの表明をすることすらまれなこと。いつの間にかうやむやというのが,この世界の常ではないですか。それを,だれも非難はしませんよ。非難する人は,引き継げばよい。非難する人も,引き継ぐ人もいないなら,それはそのようなことということに過ぎないのでしょう。~ -- 2008-01-17 (木) 23:09:30
  • ありがとうございます。では、VineLinux用のRパッケージングを引き継ぐ人はいませんか?という質問に変更したいと思います。もし、引き継ぐ人が現れなければVineLinuxのバイナリパッケージをCRANからはずしてもらうようにRプロジェクトに依頼します。 -- 谷村 2008-01-18 (金) 13:11:49
  • お疲れさまでした. 私は日本語化当初Vineを使っていましたが, 今では国際化の関係でdebianに移行してしまい, Vineは全く使っていません. 後任が見付かると良いですね. (R以外にも鬼のようにVinePlus?にパッケージが入ってたような...本当に見付かると良いですね) -- なかま 2008-01-18 (金) 17:55:18

Rマルチリンガル化

なかま (2008-01-12 (土) 16:30:33)

先頃, R教授より赤紙が参りまして戦地に赴いて参りました.
Winコンソール方面にてUnicode上陸作戦が行われましたが, 局地戦に終始してしまい, 戦況の大開を図るに至らず一時撤退しました.
現在, RegisterClass? はANSIのままですので, さほど困らない状況ですが, いぜれにせよサロゲートペア方面の問題もあるのでgraphappのUnicode化は持久戦になると思います.
現在, ローケル方面の局地的戦闘を挑みましたが, 戦線が何故か広大な範囲に延びきってしまい
いよいよ収集がつかなくなってしまいました...
これまでは, 9x式M$のおかげ(良くも悪くも)でこの作戦議論は棚上げでしたが, 2008年度より,
9x式M$は退役し00式以降のM$のみとなります.
閑話休題...
最新のR-develはRguiのコンソールが一部Unicode化されています.
目的としては、例えば日本語Windowsなのにウムラウトが書きたいとか
そういうのが出来るようにしたいと言うことです.(現状ではまだです)
R教授はUCS2ですすめて行くと言ってますが, それだと困るとか, そんなら
私がやります!とか. 意見などございましたらお願いします.

ついでに, IMEのキャレットを直したので, ATOKでも大丈夫かどなたか試して
頂けると幸いです.
最新のR-devel for win はこことかダウンロード可能です.

  • どうしよう(独り言...) -- なかま 2008-04-02 (水) 10:48:06
  • うーん、ちゃんと動くと思うんだけど...(T_T? -- なかま 2008-04-11 (金) 23:48:05
  • 多少の虫は無視してね. -- なかま 2008-04-14 (月) 23:10:39

Rユーザー会2007発表スライド

okinawa (2007-12-10 (月) 16:43:58)

下記のURLにて発表スライドを随時公開してゆくとのことです。
http://jasp.ism.ac.jp/meetings/R2007/

  • 足を骨折してしまい、参加できませんでした。ありがとうございます。 -- akira? 2007-12-10 (月) 19:41:47
  • 皆様どうもありがとうございました。講演資料+写真を http://www.ef-prime.com ページ下のNEWSに公開しております。統数研サイトのほうにも載せていただけるよう手配をお願いしておきます。 -- 鈴木@ef-prime? 2007-12-11 (火) 20:23:57

Rユーザー会終了

okinawa (2007-12-09 (日) 12:26:41)

Rユーザー会が盛況のうちに終了しました。(関係者の皆様本当にご苦労様でした)。今回は、前回よりも実用的かつ深い内容のものばかりで、更にレベルアップしていたように感じました。個人的には、NTT西日本のRグリッドが興味を引かれましたが、時間が無かったのか、プレゼンがXXで今ひとつ良くわからなかったです。可能ならばRjpwikiで詳しく説明してほしいですね。

  • 行きたかったのですが、なにかと忙しくて、PPT等公開お願いします -- Thara? 2007-12-09 (日) 14:46:37
  • NTT西日本光グリッド。会員登録された家庭等のパソコンの遊休能力を対価を支払い使うようですね。個人的に伺ったところ一台あたり月一万円で使い放題という説明でした。大組織なら出せないことはないかもしれないですね。 -- 間瀬茂 2007-12-09 (日) 15:19:14
  • 間瀬先生ありがとうございました。ひかりグリッドは「リソース提供者には約1000円/月」ってお金をいただけるようですね。やってみようかな・・・(もちろんリソース提供の方)。 -- okinawa 2007-12-09 (日) 15:57:35
  • 集会冒頭で「Rシステムの限界」ということに一寸触れましたが、具体的には大規模データ処理、処理速度の二点でしょうか。通常の処理にはほとんど関係ないですが、Rが「統計システムの共通基盤」となりつつある以上避けては通れない問題かと感じています。前者に関しては、とりあえずSASが得意らしいメモリーと外部記憶媒体との間のシームレスな連携機能でしょうか。牧山さんの講演がそうした方向にも関連するのか聞きそびれましたが。後者に関してはグリッドシステムによる並列処理が、ハード・ソフトの両面で一般ユーザーに特段の知識なし(できれば過大な追加投資なしに)に利用できるような機構の整備でしょうか。ついでながら、最近「貧乏人のグリッドコンピューティング」なるものができないか考えています。今やネットにつながったパソコンが回りにあふれている時勢ですから、ダイレクトにつながっていなくても、分割処理した結果ファイルをネット越しに(Rのsystem関数経由で rcp 等のファイル転送ソフトで)送れば、結果としては擬似グリッドコンピューティングが実行できるようになるのではないでしょうか。実験してみたいのですが、問題は DHCP 接続ではパソコンのIPアドレスが固定していないこと。現在の接続のIPアドレスをソフトで確認することはできますが、IPアドレスだけを使ってファイルを転送する方法がわからない。どなたかご存知なら教えてください。 -- 間瀬茂 2007-12-09 (日) 16:59:46
  • 私の講演はいわゆる「大規模データ処理」とはちょっと違いますが、「大規模データ転送・格納」ではあります。Rが大規模データ処理と高速な処理速度の2つを実現するには、7日の講演にもありましたがRの実行プロセスを複数の並列スレッドに分割し、かつプロセスごとにメモリキャッシュと永続化がシームレスに行えるようになることだと思います。(並列実行はR2.7? 2.8?かと言われてたような)あと、先生のおっしゃっているような仕組みは「VPNソフト」を使うと実現できるような気がします。 -- okinawa 2007-12-09 (日) 20:46:18
  • Rユーザー会の関係者の皆様,本当にお疲れ様でした.相変わらず私の発表は早口で,何を言っているのか分らない方が多数おられたかと思いますので^^; 私の発表スライドを ここ にアップしております.よろしければご覧ください.
    もし、引き続き発表させていただけることが出来ましたら、次回は「Rのレポーティング機能について・グラフや要約表を1つのドキュメントにまとめる方法」についてお話させていただこうかと考えております(SASユーザーからこのあたりのクレームをいただいておりますので^^; )。 -- 舟尾? 2007-12-10 (月) 00:38:26
  • 統計数理研究所の方で今回のRユーザー会のスライドを集めて公開していただけるのですが、とりあえず私のものはCache'とRにおいておきます。 -- okinawa 2007-12-10 (月) 09:18:56
  • ついでながらNTT西日本の方がデモ用に使われたプログラムは大変良いものでした。というのは、効率的なRコードの鉄則(ベクトル化)を無視した素朴なコードだったからです。あれでは余計な時間がかかるから並列処理しないと間に合いません(笑)。教訓:貧乏人は知恵を、金持ちは金を使え。 -- 間瀬茂 2007-12-10 (月) 20:21:04
    ## 円周率を矩形 [0,1]^2 に落とした無作為な点が単位円に入る割合から求める 
    > system.time(x <- 4*mean(runif(1e7)^2+runif(1e7)^2 <= 1))
    [1]  1.652  1.796 23.575  0.000  0.000
    ## デモ用のコードは長ったらしかったが要するに
    > system.time({n <- 0; for(i in 1:1e7) n <- n+(runif(1)^2+runif(1)^2 <= 1); x <-  4*n/1e7})
    [1]  97.639   0.124 100.253   0.000   0.000
  • ひかりグリッドの性能と、デモの良し悪しは切り離して考えた方がいいですね。デモをした人はNTT西日本から委託された業者じゃないでしょうか。普通、自分の会社を『さん』付けで呼んだりしないでしょう。 -- 2007-12-11 (火) 09:14:12
  • 初歩的な質問なのですが、データを分割処理して最後に合算して結果を出すような統計手法ってどのようなものがありますか?私の知っている多変量解析の手法だと、データをいっぺんに食わせるものばっかりのような気がします。 -- okinawa 2007-12-11 (火) 09:43:04
  • VPNソフトのこと少し知らべました。フリーのものもあるようですが、セキュリティ面で危ないことがあるらしく、素人には手を出せないと感じました。最近大学では団体からの訴訟を恐れP2P風ソフト等の使用に神経を尖らせています。Ubuntuにはファイルダウンロード用のbittorentというソフトが既定で入っていますが、これも駄目ということで、慌てて消しました。自宅で試しに使ってみたら確かにダウンロード時間が目覚しく短縮されました(笑)。知らないまに使っている可能性もありますから、学校や職場では注意してください。 -- 間瀬茂 2007-12-11 (火) 21:55:19
  • 大学等のネットワーク管理者から見れば、ウイニーもbittorentもVPNソフトも同じなのでしょうね。まあ、どれを利用してても所詮ポートに穴をあけるのでセキュリティは下がりますよね。でも要は接続する技術の問題というより、接続したネットワークに乗って媒介されるウイルスやスパイウエアが本当は危険なので、頭が痛い問題です。ネットワークの機能とセキュリティはバーターですね。そこでNTT西日本が!という話なのでしょう。 -- okinawa 2007-12-12 (水) 09:25:30
  • 固定IPじゃないという問題はDynamicDNSを使えば解決できるでしょう。ただ、いずれにしろ外部との接続を行う行為は大なり小なりセキュリティホールとなりうるのですが。 -- aki 2007-12-13 (木) 12:46:15
  • 並列処理できそうな問題としては、たとえばモデル選択などが考えられます。各モデルを当てはめて最尤推定するところはそれぞれ独立に(通信無しに)計算可能でしょう。 -- aki 2007-12-13 (木) 12:48:52
  • bootstrap、jackknife、permutationなどrandomization関連もレプリケート間に依存性が無いのでノード数に応じてリニアに近い高速化がきたいできるのでは。 -- aki 2007-12-13 (木) 12:52:22
  • snowパッケージにはapply系関数を並列化したものが実装されていますので、apply系でいけるものは全てほぼリニアに高速化できます。私のpvclustパッケージでもこれを利用して、bootstrap部分の計算を並列化する関数を実装しています。通信のコストをうまく減らすことで、マシンが10倍になれば9倍くらいの速度は出せるようになっています。 -- 鈴木@ef-prime? 2007-12-13 (木) 19:35:22

Rユーザー会のプログラム(最終)

間瀬茂 (2007-10-27 (土) 16:00:36)

間瀬です.統計数理研究所の共同研究集会(通称Rユーザー会)のプログラムが概略決まりましたので、参考までにおしらせします.参加は三日間ともどなたも自由です.場所は昨年と同様統計数理研究所の大講堂です。なお、土曜日は研究所の鉄柵が閉まっておりますので,鉄柵の通用口からお入りください。

-----------------------------
7 December 2007
10:30 - 11:30  Simple Parallel Statistical Computing in R by Luke Tierney
11:45 - 13:30  Lunch
13:30 - 14:30  R Behind the Scenes: Using S the (un)usual Way 
        by Friedrich Leisch
14:45 - 15:45  Code Analysis and Parallelizing Vector Operations in R 
        by Luke Tierney
16:00 - 17:00  Flexible Implementations of Cluster Analysis and Mixture 
        by Friedrich Leisch
18:00 -        Dinner
Each talk has one hour length and followed by about 10 minutesdiscussion.
------------------------------------
12.8 
 9:40--10:30 牧山文彦(データキューブ)「R+M=?−Rとオブジェクトデータベースの
                                       新次元−」
10:30--11:20 樋口千洋(大日本住友製薬)「Bioconductorの概要とその利用方法」
11:20--12:10 鈴木了太(ef-prime)「ビジネスデータ分析の現場から」
12:10--13:20 昼休み
13:20--14:10 舟尾暢男(武田薬品工業)
            「今日からあなたも統計ソフト開発者!
             〜 R Commander の概要,改造,数式処理機能の実装例 〜」
14:10--15:00 石田基広(徳島大学総合科学部)「Rと自然言語研究」
15:00--15:20 休憩
15:20--16:10 谷村晋(立命館アジア太平洋大学)「疫学におけるRの活用」
16:10--16:50 小笠原理(遺伝研DDBJ)「R Graphical Manualのつかいかた」
16:50--17:20 山本寛(NTT西日本),福崎昭伸(NTT西日本),中野純司(統計数理研究所)
            「グリッドコンピューティングとR」

なお6日に関連して次の講演が予定されていますので、併せておしらせします.

6 December 2007
13:30 - 14:30  Finite Mixtures of Generalized Linear Regression Models   
                by Friedrich Leisch
14:45 - 15:45  MRI Tissue Classification Using Bayesian Hidden Markov Normal Mixture Models 
                by Luke Tierney

  • あと一週間ですね。皆様の講演を楽しみにしております。 -- 鈴木@ef-prime? 2007-11-30 (金) 21:44:34
  • 私の講演では、弊社で開発中のRユーザーインターフェースをご紹介させていただく予定です。行動計量学会でお見せしたものから劇的にパワーアップしておりますので、どうぞご期待ください! -- 鈴木@ef-prime? 2007-11-30 (金) 21:50:43
  • 鈴木さん楽しみにしてます。ちなみに私の講演は、RとオブジェクトデータベースCache'の連携ソリューションの話です。RからCache'へダイレクト接続する自作パッケージも紹介します。(もちろんGPLで公開します)SQLデータベースが使いづらくてお悩みの方は面白いかも。 -- okinawa 2007-12-01 (土) 12:02:13

R Graphical Manuals Web API

小笠原? (2007-10-10 (水) 13:27:59)

r-helpにメールを出したら早速「web APIは無いのか?」という返事だったので、作ってみました。詳しくは http://cged.genes.nig.ac.jp/RGM2/webAPI.php をご参照ください。

  • てゆうか、すごくない?これ。 -- okinawa 2007-10-10 (水) 14:32:15

R Graphical Manuals本サイト

小笠原? (2007-10-08 (月) 09:48:28)

R Graphical Manualsは http://cged.genes.nig.ac.jp/RGM2/index.php を本サイトとすることにしました。昔のURLをブックマークしてくださってるかたは、お手数ですが、ブックマークの変更をお願いします。


ビデオアーカイブ「計算による数理科学の展開」

hamada? (2007-10-03 (水) 16:47:30)

先日、東北大学で行われたワークショップ「数学ソフトウェアとフリードキュメント V」の講演ビデオが神戸大学「計算による数理科学の展開」プロジェクトから公開されました。間瀬先生による R に関する講演ビデオも含まれていますので、よろしければ御覧ください。

http://www.math.kobe-u.ac.jp/cm/

からビデオアーカイブへ進むと一覧が表示されます。


変数名の無造作な生産

なかま (2007-10-02 (火) 14:33:19)

関数のテスト等を行うときに, 色んなデータを造り, 変数名をhoge.1,hoge.2 等ととりあえず作りながら, どんな変数名にしたかls()等で確認して, 「さっきは13まで作った」と言う方もいらっしゃるかも(私だけか?)しれません.
そこで, この枝番とも言うかを自動で生成してくれればと思い立って, 以下のような物を作りました.

`:=` <- function (x, value)
{
    penv<-as.environment(-1)
    pat<-paste("^",deparse(substitute(x)), sep="")
    patnames<-ls(pat=pat,envir=penv)
    oldname<-make.names(patnames,unique=T)
    newname<-make.names(c(patnames,deparse(substitute(x))),unique=T)
    addname<-newname[!newname%in%oldname]
    assign(addname, value, envir = penv)
    comment(penv[[addname]])<-deparse(substitute(value))
    addname
}


これによって, 例えば,

   num   <- 1:1000
   num.1 <- 1:10000
   num.2 <- 1:20000


   num   := 1:1000
   num  := 1:10000
   num  := 1:20000

と, することにより, num,num.1,num.2 の名前が自動的に付けられます.
キー操作が格段に減ります.
式もコメントに保存して,

   comment(num.2)

なにやら, 「おおっ!」と言う感じです.
そして, 私は気持ち良く, データをデータ名を気にすること無く作り始めました.
やがて, 大きなミスを侵していることに気づきます.

TEST <- rnorm(1000, sd=30)

全ては水泡と消えました....とさ.(;_;)


R Graphical Manuals テストサイト

小笠原? (2007-10-01 (月) 15:45:51)

長らく更新していなかった(ので死んでいるのかと思われていたかもしれない)R Graphical Manualsですが、新しいインタフェイスを http://cged.genes.nig.ac.jp/RGM2/index.php にてテスト中です。本サイトに反映されるのはもう少しかかりそうですが、不具合報告、御意見御感想など教えていただけると幸いです。cran task viewのお題にも挑戦してますが...どうでしょう。

  • す、す、すごーい! -- okinawa 2007-10-01 (月) 15:51:16
  • 拝見していて思ったのですが、CRAN Task View以外にCRAN Graph Viewが○○な気がしました(^_^; ○○は言い出しっぺの法則が適用されると恐いので臥せておきます... -- なかま 2007-10-02 (火) 13:45:14
  • 私も○○と思います(笑)。 -- 小笠原? 2007-10-02 (火) 18:58:13
  • 私も○○と思います(笑)。 -- 小笠原? 2007-10-02 (火) 19:48:51
  • すみません。何か間違って2回入力されてしまいました。 -- 小笠原? 2007-10-02 (火) 20:37:59

R パッケージ開発のための R-Forge

偶然 R-Forge というウェッブサイトを見付けました.R パッケージ開発プロジェクト用のサイトらしいです.~ (2007-08-18 (土) 07:47:41)

RForge strives to provide a colaborative environment for R package developers. 
The ultimate goal is to offer SourceForge-like services (such as SVN repository, 
place for documentation, downloads, mailing lists, bugzilla, wiki etc.) with 
additional features specific to R package development, such as make check 
on-commit, nighlty builds of packages, testing on various plarforms and full 
CRAN-like reposity access. The focus is on R-specific features that are not 
offered by SourceForge or GForge.

Currently the RForge contains over a dozen R packages (and other  
projects) with public and developer SVN access. Snapshot source 
packages are created upon commit and become available from the 
repository right away. Also make check is run automatically and 
documentation is generated. See RForge Documentation page for details.

今年度の統計数理研究所のR集会について

間瀬茂 (2007-08-17 (金) 23:19:28)

間瀬です.統計数理研究所の中野先生から今年度のR集会を12月7,8日(金、土)開催に確定したいとのご連絡がありましたのでおしらせします.今回の外国からのお客さんはRコアチームのLuke Tierny (LispStat?、R Byte compiler 作者)と Friedrich Leisch さんだそうです.8日(おそらく)の日本語集会の出し物について自選、他薦よろしくお願いします.


秋の数学会に関連した講演会のお知らせ

間瀬茂 (2007-08-17 (金) 11:22:31)

間瀬です。数学会の直前に「数学ソフトウェアとフリードキュメント」という集会が毎年開催されています。趣旨は数学研究に役立つ各種ソフトウェアを紹介するということのようで、今回で5回目になります。自作ソフトウェアの紹介講演が主なようですが、今回主催者の福岡大学の濱田さん(Knoppix/Math プロジェクトの中心人物です)からのご依頼で一時間のR紹介講演を引き受けました。Rは既に統計ユーザにはかなり認知を受けていると思いますが、非統計ユーザー、特に数学者における認知度は低いのではと思います。これはもったいないと日頃感じていましたので、海外出張直前で日程的に厳しかったのですが、講演をお引き受けしました。聴衆は非統計ユーザという前提で話すつもりですので、RjpWikiの関係者にはお役に立たない(さらに昨年度のRユーザー会の講演の焼き直しです)と思いますが、周囲の非統計ユーザでご関心を持ちそうな方がいらっしゃいましたら、ご周知願えれば幸いです。以下講演会情報:

9月20日(木)午後(数学会の会期は9/21-24)
数学ソフトウェアとフリードキュメントV


2007年度日本OSS貢献者賞の推薦

okinawa (2007-08-12 (日) 13:19:27)

2007年度日本OSS貢献者賞の推薦が開始されていますが、Rで出しませんか?すばらしい貢献をされている方が大勢いらっしゃいますので。http://www.ipa.go.jp/software/open/ossc/2007/contribute/ossaward2007.html


「Rプログラミングマニュアル」、御報告とお願いの件

間瀬茂 (2007-08-08 (水) 10:41:22)

先日他の頁で一寸ほのめかした「Rプログラミングマニュアル」の原稿を昨日出版社(数理工学社)に提出しました。予定通りなら10月に刊行予定です。こうしたことがらは、刊行後に誰か気づいた人がタレコミするのが奥ゆかしいやりかたですが、敢えて刊行前に著者自ら案内するという「はしたない」ことをするのは事情があります。この本は以下のような章建てで、計算機言語としてのRの機能(だけ)を出来るだけ網羅的に紹介することを目標にしています。各章末(最終章)には章題に関連したTipsを紹介しています。このTipsは、Rユーザが実際にRを使用した際に出会った困難を紹介するという趣旨から、RjpWikiの記事、特に Q&A コーナー、をおもな参考ソースにしています。質問された方、解答を寄せられた方双方(多くは匿名ですが、お名前のわかる方も含め一々引用はしておりません)に、勝手に引用(かつ一部編集)したことをご報告すると共に、ご了解をお願いしたいと思います。この意味でこのマニュアルは「The R Tips」と同様に RjpWiki の産物と言えます。勿論、参照結果の適切さ、正確さの責任はひとえに著者にあります。お詫びの印として印税の一部を R Foundation に寄付させて頂きたいと思います。なお、最初「初心者には一年早い」という副題を付けようと考えましたが、出版社が嫌な顔をすると思いましたので取り止めました。しかし、内容は初心者向きでは無く、ある程度 R を使いこなしている方を念頭においております。以上、よろしくお願いします。

 目次
    序
 1. 論理オブジェクトと論理演算
 2. 繰り返しと選択
 3. ベクトル
 4. 文字列とマッチング
 5. 行列
 6. 配列
 7. リスト
 8. データフレーム
 9. 因子
10. 関数
11. apply関数族
12. 作表関数
13. 数値関数
14. 日付、時間
15. 入出力
16. 環境
17. 言語オブジェクト
18. クラスとメソッド
19. Rの便利な関数とその他のTips集
20. Rコードの高速化のヒント
    文献
    索引
  • http://www.saiensu.co.jp/index.php?page=book_details&ISBN=ISBN978-4-901683-50-0&YEAR=2007 -- 2007-10-17 (水) 00:30:31
  • 11月みたいですね。 -- 2007-10-17 (水) 00:32:01
  • 豊田先生の本を購入し、BRugsをいじって遊んでみようかと思っていたらBRugsのパッケージがCRANから取り除かれていました。私自身はBRugs本体はインストールしてあるのですが、マニュアルのPDFを持っていません。どなたかゆずっていただけないでしょうか。 -- BRugsはどこへ行った?? 2008-06-07 (土) 08:22:06

Ryacas

(2007-08-05 (日) 14:19:03)

既に御存じの方もいらっしゃるかも知れませんが、Mathematica 風のフリーの計算機代数システム yacas を R から使うパッケージ Ryacas というのがあることを r-help 記事で知りました。多倍長精度演算や数式微積分等ができるようです.参考リンク:Ryacas.pdf,
もっと詳しい情報
ついでに見かけた Wikipedia 記事 統計パッケージの比較


sqldf

okinawa (2007-07-23 (月) 10:29:10)

どこかで、データフレームでSQLが使えたらいいなという書き込みを見た記憶があるのだが、今日更新パッケージをみていたら、それらしき物が出ていた。
R魔人の先生方には不要な代物のような気もするが、SQLも「それなりに」使えば役に立つので有難い。
ここまできたら、データフレームの永続化(DB化)もほしいところですが、どなたかご存じないですか?

  • ちょっとさがしたところ、SQLiteDFというのもありました。sqldfのほうはDBのセットアップなしでも使えるのがメリットですが、こちらは永続化もありそうな感じです。 -- 2007-07-23 (月) 16:57:13
  • おお!こんなものがあったのですね、検索不足でした。調べてみたところ、SQLiteってCのライブラリだったんですね。DBはファイルになると言うことらしいので、一応永続化できるようです。ということは、sqldfと組み合わせるとデータフレームを使ったリレーショナルデータベースが「とりあえず」作れるということなのだろうか?勉強してみます! -- okinawa 2007-07-23 (月) 17:19:23
  • データベースど素人な私は SQLite を重宝しております。今まではパッケージ「RSQLite」を使って…
    library(RSQLite)
    # create a SQLite instance and create one connection.
    m <- dbDriver("SQLite")
    con <- dbConnect(m, dbname = "test.db")
    data(USArrests)
    dbWriteTable(con, "USArrests", USArrests)
    などとしてデータフレームを保存しておりましたが、「sqldf」や「SQLiteDF」は知りませんでした!早速、試してみます^^。 -- 舟尾? 2007-07-23 (月) 17:55:26
  • 以前, Omegahatに S4DBMSInterface と言うのがあったような気がしたんですが, どうなったんでしょうね?. SQLiteはUTF-8もしくはLatin1しかサポートして無かった様に覚えているのですが, Windowsを御利用の方では不具合があるかも. -- なかま 2007-08-08 (水) 09:31:16

[r-help 記事より] Improved Windows Vista compatibility

(2007-07-12 (木) 09:18:11)

subject		[R] Improved Windows Vista compatibility	 
Duncan Murdoch and I have been working on Vista compatibility.

The first build of R-2.5.1-win32.exe was built with a version of the
installer that had some compatibility issues, and it has been rebuilt
under the latest version.  What now happens is that if you want to install
R in an adminstrative area you need to select 'Run as Administrator' when
running the installer: otherwise the default installation directory
offered will be in your user area (e.g. c:/Users/ripley/Documents).

The Tcl support files came with obsolete Winhelp 4 .hlp files that are not
readable under Vista, and .chm help has been added.  (As from the next
release .hlp will be dropped.)

Rtools.exe has also been rebuilt with newer versions of the tools that
work on Vista.  There is still a compiler path issue, and you need to add

c:\Rtools\MinGW\libexec\gcc\mingw\3.4.5

(or similar) to your path.  When that is done I have successfully built
and run R-patched and R-devel on 64-bit Vista.

Brian D. Ripley
  • "R-devel on 64-bit Vista"って??? -- 2007-07-13 (金) 14:21:43
  • R-patched は現在バージョン R 2.5 にパッチをあてたもの、R-devel は開発中の次期バージョン R 2.6 のことでしょう。 -- 2007-07-13 (金) 15:01:56
  • 情報ありがとうございます。いよいよ RもWIn64 時代到来ですか。 -- 2007-07-13 (金) 18:10:25
  • 64bitのWindows上で32bit版のRが動くようになったと言う意味ですよ. -- なかま 2007-07-16 (月) 19:29:25
  • なかまさん、情報ありがとうございます。R for Win64 はまだなんですね。MinGW for 64 bit がまだ出てないからかな。 -- 2007-07-17 (火) 10:13:52

STEMがオープンソースに

okinawa (2007-06-11 (月) 17:33:40)

STEM(Spatio-Temporal Epidemiological Modeler:時空間的疫学モデラー)」というソフトウェアで、IBMのアルマデン研究所(米国)、ハイファ研究所(イスラエル)、ワトソン研究所(米国)が共同で開発し、Eclipseコミュニティを統率するEclipse財団に寄贈され、EclipseOHF(Eclipse Open Healthcare Framework Project)を通じて提供されるそうです。
これどんなものか知っている方いらっしゃいますか?

  • 記事はこちら>ですね,試してみたいです -- 2007-06-12 (火) 00:07:41
  • RJava で使えるかな? -- 2007-07-13 (金) 19:26:19

ドイツ語版 R Wiki

(2007-06-07 (木) 22:11:30)

今日のパッケージ更新情報で気づきましたが、ドイツ語版 R Wiki があるようですね。やはり自国語で情報を得たいとのことでしょうか、共感。パッケージ wikibooks はこの Wiki の投稿内容をまとめたもののようです。


パッケージ timsac

(2007-06-03 (日) 06:21:01)

今日のパッケージ更新情報で気づきましたが、統計数理研究所で赤池氏を中心に開発された時系列解析用のフォートランライブラリ TIMSAC がRパッケージとして公開されているようですね。統計数理研究所の中野先生が R パッケージにして、研究所のウエッブサイトで密かに公開されていると聞いていましたが。

  • この密かに公開されている研究所のウエッブサイトって、wo ist da? -- 2007-07-13 (金) 20:18:46

r-help での問答

間瀬茂 (2007-06-02 (土) 20:24:23)

初心者:「行列の最大サイズは?」
中級者:「本来制限はない、メモリ量次第。」
上級者:「行列の内容にもよる。同じメモリでも整数ならより大きなサイズが可能」
Wizard:「いや制限はある。ベクトルとしての添字は最大整数 .Machine$integer.max = 2147483647 を越えることはできないから(例え、64bit機でも)。」
神様:「今どうすればその制限を無くせるか考慮中。」

もちろん神さまとはR教授です。

  • P.S. つまり現在可能な実数行列の最大サイズは16GB、ということです(笑)。 -- 2007-06-03 (日) 00:22:27

パッケージ inline

(2007-05-31 (木) 08:41:18)

inline (バージョン0.2.1)というパッケージはRコード中にC,C++コードを直接書き込めば、それを動的にR関数に変換してくれるようです。RからC,C++関数を呼び出す作業を簡単にしてくれるかもしれません。どうしても for ループが必要な状況では試してみては。


パッケージ R.huge

間瀬茂 (2007-05-24 (木) 20:43:53)

CRAN にある R.hugeと言うパッケージを試してみました。R の既定であるオブジェクトを全てメモリ上に置くという流儀は、巨大なオブジェクトを扱うことができず、不満を持つユーザーがしばしばいるようです。R.huge はオブジェクトの本体をファイルに置くことにより、巨大なベクトル、行列をRで処理することを可能にするようです。こうした巨大オブジェクトの処理はSASが得意らしいのですが、ある説明によれば、これはSASが作られた時代はメモリ量が限られていたため、外部記録装置に本体を置く処理が不可欠であったためだそうです。たしかに X <- runif(1e8) (0.75GB!)を苦もなく実行してくれました。日頃大きなオブジェクトを扱っている方は試してみたらいかがでしょうか。ただし、おそらく処理の遅さ(想像、未確認)に、やはり必要な部分だけ処理する事になりそうですが。

  • USB メモリーを使えば速くなるのではないでしょうか? -- 2007-05-24 (木) 22:31:00
  • そうそう!これから出てくるSSD(Solid State Drive:フラッシュメモリドライブ)あたりと組み合わせると、かなり使えそうな感じですね。間瀬先生はいつもいいものを見つけてきてくださる。 -- okinawa 2007-05-25 (金) 09:03:14
  • 水をさすようですが、少なくとも私の経験では、巨大なファイルのコピーでは、USB メモリは外付けハードディスクよりも遅いことがありました。なぜでしょう。 -- 間瀬茂 2007-05-25 (金) 22:29:09
  • 転送レートやファイルフォーマットの問題もあるので、最近のHDより遅いUSBメモリもあります。メモリだから速いというわけではないようです。ただし32G-SSD(10万円くらい)はHDの1.5倍くらいは速いようですね。だれか人柱になってくれないかな〜。えっ、私? -- okinawa 2007-05-26 (土) 09:41:46

0乗について

samejima? (2007-05-21 (月) 17:20:07)

初めて投稿します。

EXCELでは
NA^0=#VALUE!
0^0=NUM!
ですが、

Rでは両方とも1になってしまうのですね。
これは問題ではないのでしょうか?

> NA^0
[1] 1

> 0^0
[1] 1
  • Google で,0^0 を検索語欄に入れて検索すると,以下が表示されます。NA^0 は他の言語では追試できない?
    C では,NaN^0 は1になりますね(0^0 も 1)。C でプログラム書いて確かめてみた。
    「ゼロのゼロ乗」を検索すると容易に答えを得られる http://www4.airnet.ne.jp/tmt/mathfaq/0supscr0.pdf -- 2007-05-21 (月) 19:19:18
    0pow0.png
  • ゼロ以外の数値 x では x^0 は 1 です。 関数 f(x) = x^0 が x について連続であるようにするには 0^0 = 1 とするのが合理的。また NA を含む演算は基本的には NA を返すのですが、値が合理的に与えられる(先と同じ理由で)場合にはそれを使います。とういうのが、説明ではないでしょうか。同じ理由から (Inf)^0, (-Inf)^0, NaN^0 も 1 になりますね。EXCEL はどうして投稿のような結果にしているのかしりませんが、おそらく普通のひとには R 流の決め方が不可解だから、という理由ではないのでしょうか。 -- 2007-05-21 (月) 20:46:11
  • > おそらく普通のひとには R 流の決め方が不可解だから、という理由
    というか,Excelを書いたプログラマが「普通のひと」だったからかもしれませんね。 -- 2007-05-21 (月) 20:50:14
  • ありがとうございました。0^0が1というのは納得できました(これは数学の問題でしたね)。しかしNA^0も1というのが依然として気持ちが悪いです。たとえば、a<-c(NA,1,2)とするとsum(a^x)はxに0以外の数が入ると常に「NA」が返ってきますが、x=0の時のみ「3」というNA以外の値が返ってきます。そういうものですか? -- samejima? 2007-05-21 (月) 23:25:53
  • 例はsum(a^x,na.rm=TRUE)とするべきだったかもしれません。この場合、xを正からも負からも0に近づけていくと2に近づいていくのですが、x=0ちょうどにすると3になります。合理的でしょうか? -- samejima? 2007-05-21 (月) 23:33:35
  • NA^0 が 1 とされるのは、x が数値であれば必ず x^0=1 だから、NA (これは NULL、つまり何もない、ではなく、あるのだけれど値が不明ということですね)のゼロ乗も 1 にしておいても合理的だろう、ということだと思います。ちなみに NULL^0 は numeric(0)、つまり NULL ですね。いっぽう非数 NaN のゼロ乗はやはり 1 ですね(非数は二進法による浮動小数点表現で生ずる例外グループです)。NA 値を含む演算が NA にならない例としては論理演算 NA|TRUE が TRUE になる例があります。これも NA が仮りにどんな値であろうと結果は TRUE になるから、そう決めるのが合理的だからでしょう。一方 NA&TRUE は値が一意的に決まらないから NA とされます。御指摘の例は x が以外では a^x は NA を含むし、x がゼロなら NA を含まない、という意味で当然そうなるべきだろうと思います。-- 2007-05-22 (火) 00:10:40
  • Rの開発グループはアカデミックな人達がほとんどですから、例外的な場合の処置は結構うるさいようです。過去にもう一つ「おや」と思った例は sum(NULL) が 0 を返すことです。これも、数学の世界では範囲が空集合の和はゼロとするのが一般的だからでしょう。prod(NULL) が何を返すか、確かめてください。 -- 2007-05-22 (火) 00:33:52
  • 0^0はIEEE754の決まり事では?(Rがどうこうは関係無い話だったような) sum(NULL)は集合的(よくあるのはSQLかな)なお話かと. EXCELは表計算(どちらかと言えば勘定系なのでIEEEは合わない)なのでそういうもんかと. -- なかま 2007-05-22 (火) 09:45:13
    > sapply(c(sum,length),function(x)x(c(NULL,1,2,3)))
    [1] 6 3
    > sapply(c(sum,length),function(x)x(c(NA,1,2,3)))
    [1] NA  4
  • ありがとうございました。NA^xはxがゼロ以外の時は値が決まらないから常にNAだけど、x=0のとき値が決まる(「1」)からそれを返すということですね。 -- samejima? 2007-05-22 (火) 14:24:12
  • ところでこの内容はむしろ、Q&Aですので、そちらの方に移した方が良いと思うのですが、ご賛同得られますか?(やり方に自信がないので経験者の方にやっていただけると、よりありがたいですが) -- samejima? 2007-05-22 (火) 14:28:16
  • ああ、質問だったんですか。話題提供かと思っていました。ところで、Rの芸の細かさ(?)をもう一つ紹介。あまり知られていないと思うのですが、as.character(NA)で得られる、文字列タイプのNA値があります。これは単なる文字列"NA"とは異なるものですが、当然ながら巾乗するとおこられます。 -- 2007-05-22 (火) 20:17:29
    > as.character(NA)^0
    以下にエラーas.character(NA)^0 : 二項演算子の引数が数値ではありません
    > x <- c("NA",NA)
    > x
    [1] "NA" NA  
    > identical(x[1], x[2])
    [1] FALSE
    > str(x[1])
     chr "NA"
    > str(x[2])   # 表示の微妙な差に注意
     chr NA
  • ? NA ..... As from R 2.5.0 there are constants NA_integer_, NA_real_, NA_complex_ and NA_character_ of the other atomic vector types which support missing values. -- 2007-05-22 (火) 21:43:03
    > identical(as.character(NA), NA_character_)
    [1] TRUE
    > identical(as.character(NA), NA)
    [1] FALSE
    > identical(as.integer(NA), NA_integer_)
    [1] TRUE
    > identical(as.integer(NA), NA)
    [1] FALSE
    > identical(as.real(NA), NA_real_)
    [1] TRUE
    > identical(as.real(NA), NA)
    [1] FALSE
    > identical(as.complex(NA), NA_complex_)
    [1] TRUE
    > identical(as.complex(NA), NA)
    [1] FALSE
  • NA_complex_^0 は様相が違う -- 2007-05-22 (火) 21:53:00
  • 済みません、事情がありまだR.2.4.1ユーザーです。R2.5 では NA_complex_^0 はどういう結果になるのでしょうか、教えてください。 -- 2007-05-22 (火) 22:19:22
  • NA_complex_^0 は NA になります -- 2007-05-22 (火) 22:37:13
  • 私のR2.5.0では
    > (NA_complex_)^0
    [1] NaN+NaNi
    となりますが?この面妖な結果を自己流に解釈してみます。複素変数 x に対する a^x は exp(x*log(a)) で計算されますが、複素数値 a の対数値 log(a) には 2nπi (n は任意整数) だけの曖昧さがあります(R の複素対数値は主値、つまり n=0 のケースを与えます)。今 x -> 0 としても、2nxπ の値は n が不定とすると必ずしも 0 に近付くとはいえず、(NA_complex_)^0 を一意に合理的に定めることはできません。という訳で苦肉の策として NaN+NaNi? という値を与えることにした(?)、のではないでしょうか。-- 2007-05-22 (火) 23:22:32
  • へ〜OSにより(?)一緒じゃないんだ -- 2007-05-22 (火) 23:43:22
    > (NA_complex_)^0
    [1] NA
    > sessionInfo()
    R version 2.5.0 (2007-04-23) 
    i386-unknown-freebsd4.8 
      以下略
  • コンパイラと言うかOS依存(libmのcpow依存)で結果が異なります. 1+0iになるのが正しいですよね. とりあえずAIX(xlc extc99)=NaNQ+NaNQiでIA64(icc+libimf)=1+0iでLinux(gcc)はNaN+NaNi?でした. 乗数が0以外の時はx^y=exp(y*log(x))で0の時は固定で1+0iにするのが良いか... -- なかま 2007-05-23 (水) 01:50:00
  • 鬼門なのね...(^_^; -- なかま 2007-05-23 (水) 10:24:08
  • 結局EXCEL風(解釈放棄)が無難、という話になったりして :-) -- 2007-05-23 (水) 17:52:57
  • 話題提供のつもりが、「答え」があったのでQ&Aかと思ったのですが、またトピック的になってきたのでこの場所に置いておくことにします。 -- samejima? 2007-05-24 (木) 14:40:14

Windows Vista issue

間瀬茂 (2007-04-14 (土) 20:00:56)

r-help にR教授が Windows Vista にRをインストールする実験をした結果を報告しています。参考までに転記します(ついでながら、年度末に入手したパソコンは不幸にも Windows Vista 版で、Microsoft 流いらぬお節介の程度が一層増したようでいらいらさせられます)。

It seemed FUD [*] has been prevailing here and elsewhere on Vista security
features.

I asked our sysadmins to set up a Vista box for me on which I have access
to all levels of accounts.  Many of the issues I found were covered by
earlier answers and all in the upcoming rw-FAQ (currently available at
http://www.stats.ox.ac.uk/pub/R/rw-FAQ.html and in the 2.5.0 pre-releases)
but a quick reprise may help.
 
Most of my testing was of 2.5.0 beta, but I did some quick tests of 2.4.1.

1) The R installer and uninstaller are from an 'unidentified publisher'
and you may have to agree that you trust them.  This is a problem of the
Inno Setup installer kit we use.  An ultra-cautious sysadmin could
configure Vista to stop you installing via such a program.

2) Permission problems:

If you install R as an ordinary user (into your own file space) you should
see no permissions problems.  (There would have been problems, including
under XP, with some recent daily binary builds as the installer kit had
changed one of its defaults to disallow non-administrator installs, but
these have been fixed.)

I also encountered no problems installing R under the Administrator
account (normally hidden) and installing packages under the same account.

Things are more complicated if you use an account which is in the local
administrator group (but is not Administrator itself).  Such accounts are
no longer (by default) equivalent to Administrator, and run programs as
ordinary user accounts. They need to 'Run as Administrator' to do things
in the system area such as C:\Program Files.  You will be asked if you
want to run as administrator if you try to install software such as R, but
you will not be asked if you try to install packages in the main R library
(since asking is something that applies to a program, not part of a
particular session).  One simple solution is to elevate your credentials
when running an R session to install packages in the same way that you
needed to when installing R.  (Unix and MacOS X users will recognize a
somewhat automated reincarnation of 'sudo'.)

It looks like the best practice will be to change the (full) ownership of
the R installation to the account used to install it, something which
would be standard practice in the Unix world.  Also, we are encouraging
people as from 2.5.0 to install packages into a site or personal library
where these permission issues should not arise (except when updating
recommended packages).

3) The most worrying problem is that Vista is reporting quite incorrectly
file permissions through the POSIX interfaces used by file.info() and
file.access(), and furthermore allowed me as a standard user to create
directories in areas over which it says I do not have write permission. We
will look further into possible solutions, but it seems the Win32 API
functions are giving the same answers.

Problems with 'access' (the C call underlying file.access()) mean that the
MinGW compilers do not currently run on Vista without a lot of
hoop-jumping.

[*] http://en.wikipedia.org/wiki/Fear,_uncertainty_and_doubt
--
Brian D. Ripley,                  ripley@stats.ox.ac.uk
Professor of Applied Statistics,  http://www.stats.ox.ac.uk/~ripley/
University of Oxford,             Tel:  +44 1865 272861 (self)
1 South Parks Road,                     +44 1865 272866 (PA)
Oxford OX1 3TG, UK                Fax:  +44 1865 272595

ubuntu (dapper, edgy)版最新 R

間瀬茂 (2007-04-11 (水) 09:32:24)

Linux のディストリビューションのひとつ Ubuntu 用の R は既定のリポジトリには依然として R 2.3.1 しかありませんが、CRAN に最新版 R 2.4.1 があることをやっと気づきました。Ubuntu 版最新R。リポジトリに登録するには正規に認証されたサイトであることを教えるための手続きが必要です。注意書き Readme を読んでください。

なお、 Vmware 版 Ubuntu をしばらく使っていますが、Windows に寄生できるという利点のほかに、Vmware 版 Ubuntu は Windows にとっては単にディレクトリに過ぎないので、チューンアップした Ubuntu をハードディスクにコピーし、容易に他の機械に引越しできるというメリットがあることに気づきました。


R ユーザであることの幸せ

(2007-04-07 (土) 01:12:41)

SPSSの値段


RSiteSearch? 用の Firefox plugin

(2007-04-06 (金) 00:38:07)

Firefox のサイドバーから RSiteSearch? 機能を使うプラグインを見つけました。便利かどうかは一寸わかりません。
Firefox Plugin

  • キーワード検索以外に、R の各種パッケージ(R本体付属を含む)の付属ヘルプドキュメントをマウスクリックだけで見ることができます。結構便利そうです。 -- 2007-04-06 (金) 00:51:19
  • R掲示板#u905c5f1 -- 2007-04-06 (金) 02:51:59
  • 既出でしたか。失礼。 -- 2007-04-06 (金) 07:52:25

V. Zoonekynd 氏の新しいマニュアル

間瀬茂 (2007-04-01 (日) 09:52:59)

r-help 記事で知りましたが、あの華麗なRグラフィックスで知る人ぞ知るオンラインマニュアル Statistics with R の作者の V. Zoonekynd 氏が又素晴らしいオンラインマニュアル Programming in R を公開しています。Rプログラミング全体に関する事項が要領よくまとめられています。まだ書きかけのようです(今回は最初から英語版)が、参考になります。


Vista は R ユーザーを(不)幸せにするか?

間瀬茂 (2007-03-30 (金) 23:21:02)

r-help で Vista で R を使うことができるかどうか議論になっています。R 自体のインストールは問題ないようですが、貢献パッケージのインストールに関しては Vista の管理者特権機構(?)から問題が起こる(特に会社のパソコンで管理者権限無しで使っている場合)らしいです。以下の R 教授のコメントがヒントになりそうです。関連スレッドにはUSB経由でパッケージを使う裏技があるとのコメントも。

On Wed, 28 Mar 2007, christian.ritter@shell.com wrote:
> The Vista issue is not innocent as it threatens the life of R within~
> large corporations. So any posts on how R runs under Vista and what has~
> to be done to make it work and what cannot be done etc will be very~
> useful.

See the rw-FAQ in the R-2.5.0 alpha versions and later.  That contains all
that we have seen reported, wiht documented workarounds.

My understanding is that there are no Vista issues per se with R, but
there are permission issues just as there are under 2000/XP if set up to
the same levels of security as are the defaults in Vista.  (Further,
that agrees with advice from someone within Microsoft who uses R.)

We do not intend to roll out Vista for several months, and it would
surprise me if 'large corporations' would do so without ensuring that
there is full software compatibility.

関連文書


DSC 2007 レポート

鈴木@ef-prime? (2007-03-12 (月) 17:51:21)

ef-prime鈴木です。もう1ヶ月経ってしまいますが、2月15・16の二日間、Rの故郷ニュージーランドのオークランド大学で行われた国際学会 "Directions in Statistical Computing 2007" に参加してきました。
http://www.stat.auckland.ac.nz/dsc-2007/

目的は弊社開発の無償データ分析ソフト "Natto" と、NattoをRから利用するライブラリ "nattoR" の紹介だったのですが、Rコアメンバーの中でどんなことが議論されているのかと若干のミーハー根性を抱きつつ参加してまいりました。

仕事を抱えながらの参加で集中して聞くことのできた講演は数えるほどしかないのですが、印象的だったものをご紹介します。

■Ross Ihaka, "Common Lisp as a Vehicle for Implementing Statistical Environments"

第0回(?)Rユーザー会でも来日してくださったRoss Ihaka先生の講演。「初歩的なLispの実装にSとの互換性を持たせた」というRの実装に対して、「最初から完全なLispの上に統計システムを構築する」という発想で進めているという最近の研究成果について報告されていました。

恥ずかしながら、RがLispベースのシステムだということを初めて知りましたが、すでに「ポストR」の開発が始まっているのだなぁと感慨深い思いでした。「まだ実験段階」だと前置きがありましたが、実験ではRよりも効率的な計算が実現できているようでした。

■Thomas Lumley, "Memory profiling in R"

"R is well-known to be slow and able to handle only small data sets."という印象的(かつ自虐的?)なアブストラクトに惹かれて覗いてみました。関数ごとの計算時間を計測してくれるRのプロファイリング機能 "Rprof" は大掛かりな自作関数を作られる方ならおなじみの機能ですが、同様にメモリの効率についても計測してみよう、という趣旨のようです。(R-2.4.0以降で追加?)

結果はなかなか衝撃的でした。ちょっとした回帰モデルをひとつ作成するのに、なんと元データを6回もコピーしていることが判明!その実例ではfomulaにlogが入っている場合に、logをとるためだけにデータがコピーされてしまう…というもので、以下に類似例があります。
http://developer.r-project.org/memory-profiling.html

Rの最大の利点とも言えるお気楽プログラミングに慣れてしまった我々にはたいへん衝撃的な結果なのですが、結論としては「関数書くときはメモリの利用効率も気をつけよう!プロファイラ使ってね!」ということのようでした。やはりこのあたりは人手で最適化するしかないようです。

■Aaron Ping, "Beyond Line Charts: Graphing market trends with R"

日本からの参加者は統数研の中野先生と私だけ…かと思いきや、意外なところにもう1名いらっしゃいました。なんと、あのP&G社からの講演です。それも日本から!

内容はディベロッパーというよりユーザー寄りといった感じでしたが、マーケティング観点からの分析と視覚化のセンスの良さに脱帽です。日本企業からもどんどんこういった報告が上がって、マーケティングデータ分析全体がレベルアップしていくといいなぁと個人的に感じた発表でした。

■Paul Murrell and Ross Ihaka, "Display Lists in R"

最後の講演はこちらも以前来日されたPaul Murrel先生。R上でダイナミックグラフィックスを扱う方法について実例を交えて紹介されていました。プロット画面上に収まるようにグラフをレイアウトする例や、ウィンドウサイズが変更されても文字がはみ出ないlegendの例など「Rでそんなこともできるのか!」という驚きに満ちた内容でした。

ただし、Rの標準グラフィックは「システムに多くを任せすぎ」で、対して講演内容の手法は「ユーザーに負担を与えすぎ」とのことで、「ちょうどいい中間地点は存在しない」という結論でした。ともあれ、選択肢が増えることは有意義なことだと感じました。

Paul先生のスライドはこちらから入手できます:
http://www.stat.auckland.ac.nz/~paul/


他にもRコアメンバーや統数研の中野先生、統計ベンチャーなどから面白い内容の講演を聞くことができ、たいへん有意義な学会でした。人類の共有資産、というとやや大げさかも知れませんが、多くの優秀な研究者・開発者の地道な貢献がRの発展を支えているのだなぁ、と感慨深い思いで帰国の途に着いたのでした。

ちなみに、弊社ソフトウェア Natto とRパッケージ nattoR は下記ウェブサイトから無償でご利用いただけます。フィードバックなどいただければ幸いです。
http://www.ef-prime.com/

それでは、長文失礼いたしました。

  • 極秘ルートからの情報によれば「ポストR」の開発プロジェクト名は「T」です -- 2007-04-01 (日) 10:04:18
  • なんと、「ポストS」どころか「ポストR」狙いですか! -- 2007-04-06 (金) 14:05:45
  • ↑うっ、逆でした。 -- 2007-04-06 (金) 14:08:57
  • "「ポストR」の開発プロジェクト名は「T」です" -> 嘘(本当)だと思ったら投稿日付を良く見てください :-) -- 2007-04-07 (土) 01:16:37
  • 1ヶ月越しで気づきました。や、やられた… -- 2007-05-10 (木) 19:25:43

こんな集会もあります

間瀬茂 (2007-03-06 (火) 14:46:40)
日本統計学会の春季集会(今年から新設)です。計算機統計のセッションでR関係の講演が複数あります.そのうちひとつは岡田さんが話されます.統計学会会員は(のふりをすれば)無料です.


日本統計学会 会員の皆様

庶務会計担当理事の川崎です。3月10日(土)に東京理科大学を会場に開催されます、春季集会の再度のご案内です。既に会報に同封で、春季集会のプログラムをお届けしておりますが、会員の皆様の積極的参加をお待ちしております。

# 学会ウェブサイトでも引き続きご案内中です。http://www.jss.gr.jp/ja/

なお、集会終了後18時〜20時に、東京理科大学理窓会館におきまして、懇親会を企画しております。会費は3,000円です。
http://risoukai.rikadai.jp/risoukai/activities/hall.html

準備の都合上、参加人数を把握しておきたいと考えますので、懇親会への参加を希望される方は、3月3日(土)までに,瀬尾隆会員宛にメール(seo__at__rs.kagu.tus.ac.jp)あるいは~FAX(03-3260-4293)にてご連絡くださいますようお願いします。

先日広報担当・坂本理事からご連絡がありましたように、この週末に学会サーバー移転が計画されている関係で、やや早めのremindとなりましたが、宜しくお願い申し上げます。

川崎能典 統計数理研究所

# __at__ はアットマークです


こんな集会があります(ただし有料) ~ [#ve7045e5]

間瀬茂 (2007-03-06 (火) 14:46:35)
統計ML stats 投稿記事より転載

STATS の皆様
 
大阪大学の坂本 亘と申します。

下記の案内を送信いたします。ぜひご参加ください。
僭越ながら、私も講演者の一人です。

-----

特定非営利活動法人・医学統計研究会
特定主題シンポジウム
「臨床評価における計算環境Rとその周辺」―S-Plusによる妥当性確認―

日時: 2007年3月17日(土)9時30分〜17時00分
場所: TKP新宿モノリスB1大会議室
参加費:会員 5,000円,非会員 10,000円
共催: (株)数理システム

<プログラム>

 9:30- 9:40 開会挨拶 魚井 徹(特定非営利活動法人・医学統計研究会)

座長 田澤 司((株)数理システム)
 9:40-10:55 「計算環境 R とそれに基づく統計実践」
山本義郎(東海大学)
10:55-11:05 休憩
11:05-12:20 「R による統計的シミュレーション入門」
坂本 亘(大阪大学)

12:20-13:30 昼食休憩

座長 武田 純(アステラス製薬(株))
13:30-14:45 「R による計量データの解析:パッケージと開発環境」
下川敏雄(山梨大学)
14:45-15:00 休憩
15:00-16:15 「R による離散データの解析:パッケージと開発環境」
越智義道(大分大学)

16:15-16:30 閉会挨拶 後藤昌司(特定非営利活動法人・医学統計研究会)

下記のウェブページからもご覧になれます。
http://www.bra.or.jp/event.html

----------------------------------------------
 坂本 亘 (Wataru Sakamoto)
 sakamoto__at__sigmath.es.osaka-u.ac.jp
# __at__ はアットマークです
----------------------------------------------

Ubuntu Linux 6.10ja + R 2.4.1

小笠原理? (2007-02-13 (火) 04:26:58)

日本語版Ubuntu Linux6.10(ubuntu-ja-6.10-desktop-i386.iso)に対してR-2.4.1のソースコードをコンパイルするためには、ちょっと一手間いるようです。(Ubuntuのr-baseパッケージは現在version 2.3.1-1ですからもっと新しいバージョンが好きな人はコンパイルが要るわけです。)

Ubuntuの日本語版では、OpenOffice?の日本語化に伴ってlibx11-6なるパッケージのバージョンが

1.0.3-0ubuntu4 => 1.0.3-0ubuntu4ja1

に変更になっています。そのせいでlibxt-devパッケージをapt-getしようとすると(libxt-devはlibx11-devに依存し、これはlibx11-6に依存しているので)
依存関係の計算がおかしくなりapt-getできません。

結局libx11-devのソースコードを入手して、依存関係のルールを1.0.3-0ubuntu4ja1も許すよう、ちょっとだけ変更することで解決しました。

sudo apt-get source libx11-dev
cd libx11-1.0.3/

libx11-1.0.3/debian/controlファイルの該当部分を以下のように編集

Package: libx11-dev
Architecture: any
Depends: ${shlibs:Depends}, ${misc:Depends}, libx11-6 (>= ${Source-Version}), <=この'>'を入れるだけ

パッケージを作ってインストール

dpkg-buildpackage -rsudo
sudo dpkg -i libx11-dev_1.0.3-0ubuntu4_i386.deb
sudo apt-get libxt-dev

Rのコンパイル

./configure --x-includes=/usr/include/X11 \
 --x-libraries=/usr/lib/X11 --enable-R-shlib
make
sudo make install
  • 報告ありがとうございます。(私もやってみようっと)ところで、ubuntu6.10Jはwindowsと比べてもいい線いってます。特にプリンタ回りの設定は簡単でびっくりでした。これならちょっと古いノートに入れても十分使えますね。 -- okinawa 2007-02-13 (火) 17:43:37
  • ubuntu 6.10ja、なかなか良いですね。でもnetwork-adminがよくcrashするので不勉強な私はよそで無線LANに繋げるたびにどきどきしてました。iwconfigを使って設定すること (^^;)。 -- 小笠原理? 2007-02-13 (火) 19:44:50

useR! 2007 アナウンス

間瀬茂 (2007-02-11 (日) 23:06:39)

始めてウィーン(ヨーロッパ)以外で開かれるようです。

R Users and Developers,

Plans are being made to hold the first North American useR! will be
held at Iowa State University, Ames, Iowa, August 8&#8211;10, 2007, which
will be a week after JSM'07.

This follows successful meetings in Vienna, Austria, in 2006 and 2004,
and also Directions in Statistical Computing (DSC) meetings in
Auckland, NZ (Feb 2007), Seattle (2005), and Vienna (1999, 2001,
2003).

Information about the meeting can be found at
http://www.user2007.org/

If you have suggestions for the meeting please email the program
committee at user2007@iastate.edu.

Regards,
useR! 2007 Program Committee
Douglas Bates, Dianne Cook, Dave Henderson, Heike Hofmann, Luke  Tierney
  • 初のヨーロッパ外とありますが、"Seattle (2005) "ってなんでしょう。 -- 2007-02-12 (月) 05:32:08
  • DSC -- 2007-02-12 (月) 06:00:53

RODBC

takahashi? (2007-02-09 (金) 08:59:11)

windowsにmysqlとmyODBCインストールしてRODBCで接続してみたんですが、
動作が遅くないですか?

約8600 x 15程度のデータフレームをセーブするのに数分時間がかかったんですけど、そんなもんなんでしょうか?

write.tableであれば、数秒で保存されるのに・・・

似たような環境で運用してる方がいたら、ご意見を伺えるとうれしいです。

  • それは, RODBCが遅いのではないでしょう. DBのチューニングを行いましたか? 殆どの場合ミッションクリティカルである必要は無いでしょうから, mysqlなら innodb_flush_log_at_trx_commit の値を1以外に設定してみては如何でしょう. 一般に◯◯が遅いとか言うときはやった事や設定を詳細に述べないと, 中の人や周辺の人は気分を害する恐れがあります. 言い方もまだ「初心者でーす。mysqlインストールしました。DB初心者です。早くする為にチェックポイントなどあったらおせーて。」とかの方がまだよいです. たぶんsqlSaveは使われているでしょうが...(つまりやった事が書いてないと普通, 御意見のしようもないんです)...現在,「(`Д´) ムキー! 」な状態なのでカドがあったらすみません. -- なかま 2007-02-09 (金) 13:54:28
  • 申し訳ないです。あまりの遅さに愕然としていたもので、無神経な書き込みをしてしまいました。sqlSaveは使っていますが、ちょっといろいろ試してみます。早くなったらチューニングのポイントをフィードバックしますので、お許しを m( __ __ )m -- takahashi? 2007-02-09 (金) 17:13:49
  • なかまさん、ほんとにありがとうございました。劇的に速くなりました。RODBCのページにフィードバックしておきました。 -- takahashi? 2007-02-09 (金) 19:08:05
  • あっ,いえ,同じような事を(-"-)な顔してリアルで言ってたもんで...相当飛び火してしまいましてすみません.orz -- なかま 2007-02-09 (金) 23:07:17

MSWindows + Vmware + Ubuntu + R, 使いものになる?

間瀬茂 (2007-02-04 (日) 21:39:46)

二年ほど前(?)から、私の愛用の Knoppix が新しいパソコンで起動しない、起動してもHDにインストールできないことが、たびたび起きて困っています。これまで、少なくともデスクトップ機では一発で起動、インストールできていたのに。というわけで、ウィンドウズしか動かないしょうもない計算機で Linux が動かせると話題の Vmware と、これまた最近話題の新しい Linux distribution Ubuntu (Vmware 用仮想マシン版) を試してみました。Ubuntu 自体はあっさり動き、家主の Windows の気配も感じさせず、文句なく動きました(GNOME ベースなので慣れなくて使いにくいですが)。しかし、仮想マシンとは所詮居候の身、「三飯目にはそっと出し」ではないが、R の実行速度はかなり落ちるのではと疑い、次の簡単なコードで時間を計ってみました。

system.time({n <- 2e3; x <- matrix(runif(n^2),n,n); y <- x %*% x; z <- det(y)})

結果は、結構意外で、 居候 Ubuntu は16.2秒、家主 Windows では 37.0秒、そして Knoppix では 12.8秒(いずれも三回の平均)。Windows しか動かない馬鹿な機械も、これで書類書き専用機以外の使い道ができそうです。

  • Vmwareで動かしてるOSの内部時間は実際の時間とずれるという話を聞いたことがあります。確認してみたほうが良いかもしれません。 -- 2007-02-04 (日) 23:03:54
  • これは内部タイマーの差分ですから、系統的にずれている限り問題はないのでは。体感時間でも Windows ははるかに遅かったですね。一例だけで判断するのは拙速ですが、こんなもんなのでしょうか。すこし差がありすぎるような。 -- 間瀬茂 2007-02-05 (月) 00:05:50
  • それと Ubuntu では r-base-dev (確か)というパッケージをインストールすると、R 関連の開発環境(コンパイラー等)をまとめてインストールしてくれて、感激しました。本家 Debian にはそんなパッケージは無い。ただし、Ubuntu の R はまだ 2.3.1 でした。 -- 間瀬茂 2007-02-05 (月) 00:18:23
  • 宿主より早いのはATLAS効いているのではと思うのですが...あと,仮想OSのRTCは一般的には信用無いです. -- なかま 2007-02-05 (月) 23:15:24
  • コメント/VMwareでR? に関連記事 -- 2007-02-09 (金) 09:10:39
  • r-base-devは自分でビルドすると作成されます。本家に置いてないのは、ATLAS等の演算ライブラリに依存するからでしょうかね。ちなみにCRANで配布されるdebパッケージはetchで作られているのか、最初はFortranにgfortranが使われているのでsargeに入れようとする&libc6をUpgradeしたくない場合にはちょっと困ります。で、数日後にg77でリビルドしたものがsargeに上げられています(過去2回のリリースではそうでした)。 -- 2007-02-09 (金) 17:01:56

Rが得意な方のための御仕事です(若干名)

瀧本 ( ttakimoto@kansatobunseki.co.jp )? (2007-01-22 (月) 21:58:15)

Rを使ったプログラミングとデータ解析の仕事をしていただける方を探しています。主に大量なデータを利用した回帰分析に関するものです。
雇用期間は数ヶ月間を予定していますが、延長も可能です。
大学院生歓迎です。
パートタイムベースで条件等については相談に応じますので、研究との両立が可能です。

仕事場は、千代田区大手町です。
詳細は監査と分析、瀧本までお問い合わせください。

(以上の内容で独立したページができていましたが、おそらく掲示板への掲載を意図したものと思われたので転載しました)


gnomeGUI

谷村 (2007-01-17 (水) 16:48:25)

新規ページを起こすまでもないのでR掲示板に書き込んでおきます。
gnomeGUIはgladeのライブラリに依存していますが、これはglade2でもglade3でもなく、何とglade (初期バージョン)です。これに気がつかないでちょっとはまったので、VineLinux4.0にgnomeGUIをインストールする手順を書いておきます。ターミナルでルート権限になり

# apt-get install  libglade-devel

これでgladeライブラリの開発ファイルが入ります。次に、ルート権限でRを起動し、

> install.packages("gnomeGUI", configure.args='--includedir=/usr/include/libglade-1.0')

とします。これで問題がなければ、gnomeGUIが入ります。gnomeGUIが入ったら、Rを終了して、ユーザ権限に戻り、ターミナル上で

$ R --gui=gnome

とするとRのGOMEグラフィックインターフェイスが起動します。

gnomeGUI.png

文字化けした場合は適当なフォントを指定するか、LANG=Cを頭につけて英語版で起動してください。


PS3LinuxでR

gamer? (2006-12-26 (火) 01:38:54)

単純にCellプロセッサでベンチをとりたいだけなんですが、どなたかPlayStation3 LinuxでRを動作させた方はいらっしゃいませんか?ppc64アーキテクチャなので、ビルドにはPowerMac? G5のppc64アーキテクチャでのビルドの情報が役立ちそうな気がしているのですが...

  • PS2Linux での実行例はあるのでしょうか? -- PS2? 2006-12-26 (火) 04:03:10
  • ( http://emuonpsp.net/linux_on_PS3.html )でFedora Core5が乗ったらしいので、ご自分でお試しあれ。 -- 2006-12-26 (火) 14:44:35
  • Debianも動き出したようなので, 試してみました。あっさりsshdとRが入ったので、性能テストをしてみたいと思います。次は適当なベンチプログラム探しです。 -- gamer? 2007-01-04 (木) 23:52:18
  • それはすごい。楽しみにしています。メモリが256なのが厳しいですが。 -- 2007-01-05 (金) 08:10:36
  • そのままだとクロック分ぐらいしか早くなりそうにないので、Cellプロセッサに適したBLASはあるのかな..とか勉強中です. HPCとか数値計算は専門外なので苦労していますが、面白いゲームもまだそんなにないので素人なりにがんばっております -- gamer? 2007-01-05 (金) 14:19:02
  • ATLAS+Rのビルドにあるtest2関数を使ってみましたが...Debianをインストールしただけの状態では,
    > test2()
    [1] 7.528 0.104 7.631 0.000 0.000
    と, とても遅いです。-- gamer? 2007-01-08 (月) 12:06:11

「Rの基礎とプログラミング技法」Uwe Ligges 著

間瀬茂 (2006-12-25 (月) 20:03:29)

表題の本、やっと暇ができたので流し読みしました。良い本だと思います。私も知らない話題が数多くありました。といって、蘊蓄を傾けてすぎてもいず、バランスが良いです。入門書には少し程度が高いと思いますが。訳も良くこなれて丁寧です。中でも環境、検索パス、スコープ規則、S4 クラス・メソッドの解説は、簡潔かつ要領を得ていてお勧めです。ドイツ語から訳された石井さんにお礼を申し上げます。


R-2.4.1-0vl1.i386.rpm

谷村 (2006-12-21 (木) 11:29:26)

VineLinux4.0用にRのrpmパッケージを作成しました。VinePlus? 4.0 extrasにputしました。

# apt-get install R

でバージョンアップされると思います(/etc/apt/source.listのextrasは有効にしておいてください)。
2.4.0からのパッケージングの変更点は、(1) 日本語PostScript?フォントをデフォルトにすることはやめた(VineLinux用Rprofile.siteの追加をやめた)、(2) リビルド時に指定できるオプションが追加された:最適化オプション(LINUXOPT)、Webブラウザ指定オプション(R_BROWSER)、PDFビューア指定オプション(RPDFVIWER)、infoヘルプ生成オプション(INFO)。これらは、本家のオプション追加に追従しています。なお、Webブラウザのデフォルトはfirefox、PDFビューアのデフォルトはevinceと、VineLinux4.0のデフォルトにあわせてあります。

VinePlus? FTPサーバへのアップロードが不調な関係で、ひょっとしたらsrc.rpmが壊れているかもしれません。その際は、ご一報ください。また、何か不具合がありましたら、ご連絡ください。


盛会御礼

間瀬茂 (2006-12-09 (土) 19:55:35)

本日の第三回(本当は第二回) R ユーザー会日本語デーに御参加頂いた皆さん、特に御講演頂いた皆さん、ありがとうございました。想像以上の参加者に驚きました。あの広い統数研の講堂が決して広すぎるとは感じられませんでした。R の普及がそれだけ進んでいる証拠だと思いました。内容も、前回の集会が多分にそうだったような「R オタク」の集会ではなく、実際の利用に根ざした、聞きごたえのあるものだったように思います。集会の本当の主催者の中野先生に厚くお礼を申し上げます。

英語デーの講演も含め、多くの話のスライドがいずれ統数研のホーム頁から入手できる予定だそうですので、聞きそびれた方は御覧ください。

8日に講演した韓国の若手の Park さんが、挑発的に計算機言語としての R の欠点を幾つも指摘し、もしかして R 教授と激論になるかと心配(少し期待)しましたが、あっさり無視。R 教授を前にこんな話をする元気さに感心しました。

Park さんについてもう一つびっくりしたのは、片言の日本語を話す事。聞いたら日本のアニメおたくなんだそうです。隣のトトロの主題歌を日本語で歌ってくれました。更に驚いたのは、彼が銀河鉄道スリーナインのファンだったという話を始めたら、Iacus さんが自分も知っている、と言い出した事(笑)。これからは、子どものころ日本製アニメに洗脳された海外若手研究者が喜んで日本に来てくれるかも知れないなと思いました。

PS. 私の講演で統計学者ナイチンゲールの話を披露しましたが、後で思いだしたことがあります。ナイチンゲールは統計学の重要性を訴え、オクスフォード大学に応用統計学の講座を作るべく運動したそうです。ところで、R 教授はオクスフォード大学の応用統計学の講座の教授ですね。つまり、ナイチンゲールと R には不思議な縁があるわけです(笑)。

  • 間瀬先生、そして皆様、本日はどうもありがとうございました!大阪にとんぼ返りして早速仕事中な舟尾です。いや〜、昨年に続き、物凄く楽しいユーザー会でした!!主催者の中野先生に感謝々々。重ねて御礼申し上げます。

    記事の読み忘れのため、ナイチンゲールのお話は本日初めて拝聴したのですが、まさかあのナイチンゲールが「オクスフォード大学に応用統計学の講座を作るべく運動した」とは…、驚きです。
    あ、ナイチンゲールのお話を聞きそびれたという方は、統数研のHPに近日公開される間瀬先生のスライドをご覧下さい^^。

    しかし…、皆様の発表を拝聴しておりますと、いよいよRの時代が到来したという感じで…。
    こういう時代が来ると信じてはいたのですが、Rがどんどん発展していくのを目の当たりにすると…、万感の思いが…(涙)。 -- 舟尾? 2006-12-09 (土) 22:48:46
  • 無事終わり. 大変ほっとしています.(小心者) 来年もよろしくお願い致します.m(_|_)m -- なかま 2006-12-10 (日) 02:25:47
  • 集会の内容まとめを報告しようと考えましたが、どうせ(笑) ここ に掲載されると気付き、略。12月8,9日分の日誌を御覧下さい。 -- 間瀬茂 2006-12-10 (日) 10:26:26
  • 皆様、本当にお疲れ様でした。結構実用的な内容ばかりで驚きました。特に「起業」の部分は驚かされました。データ分析で飯を食ってゆく・・・なんてすばらしいことでしょう。また、間瀬先生のRの講義依頼のお話を聞きながら思ったのですが、今後Rの啓発普及にはやはりユニオン的な活動も必要になってくるのかもしれません。でも「Rヲタ」の話も聞きたかったです。来年は「Rヲタ」の話も混ぜてください。 -- okinawa 2006-12-11 (月) 09:11:37
  • 実はナイチンゲールの話は、その筋(公衆衛生・疫学系)では有名な話です。白衣の天使の印象が強すぎますが、クリミア戦争の後に体を壊し病床に臥しているときに(時間があるので)統計をガンガンやっていたようです。また、この成果を国の上層部へ伝えるための「とある将校」とのロマンスも・・・。深い。 -- okinawa 2006-12-11 (月) 09:18:57
  • そういえば服部恵美さん((株)情報数理研究所)って、R研ではじめての女性スピーカーだったんじゃないでしょうか? -- okinawa 2006-12-11 (月) 09:33:33
  • 私自身はソフト開発は基本的にハッカー(オタク)の仕事だと思っています。R CORE メンバーも結構その気があるのでは。統計に必要だから、という動機だけではあれだけの献身は不可能でしょう。とはいえ、アカデミックな世界では「あれはオタクの集団だから」という見方が強いのも事実だと思います。このあたりのバランスが難しいですね。次回も両者のバランスの取れた講演がそろえられたらと期待しています。 -- 間瀬茂 2006-12-11 (月) 11:05:33
  • ef-prime鈴木です。素晴らしい機会を与えていただき、ありがとうございました。とにかく人数の多さに驚きましたが、上のokinawa様のように好意的に受け止めていただくことができ、ほっとしています。また機会がありましたら、是非よろしくお願いいたします! -- 鈴木? 2006-12-11 (月) 16:25:44
  • Natto が「納豆」とは気付きませんでした。そういえば、社名の ef-prime は「f'(x)」という洒落(?)だということ気付かれましたか。ところで、慶応大学の柴田里程先生のお得意のセリフは「僕のイニシャルは R と S」ですが、鈴木君も 「R と S」 ですね :-) -- 間瀬茂 2006-12-11 (月) 20:50:06
  • 初めて参加させていただき、どうもありがとうございました。皆様のRに対する熱意を垣間見て大変驚き、刺激になりました。大変楽しい会でした。何を話していいのかわからないのを言い訳に、言いたい放題ぶちまけてしもうた感もありましたが、R graphical manualsに対するご意見など今後も賜りますようお願いします。 -- 小笠原? 2006-12-12 (火) 01:00:56
  • 間瀬先生、おっしゃるとおりf'(x)です。世の中の複雑な現象を統計モデルで近似して徐々に改善していく様子を、Newton法が関数を反復近似して最適化する様子に見立てて名づけました。イニシャルに関しては、柴田先生のお話を伺って同じことを考えましたが、恐れ多いので隅っこでおとなしくしています(笑) -- 鈴木? 2006-12-12 (火) 15:29:49
  • 上に「英語デーの講演も含め、多くの話のスライドがいずれ統数研のホーム頁から入手できる」とありますが、既に公開されていますね。R教授や okinawa さんのスライドは公開される予定があるのでしょうか? -- 2006-12-14 (木) 18:01:56
  • デモが多かったので多少作成しなおしております。しばらくお待ちください。(もちろん公開いたします) -- okinawa 2006-12-15 (金) 09:35:41
  • スライドUPしました。遅くなって申し訳ございません。 -- okinawa 2006-12-19 (火) 08:56:34

R ユーザー会プログラム再掲

間瀬茂 (2006-11-24 (金) 18:58:45)

間瀬です。先にお知らせしたRユーザー会のプログラムの完全なプログラムが公表されましたので、
再度お知らせします。R教授が本当に来てくれるか心配でしたが、大丈夫のようです(笑)
R教授と後藤さんは日を変えて二回講演をお願いできるようです。
なお土曜日は研究所入口の鉄柵がしまっていると思いますが、一部が開閉出来るようになっておりますからご心配なく。

統計数理研究所共同研究「Rの整備と利用」研究会開催のお知らせです。(前
にもお知らせしましたが、未定だった英語講演のタイトルおよびアブストラク
トを付けました。)

また、Professor Ripley と Dr. 後藤には日を変えて追加の講演をお願いでき
ることになりました。どの講演も参加は無料で自由ですので、皆様の多数のご
参加をお願い申し上げます。

<<追加講演>>

● "Visualization for data mining"
       by Brian Ripley (Univ. of Oxford, UK)

日    時: 2006年12月7日(木)   10:30 - 11:30 (12:00 まで延長可)
場    所: 統計数理研究所 新館2階 研修室
Abstract:
The talk will start with an introduction to data mining, and the types
of data and questions that occur in that field.  It will then consider
ways to visualize such high-dimensional datasets via for example
projection pursuit and multidimensional scaling, and show some
examples from real-world consulting problems using R and GGobi.

● "GotoBLAS チュートリアル"
       by 後藤和茂 (Univ. of Texas, US)

日    時: 2006年12月11日(月)   10:30 - 11:30 (12:00 まで延長可)
場    所: 統計数理研究所 新館2階 研修室
Abstract:
GotoBLAS は複数のアーキテクチャをサポートする最適化 BLAS の実装の 1 つ
であるが、GotoBLAS 上で施されている種々の最適化の手法ついてはあまり知
られていない。そこで、本講演では、最適化を行う上での基本的な考え方を解
説するとともに、BLAS の Level 1 〜 Level 3 の特性及びこれらの関数を呼
び出す場合の注意点等に関して議論を行う。


世話人:
間瀬茂 (東京工業大学)
中野純司 (統計数理研究所)

-----------------------------------------------------

統計数理研究所共同研究「Rの整備と利用」研究会

日          時: 2006年12月8日(金)   9:30 - 17:00
                2006年12月9日(土)   9:30 - 16:20
場          所: 統計数理研究所 講堂
                地図 http://www.ism.ac.jp/access/index_j.html
参  加  費  用: 無料
使  用  言  語: 12月8日は英語、9日は日本語

■ プログラム

●12月8日 (各 talk の abstract が下にあります)

09:30 - 10:30
     Brian Ripley (University of Oxford, UK)

     Title: Software for Statistical Developments

10:45 - 11:45
     Kazushige Goto (The University of Texas, US) 

     Title: Various optimization and performance tips for processors

13:30 -14:30
     Stefano Iacus (Universita degli Studi di Milano, Italy)

     Title: Two R specific optimization techniques for speed and data management~

14:45 - 15:45
     Sungwoo Park (Pohang University of Science
                            and Technology, Korea)
     Title: A critique of R from the perspective of programming
            language theory

16:00 - 17:00
     Junji Nakano (ISM, Japan) and
     Ei-ji Nakama(COM-ONE Inc., Japan)

     Title: R on super-computers at ISM

( 18:00 -      Dinner)

●12月9日

09:30 - 10:15
   舟尾暢男
   武田薬品工業(株)医薬開発本部
   日本開発センター  統計解析部 統計グループ
  「Rでデータハンドリング 〜 データフレーム 30 分クッキング〜」

10:15 - 11:00
 久保拓弥
   北海道大学・地球環境科学研究院・環境生物科学部門 陸域生態学分野
  「MCMC 計算まわりでさまよう R ユーザー」

11:00 - 11:45
   鈴木了太
   (株) ef-prime
  「Rで起業!フリーソフトウェアとデータ分析ビジネスの現在」

 (11:45 - 13:00 昼休み)

13:00 - 13:45
   小笠原理(国立遺伝学研究所 生命情報・DDBJ研究センター)
   服部恵美((株)情報数理研究所)
   三十尾潔高((株)情報数理研究所)情報数理研究所
  「R graphical manualsの開発と今後の展開」

13:45 - 14:30
 牧山文彦
   特定医療法人敬愛会 ちばなクリニック 健康管理センター
  「GoogleEarth とR言語」

 (14:30 - 14:50 休憩)

14:50 - 15:35
 谷村晋
   長崎大学 熱帯医学研究所 社会環境分野
  「地理空間分析のためのベクタデータモデル共通基盤 −
    sp パッケージのクラスとメソッド−」

15:35 - 16:20
   間瀬茂
   東京工業大学 情報理工学研究科 数理・計算科学専攻
  「R 紹介のためのオープンソース原稿」

■ Abstracts of talks on 8 December:

Title: Software for Statistical Developments
Speaker: Brian Ripley

To make statistical methodology available to end-users, especially to
those outside statistics, we need to make available software to
implement the method.  That software should ideally be readily
available, easy to use, flexible (as R is) and work correctly (and R
has a great record for rapidly fixing bugs).

The talk will discuss the process of moving new statistical
methodology from ideas to practical implementation(s) (with R
providing a near-idea vehicle for a reference implementation),
illustrated by some case studies of state-of-art statistical analyses
made possible by having code in S or R.


Title: Various optimization and performance tips for processors
Speaker: Kazushige Goto

Most developers don't like doing optimization, because they
believe it's a compiler's job, or optimization makes their code
dirty. Unfortunately they confused algorithmic optimization and
instruction optimization. Actually you don't have to do instruction
optimizations which make your code dirty. Instead you need to
think good algorithm to avoid various traps that CPU hates.

This talk will discuss the key to perform your application better
and how to avoid wrong coding.
  • 昨年,鉄柵に阻まれてお帰りになられた方もいらっしゃるかもしれませんが,休日の入り方はにも書いてございます. 鉄柵の右手に小さな扉がございますのでそれを開閉してください. -- なかま 2006-11-24 (金) 20:41:23
  • プログラムに書いてある通り、8,9 日の集会は前回と異なり、広い講堂で行なわれるようです。念のため。 -- 2006-11-24 (金) 23:17:38
  • つまらない事ですが, Rユーザ会は第2回なのではなかったでしょうか? わたしがボケてる? -- なかま 2006-11-30 (木) 11:25:59
  • 実は二回目です。ただし、R 関係の統数研集会は今回で三回目なのでサバをよんでみました。 -- 間瀬茂 2006-12-02 (土) 19:44:33

Sweaveでコメント

なかま (2006-11-20 (月) 19:35:32)

Sweaveでコメントが出るよう(100%パズル...)に弄ってみました.
人柱お願いします.
コメントを出す場合は, deparse(主に整形)されません.
チャンクのオプションに例えば,

<<fig=T,pdf=F,eps=T,echo=T,eval=T,keep.source=TRUE>>=

keep.source=T を加えます.
ここから
パズルちっくなので不具合は多いかもしれません.m(_|_)m

  • パース回数を減らしてみました. -- なかま 2006-11-24 (金) 20:31:46
  • R-devel(読んでなかった...)とかぶりました...orz -- なかま 2006-11-27 (月) 21:48:30
  • 先週なかまさんのページをみつけて早速利用させてもらいました.ありがとうございます.え?すでにあったの? -- 下平? 2006-11-28 (火) 10:13:48
  • R-develのほうに, 2.5.0から keep.source が増えるそうで...(^_^; dancanさんからメールが来まして, 「R-develみたの? ...(見てないっていうか...Rメール大杉)」と. んでもって,試してみたら, sum(x);mean(x) とか1行に複数アウトプットのケース(わたしもそれにはまりました)が同じく(世界共通!)はまってまして, 昨夜R-develの方も直りまして まあ, 目出度し目出度しと言うことでした. (^_^; sed -e 's/rawcode/keep.source/g' して,週末直したProfile版を使えば, R-2.5.0になっても Makefileの変更だけで済むと思います(^_^; -- なかま 2006-11-28 (火) 10:31:47
  • うちのも, R-2.5.0互換に直しました.(^_^; -- なかま 2006-11-28 (火) 10:55:04
  • R-2.5.0からdancanさんのkeep.source(defaultはFALSE)で可能となりますので, それまでの繋ぎでお使い頂ければ幸いです. -- なかま 2006-11-29 (水) 13:43:30

r-help 記事より

なぜでしょう?? (2006-11-18 (土) 23:04:41)

r-help に整数の和が associative (もちろん数学的ではなく R 的に)でない以下の例が紹介されていました。なぜこうなるのか、わかる方教えて下さい。

> as.integer(2^(30))
[1] 1073741824
> as.integer(2^(31))
[1] NA
Warning message:
強制変換により NA が生成されました
> as.integer(2^(30))+as.integer(2^(30))+1
[1] NA
Warning message: 
整数の桁あふれにより NA が生成されました in: as.integer(2^(30)) + as.integer(2^(30))
> as.integer(2^(30))+(as.integer(2^(30))+1)
[1] 2147483649
> as.integer(2^(30))+(as.integer(2^(30))+2)
[1] 2147483650
> as.integer(2^(30))+as.integer(2^(30))+2
[1] NA
Warning message:
整数の桁あふれにより NA が生成されました in: as.integer(2^(30)) + as.integer(2^(30))
> (as.integer(2^(30))+2)+as.integer(2^(30))
[1] 2147483650
> (as.integer(2^(30))+5)+as.integer(2^(30))
[1] 2147483653
  • 中間結果が integer になるか numeric になるかの違いでしょう。境界領域でうまく処理できないのは処理プログラムが未熟なせいでしょうが,そのあたりを作業領域とするようなプログラムをくむ側も,意識しておく必要はあるのでしょう。要するに,numeric で扱うようにしておけばよいと。integer で扱えない可能性のあるところでは numeric でやればよいだけ。 -- 2006-11-18 (土) 23:21:38
    > as.integer(2^(30))+as.integer(2^(30))+1
    [1] NA
    Warning message:
    整数の桁あふれにより NA が生成されました in: as.integer(2^(30)) + as.integer(2^(30)) 
    > as.numeric(2^(30))+as.numeric(2^(30))+1
    [1] 2147483649

Bioconductor チュートリアル

統計数理研究所の中野さんからのお知らせを転記します。間瀬茂 (2006-11-07 (火) 20:21:47)

Bioconductor のチュートリアルをやります。興味があれば、ご参加、または情報の
配布をお願いいたします。
 
中野

-------------------------------------------------
 
             Tutorial: Introduction to Bioconductor
 
Time and Date:  13:30-17:00, 1 December 2006

Speaker: Eun-kyung Lee (Seoul National University, Korea)

Venue: Auditorium of the Institute of Statistical Mathematics (ISM)
       http://www.ism.ac.jp/

Language: English

Program:

13:30 - 15:00  Part 1 : Overview of the Bioconductor project

15:30 - 17:00  Part 2 : Statistical analysis using Bioconductor

Abstract:

Introduction to Bioconductor

Bioconductor is an open-source and open-development software project
for the analysis of biomedical and genomic data. This project repository 
has a lot of packages for the analysis of genomic data, e.g. data I/O, 
image preprocessing, data normalization, pathway analysis, data visualiation,
meta analysis, annotation facilities(MIAME, GeneBank, LocusLink, Unigene,
etc), reference crawling over the PubMed and GO, design of experiments, 
gene selection, classification, clustering, ROC curves, Cox regression 
and much more. In this talk, we will browse Bioconductor project first. 
After then, we will talk about statistical issues in genomic data.

Part 1 : Overview of the Bioconductor project

In this talk, we will discuss what Bioconductor Project is, focusing on  
Bioconductor software design. We also talk about the Vignetts and Sweave, 
a special documentation paradigm in the Bioconductor. We will browse
Bioconductor packages.

Part 2 : Statistical analysis using Bioconductor

In this talk, we will focus on statistical issues to analyze genomic
data. Using real example, we wll discuss how to analyze genomic data
(microarray) using packages in Bioconductor and statistical issues in 
each step of analyses.

------------------------------------------------
                      中野純司(統計数理研究所)
                    

第三回 R ユーザー会

なかま (2006-11-06 (月) 12:04:25)

みなさま,
このたび, 岡田先生,間瀬先生,中野先生,の御手を煩わせること...てんこもり...(爆)...により.
たぶん, 無事,「第三回 R ユーザー会」を開催する運びとなりました.
苦情,お叱りその他はなかままでお願いいたします.


統計数理研究所共同研究「Rの整備と利用」研究会開催のお知らせです。

データ解析環境Rに関する研究集会を以下のように行います。
(なお、都合により若干の変更を行う場合があります。)

参加は無料で自由ですので、皆様の多数のご参加をお願い申し上げます。


世話人:
    間瀬茂  (東京工業大学)
    中野純司 (統計数理研究所)

-----------------------------------------------------

     統計数理研究所共同研究「Rの整備と利用」研究会

日          時: 2006年12月8日(金)   9:30 - 17:00
                 2006年12月9日(土)   9:30 - 16:20
場          所: 統計数理研究所 講堂
                 地図 http://www.ism.ac.jp/access/index_j.html
参  加  費  用: 無料
使  用  言  語: 12月8日は英語、9日は日本語

■ プログラム

●12月8日

09:30 - 10:30
      Brian Ripley (University of Oxford, UK)

      Title:  Software for Statistical Developments

10:45 - 11:45
      Kazushige Goto (The University of Texas, US)

      Title: Various optimization and performance tips for processors

13:30 -14:30
      Stefano Iacus (Universita degli Studi di Milano, Italy)

      Title: Two R specific optimization techniques for speed and data management

14:45 - 15:45
      Sungwoo Park (Pohang University of Science 
                             and Technology, Korea) 
      Title: A critique of R from the perspective of programming
             language theory

16:00 - 17:00
      Junji Nakano (ISM, Japan) and
      Ei-ji Nakama(COM-ONE Inc., Japan)

      Title: R on super-computers at ISM

( 18:00 -      Dinner)

●12月9日

09:30 - 10:15
    舟尾暢男
    武田薬品工業(株)医薬開発本部
    日本開発センター  統計解析部 統計グループ
   「Rでデータハンドリング 〜 データフレーム 30 分クッキング〜」

10:15 - 11:00
   久保拓弥
    北海道大学・地球環境科学研究院・環境生物科学部門 陸域生態学分野
   「MCMC 計算まわりでさまよう R ユーザー」

11:00 - 11:45
    鈴木了太
    (株) ef-prime
   「Rで起業!フリーソフトウェアとデータ分析ビジネスの現在」

 (11:45 - 13:00 昼休み)

13:00 - 13:45
    小笠原理(国立遺伝学研究所 生命情報・DDBJ研究センター)
    服部恵美((株)情報数理研究所)
    三十尾潔高((株)情報数理研究所)情報数理研究所
   「R graphical manualsの開発と今後の展開」

13:45 - 14:30
   牧山文彦
    特定医療法人敬愛会 ちばなクリニック 健康管理センター
   「GoogleEarth とR言語」

 (14:30 - 14:50 休憩)

14:50 - 15:35
   谷村晋
    長崎大学 熱帯医学研究所 社会環境分野
   「地理空間分析のためのベクタデータモデル共通基盤 −
     sp パッケージのクラスとメソッド−」

15:35 - 16:20
    間瀬茂
    東京工業大学 情報理工学研究科 数理・計算科学専攻
   「R 紹介のためのオープンソース原稿」

------------------------------------------------
                       中野純司(統計数理研究所)
                       nakanoj@ism.ac.jp
  • なお、牧山さんとは okinawa さんのことです。 -- 間瀬茂 2006-11-06 (月) 17:19:18
  • R(Ripley)教授は9日(土)も来られるのでしょうか? -- 霧のロンドンブリッジ? 2006-11-06 (月) 18:00:38
  • R教授より,「行くっていったんだから行くよ」と*だけ*... -- なかま 2006-11-06 (月) 18:38:03
  • R 教授の出席は当然金曜日だけでしょうね。 -- 間瀬? 2006-11-06 (月) 20:56:51
  • 参考までに述べると Stefano Iacus 氏は R コアメンバーの一人、後藤さんはこの Wiki でも何度か登場の高速数値演算ライブラリ libgoto の作者です。 -- 間瀬茂 2006-11-07 (火) 21:53:09

R programming contest

間瀬茂 (2006-10-23 (月) 19:57:18)

r-help 投稿記事より

-------- Original Message --------
Subject: [AGDG-LIST:405] R Computing Contest
Date: Sat, 21 Oct 2006 12:08:13 -0400
From: Larry Schaeffer <lrs@uoguelph.ca>
Reply-To: lrs@uoguelph.ca
To: Animal Geneticist's Discussion <agdg-list@colostate.edu>

For those that are interested only:

R Computer Programming Challenge

Given:  y = Factor A + Factor B + b1(Covariate1) + b2(Covariate2) +  ...
+ bp(Covariate p) + animal + e
where y is a single trait - vector of observations,
Factors A and B are fixed with ma and mb levels respectively,
Covariates 1 to p are fixed regressions and p is a general number but
less than 20.
Heritability is a variable and should be requested by the program.

You are given a list of the animal IDs of animals with records, and
their sires and dams.  Sire and dam
IDs are smaller than the IDs of their progeny, and all IDs go from 1  to
n where n can be up to 10 million
animals.

Tasks:
1) Estimate the EBVs of all animals using BLUP and mixed model  equations
and
  list the top 10 largest EBVs with associated animal IDs,
  first ten levels of Factor A with solutions,
  first ten levels of Factor B with solutions,
  and all estimated regression coefficients. 

Submit your R program to Bill Szkotnicki (bszk@uoguelph.ca) by January
5, 2007.  Submissions
will be dated by their arrival date.  Provide any special functions or
details that might be needed to run your program.

All R programs will be run on the same test data sets, computer  (Linux),
and timed.

Winner: Earliest submitted R program that runs the fastest and gives  the
correct answers.

Prize: Free registration for the Kennedy Conference in 2008 in Guelph.

--
Lep pozdrav / With regards,
   Gregor Gorjanc
----------------------------------------------------------------------
University of Ljubljana     PhD student
Biotechnical Faculty
Zootechnical Department     URI: http://www.bfro.uni-lj.si/MR/ggorjan
Groblje 3                   mail: gregor.gorjanc <at> bfro.uni-lj.si

SI-1230 Domzale             tel: +386 (0)1 72 17 861
Slovenia, Europe            fax: +386 (0)1 72 17 888

既に気づかれているかたもいらっしゃるでしょうが...

間瀬茂 (2006-10-16 (月) 16:35:43)

R の新しい公式マニュアル 「R internals」 が公開されています。R 開発者向けに R システムの内部言語仕様情報やコーディングスタイルが紹介されています。どう見ても末端ユーザー向けでは無い。それと、R 2.4.0 の変更点で「システム関数の再定義ができなくなった」と書いてあるように読めるのですが本当でしょうか。Debian パッケージの公開が遅れているので確認できません

  • 試してみますが、どこに書かれていますか?そのような記載は見当たらなかったです。 -- takahashi? 2006-10-16 (月) 17:36:06
  • それは,ここでしょう。 -- 2006-10-16 (月) 17:53:01
    http://cran.r-project.org/src/base/NEWS
    CHANGES IN R VERSION 2.4.0 の
    USER-VISIBLE CHANGES の4つ目
       o	The bindings in the base environment/namespace (currently the
    	same thing) are now locked.  This means that the values of
    	base functions cannot be changed except via
    	assignInNamespace() and similar tricks.
  • 確かに、再定義できなくなってます。 -- takahashi? 2006-10-16 (月) 18:03:09
  • 再定義ってどういうことをさしているのか,私にはわかりませんでした。 -- 2006-10-16 (月) 18:07:04
    > attach <- function(x) sqrt(x) # attach という関数を再定義?した??
    > attach(8) # 再定義された結果が得られる
    [1] 2.8284271247461903
  • <<-のことです。↑の例は、base envのattachにbindingしてるわけじゃなくて、カレントenvに新しい変数を作成してるだけですので。なので<<-であっても、それより親envにbase envの変数や関数と同名の変数や関数が定義してあるなら、問題ありません。ようするに、 -- takahashi? 2006-10-16 (月) 18:11:54
    t<-1 # OK *1
    t<<-1 # NG
    f<-function(){t<<-1}
    f() # OK. tが*1で定義されてるので。
    rm(t)
    f() # NG. *1のtを削除したので、f()の中のtがbase::tを参照するから。
  • 環境毎のロックlockEnvironment シンボル単位のロック lockBinding ロックの解除 unlockBinding ロックしてたっけ? bindingIsLocked? .
    #################### ロックが嬉しいケースもあるのかも...
    > t<-1 # OK
    > lockBinding("t",globalenv())
    NULL
    > t<-2 # ERR
    エラー:'t' に対するロックされたバインディングの値は変更できません
    > unlockBinding("t",globalenv())
    NULL
    > t<-2 # OK 
    > t
    [1] 2
    ##################### PI を無理矢理
    > options(digits=22)
    > base::pi
    [1] 3.141592653589793
    > assign("pi",3.14,envir=baseenv())
    以下にエラーassign("pi", 3.14, envir = baseenv()) :
            'pi' に対するロックされたバインディングの値は変更できません
    > unlockBinding("pi",baseenv())
    NULL
    > assign("pi",3.14,envir=baseenv())
    > lockBinding("pi",baseenv())
    NULL
    > pi
    [1] 3.14
    どうしても何か変えたい時に参考になれば. -- なかま 2006-11-15 (水) 17:37:31

韓国語メッセージ

岡田 (2006-09-25 (月) 16:14:03)

Windowsインストーラ関係の日本語訳は無事送りましたが、韓国語の翻訳者に連絡がとれなくなってしまい困っているそうです。どなたか2つ下の「Windows版インストーラの日本語メッセージ」にある文章の韓国語訳をしてくださる方がいらっしゃいましたら、こちらにコメントしていただくか、までメールで送っていただけませんか?
よろしくお願いいたします。


R-2.4.0の日本語メッセージ

岡田 (2006-09-21 (木) 00:18:09)

1つ下の記事にWindowsインストーラの日本語メッセージのお願いも出しましたが、こちらはOSにかかわらないRの出力メッセージの英日翻訳ご協力のお願いです。今回は95%からのスタートです。

※翻訳システム Pootleのバージョンアップを行いました。

  • 翻訳システムにはhttp://pootle.okada.jp.org/ でアクセスできますが、大幅なバージョンアップのため、ログインアカウントはいったんリセットされています。お手数ですがもういちどアカウントを取得してください。
  • ページ右上の"Register"から、メールアドレスを入力してパスワードを決めるだけで登録できます。登録すると"activation code"がメールで届きますから、それをWeb上で入力すれば登録完了です。
  • ログインすると"Projects"に"R-2.4.0"があります。さらに"ja"とたどると、本体のメッセージ("po"フォルダ)およびバンドルパッケージのメッセージ("src"フォルダ)があります。それぞれのフォルダ内にあるファイルをクリックすると1文ずつ翻訳できます。
  • フォルダ一覧がでているところで、"Show Editing Functions"をクリックすると、"Quick Translate"(未翻訳やFuzzyな部分だけをピックアップして翻訳)などの便利な機能がつかえます。
  • WindowsでもMacでも、Firefoxを使うとフォントが大きめに出てしまうようです。WindowsではIE, MacではSafariを使うと適切な大きさになるようです...
  • "%s" "%d" "?n" のような記号はそのまま訳文中にも残してください。
  • "%s" "%d"のような記号が2つ以上ある文では、訳文中でも出現順序がかわらないようにご注意ください。

    今回は9月26日締め切り(Prof. Ripley said, "This really is a hard deadline, "だそうです)ということなので、みなさまどうぞご協力よろしくお願いします。
  • Pootle の日本語訳部分の表示がおかしいですね。文字が多きめで、上下が欠け、行が一部オーバーラップしており、判読不能です. -- 間瀬茂 2006-09-21 (木) 18:01:10
  • Firefoxの場合の症状ですね、ちょうどいま、スタイルシートを修正してみました。これでFirefoxでもOkになったと思います。 -- 岡田 2006-09-21 (木) 20:59:30
  • 実は旧式 Mozilla を使っているのですが、FIrefox では確かに正常に表示されるようになりました。 -- 間瀬茂 2006-09-21 (木) 22:35:04
  • SIngular, Plural と単数と複数の場合が並べて表示されますが、日本語訳はどう入力したら良いのか。それと、以前の訳とまったく対応していない物が多数あるようです.困った。 -- 間瀬茂 2006-09-21 (木) 23:21:52
  • 単数、複数を日本語で訳し分けるのは難しいので、意味に大きな影響がなさそうなら同じにしてしまってもよいのではないかと思います。Fuzzy扱いになっている訳は、新規のメッセージに対して機械的に似ていそうな既存の訳文をあてはめただけのものなので、最初は大きくずれているように見えるものもあります。Fuzzyになっていないもので対応していないものがありますか? -- 岡田 2006-09-22 (金) 00:46:45
  • おかげさまで100%になりました! ご協力ありがとうございました -- 岡田 2006-09-22 (金) 16:38:39

Windows版インストーラの日本語メッセージ

岡田 (2006-09-20 (水) 22:36:14)

R-2.4.0のリリースが迫っていますが、今回はWindows版のインストーラも若干メッセージが追加されるようです。私はWindowsをあまり使わないので、Windowsらしい翻訳文を作ることができないのですが(^_^;; 、どなたかWindowsっぽく見える訳文を教えていただけませんでしょうか?

なお、"="の左側はプログラム内部で使われるメッセージの識別記号ですので、"="の右側の訳文案をお寄せください。

(9/22追記: とりあえず下記のような文案で送っておきました。おかしなところがあればどんどんご指摘ください)

  • 追加されるメッセージ ここから
    ja.startupt=起動時オプション
    ja.startupq=起動時オプションをカスタマイズしますか?
    ja.startupi=「はい」または「いいえ」を選択し、「次へ」をクリックして下さい
    ja.startup0=はい (カスタマイズする)
    ja.startup1=いいえ (デフォルトのまま)
    ja.MDIt=表示モード
    ja.MDIq=MDIとSDI, どちらの表示方法にしますか?
    ja.MDIi=「MDI」または「SDI」を選択し、「次へ」をクリックして下さい
    ja.MDI0=MDI (Rを1つの大きなウィンドウで表示)
    ja.MDI1=SDI (複数のウィンドウを使用して表示)
    ja.HelpStylet=ヘルプの表示方法
    ja.HelpStyleq=ヘルプはどのような表示方法にしますか?
    ja.HelpStylei=テキスト形式, CHMヘルプ, HTMLヘルプのどれかを選び、「次へ」をクリックして下さい
    ja.HelpStyle0=テキスト形式
    ja.HelpStyle1=CHMヘルプ(Windowsのデフォルト)
    ja.HelpStyle2=HTMLヘルプ
    ja.Internett=インターネット接続
    ja.Internetq=internet2.dll を使って、RがInternet Explorer のプロキシ設定を参照するようにしますか?
    ja.Interneti=「標準」か「Internet2」を選択し、「次へ」をクリックして下さい
    ja.Internet0=標準
    ja.Internet1=Internet2
    ja.adminprivilegesrequired=Rをインストールするためには、管理者権限のあるユーザでログインするべきです
    ja.adminexplanation=注意: Rを完全にインストールするためには管理者権限が必要でが、
    現在のユーザでは権限が十分でないようです。このまま続けると、DCOMサポートをインストールできず、
    またRを拡張子.RDataのファイルに関連付けることもできません。
    また、書き込み権限のあるディレクトリにしかインストールすることができません。
    ja.recordversion=バージョン番号をレジストリに保存する
  • ここまで

第三回 R ユーザー会(予告)

間瀬茂 (2006-09-19 (火) 12:31:34)

間瀬です.第三回の R ユーザー会が12月8、9日(金土)に統計数理研究所で行われる予定です.これまでと同様に8日(金)に招待講演者(言語英語)、9日(土)にユーザー会(言語日本語)を予定しています。招待講演者については現在交渉中ですが、大物の来日が予定されています(guess who!)。正式に決まりましたらまたお知らせします。関連してユーザー会で講演いただける方を募集しますので振るって御参加ください。こちらからご講演をお願いした場合はよろしくお願いします。内容はこれまで同様幅広く考えていただいて結構です.講演の申し込みは私(m a s e s h i g e r u @ g m a i l. c o m)までお願いします。


Firefox用のR Site Searchエクステンション

谷村 (2006-09-01 (金) 22:27:59)

A firefox extension for R Site Searchが出ていました。
RSiteSearch?()に慣れてしまった人にもひと味違う2ペインです。

rsitesearch.smaller.png

CRAN パッケージ数

夏休み中の暇人? (2006-08-21 (月) 15:41:26)

今日現在の CRAN パッケージ数は817。

  • 最近たまたまRLadyBug?という感染症数理のパッケージを発見しましたが、CRANには登録されていないようでした。こういうパッケージってけっこうあるんでしょうか? -- まさひと? 2006-08-30 (水) 00:41:47
  • ググッと一発。 Voila http://www.statistik.lmu.de/~hoehle/software/RLadyBug/index.html -- Doo bee doo bee doo...? 2006-08-30 (水) 05:03:21
  • いえ、そういう趣旨ではなくCRANに登録されていないパッケージって何個ぐらいあるのかという意味です。 -- まさひと? 2006-08-30 (水) 09:57:03
  • BioConductorなどCRANのサイトに記載がないものは、User R! やCRANのメーリングリスト、論文、やはり最後はググルしかないのではないでしょうか? -- Doo bee doo bee doo? 2006-08-30 (水) 13:21:18

R で物理乱数

間瀬茂 (2006-08-20 (日) 20:19:50)

本日公開のパッケージ random は R から物理乱数を使うことを可能にするようです。ネットでリアルタイムで生成公開されている物理乱数を R 経由で取り寄せるようです。Mersenne-Twister 乱数でもまだ不安な方はお試しあれ。速度は当然遅い。http://www.random.org には生成済み乱数ファイルが用意されているから、それを使ったほうが早そう。

  • Linuxのカーネルモジュールのhw_randomモジュールがロード出来てrng-toolsをインストールしてrngdデーモンを起動していれば,(要するに一部のハードでしか動きません) /dev/randomで物理乱数が使えます(hw_randomがロード出来なければ加速度的にマウスを動かせばもしかしたら...ハイパーオリンピックなるゲームを思い出すかも...)。こちらから人柱の方はどうぞ。間違っても乱数生成競技など誤った御利用方法による諸問題について責任は追い兼ねますので御了承下さい. -- なかま 2006-09-06 (水) 00:26:52

国際化R普及調査に御協力お願いします

なかま (2006-08-08 (火) 16:07:50)

2005年度中に
1.「査読付き論文」
2.「その他の論文・寄稿記事」
等にRの国際化機能(CJKフォント,ファイル名,オブジェクト名)を使われた方は

Title :
Author :

郵便番号 :
住所 :
電話番号 :
氏名 :

以上を御書き添えの上, eiji.nakama@gmail.com までお送り願えると幸いです.
御協力頂いた方には抽選で豪華(個人差はあるでしょうが)商品をお送り致します.
データの利用目的はIPAでの開発成果に関する論文数の調査に利用いたします.
尚, 開示頂いた個人情報は商品発送目的以外での利用は致しません.
個人データの開示が嫌な方は抽選から洩れますが御協力頂ければ幸いです.

当選者の発表は発送をもってかえさせて頂きます.抽選はRで行います.

〆切は 8/10 AM 9:00をもって終了します.(だって今日来たんだもん)


エレガントな解を追求するクイズ---#1

クイズマニア? (2006-07-18 (火) 23:24:19)

各行が,二項係数になるような行列を作る
もっと短く,もっとエレガントに

p <- matrix(0, 20, 20)
p[1,1] <- 1
for (i in 2:20) {
	p[i,] <- p[i-1,]+c(0,p[i-1, 1:19])
}
  • choose 関数があるから。 -- 2006-07-19 (水) 06:56:36
    outer(0:19, 0:19, FUN=choose) # 少しでも短い方が良いなら outer(0:19, 0:19, choose)

pukiwiki-mode.el

Emacs user? (2006-07-18 (火) 13:30:03)

スクリーンショット

pukiwiki-mode.png

pukiwiki-mode.elはここからダウンロードできます。


useR! 2006 の講演スライド公開

間瀬茂 (2006-07-01 (土) 05:59:12)

Dear useRs,

the useR! 2006 conference took place in Vienna two weeks ago: it was an
exciting and interesting meeting with about 400 useRs from all over the
world and more than 150 presentations.

Especially for those of you who could not make it to the conference, we
have made 4up PDF versions of the presentations slides available.

The slides for the keynote lectures are available at

http://www.R-project.org/useR-2006/Keynotes/

and the user-contributed presentations at

http://www.R-project.org/useR-2006/Presentations/


Finally, some materials for the panel discussion on "Getting recognition
for excellence in computational statistics" are provided at

http://www.R-project.org/useR-2006/PanelDisc/

including a summary, the short presentation slides of the panelists and
the full discussion as a video.

A big thank you to everyone who contributed to the conference and...
best wishes from Vienna!

The organizing team
Achim, Torsten, David, Bettina, Fritz and Kurt.


MacOSX版でrgdalをインストール

谷村 (2006-06-22 (木) 18:15:34)

2006年6月29日のTutorial of Analysing Spatial Data in Rに出席されるMacOSXユーザの方への連絡事項なのですが、多少の公益性があるので、この掲示板を借ります。

MacOSXでは、install.views("Spatial")でもrgdalは入りません。下記の手順を参考にしてインストールして下さい。

  1. Darwin Portsをインストールします。手順はここを参照。
  2. 下記のコマンドでgdalのインストールを試みます。
    $ sudo /opt/local/bin/port install proj
    $ sudo /opt/local/bin/port install gdal
    projの方は成功すると思いますが、gdalの場合は依存パッケージであるreadlineのインストール段階で失敗すると思います。
    --->  Fetching readline
    --->  Attempting to fetch readline51-001 from  ftp://ftp.cwru.edu/pub/bash/readline-5.1-patches/
    --->  Attempting to fetch readline51-001 from http://distfiles-od.opendarwin.org/
    --->  Attempting to fetch readline51-001 from http://distfiles-msn.opendarwin.org/
    --->  Attempting to fetch readline51-001 from http://distfiles-bay13.opendarwin.org/
    Error: Target com.apple.fetch returned: fetch failed
    Error: The following dependencies failed to build: readline
    Error: /opt/local/bin/port: Status 1 encountered during processing.
    ダウンロードに失敗したファイルをwgetで落とせば後の処理はうまくいきます。wgetをまだ入れていない方は先にwgetをインストールして下さい。
    $ cd /opt/local/var/db/dports/distfiles/readline
    $ sudo /opt/local/bin/wget ftp://ftp.cwru.edu/pub/bash/readline-5.1-patches/readline51-00{1,2,3,4}
    $ cd -
    $ sudo /opt/local/bin/port install gdal
  3. 次に、rgdalのソースをとってきて展開します。configureをCVSのものと差し替える必要があります。
    $ wget http://cran.md.tsukuba.ac.jp/src/contrib/rgdal_0.4-4.tar.gz
    $ tar xvzf rgdal_0.4-4.tar.gz
    $ cd rgdal
    $ wget http://rgdal.cvs.sourceforge.net/*checkout*/rgdal/rgdal/configure?revision=1.6
    $ mv configure?revision=1.6 configure
    $ sudo R CMD INSTALL ./
    gdal-configへのパスが通っていればこれでrgdalがインストールされます。

    私の場合はパスが(意図的に)通っていないので、
    $ sudo R CMD INSTALL --configure-args='--with-gdal-config=/opt/local/bin/gdal-config' ./
    としました。

    うまくインストールできなかった方は遠慮なくご相談ください。

Postscriptの取り込みと描画

谷村 (2006-06-21 (水) 15:36:13)

任意のベクトル画像をプロットすることが長い間の課題でしたが、今日、grImportパッケージを使うと、Postscriptを取り込めることを知り、さっそく試してみました。スケールを小さくした場合につぶれてしまうなど微妙な問題があるようです。 例えば、no_entry.pngを使って大きさを変えながら描画してみると
表示例no_entry_result.png
標識中央の白線左側が正しく描画できていません。また、小さいものは赤白の比率がおかしくなっています。
ソース

library(grImport)
a <- PostScriptTrace("tmp4.eps")
b <- readPicture("tmp4.eps.xml")
grid.newpage()
pushViewport(viewport(x=0.5, y=0.5, w=0.8, h=0.8,xscale=c(0,10), yscale=c(0,10)))
grid.rect(); grid.xaxis(); grid.yaxis()
for (i in 1:20/100) {
  grid.symbols(b,size=unit(i,"npc"),x = unit(runif(1), "npc"), y = unit(runif(1), "npc"))
}
popViewport()
  • Postscript画像に文字が入ると英文和文にかかわらずうまくいかないようです。環境 Vine3.2+R 2.3.1 -- 谷村 2006-06-21 (水) 16:20:06
    > a <- PostScriptTrace("tmp6.eps")
    GNU Ghostscript 7.07: Unrecoverable error, exit code 1
    以下にエラーPostScriptTrace("tmp6.eps") : status 256 in running command \
    'gs -q -dBATCH -dNOPAUSE -sDEVICE=pswrite -sOutputFile=/dev/null \
     -sstdout=tmp6.eps.xml capturetmp6.eps' \
  • b <- readPicture("tmp4.eps.xml") の tmp4.eps.xlm をこのページへアップロードしてください。追試できません。 -- 2006-06-21 (水) 20:03:45
  • あ・そうか。質問じゃないのね。失礼しました。 -- 2006-06-21 (水) 22:05:47
  • うーん, うちでやってみると, フォントがあるのは `embedFonts("hode.eps")' (中はGSですが,)すればいいようです.微妙な図になりますが... -- なかま 2006-06-22 (木) 00:09:42
    postscript("norm.eps", horizontal = FALSE, onefile = FALSE, paper = "special",
                           width=4, height=4, bg="yellow")
    curve(dnorm,-5,5,axes=F,ylab="",xlab="",main="dnorm",col="red")
    dev.off()
    embedFonts("norm.eps")
    
    library(grImport)
    a <- PostScriptTrace("norm.eps")
    b <- readPicture("norm.eps.xml")
    grid.newpage()
    pushViewport(viewport(x=0.5, y=0.5, w=0.8, h=0.8,xscale=c(0,10),  yscale=c(0,10)))
    grid.rect(); grid.xaxis(); grid.yaxis()
    for (i in 1:20/100) {
            grid.symbols(b,size=unit(i,"npc"),x = unit(runif(1), "npc"), y =  unit(runif(1), "npc"))
    }
    popViewport()
  • いつもありがとうございます > なかまさん。embedFonts()でエラーを回避できました。しかし、プロットされるeps画像はさらにおかしなことに。上記のnorm.epsでもdnormの文字がただの太い黒線になりますね。まだ、Cartography的な使い方をするには厳しい段階ですが、期待しています。> Pual Murrell先生 -- 谷村 2006-06-22 (木) 11:16:55

ミラーサイトの接続できません。

Ryuu? (2006-06-19 (月) 21:27:44)

パッケジをインストールしようとしたところ、ミラーサイトを選んだときに

chooseCRANmirror()
以下にエラーopen.connection(file, "r") : コネクションを開くことができません
追加情報: Warning message:
'cran.r-project.org' をポート 80 でコネクトできません

というエラーメセッジが出た。どうすればいいでしょうか。教えていただきませんか。

  • cran.r-project.org を選ぶのがマナーにはずれている(近いところを選ぶべし)。それと,そんなに急ぐこともないのだから,しばらく待ってもう一度やってみる。一日か二日くらいは待ってみる。なお,今までに同じようにやっていて今回はできなかったと言うことを仮定しての回答であるが,今回が初めてでそのエラーが出たというなら,使い方が間違えている可能性もあり,その場合にはあなたがどういう操作をしてそのエラーに遭遇したかをくわしく書かないと回答はえられない。
    それよりなにより,ここは,質問の場所でもクレームを付ける場所でもない。お門違いと言うことを分かって欲しいものである。 -- 2006-06-19 (月) 21:53:49
  • 回答、ありがとうございました。メニュから、パッケージを選択して、ドロップしたサブメニュに、CRANミラーサイトの設定を選択した後に上のエラー出ました。 -- Ryuu? 2006-06-19 (月) 22:12:13
  • 申し訳ございません。 -- Ryuu? 2006-06-19 (月) 22:13:59
  • 職場や学校では、インターネットに接続するためにプロキシサーバが必須になっている場合がありますよ。Windowsであれば、Internet Explorerの「ツール」メニューの「インターネットオプション」を出し、「接続」タブをみるとわかります。 -- 2006-06-21 (水) 00:45:54
  • もしプロキシが必要な場合は、Windowsならば、Rの起動用ショートカットのプロパティを参照して、...Rgui.exe" のあとに --internet2 と追記すればよいです。 -- 2006-06-21 (水) 00:48:58
  • proxyの設定についてはCRAN国内ミラーの使い方が参考になります。 -- とも? 2007-07-25 (水) 10:13:21

R は静かにひろまっているか?

間瀬茂 (2006-06-16 (金) 00:39:18)

私の研究室を昨年修了したもと院生(The R Book の一章を書いている人物)から近況メイルをもらいました。彼は現在ある銀行で為替リスクを計量するシステムの仕事をしているそうですが、その部署でも既に R を使っている人がいて驚いたそうです。なかなか表には聞こえてきませんが、統計をヘビーに使うような業種では結構つかわれているのかなとおもいました。

  • 製薬業界でも,研究部門では R が静かに使われているようですね^^. -- 舟尾? 2006-06-16 (金) 01:27:35
  • 製薬業界は基礎研究費に制約があるのでパソコンソフトにお金をだせない所が多いようです。申請でない限りフリーソフトを使っています。 -- 2006-06-16 (金) 08:28:26
  • 日ごろは専らラテフで作業しているのに、事務に出す書類はわざわざ手間かけてワードで汚く書き直している、...みたいな(笑)。 -- 大学関係者? 2006-06-16 (金) 10:21:18
  • useR!の会場からカキコしています。私の出席したセッション(ファイナンス&時系列)でも、銀行、保険会社でRを使っているユーザーの報告がありました。他の言語、プログラムとの併用も考えれば、相当な人が使っているのではないでしょうか。 -- ジェットラグ? 2006-06-16 (金) 17:16:10

R graphical manuals公開

小笠原? (2006-06-14 (水) 18:53:09)

Rの各パッケージに付属するマニュアルのExampleを実行すると美しいグラフィックスを表示するものがたくさんあります。そのようなグラフィックスを集めて表示するページを(株)情報数理研究所より公開しました。 ( http://bg9.imslab.co.jp/Rhelp/ )
ご意見いただけると幸いです。

  • (株)情報数理研究所 これだけ一挙に集めると壮観ですね。ええと、これは会社の製品と何か関係(使用)しているのでしょうか? 遠慮せずに宣伝してください。 -- 間瀬茂 2006-06-14 (水) 20:36:54
  • 凄いの一言...興味本位で恐縮ですが, ctvパッケージのようなカテゴライズをすると言うのはどうでしょう.(^_^; -- なかま 2006-06-14 (水) 21:44:07
  • COM-ONE社さんもがんばらなきゃ(笑) -- 間瀬茂 2006-06-14 (水) 23:12:57
  • 間瀬様、中間様どうもありがとうございます。ctvパッケージのカテゴライズ、試してみたいと思います。(その前に同じ図が何回か出てるのを早急に直さないと....) このページは現在開発中のDuckbillという実行可能ドキュメントシステムのひとつの使用例のつもりです。Duckbillは実際のデータ解析作業の労力軽減・効率向上のために作られたものです。これはフリーで配布して段々に機能を追加していくつもりです。 -- 小笠原? 2006-06-15 (木) 01:51:43
  • 楽しみにしています(bioconductorも入れてくれるとうれしいです) -- 2006-06-15 (木) 08:16:29
  • 落ち着いたらbioconductorも入れようと思います。しばらくお待ちください。 -- 小笠原? 2006-06-15 (木) 21:30:10
  • RSiteSearch?()を書き換えればRから検索もできるかな? -- 2006-06-16 (金) 10:56:23
  • 間瀬様、みなさま、貴重なアドバイスありがとうございます。ctvのカテゴライズを入れてみました。 -- 情報数理研究所 服部? 2006-06-16 (金) 19:27:27
  • 補足です。ctvに対応したのはトップページだけです。ImageBrowser?は未対応です。これから試してみたいと思います。 -- 情報数理研究所 服部? 2006-06-16 (金) 19:29:54

Rによる空間データ分析のチュートリアルとワークショップ

谷村 (2006-06-07 (水) 21:16:56)

Rを用いた空間データ分析のチュートリアルが6月29日に開催されます。講師は、Rの主要な空間データ分析関連パッケージ(spパッケージやmaptoolsなどいろいろ)の作者であるRoger Bivand先生です。参加費は無料ですが、会場スペースの都合で先着順60名のみを受け付けます。詳細はここを参照してください。なお、チュートリアルに引き続き6月29-30日に空間データ分析のワークショップを開催しますので、こちらもあわせてご参加ください。

  • いよいよ後2日に迫りましtが、Bivand先生はその前に京都で経済学者のミーティングにも招かれているようですが、これに関するWebページはどなたか、ご存知でしょうか? -- long rider? 2006-06-27 (火) 10:19:39
  • これかな -- 2006-06-27 (火) 10:40:44
  • おお、まさしくこれだ!!ありがとうございます。 -- long rider? 2006-06-27 (火) 12:32:37
  • 今回のワークショップで使用されたPPTなどは公開されないのでしょうか? -- lax? 2006-07-03 (月) 13:16:41

世界で最も有名な統計家は誰れ?

間瀬茂 (2006-06-07 (水) 15:53:37)

馬齢を重ねてもまだまだ「本当!知らなかった!」という話を聞くことがあります。つい最近知って仰天した話を紹介します。クイズ形式で

(1) 世界で最も有名な統計家は?
(2)円グラフを発明した人は?
(3) 英国王立統計学会の最初の女性会員は?

答えはフローレンス・ナイチンゲール、そうあの近代的看護学の母です。実は彼女は数学の才に恵まれ、統計学者として有能な人物だったそうです。円グラフ(coxcomb diagram)は彼女がクリミヤ戦争の悲惨さを政府のお偉がたに納得させる(彼らは数字が大嫌い)ための有効な方法として考案したのだそうです。そのグラフは、戦争による死者は、戦闘そのものよりは、怪我の処置の不足で死ぬ方が多いことを雄弁に立証することに効果があったそうです。

ただし、彼女の円グラフは、いわゆる円グラフとは少し異なるもので、パイ(扇形)の半径が異なるものだったようです。実例はここでみられます

電車でたまたま一緒になった東工大の宮川先生とこの話で盛り上がったさい、次の近刊本を紹介されました。「統計学を拓いた異才たち」(日本経済新聞社)。まだ読みかけですが、面白い話がいっぱいでお薦めです。宮川先生から聞いたもう一つの「本当!」は、仮説検定論の基礎である Neyman-Pearson の補題(最近は定理というらしい)で有名な Pearson はあの統計学者 Karl Pearson の子供 (Egon S. Pearson) だということ。危うく同一人物と信じたまま棺桶に入るところでした。K. Pearson は Fisher 流の数理統計学は大嫌い(理解不能だった)ようです。

  • ナイチンゲールに関しては、多尾清子(1991)『統計学者としてのナイチンゲール』医学書院、があります。図版やデータの紹介もあります。ナイチンゲールは統計教育の必要性を感じ、オックスフォード大学に応用統計学の教授職を創設する運動をしていたそうです。 -- あらき 2006-06-09 (金) 14:52:50
  • 『R.A.フィッシャーの統計理論(九州大学出版会)』も面白いです -- 2006-06-14 (水) 23:54:56

日本計量生物学会でR利用のチュートリアル

QDU? (2006-05-15 (月) 17:49:58)

日本計量生物学会でRのチュートリアル二つが予定されています。うちひとつは中澤先生によるもの。以下のURLを参照してください。

  • 怖いもの知らずにも引き受けてしまったのですが,このチュートリアルは,基本的には,日常SASを使って統計解析をしている方にRの使い方をお示しするという主旨らしいです。何か「Rは便利だぞ」とアピールするような参考情報があればお教えいただけると助かります(玉砕するような気もしていて,実はやっぱり不安ですが)。 -- 中澤? 2006-05-16 (火) 10:05:12
  • bioconductorを常用するのでRはかかせません -- Akira? 2006-05-16 (火) 13:50:13
  • こんなのもありましたけど, 最大の特徴はRの場合好きに弄れます. 弄った成果はGPLです.:-) ちなみに3年前のRを日本語化して下さいと言われても,「*仕事*なら断りますが(爆)」。国際化も極東から順に対応していきますし(ウラル山脈で激突か?!), メモリー管理とか, 速度とか興味深い課題も多いですから, R-7.0.0あたりを目標に日々精進していきたいと思います(笑) 「失礼, GPL最大の利点で, Rは倒産したり撤退したり商業的理由で無くなったりしません」-- なかま 2006-05-16 (火) 21:42:28
  • 大規模データからのマイニングに適したSAS, インタラクティブな探索的解析に適したRという住み分けがはっきり示せると、なぜか小規模データの探索的解析にSASを使っているユーザを取りこめるんじゃないかと思っています -- 岡田 2006-05-18 (木) 07:55:23
  • いろいろsuggestionありがとうございます。ぼくの後が国立がんセンターの吉村公雄先生で,主にgeneticsライブラリを使ったゲノム解析の話をされるので,ぼくはその前座です。データハンドリングのいろいろなやり方に重点をおいて説明しようかと思っています。 -- 中澤? 2006-05-18 (木) 10:17:57
  • 大規模データのRでの取り扱いについては、最近本家Rのメーリングサイトにいろいろと記事が投稿されていましたね。 -- MJ? 2006-05-18 (木) 10:29:46
  • SASはグラフのセンスが絶望的で,実は論文や報告書には使えないということをさりげなく知らせることが吉です. -- 名もなき者? 2006-05-23 (火) 16:07:58
  • ちょっと時間を超過してしまってご迷惑をおかけしたり,後悔する点も多かったのですが,とりあえず無事に終わりました。自分のサイトにプレゼンをアップロードしておきましたので,何かのご参考にしていただければ幸いです。 -- 中澤? 2006-05-29 (月) 19:24:47
  • 中澤先生のこの資料をRを薦める100+の理由でリンクしていいですか? -- 2006-05-30 (火) 08:25:52
  • どうぞ。リンクと引用についてに書いた通り,中澤のサイト内各ページへのリンクはまったく自由です。 -- 中澤? 2006-05-30 (火) 10:10:07

lapply 関数に対するR教授のコメント

QDU? (2006-05-15 (月) 17:44:09)

apply 関数族は単に for loop を隠しているだけと思っていたら lapply 関数は実際に早くなることもあるそうです。r-help のR教授のコメントを引用:(また日本語スパム投稿があったようですね。)

> Can someone tell me why apply (and apply) are faster in performing
> repeated operations than a for (or do) loop? I am looking for a
> technical explanation.

apply() is just a wrapper for a for loop.  So it is not faster that at
least one implementation using a for loop: it may be neater and easier to
understand than an explicit for loop.

lapply() can be faster than a carefully crafted for() loop (since C-level
code is more efficient in memory allocation), but its main rationale is
clarity (and especially to avoid traps like

ans <- vector("list", n)
for(i in 1:n) ans[[i]] <- fun(i)

if n turns out to be zero or fun(i) to be NULL).

R Foundation と Google

間瀬茂 (2006-04-26 (水) 12:27:54)

R の開発を支援する公式団体 R Foundation という組織があることは御存じの方も多いと思います。CRAN にある Foundation への寄付者一覧に Google の名前があることに気づき驚きました。他にも製薬会社の Merck やアメリカ統計学会(IMS)の名前もあります。実は私(そして中澤さん)も印税の一部を寄付しております。他にも supporting member 制度があります。わずかな年会費(カードがあれば支払いも簡単です)で CRAN に名前がでますので少し気分が良いです。日頃 R 無しでは生きていけない方は参加如何でしょうか。


R-2.3.0

間瀬茂 (2006-04-24 (月) 21:48:26)

R-2.3.0 が本日公開されました。

  • 設定に関して
    Windows
    Windowsユーザの皆様, フォントの設定の呪文(etc内の2ファイル)を忘れないようにお願い致します. 尚, `Version of East Asia' の選択は無くなりました.(全世界共通バイナリです)
    *nix
    X11のフォントの設定は.Rprofileに以下を加えて下さい
          options(X11fonts=c("-kochi-mincho-%s-%s-normal--%d-*-*-*-*-*-*-*",
                             "-adobe-symbol-medium-r-*-*-%d-*-*-*-*-*-*-*" ))
    X11日本語フォントの一覧は,
          xlsfonts -fn "*jis*"
    で得られます.
    全プラットフォーム共通
    日本語のPostScript?及びPDFを扱う場合は, .Rprofileに以下を記して下さい
          setHook(packageEvent("grDevices", "onLoad"),
                  function(...) grDevices::ps.options(family="Japan1"))
    PostScript?,PDFのフォントの一覧を得るならコマンドラインより
          postscript
                 cbind(lapply(postscriptFonts(),function(x){x$family}))
          pdf
                 cbind(lapply(pdfFonts(),function(x){x$family}))
    尚,イラストレータ等外部にデータを渡す場合は日本語フォントの場合はEPSでは無くPDFをお薦めします-- なかま 2006-04-25 (火) 00:40:39
  • 上記の「日本語のPostScript?及びPDF」について私自身すこし悩みましたので補足しますが、.Rprofile(というファイル)を新規に作り、R-2.3.0のフォルダかマイドキュメントに置いて下さい。もしくはetc/Rprofile.siteに書き足してもOKのようです。 -- Windowsユーザ? 2006-04-26 (水) 23:28:24
  • Mac版も早くも出たようです. 私は, /Applications/R.app/Contents/Info.plistに
    MacOSX(10.4以上)
           <dict>
                   <key>DYLD_FALLBACK_LIBRARY_PATH</key>
                   <string>/Library/Frameworks/R.framework/Resources/lib</string>
                   <key>DYLD_LIBRARY_PATH</key>
                   <string>/Library/Frameworks/R.framework/Resources/lib</string>
                   <key>R_HOME</key>
                   <string>/Library/Frameworks/R.framework/Resources</string>
                   <key>LANG</key>
                   <string>ja_JP.UTF-8</string>
                   <key>LC_CTYPE</key>
                   <string>ja_JP.UTF-8</string>
           </dict>
    LANG,LC_CTYPEを加えましたが, 他にも良い方法がありますか? -- なかま 2006-04-27 (木) 18:05:43
  • 早速導入し,なかまさんの記事を参考に LANG, LC_CTYPE も加えてみましたが,日本語を使った図をpdf ファイルにしたとき,日本語が化けておりました。
    > pdf("test.pdf", width=2, height=2)
    > hist(rnorm(1000), main="日本語")
    > dev.off()
    理解力不足ですみません。 -- 青木繁伸 2006-04-27 (木) 19:31:36
  • ホームディレクトリに, .Rprofileを作成して, 中に setHook(packageEvent("grDevices", "onLoad"),function(...) grDevices::ps.options(family="Japan1")) と書けば行けましたが... -- なかま 2006-04-27 (木) 19:38:29
  • おっしゃるようにしたところ,うまく日本語が表示されました。ありがとうございました。
    最初,上の方で「Windows ユーザは」という記述があったので該当しないのかと思っていました。今日見たら,「全プラットフォーム」ということで,了解です。 -- 青木繁伸 2006-04-27 (木) 21:33:48
  • Mac OSX 10.4.6にR-2.3.0をインストールしましたが,起動すると以下のメッセージがでました:
    2006-04-28 13:34:46.109 R[1113] CFLog (21): Error loading \
       /System/Library/ScriptingAdditions/StandardAdditions.osax \ 
       /Contents/MacOS/StandardAdditions:  error code 4, error number 0 \ (Symbol not found: ___eprintf 
     Referenced from: /System/Library/Frameworks/AppleShareClientCore. \
                      framework/Versions/A/AppleShareClientCore
     Expected in: /Library/Frameworks/R.framework/Resources/lib/libstdc++.6.dylib)
    
    R-2.2.1のときにインストールしたパッケージも消失していました!? 上記のInfo.plistも.Rprofileも設定前のことです。-- 高井? 2006-04-28 (金) 13:33:26
  • いろいろ状態の異なる5台のMacintoshにインストールしましたけど,問題は起きなかったです。もう一度インストールしてご覧になるとよろしいかも。
    インストールしたパッケージ類はバージョンごとに管理されているので,新版をインストールしたらライブラリも再度インストールすべきです。前のバージョンのパッケージは,/Library/Framewaorks/R.frameworks/Versions/*.*/Resources/library の中に入るんです。だから,新しいバージョンからは見えなくなる。 -- 青木繁伸 2006-04-28 (金) 17:11:42
  • CPUはなんでしょう?, PPCなら問題は無いような...ユニバーサルバイナリですから(アーキテクチャによって若干構成が違ってる!?)差異の何処かに原因があるのかも... -- なかま 2006-04-28 (金) 17:42:16
  • >Windowsユーザの皆様, フォントの設定の呪文(etc内の2ファイル)を忘れないようにお願い致します.
    呪文無しでも文字化けのない綺麗な日本語が表示されましたが、念のため呪文を唱えた方が良いでしょうか? -- 2006-04-28 (金) 21:11:32
  • PPC G4のMac miniとPPC G5のPowerMac? G5のMac OSX 10.4.6上で同じ現象でした。で,別のユーザで起動すると上記のエラーはでませんでした。ということはユーザ環境の違いかと気が付き,まずはログイン項目をひとつづつ潰してみました。すると,DefaulFolder? X 2.5.0.b3を併用しないとエラーが出ないことを突き止めました。DefaultFolder? Xを2.0.4に戻してもエラーは出ませんでした。ということは,ベータ版のDefaultFolder? Xが原因だったようです。青木さんのコメントで旧バージョンのパッケージのことも理解できました。ありがとうございます。 (追加)DefaultFolder? X 2.5.0b4がでました。が,これもR2.3.0とコンフリクトします。-- 高井? 2006-04-28 (金) 21:47:17
  • 他人事ながら,これでわかるのでしょうか??
    > >Windowsユーザの皆様, フォントの設定の呪文(etc内の2ファイル)を忘れないようにお願い致します.
    > 呪文無しでも文字化けのない綺麗な日本語が表示されましたが、念のため呪文を唱えた方が良いでしょうか?
    「etc内の2ファイル」?? -- 青木繁伸 2006-04-28 (金) 21:46:35
  • ↑わからない人も多いかもしれませんね。"Rconsole" と "Rdevga" の2つです。「呪文」の内容はRjpWiki内を検索してください。ちなみにこの2つのファイルをマイドキュメントに置いておけばバージョンアップの時も気にしなくて済みます。 -- Windowsユーザ? 2006-04-28 (金) 22:54:22
  • 「rw-FAQ読んでください,マニュアル読んでね」とかって気軽に言える量でもなくなってきてますね.(^_^; -- なかま 2006-04-29 (土) 01:31:14
  • Windowsユーザです。R-2.3.0 で plot() の pch に日本語を使うと化けるのですが原因をご存知の方はお教えください。R-2.2.1では問題ありませんでした。Rdevgaは2.2.1と2.3.0で同じファイルを使用しています。 -- Windowsユーザ? 2006-04-29 (土) 19:07:33
  • そうですね。単に,バイナリファイルをダウンロードしてクリックして「OK」を繰り返せばよいという(それはそれで問題はあるが)のとは違い,面倒ですよね。
    せめて,標準のインストール手順が終わった後は,Windows ユーザはこれをクリック,Mac ユーザはこれをクリックというように簡単になっていれば,利用者も増えるのではないかと思います。あそこを見て,ここを見てというのでは,見ることは見ても,実際にどうやったらよいのかわからないユーザも多いのではないかと思います。Macintoshユーザの例を挙げれば,「/Applications/R.app/Contents/Info.plistに以下の行を加える」と言われても,どうやって加えたらよいかわからないユーザも多いのではないかと危惧します。特にマックユーザはターミナルについてはよくわからないというユーザが多いのではないでしょうか。 -- 青木繁伸 2006-04-29 (土) 21:35:58
  • ううっ(T_T) pchはpoint関係のバグでしょう...MacはInfo.plistを触る必要が無いかもしれません.(LANGがCにされてしまう環境と,ちゃんとUTF-8になる違いが読み取れていません) -- なかま 2006-04-30 (日) 00:45:05
  • 日本語の入ったPSファイルを作成した場合、ゴシック体はHeiseiKakuGo?になるようですね。当方はWindows上でGhostscript7.07をインストールしていますが、デフォルトではRyumin-LightとGothicBBB-Mediumしか設定されてないので、いくらR側の設定を上記のようにしたところで、GS側の設定を正しく行わないと、日本語PSファイルはエラーとなり、表示すらされませんでした。なぜHeiseiKakuGo?なんでしょうねぇ…。 -- Hiro? 2006-04-30 (日) 11:02:37
  • cbind(lapply(postscriptFonts(),function(x){x$family})) -- なかま 2006-04-30 (日) 12:53:55
  • .Rprofileの中に記述する設定で、family="Japan1"と書かれてある部分を family="Japan1GothicBBB" と変えてやると、Ghostscript側の設定変更なしで無事日本語が表示できました。なかまさま、ありがとうございました。 -- Hiro? 2006-04-30 (日) 13:24:55
  • pchで日本語(Windowsだけ)が出ない原因は,mingwのwcrtombの問題でした. さてどうしたものか... -- なかま 2006-05-01 (月) 20:20:26
  • 適当に弄ってみたのをR-2.3.0-win32.exeに置きました. ビルドされたい方は,libmingwex.aもどうぞ. -- なかま 2006-05-01 (月) 23:48:19
  • 結局wcrtombをR本体に収容したので今晩以降のpachedでは問題が発生しなくなります.(^_^; -- なかま 2006-05-02 (火) 06:55:26
  • MacOSX(10.4以上)のときの2つのファイルを変更するRプログラムを書いてみました。コピーして,Rのコンソールへペーストすれば良いはず。
    fn <- "/Applications/R.app/Contents/Info.plist"
    hn <- file(fn, open="r")
    x <- scan(file=hn, what=list(s=""), sep="\n")
    close(hn)
    if (length(grep("LANG", x$s))) {
    	cat("Info.plist は変更せず\n")
    } else {
    	i <- grep("R_HOME", x$s)
    	ln <- length(x$s)
    	x$s[(i+6):(ln+4)] <- x$s[(i+2):ln]
    	x$s[i+2] <- "\t\t<key>LANG</key>"
    	x$s[i+3] <- "\t\t<string>ja_JP.UTF-8</string>"
    	x$s[i+4] <- "\t\t<key>LC_CTYPE</key>"
    	x$s[i+5] <- "\t\t<string>ja_JP.UTF-8</string>"
    	hn <- file(fn, open="w")
    	junk <- sapply(x$s, function(i) cat(i, "\n", file=hn, sep=""))
    	close(hn)
    }
    fn <- "~/.Rprofile"
    hn <- file(fn, open="r")
    x <- scan(file=hn, what=list(s=""), sep="\n")
    close(hn)
    if (length(grep("ps\.options", x$s))) {
    	cat(".Rprofile は変更せず\n")
    } else {
    	hn <- file(fn, open="a")
    	cat("setHook(packageEvent(\"grDevices\", \"onLoad\"),
    	function(...) grDevices::ps.options(family=\"Japan1\"))\n", file=hn, sep="")
    	close(hn)
    }
    スマートじゃないし,チェックも不十分だけど。 -- 青木繁伸 2006-05-02 (火) 10:27:33
  • ついていけてなくて、本日ようやく2.3.0をインストールしましたが、Mac Intel 10.4.6上では .RprofileにsetHook(...)を追記するだけで日本語PDF出力Okでした。なお、MacOS X 10.4では、LANGは「システム環境設定」→「言語環境」→「書式」タブ(「言語」タブではない!)の設定に従って変化します。LC_CTYPEは基本的に未設定です。 -- 岡田 2006-05-04 (木) 01:16:02
  • で、デフォルトのLANGはja_JP.UTF-8のようです(R内, Sys.getenv("LANG")で確認). -- 岡田 2006-05-04 (木) 01:17:05
  • ついでに、$HOME/.MacOSX/environment.plist がユーザ別の環境変数設定です。ここを変えてしまうお行儀の悪いアプリがいると、いろいろと人とは違うことが起こるユーザができあがります:-P -- 岡田 2006-05-04 (木) 01:23:23
  • Windows版も Parallels Workstation のWindows2000新規インストール環境で試してみましたが、RprofileとRdevgaはもう不要になっているようですね。 -- 岡田 2006-05-04 (木) 02:00:21
  • 遅くなりましたが、Vine用のrpmを調整中です。 /usr/lib/R/library/base/R/Rprofileにあらかじめ日本語フォントの設定を書いておいた方が嬉しい人が多ければ、そうしますが、いかがしましょう。Sys.getenv("LANG")は"ja_JP.eucJP"ですが、何故かfont metrics unknown for Unicode characterとエラーがでてepsやpdfで日本語が文字化けします。ちょっと時間がかかるかも知れません。 -- 谷村 2006-05-08 (月) 18:41:21
  • setHook(...)は、Rが起動後に読み込んでも有効ではないようですね。familyをJapan1、Japan1HeiMin?、Japan1GothicBBB、Japan1Ryuminに変えて試行錯誤した結果、HeiseiKakuGo?-W5やHeiseiMin?-W3がインストールしていないにもかかわらず、何故かJapan1とJapan1HeiMin?で正常なepsを作成でき、逆にJapan1GothicBBBとJapan1Ryuminでは正常なepsを吐けないようでした。でも、使えることが分かったので、/usr/lib/R/library/base/R/Rprofileにこれら設定をあらかじめ書いておこうかと思いますが、いかがでしょうか。> Vineな人 -- 谷村 2006-05-08 (月) 18:55:52
  • ご不便をおかけします. setHookはライブラリのロード時に実行しといてね命令ですので,grDevicesのロード(すなわちデフォルトでプロファイルの処理後の基本ライブラリのロード時に処理されます)が行われていないのにそのパッケージに値を設定する目的に利用します(変な日本語ですまんです) なのでロード済みの場合は `ps.options(family="Japan1GothicBBB")' とだけすれば良いです. Vineのghostscriptはvflibの利用が基本ですので, `GS_OPTIONS=-dNOKANJI ggv hoge.ps' 等として 環境変数GS_OPTIONSに vflib使わないでねと知らせてあげる必要があります. この問題はVine以外では発生しない宗教上の問題と認識しています. vine3.2ではどの設定(基本4family) でも作成出来たように思います. Vineは日本向けですから,$R_HOME/etc/Rprofile.site が良いのではないかと思います. -- なかま 2006-05-08 (月) 19:40:11
  • -dNOKANJIで解決です。$R_HOME/etc/Rprofile.siteを含めるようにしてリリースします。ありがとうございました。  -- 谷村 2006-05-08 (月) 19:55:01
  • んと, RprofileとRdevga の件ですが,未設定の場合はFixedFont?を使ってくれます. その為, 以前のような初回起動時の文字化けが発生しません.(もっとも,化ける国は日本だけのようでしたが). 巨大フォントを使いたい場合(例えば36pt)や10point以外のコンソールフォントを利用される場合はRprofileとRdevga 確実に設定して下さい. -- なかま 2006-05-08 (月) 20:01:30
  • R-2.3.0-0vl1.i386.rpmをVinePlus?にputしました。Vineプロジェクトにリジェクトされなければ
    # apt-get install R
    でネットワークインストールされます。ただし、/etc/apt/sources.listのextrasを有効してください。
    R-2.2.1-0vl1をお使いの方へ
    R-2.2.1-0vl1のR.specにバグ(%preunタグのエラー)があり、通常の方法ではR-2.2.1-0vl1を正常にアンインストールできません。従って、rpm -FvhなどでR-2.3.0-0vl1をインストールできなくなっています。大変申し訳ありません。お手数で恐縮ですが、一度、
    # rpm -e R  --noscripts
    でR-2.2.1-0vl1をアンインストールしてからR-2.3.0-0vl1をインストールしてください。-- 谷村 2006-05-09 (火) 02:00:13
  • 谷村さん, 重箱小姑のようで申し訳無いのですが, /usr/lib/R/etc/ldpaths のJAVAのパスは JAVA_HOMEを元にするとかif [ "x${JAVA_HOME}" != "x" ] などで括ってあげると良いかもしれません. 近頃Vineは使わなくなってきたので,よろしくお願いいたします.m(_|_)m `rpm -qa --qf "%-30{NAME}:%{PACKAGER}\n"|grep nakama' 等としてもし何か出てくるようなら危険(ずっとメンテしてない)なパッケージが入っているかも...(^-^; -- なかま 2006-05-09 (火) 11:02:48
  • JAVAのパスはどうしようかと思ったまま放置していました。スミマセン。javaってVinePlus?のnosrc.rpmで入れる人とSun Microsystemsのrpmを入れる人がいるので、ご指摘の通り${JAVA_HOME}を拾う方が親切ですね。対処します。'rpm -qa --qf "%-30{NAME}:%{PACKAGER}\n"|grep -i nakama |wc -l'はゼロでした。 -- 谷村 2006-05-09 (火) 11:24:04
  • R-2.3.0-0vl2.i386.rpmをVinePlus?にputしました。R_JAVA_LD_LIBRARY_PATHの修正です。GRANの方にも修正版をputしておきます。VinePlus?に収録されたらCRANになくてもよいかも知れませんが。。。 -- 谷村 2006-05-09 (火) 15:51:25

IPAX2006

間瀬茂 (2006-04-18 (火) 20:51:43)

中間さんの勤める COM-ONE 社が IPA 事業の一環として R の日本語化プロジェクトを昨年度行ったことはご存知の方も多いとおもいますが、5月17日(水)から19日(金)に IPAX2006 という催し物(東京ビッグサイト, 西展示棟)にブース出展するそうです。幾つか R を使った作業例のパネル展示もされるようです。一番の出し物は中間さん本人と思われますから、まだ実物を見たことがない方、日本語化 R を日ごろ感謝して使って使っていらっしゃる方、は見物がてらお出かけください。IPAX2006 の公式URLは以下の通りです(一見したところ COM-ONE 社の出展に関する記事はまだ見当たりませんが)。
http://www.ipa.go.jp/event/ipax2006/
なお入場には上のURLからダウンロードした招待状に必要事項を記入したものを受付に(名刺と一緒に、なければそれはそれで良いとおもうのですが)提出する必要があるようです。

  • 今日,上記URLが公開されたようです. ついでにプレゼン時間も上記で知りました...ありがとうございます... -- なかま 2006-04-18 (火) 22:40:05
  • IPAX2006招待券が必要な方は `eiji.nakama@gmail.com' まで郵便番号,住所,所属,氏名をお書き添えの上、メール(電子メール)をお送り頂ければ、メール(郵便メール)にて招待状を発送致します。 -- なかま 2006-04-24 (月) 11:49:13
  • プレゼンようのPCがお亡くなりになってしまいました.(汗; 今からリカバリー作業を開始します... -- なかま 2006-05-17 (水) 19:30:32

Rが得意な方のための御仕事(数ヶ月間)です。

竹澤? (2006-04-10 (月) 18:57:27)

Rを使ったプログラミングとデータ解析の仕事をしていただける方(博士号が必須、日本以外の国籍の方も可)を探しています。主に、ノンパラメトリック回帰やニューラルネットワークを含む、広い意味での回帰分析に関するものです。雇用期間は数ヶ月間(2006年度)を予定しています。仕事場は中央農業総合研究センター(つくば市 観音台 3-1-1)です。詳細については竹澤(http://cse.naro.affrc.go.jp/takezawa/index.html)に御連絡ください。


R News, volume 6, issue 1

QDU? (2006-04-03 (月) 12:10:35)

R News, volume 6, issue 1 が公開されたようです。

  • ベイズの特集ですね。 -- 2006-04-03 (月) 13:59:25

祝、GotoBLASソース公開

なかま (2006-03-30 (木) 14:41:15)

あげておきます.
http://www.tacc.utexas.edu/resources/software/祝公開!

  • うひょー、はぇーっ! -- なかま 2006-03-30 (木) 22:37:45
  • 致命的ではないが、多くのバグがあることが判明。これは泣ける。安定するのにはしばらく時間がかかりそう。 -- 後藤 2006-03-31 (金) 06:50:07
  • Win32 などのバイナリは将来は提供されないのでしょうか? -- Goeppingen? 2006-03-31 (金) 14:54:47
  • 特殊な事情(例えば、コンパイラにパッチが必要等、通常では簡単に構築できない場合。)を除いては、バイナリ配布は行わない予定です。組み合わせ数が膨大になるのが主な理由です。 -- 後藤 2006-03-31 (金) 21:18:21
  • 後藤さん、直々のご回答ありがとうございます。 -- Goeppingen?? 2006-03-31 (金) 22:08:56
  • Athlon も密かにサポートしています。性能はいまひとつですが。 -- 後藤 2006-04-01 (土) 00:43:52
  • パッチを2つ出してかなり安定してきたようです。誰かバグを見つけた方はいませんか? -- 後藤 2006-04-09 (日) 23:20:04
  • libgoto_northwood-r1.02.dllをcygwinでビルドして使わせていただいてます.いたって安定動作です. -- k? 2006-04-10 (月) 08:06:03
  • Opteron254*2にSuse10.0 32bitの環境でsoファイルを構築するところまではいったのですが、これから???普段プログラミングをやらない人間には、やっぱり敷居が高いです。お知恵をいただけると助かります。 -- やま? 2006-08-15 (火) 15:04:14
  • 同じOpteron254*2にWinXPでCygwinでビルドしようとすると、level1以降の処理でMakefile.ruleファイルを参照できずに止まってしまいました。残念。 -- やま? 2006-08-17 (木) 01:43:47

UseR 2006 プログラム公開

間瀬茂 (2006-03-28 (火) 06:32:30)

UseR 2006 プログラム

  • 日本の方の発表がいくつかありますね。 -- 蘆花公園? 2006-03-28 (火) 10:38:22

統計ML 記事の転載

間瀬茂 (2006-03-22 (水) 22:40:21)

統計ML stats 投稿記事を転載します。 R の故郷 Auckland 大学で開催されます。R に関する集会も開かれるようです。

stats のみなさま、

Professor David Scott より、ASC/NZSA 2006 の案内の投稿依頼がありましたの
で、代理投稿します。
------------------------------------------------
                      中野純司(統計数理研究所)
                      nakanoj@ism.ac.jp
_________________________________________________________________
 David Scott Department of Statistics, Tamaki Campus
       The University of Auckland, PB 92019
       Auckland    NEW ZEALAND
 Phone: +64 9 373 7599 ext 86830     Fax: +64 9 373 7000
 Email:  d.scott@auckland.ac.nz
 
 Australian Statistical Conference / New Zealand Statistical  Association
 Conference
 Statistical Connections
 SKYCITY, Auckland, New Zealand 3 - 6 July 2006
 
 Please submit abstracts via the website www.statsnz2006.com
 <http://www.statsnz2006.com>
 
 The extended deadline for abstract submissions is Wednesday 22 March 2006.
 
 Early bird registrations close Tuesday 25 April 2006.

 Keynote Speakers who will present a plenary session are David Donoho,
 Peter Hall, Xiao-li Meng and Ray Chambers (Foreman Lecturer).~
 
 There are more than 20 Invited Sessions organized with noted
 speakers. A list of Invited Sessions and Speakers may be found at
 http://www.statsnz2006.com/invitedsp.asp
 
 There have already been over 100 abstracts submitted including many
 from outside Australasia.
 
 Brian Pink from Stats NZ and Dennis Trewin from the Australian Bureau
 of Statistics are to speak at the Official Statistics Forum on Tuesday, July 4.
 
 A number of workshops have been organised around ASC/NZSA 2006.
 
 Introduction to Distance Sampling Workshop 28-30 June 2006
 presented by Steve Buckland
 For further information, see
 <http://www.creem.st-and.ac.uk/NZ2006/Enquiries.htm>
 http://www.creem.st-and.ac.uk/NZ2006/Enquiries.htm
 <http://www.creem.st-and.ac.uk/NZ2006/Enquiries.htm>
 
 Stochastic Processes Workshop 7 July 2006
 For further information, contact Dr Ilze Ziedins:
 ilze@stat.auckland.ac.nz <mailto:ilze@stat.auckland.ac.nz>
 
 R-Fest: Workshops on S, R, and Bioconductor
 S Programming: Bill Venables, CSIRO,
 9:30--13:00, Friday, July 7, 2006
 R Graphics: Paul Murrell, University of Auckland,
 14:00--17:30, Friday, July 7, 2006
 Bioconductor: Robert Gentleman, Fred Hutchinson Cancer Center
 9:00--5:00, Saturday, July 8, 2006
 For further information or to register your interest, email:
 r-fest@stat.auckland.ac.nz

複数のRセッションの並列実行

間瀬茂 (2006-03-21 (火) 23:21:35)

最近の r-help 記事で、R は single-threded だから dual-core CPU マシンで実行してもその分早くならないが、複数のRセッションの並列実行が高速に出来るというメリットがある、と解説があったのが気になり少し実験してみました。次のクイックソートプログラムを複数のRセッションで並列実行してみました。結果は少し理解不能なものになりました。実験例が適当でなかったのか?

>  quicksort <-
     function (x) {
       if (length(x) <= 1) return(x)
       if (length(x) == 2) {if (x[1] <= x[2]) return(x) else return(x[2:1])}
       fence = sample(x,1)  
       return( c(quicksort(x[x < fence]), x[x == fence], quicksort(x[x  > fence])) )
     }
> gc(); set.seed(1111); x<- runif(1e6); system.time(y <- quicksort(x))

結果は次のようになりました。 
 1セッション 30秒
 2セッション 30秒、32秒、
 3セッション 33秒、31秒、33秒、
 4セッション 31秒、31秒、31秒、32秒

  • 失礼、上の時間は各セッションのCPU占有時間ですから、同じ作業なら(ほぼ)同じになるのは当然。もう少し調べてまた報告します。 -- 間瀬茂 2006-03-22 (水) 00:32:35

ページをWeb翻訳した場合のRコード表示部分の崩れについて

okinawa (2006-03-17 (金) 17:07:54)

最近、色々な国の方がRjpWikiを見ているようで、自分のWebページを自動翻訳リンク(日=>英)しようとしたのですが、Rコードを表示させている部分(薄いブルーになる部分)が崩れてしまいます。どなたか回避方法をご存知の方はいらっしゃいませんでしょうか?ちなみに、excite,Google他いくつか試したのですが×でした。(全部英語で作れば?という突っ込みはなしですよ。)


第二回Rユーザー会?

間瀬茂 (2006-03-14 (火) 20:43:38)

私が代表で応募中の第二回Rユーザー会(正式名は共同研究集会?)の申請が認められたと今日統計数理研究所から連絡がありました。というわけで、よろしくご協力ください。出し物等ご要望があれば、この場なり、わたし宛にお寄せください。なお、今年の5月ごろにもう一つRに関係する催し物(Rプロパーではありません)の予定があるとさる筋から極秘情報がありました。はっきりしましたら、またご紹介します。


Linux, Windows or Mac ?

間瀬茂 (2006-03-11 (土) 15:47:59)

r-help では何度も取り上げられる話題に「R を動かす最適プラットホームは何か?」というのがあります。私の考えでは、R だけのためにOSを乗り換えるほどの人は少ないと思うので、この種の話題はお国自慢めいてきます。関心は

ハードとOSの差違(32,64ビット版の違いを含む)による使用可能メモリ量と速度性能、
dual processor の有効性

ということのようです。最新の r-help にまたこの問題が蒸しかえされ、R 教授が次の URL を参考に挙げていましたのでご紹介します。Linux versus Mac OS X and G5 versus Opteron Benchmarks。 なおスレッドの内容をまとめると次のようになるようです(未確認)。
(1) 巨大なデータセットには64ビット版Rが有効(ただし Windows 版ではまだ64ビット版Rを構築するツールが無い)。
(2) 高速なSCSIディスクが I/O 速度の向上に有効。
(3) 64ビット版Rでは実行速度が遅くなる。
(4) dual (or dual-core) Opterons/Athlon 64s, Linux では32,64ビット版Rが動き、メモリー・速度に応じて使い分けられる。
(5) dual processor は R 自体が single-threaded だからそのままでは速度向上は無い。ただし複数のセッションを同時に実行できる利点がある。
(6) 標準ライブラリを使う限り Linux と Windows の実行速度は概ね同じだが、Linux の方が 10-20% 早い。
(7) Windows のメモリ管理は Linux や Mac OS に比べて劣る。

  • (7) に関してですが、私の経験では OSX << Linux < Windows です。Windows のメモリ関係の関数が使いやすいかどうかは別として、質はそれなりにいいと思います。ただ、プロセスに与えられる時間が Linux よりも短いので、実際の性能は Linux よりも落ちます。OSX は Tiger になってかなりマシになりましたが、まだまだです。 -- 後藤 2006-03-17 (金) 04:46:06
  • 新しいパソコンを考えており参考になりました。2年半経っており、2008年11月現在ではどうなんでしょうか。 -- TNAKAGAWA? 2008-11-06 (木) 17:41:46
  • このような古い話のコメントは探すのが難しいですので, あたらしく話題として立てた方が良いでしょう. もっとも問題が無いのはLinuxですが, 新しいパソコンと言うことであればMacを買えばLinuxでもWindowsでも動かす事が出来るでしょう. (2)は今ならSSDになるかもしれませんね.(測ってないので真相はわかりませんが) (6)はメモリ管理(ガベージコレクション)の問題があるので, Windowsは若干性能が落ちます. ノートPCを買いたいのか, PCでクラスタを組むのかによっても話は変わりますし, どのような用途に使われるかにもよるでしょう. 普段Unix使いの方にWindowsを進めてもしょうがないですし, GoogleEarth?とかの連携ならWindowsの方が良いでしょうし, そもそも答えようが無いような気がします. -- なかま 2008-11-07 (金) 09:45:42

20万分の1日本地質シームレス地図

間瀬茂 (2006-03-04 (土) 07:28:16)

産総研が開発した面白そうな地図データがあるようです。R でも扱えるのでしょうか。
20万分の1日本地質シームレス地図

  • 公開されているデータはJPEG(ラスタデータ)ですので、rimageを使ってRへのインポートはできると思いますが・・・精度が悪いようです。数値データーってどこにあるのでしょうか? -- okinawa 2006-03-05 (日) 19:40:48
  • ダウンロードページには「データベース中の数値地質図を利用される方は,地質調査情報センター地質情報整備室までご連絡の上ご利用下さい」とありますから、頼めば貰えるんじゃないですかね。でも、なんで普通にダウンロード可能にしてくれないんだろう。 -- s? 2006-03-06 (月) 02:08:46
  • 同じ地質調査所の「地質情報インデックス検索システム(G-INDEX)」がデータ(G-XML?)をDLできるなるようです。 -- 筑波颪? 2006-03-14 (火) 18:39:13

Rのライセンス_HELP/HELP

ssuzuki? (2006-02-21 (火) 09:26:22)

会社に帰属する小職が会社のPCにRをインストールして、業務に使用する場合においても、Rはフリーソフトとして認められるのでしょうか?
“GNU 一般公衆利用許諾契約書(GNU General Public License)”を見てもどうもよくわかりません。その準拠条項など是非ともアドバイスをお願いします。

  • R本体(バイナリで配布している状態,base...+recommended)のバンドルパッケージはGPLで構成されているのでインストールする事自体は問題ありません. が、会社のマシンにフリーソフトをインストールすること自体問題にしている会社もあるので管理者?に確認は必要かと思います. contributeされているパッケージについては学術利用に限られた物から,商用の利用や配布に制限のあるものもあるので(これらはGPLでは無い) パッケージ毎に精査する必要があります. インストールされているパッケージのライセンスはread.dcf(file = system.file("DESCRIPTION", package = "stats"),fields=c("Package","License")) とかで確認できます. 中には2個書いてあるのもありますが,デュアルライセンスでは無く,Rの部分とFortranの部分で別々だったりします. 以前(メンテナンスされて無いので注意)調べたのならRcontrib内で商用利用出来ない物があります. -- なかま 2006-02-21 (火) 11:50:02
  • なかま様、ご指導深謝します。GPLの前文を読んでいて今一度、ご教示下さい。
    GPLでの、“users”や“you”“your”の属性の定義が見当りませんが、理解としては、「会社への帰属有無」や「営利目的とした業務の一環として分析ツールとしてRを使用する」など“その属性”、“使用目的”など特に区別、制限はなく、全てのRを使用するユーザーに対して、フリーソフトという理解で正しいですか。また、明確に上記、ユーザーの定義が明示されている条文、条項はがありましあたらその箇所をご教示下さい、?何卒、よろしくお願いします。 -- ssuzuki? 2006-02-24 (金) 10:49:57
  • 「会社への帰属」がどの方向を指すのか読み取れませんし,ユーザに対して制限が無い(copyleftの意味で)のがGPLですけども,フリーソフトの理解と言うのが大変多面に解釈可能ですので,ここ付近をまじえつつ判断してください. この他,問題と言えば日本の法律との整合性オープンソースソフトウェアの ライセンス契約問題に関する調査あたりも参考になりますでしょうか. 具体的なケースをあげないと,判断は難しい(拡大解釈されても困ります)のですが,まあ詳細に書けばかくほど掲示板で書くような話ではないですし, 私も法律の専門家ではありませんので.(^_^; -- なかま 2006-02-24 (金) 12:21:12
  • r-help につぎのような記事がありました。 -- 2006-02-25 (土) 07:25:25
    Douglas Bates 	<bates@stat.wisc.edu>
    I just saw a review of a book about software patents called "Math you can't use"   
    http://www.brookings.edu/press/books/mathyoucantuse.htm which looks very  
    interesting. The whole subject of software patents and licenses on code is
    important in the R Project.
  • GPLって、その適用されたソースコード自体の改変・頒布に対する制限であって、それをユーザとして利用することについては ABSOLUTELY NO WARRANTY であることを了解して使え、という以外には触れていないと思いますが。もし商用利用できないなんていう制限があるなら、Linuxをサーバに使っている企業は全滅ということになっちゃいますよ。 -- 2006-02-25 (土) 22:17:15
  • んー, 業務で必要とする要件にマッチするかが問題なんじゃないかと. 要件が異なって,*GPL違反祭り*というのも昨今目に致します. ですので,商用利用出来ない(一部のパッケージは実際利用できないのもあるけど)のではなくって, 要件をクリア出来るかが本来の問題かと. アカデミックオンリーな物を商用では使えませんので, 代替アルゴリズムをひねり出す必要があるかもしれません. アカデミックなライセンスと商用ライセンスの中間がGPL(双方幸せ)みたいに見えるのは, 私の錯覚? -- なかま 2006-02-27 (月) 12:15:44

他のソフト起動が浮動小数点演算結果に影響を与える!?

間瀬茂 (2006-02-18 (土) 20:12:10)

r-help 記事より。ゼロとなるべき分散がゼロにならないという質問に対して、議論がありました。それによると、人により真のゼロになったり、「ほとんどゼロ」になったりすることがあるらしく、次のようなコメントがありました。つまり、R セッション途中で他のソフトを起動(この場合ネット検索結果のブラウザー画面表示)すると浮動小数点演算結果が微妙に変わることがある、ということです。実質的に問題になる程度の差ではないようですが、すこし気になります。以下にそのコメントを引用します。

My guess is that you've got a video driver or some other software that's
messing with your floating point processor, reducing the precision from
64 bit to 53 or less.  I can reproduce the error after running
RSiteSearch, which messes with my fpu in that way:

 > var(rep(0.2, 100))
[1] 0
 > RSiteSearch('fpu')
A search query has been submitted to http://search.r-project.org
The results page should open in your browser shortly
 > var(rep(0.2, 100))
[1] 1.525181e-31
  • guessじゃわからないですよね。っていうか、他のプロセスは演算時間には影響あっても、演算精度には影響ないと思いますが?まずは自分の環境でいいのでデータを取りましょう。 -- 2006-02-18 (土) 20:30:43
  • いきなり出ましたが。
    > var(rep(0.2, 100))
    [1] 1.525181e-31
    > sessionInfo()
    R version 2.2.1, 2005-12-20, powerpc-apple-darwin8.4.0 
    
    attached base packages:
    [1] "methods"   "stats"     "graphics"  "grDevices" "utils"     "datasets" 
    [7] "base"     
    > var(rep(0.2, 100))
    [1] 1.525181e-31
    0.2 って,例の2 進数では正確に表せない数値。。。
    0.001100110011001100110011001100110011 … 2進数表現
    0.146314631463 … 8進数表現
    0.333333333 … 16進数表現
    とかね。
    > var(rep(0.125, 100))
    [1] 0
    とかね。
    > var(rep(0.2, 100))
    [1] 1.525181e-31
    > var(rep(0.2, 100))
    [1] 1.525181e-31
    > var(rep(0.2, 1001))
    [1] 8.022965e-30
    > var(rep(0.2, 10001))
    [1] 1.008314e-27
    > var(rep(0.2, 10000001))
    [1] 1.037158e-21 
    > var(rep(0.25, 10000001))
    [1] 0
    それともやはり,本質的にこれとは違った問題なんだろうか? -- 青木繁伸 2006-02-18 (土) 22:02:00
  • やはり,実数の表現精度に起因するもののように思えます。AWK で書いても同じような結果になりますから,少なくとも R の欠陥でないことは確かなように思えます。
    $ > cat chk.awk
    BEGIN {
            n = 100
            d = 0.2
            for (i = 1; i <= n; i++) {
                    x[i] = d
            }
            m = 0
            for (i = 1; i <= n; i++) {
                    m += x[i]
            }
            m /= n
            s = 0
            for (i = 1; i <= n; i++) {
                    s += (x[i]-m)^2
            }
            s /= n-1
            print s
    } 
    $ > gawk -f chk.awk
    1.52518e-31   # やっぱりゼロになんないでしょ!
                  # d が 0.125 とか 3 とかだとゼロになりますよ
    誰が,どのように議論したのかわかりませんが,やはり実数計算の精度については理解が不足しているのかなぁ? -- 青木繁伸 2006-02-18 (土) 23:04:19
  • しつこくて済みませんが。二項分布の確率を合計する例も挙げておきましょう。全確率は1になるはずがそうならないと言うことで。これらを,件の計算条件の違いで試して違う結果になるのかどうか。。。
    > sum(dbinom(0:10, 10, p=0.1))==1
    [1] FALSE
    > sum(dbinom(0:10, 10, p=0.125))==1
    [1] TRUE
    とかね -- 青木繁伸 2006-02-18 (土) 23:24:58
  • 先のコメントの投稿者は r-help の常連ですから青木さんが指摘している問題は周知だと思います。この直前にもう一つ常連投稿者による以下のコメントがあります。(お前の場合どうなんだといわれそうですが、 今現在使用中の Fujitsu Deskpower T90H はどうしてか dhcp 接続が成功せずに いまだに Liniux で R が動かせない状態が続いています。MSW で R を動かしてみたこと(見る気)は無いので ... (苦笑) )-- 間瀬茂 2006-02-18 (土) 23:45:32
    On Fri, 17 Feb 2006, Barry Zajdlik wrote:
    > Hello all,
    >
    > Thanks for the responses but I am still annoyed by this seemingly simple
    > problem; I recorded sessionInfo() as below.
    >
    > x<-rep(0.02,10)
    > var(x)
    > [1] 1.337451e-35
    
    Well, yes, it is accurate only to 35 digits and this is a bit unfortunate
    since it could be more accurate in this case. The exact result is probably
    system-dependent, but there has been a bug report for a long time
    (PR#1228) that var() is not as accurate as it could possibly be, and
    patches would be welcome.  They obviously aren't a very high priority for
    anyone.
  • もしかして x86形FPUでは有効精度を切り替えられる あたりが関係する? -- 間瀬茂 2006-02-19 (日) 06:41:49
  • なかまさんのRwebでは以下の通り
    > sessionInfo() 
    R version 2.2.0, 2005-10-06, i686-pc-linux-gnu  
     
    attached base packages: 
    [1] "methods"   "stats"     "graphics"  "grDevices" "utils"     "datasets"  
    [7] "base"      
    > var(rep(0.2, 100)) 
    [1] 1.525181e-31 
    > RSiteSearch('fpu') 
    A search query has been submitted to http://search.r-project.org 
    The results page should open in your browser shortly 
    > var(rep(0.2, 100)) 
    [1] 1.525181e-31 
    追試になっていないのかな? -- 2006-02-19 (日) 08:54:18
  • うちの環境は積極的に最適化してあるので(64bit:仮数部53)ゼロにはなりません. 本問題はWindowsのみの話で,「標準のブラウザーって何かなぁ〜」と窓を覗くと「IEだ!」とか「Firefoxだ」とか教えていただけるのですが、その時、精度を64bitに取り締まられるのが原因のようです.option(browser="c:/Program Files/なんとか")などこまめに設定しておけばこの問題は発生しません. Rの場合,x86では80bit,x86_64やppcでは64bitで演算します(x86でも64の方がいいと思いますが). -- なかま 2006-02-19 (日) 14:26:30
  • ウィンドウズ(R2.2)、ファイアフォックスで最初の r-help コメントと同一の現象を確認しました。微妙な問題があるのですね。var(rep(0.2, 100)) 等がゼロにならないのが「優等生(IEEE仕様)」的挙動なのでしょうね(かな?)。ちなみにここでいう 0 は表示桁数によらない真の実数 0 とされているようです。 -- 2006-02-19 (日) 14:33:10
    > var(rep(0.2, 10))
    [1] 0
    > var(rep(0.2, 100))
    [1] 0
    > RSiteSearch('fpu')
    A search query has been submitted to http://search.r-project.org
    The results page should open in your browser shortly
    > var(rep(0.2, 10))
    [1] 8.559689e-34
    > var(rep(0.2, 100))
    [1] 1.525181e-31
  • いつも手早い R 教授のコメントによれば、この問題は r-devel で修正済みとのこと(未確認)。 -- 間瀬茂 2006-02-21 (火) 10:07:38
  • まちょっと,別件の調べ物で該当部分のハックの(目視段階)ですが, R教授はvarの問題としてcovの精度をlong doubleにせっせと変えたようですが, WinのAPIのShellExecute?がfpuの精度を変えているのではないかと(system関数の場合は問題ない).なので,
    options(digits=22)
    sum(rep(.2,100))
    shell.exec("notepad")
    sum(rep(.2,100))
    あたりだと,分かり易く理解してもらえる? 該当箇所はsrc/gnuwin32/extra.cで精度の調整をsrc/gnuwin32/dynload.cのように行えば良いのではないか等と. -- なかま 2006-02-22 (水) 20:04:46
  • long double にしても意味ないと思いますけどね。全てのデータがマシンエプシロンの範囲で同じだったら0を返すようにした方がまし。そんなことしても,殆ど意味ないけど。
    true.var <- function(x) return(if(all.equal(min(x), max(x))) 0 else var(x))
    とか。 -- 青木繁伸 2006-02-22 (水) 20:18:01
  • 等といったような議論が遅配されて来てますが(gmailで止まってる?), svnの中はまだ直ってないので,議論真っ盛り?! 弱気な日本人としては壊すのがわかってるなら,取得(保存),破壊,回復(再設定)としとけばとりあえず良いような... long doubleの採用は精度地獄の幕開けか(今でも苦労してます。はい。)。(^-^; -- なかま 2006-02-22 (水) 20:54:25
  • 混乱してきていますが、例えば私の環境(Blas, Atlas 付き Linux 版 R)で var(rep(0.2, 10)) が正確に実数ゼロになるのは、var 関数が何か小細工しているのでしょうか。計算機音痴の質問。 -- 間瀬茂 2006-02-22 (水) 21:24:51
  • var 関数が何かやっているのではなくて,OS の何かが結果の表示を操作しているのでは?0.01 を100回足して1になるかどうかは,float を double にしたり long double にしたりして表面を取り繕って済むものではないと思います。それと同じでしょう。var(rep(0.2,100))は計算機上では0にならないんですよ。。と素直に陳述すれば良いだけではないのかなぁ。
    間瀬先生の環境で,var(rep(1000000000000000.2, 100)) は幾つになりますか? -- 2006-02-22 (水) 22:24:01
  • どこで書いたか忘れたが,実数の比較を伴う計算はとかく問題がある。以下の R の関数,前半の結果は間違いで,後半の結果の方が正しい。この場合,統計量とP 値は前半も後半も理論的には同じになるべきなのだが,小数部を含む実数データに基づく前半の結果は正しくない。手計算(10進数の世界)で計算すると,前半の結果が間違いであることはすぐわかる。
    > x <- c(0.8, 0.7, 0.8, 1.1, 0.8, 1.0, 0.4, 0.6, 1.0, 0.9, 0.7, 
             0.7, 0.7, 0.6, 0.9, 1.0, 0.9, 0.4, 1.1, 1.0)
    > y <- c(0.8, 0.6, 0.9, 1.0, 1.0, 1.1, 0.5, 0.5, 0.9, 1.0, 0.5, 
             0.6, 0.8, 0.6, 0.8, 0.9, 0.8, 0.7, 1.1, 1.1)
    > wilcox.test(x, y, paired=TRUE)
    
    	Wilcoxon signed rank test with continuity correction
    
    data:  x and y 
    V = 66.5, p-value = 0.6446
    alternative hypothesis: true mu is not equal to 0 
    
    > x <- c(8, 7,

添付ファイル: filersitesearch.smaller.png 2137件 [詳細] fileno_entry.png 2440件 [詳細] filegedit-latexplugin.png 1645件 [詳細] filepukiwiki-mode.png 2459件 [詳細] file0pow0.png 2112件 [詳細] filegnomeGUI.png 2383件 [詳細] fileno_entry_result.png 2496件 [詳細] filersitesearch.png 1820件 [詳細] filegazo.png 1609件 [詳細]

トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Google
WWW を検索 OKADAJP.ORG を検索
Last-modified: 2016-03-11 (金) 22:45:10 (79d)