RjpWiki自体へのコメントでも、R に関連する雑談でもOKな掲示板です

注意:新規記事用の入力欄は以下の目次の直後にあります。各記事への追加コメントの入力欄は、各記事の後にあります。


過去の記事のアーカイブ 。アーカイブ中の記事への追加コメントは自由です。ただしあまり古い記事の場合は、最新の R掲示板 に新規に項目を立てられた方が良いかも知れません。



回答を期待する記事は原則 質問コーナー Q&A にお願いします。「R 掲示板」はそれ以外の本来の(長めの)コメント専用にすることを提案したいと思います。




今日はRの集会としては20回目です

なかま (2022-12-17 (土) 10:10:47)

このところ, 何かをしようと思っても某所のサーバのお守りに時間をとられてしまい, 仕事は仕事でRとは一切無関係な事をしてるんでアレですがwww
https://prs.ism.ac.jp/useRjp/
集会としては, 20回目ですし, 前身たる岡田先生のメーリングリストからすると四半世紀になるんですね^_^;


Rのヘルプドキュメント翻訳の追試

せーだ (2022-11-26 (土) 12:58:57)

かつて間瀬先生となかまさんが取り組まれていたパッケージヘルプの日本語化ですが、R-4.2系でWindowsのデフォルト文字コードがUTF-8になったことで、以前はR側にも手を入れなければならなかった問題が解消しました。 基本的な手順は Windows版のRをビルドする方法 の通りで、追加作業は以下の2つです。R-4.2.2で確認しました。

  • R-4.2.x/src/libraryの配下に、なかまさんのサイトにある間瀬先生翻訳のRdファイル(下の記事から辿れます)を上書き
  • 日本語を含むfullrefman.pdfをPDFLaTeXで作るため、R-4.2.x/doc/manual/Makefile.winの設定を一部修正

    インストール済の純正版Rに、ヘルプが日本語化されたパッケージのhelp、htmlフォルダを差し替えても動きます。
R422jp.jpg

統計数理研究所 R研究集会(第15回 Rユーザ会)のお知らせ

なかま (2020-12-12 (土) 10:33:31)

2020年度R研究集会(統計数理研究所共同利用研究集会「データ解析環境Rの整備と利用」)はCOVID-19感染拡大の影響によりオンラインで開催することになりました。
研究集会用ホームページ

開催概要
   開催日:2020年12月19日(土)10:30~16:15
   開催場所:Zoomによるオンライン開催
   ハッシュタグ:#rjpusers
プログラム
10:25-10:30 開会挨拶 / 中野純司・藤野友和
10:30-11:00
   RS-Decomp
   川崎能典(統計数理研究所)
11:00-11:30
   2016年アメリカ大統領選挙における、ヒスパニックの投票傾向の分析
   七條あかね(徳島大学総合科学部社会総合科学科)
11:30-12:00
   e-Stat APIを用いたスクレイピング
   和田かず美(総務省統計研究研修所)/ 木村敦(独立行政法人統計センター)
12:00-13:00(昼休み)
13:00-13:30
   RとPythonを比較する - 機械学習の数理100問シリーズを2冊ずつ執筆してみて -
   鈴木讓(大阪大学)
13:30-14:00
   Rによる色覚バリアフリーグラフィック
   谷村晋(三重大学大学院医学系研究科)
14:00-14:30
   クラウド&リモート時代のデータ分析環境
   鈴木了太(株式会社ef-prime)
14:30-14:45(休憩)
14:45-15:15
   Analysis of lexical diffusion in Kansai area using Twitter
   服部恒太(徳島大学)
15:15-15:45
   Rによる探索的財務データ解析
   地道正行(関西学院大学商学部)
15:45-16:15
   Rからのデータウェアハウスの利用
   樋口千洋(国立研究開発法人 医薬基盤・健康・栄養研究所)
参加申し込み
例年は事前の参加申し込みは実施していませんでしたが、 オンライン開催となり、
参加用URLをお知らせするために必要ですので、 参加登録をお願いします。


参加登録はこちら

世話人
   藤野友和(福岡女子大学)
   中野純司(中央大学)
問い合わせ先
   藤野友和(福岡女子大学)
   Email: fujino(アットマーク)fwu.ac.jp
   Twitter: @nonki1974

R 4.0.0リリース

(2020-04-25 (土) 19:29:44)

https://cran.r-project.org/doc/manuals/r-devel/NEWS.html


統計数理研究所 R研究集会(第14回 Rユーザ会)のお知らせ

なかま (2019-11-22 (金) 12:29:54)
研究集会用ホームページ

-------------------------------------------------
2019年度 統計数理研究所共同研究集会
「データ解析環境Rの整備と利用」
-------------------------------------------------
日程 : 2019年12月21日(土)
場所 : 統計数理研究所(東京都立川市)セミナー室1(D305)
参加費 : 無料
参加登録 : 不要
研究集会HP : http://prs.ism.ac.jp/useRjp/

※ ネット中継(録画なし,ライブのみ)を予定しています.URLは後日ご案内します.

9:55 - 10:00	開会挨拶 / 中野純司・藤野友和

1   10:00 - 10:30
患者の予後予測のためのウェブ・アプリケーションをRパッケージjoint.CoxとShinyで開発
江村剛志(国立中央大学、統計研究所)

2	10:30 - 11:00
医学系研究倫理における個人情報とR
谷村晋(三重大学大学院医学系研究科)

3	11:00 - 11:30
免疫系遺伝子発現データの機械学習と選抜された遺伝子リストの評価
樋口千洋(国立研究開発法人 医薬基盤・健康・栄養研究所)

4	11:30 - 12:00
データ解析の応用とツールの現在
鈴木了太(株式会社 ef-prime)

12:00 - 13:00	【昼休み】

5	13:00 - 13:30
RとWebGISによる環境汚染物質分布評価
山川純次(岡山大学大学院自然科学研究科)

6	13:30 - 14:00
Rによるトピックモデルを用いた学内の研究実績の分析と可視化
船山貴光(東北大学)・山本義郎(東海大学)・藤野友和(福岡女子大学)

7	14:00 - 14:30
RによるIR(Institutional Research)基盤の構築
藤野友和(福岡女子大学)

14:30 - 14:45	-- 休憩 --

8	14:45 - 15:15
機械学習の数理100問のR言語バージョン
鈴木譲(大阪大学大学院基礎工学研究科)

9	15:15 - 15:45
自分の体重変化の時系列解析
中澤港(神戸大学)

10	15:45 - 16:15
探索的財務ビッグデータ解析 --前処理とデータラングリングの並列化--
地道正行(関西学院大学 商学部)

16:15 - 16:45	-- 休憩 --

11	16:45 - 17:15
Best-Worst Scaling向けパッケージ
合崎英男(北海道大学)

17:15 - 17:45
機械学習モデル構築プロセスの自動化とモデルのグレーボックス化
伊地知晋平(DataRobot Japan)

懇親会
18:30 - 20:30 立川駅周辺

その他
アクセスなどは統数研のホームページをご覧ください。
近隣にはレストラン、コンビニなどはほとんどありません。昼食は立川駅などで買ってこられることをお勧めします。
本案内はご自由に転載・転送していただいてかまいません。

統計数理研究所 R研究集会(第13回 Rユーザ会)のお知らせ

なかま (2018-11-12 (月) 16:17:25)

研究集会用ホームページ

2018年度 統計数理研究所共同研究集会「データ解析環境Rの整備と利用」を,下記の日程で開催いたします.
興味のある方は,ぜひご参加ください.
藤野友和(福岡女子大学),中野純司(統計数理研究所)
-------------------------------------------------
2018年度 統計数理研究所共同研究集会
「データ解析環境Rの整備と利用」
-------------------------------------------------
日程 : 2018年12月8日(土)
場所 : 統計数理研究所(東京都立川市)セミナー室1(D305)
参加費 : 無料
参加登録 : 不要
研究集会HP : http://prcs.ism.ac.jp/useRjp/

※ ネット中継(録画なし,ライブのみ)を予定しています.URLは後日ご案内します.

09:55 - 10:00	開会挨拶 / 中野純司・藤野友和

1	10:00 - 10:25
一般化線形モデルを起点としたデータサイエンスの実際
安川武彦(日本アイ・ビー・エム株式会社)

2	10:25 - 10:50
国外の公的統計作成部局における近年の動き
和田かず美(統計センター)

10:50 - 11:00	-- 休憩 --

3	11:00 - 11:25
R AnalyticFlowによるモダンなデータ解析
鈴木了太(株式会社 ef-prime)

4	11:25 - 11:50
What students think about their universities
服部恒太(徳島大学)

11:50 - 13:00	【昼休み】

5	13:00 - 13:25
compound.Cox: 単変量Cox回帰法にもとづく特徴選択(feature selection)のRパッケージ
江村剛志(国立中央大学、統計研究所)

6	13:25 - 13:50
Rパッケージ BNSL: 分枝限定法でベイジアンネットワークの構造学習を高速化
鈴木譲(大阪大学大学院基礎工学研究科)

13:50 - 14:00	-- 休憩 --

7	14:00 - 14:25
Rとkerasを使った臨床試験登録情報のテキスト分類
岡田昌史(東京大学UMINセンター)

8	14:25 - 14:50
Bioconductor update / BNSL パッケージによる遺伝子ネットワーク解析
樋口千洋(国立研究開発法人 医薬基盤・健康・栄養研究所)

14:50 - 15:00	-- 休憩 --

9	15:00 - 15:25
RとGISによる地球環境データ解析
山川純次(岡山大学大学院自然科学研究科)

10	15:25 - 15:50
RにおけるSimple Features Acessの実装:新しい地理空間データ構造への転換
谷村晋(三重大学大学院医学系研究科)

15:50 - 16:00	-- 休憩 --

11	16:00 - 16:25
パッケージsupport.BWSの改良:Case 1 Best-Worst Scaling
合崎英男(北海道大学)

12	16:25 - 16:50
探索的財務ビッグデータ解析
地道正行(関西学院大学 商学部)

13	16:50 - 17:15
中国P2P金融データをRで探る
石田基広(徳島大学)・Tong Zhao(徳島大学)

LTセッション
No.	時間	タイトル / 発表者
1	17:20 - 17:25	Rを用いたReproducible Researchへの挑戦 / 瓜生真也
2	17:25 - 17:30	未定 / 牧山幸史(ヤフー株式会社)
3	17:30 - 17:35
4	17:35 - 17:40
5	17:40 - 17:45	 

懇親会
18:30 - 20:30 立川駅周辺

その他
アクセスなどは統数研のホームページをご覧ください。
近隣にはレストラン、コンビニなどはほとんどありません。昼食は立川駅などで買ってこられることをお勧めします。
本案内はご自由に転載・転送していただいてかまいません。

第4回ナニワデータサイエンス研究会のお知らせ

ナニワデータサイエンス研究会のお知らせ (2017-12-20 (水) 23:24:02)

第 4 回 ナニワデータサイエンス研究会 が開催されます! 第 4 回目の研究会は 2018/3/9 に大阪・淀屋橋にて開催予定(無料),ご案内及びお申し込みはこちら からお願い致します.
定期的なカンファレンスを開催し,医薬品開発におけるデータサイエンスの最前線を発信すべく,でもユル~く活動していく予定です.

 第4回目の今回は,2016年度から開始されました医薬品製造販売承認申請時電子データ提出に関して
 今後製薬業界の皆様が対応を検討することになる「疾患領域別標準に関するお話」,近年益々その
 重要性を増すベイズ解析手法の超基本的な解説から実践的なお話まで,さらに匿名化に関する講演等々,
 最新かつ無料ではなかなか拝聴できない話題を提供させて頂きます.ナニワ発・関西発の本研究会を通じて,
 少しでもデータサイエンスに関わる方々に活力を与えることができれば幸いです.
 
 開催日時:2018年3月9日(金)13:00 ~ 17:15             (受付開始:12:30)
 開催場所:武田薬品工業 大阪本社 御堂筋ビル 11階大ホール   (地図は別紙に記載)
 参加費用:無料(消費税込)
 主  催:ナニワデータサイエンス研究会
 企  画:武田薬品工業株式会社,塩野義製薬株式会社
 
 プログラム(開場:12:30):
 13:00:開会挨拶
 
 第一部:CDISCとRのセッション
 13:05:「Therapeutic Area Data Standards User Guide for Dyslipidemiaの概要と考察」高浪洋平※(武田薬品工業株式会社),
          堀田 真一※(ファイザー株式会社),叶健※(日本化薬株式会社),保田 郁子※(アッヴィ合同会社)
          ※CDISC Japan User Group(CJUG )ADaM Team
 13:45:「Rによる臨床試験の解析結果に関するプレゼンテーションスライドの効率的な作成方法の提案」舟尾暢男(武田薬品工業)
 
 14:20:休憩(1)
 
 第二部:ベイズ解析セッション
 14:30:「ベイズ解析の基礎の基礎」舟尾暢男(武田薬品工業)
 15:10:「想定する治療効果の大きさに,自信はありますか?―統計家X『私,失敗しないので』と言える?―」小林千鶴,豊泉樹一郎,長谷川貴大(塩野義製薬)
 15:50:「医薬品開発の意思決定におけるBayesian Posterior Probabilityの適用例」作井将(武田薬品工業)
 
 16:20:休憩(2)
 
 第三部:匿名化セッション
 16:30:「No More 個人特定! ~攻撃者から身を守れ!匿名化大作戦~」宮澤昇吾,北西由武(塩野義製薬)
 
 17:10:閉会挨拶

RhpcのWindows版を少し使いやすくしてみました

なかま (2017-12-20 (水) 19:21:28)

今回Windows版のRhpcの強化を行いました.
多分WindowsのMPI環境では通常mpiexecが必要でバッチ処理が必須だったので, parallel, Rmpi, では使いにくかったと思います.
また従来のsocketによる通信は遅かったと思います.

# まあ最近はコアも沢山ありますから

今年の夏にMS-MPIがMPI_Comm_Spawnをサポートしたと言うのを見てはいたんですが,
これでもmasterプロセスはmpiexec配下で起動しなければなりません.
そこでfakemasterと言うプログラムを作成して、これをバックグランドでmpiexecに
masterとして実行させて、ここからMPIに関する環境を抜き出しで起動元のRに渡して、起動元のRがMPI_Initを行うというトリッキーな方法を実現してみました.
この方法なら、Windows上のRGuiやRstudioからでもMPIが使えます。
ただ、欠点としてはmpiexecとfakemasterがコンソールとして起動してしまうので、黒い窓が見えてしまいます。
この窓を殺すと、spawn出来なくなりますし、workerプロセスがMPI_Finalizeしても消えなくなって
しまいますので、邪魔でも殺さないでください。(^^;
複数ノードに跨る場合はmsmpilauchsvcの起動が必要になるのと、mpiexecでのマシンファイルの指示が多分必要になります。(注意:私は1台しかWindowsマシンが無いので無テストです...)
mpiexecの引数はoptions(Rhpc.mpiexec="mpiexec -n 1")等で設定可能です。
実行時には"mpiexec -n 1 fakemaster"と末尾にfakemasterが付加されます

1. 最初に, MSMpiSetup.exeをインストールします。
2. Rgui等を立ち上げます。
3. Rhpcのパッケージをインストール(0.17-353が最新です)

> install.packages("Rhpc")
> Rhpc_initialize()                                # ここで黒い窓が出ますが殺さないで!
Since this process was not started under mpiexec,
start up the cheat MPI master process:D
Import MPI environment variables.
---------------------------------
 PMI_APPNUM=0
 PMI_DOMAIN=1b3ee7b9-3d5b-4927-bfe1-fa1fbe85440b
 PMI_HOST=localhost
 PMI_KVS=5e390f84-cf04-4f58-a476-05a7ae99ea86
 PMI_NODE_IDS=smp_region_6376
 PMI_PORT=1f6ec7ca-0df3-43c5-8df3-2c1072f34f18
 PMI_RANK=0
 PMI_RANK_AFFINITIES=affinity_region_6376
 PMI_SIZE=1
 PMI_SMPD_ID=1
 PMI_SMPD_KEY=0
 PMI_SPAWN=0
---------------------------------
rank     0/    1(1140850688) : naishono-machine                     :  7340
> cl<-Rhpc_getHandle(4)                           # 4個のワーカーを作ります
> Rhpc_worker_call(cl,"Sys.getpid")               # ワーカーのPIDを返します
[[1]]
[1] 8244

[[2]]
[1] 8084

[[3]]
[1] 7684

[[4]]
[1] 8928

> system.time(Rhpc_lapply(cl,1:1000000,"sqrt"))  # 手元の環境だとparallelの40倍の速度で処理します
> Rhpc_finalize()                                # 窓を殺さなければすべてのワーカはちゃんと終了します

統計数理研究所 R研究集会(第12回 Rユーザ会)のお知らせ

なかま (2017-11-09 (木) 18:23:21)

研究集会用ホームページ

2017年度 統計数理研究所共同研究集会「データ解析環境Rの整備と利用」を,下記の日程で開催いたします.
興味のある方は,ぜひご参加ください.
藤野友和(福岡女子大学),中野純司(統計数理研究所)

日程:2017年11月25日(土)
場所:統計数理研究所(東京都立川市)セミナー室5(D313)
参加費:無料
参加登録:不要
研究集会HP:<http://prcs.ism.ac.jp/useRjp/>

※ いつもと部屋が異なりますので,ご注意ください.
※ ネット中継(録画なし,ライブのみ)を予定しています.URLは後日ご案内します.

09:55-10:00 開会挨拶および緒連絡

10:00-10:25 里 洋平(DATUM STUDIO株式会社)
  「Tokyo.Rの活動報告と機械学習最新事例のご紹介」
10:25-10:50 鈴木 了太(株式会社ef-prime)
  「R AnalyticFlowによる予測分析」
10:50-11:15 中間 栄治(株式会社COM-ONE)・中野 純司(統計数理研究所)
  「任意精度パッケージRmpenvの改良」

11:15-11:20 -- 小休憩 --

11:20-11:45 松浦 健太郎(HOXO-M Inc.)
  「StanとRでベイズ統計モデリング」
11:45-12:10 鈴木 譲(大阪大学)
  「CRANパッケージBNSLのリリース: 応用のデモと今後の展開について」

12:10-13:00 -- 昼食・休憩 --

13:00-13:25 和田 かず美・椿 広計(統計センター)
  「国内外の政府統計コミュニティにおけるRの活用について」
13:25-13:50 安川 武彦(日本アイ・ビー・エム株式会社)
  「Rを用いた社会人向けデータサイエンス教育」
13:50-14:15 合崎 英男(北海道大学)
  「パッケージsupport.BWS2の開発:Case 2 Best-Worst Scalingの適用支援」

14:15-14:30 -- 休憩 --

14:30-14:55 奥村 晴彦(三重大学)
  「RとLaTeXによる書籍作成」
14:55-15:20 樋口 千洋(医薬基盤・健康・栄養研究所)
  「マイクロRNAのパスウェイ解析」
15:20-15:45 服部 恒太(徳島大学)
  「RによるYELPの分析」

15:45-16:00 -- 休憩 --

16:00-16:25 山川 純次(岡山大学)
  「RとGISの連携による地球統計解析」
16:25-16:50 石岡 文生・梶西 将司(岡山大学)
  「Rを用いた空間データの構造分析と集積性の検出」
16:50-17:15 谷村 晋(三重大学)
  「Nipponパッケージ」

17:15-17:45 総合討論

統計数理研立川キャンパスについて

   アクセスなどは統数研のホームページ をご覧ください。
   近隣にはレストラン、コンビニなどはほとんどありません。昼食は立川駅などで買ってこられることをお勧めします。
   本案内はご自由に転載・転送していただいてかまいません。

第3回ナニワデータサイエンス研究会のお知らせ

ナニワデータサイエンス研究会 (2017-04-28 (金) 16:25:25)


第 3 回 ナニワデータサイエンス研究会 が開催されます! 第 3 回目の研究会は 2017/6/26 に大阪・淀屋橋にて開催予定(無料),ご案内及びお申し込みはこちら からお願い致します.
定期的なカンファレンスを開催し,医薬品開発におけるデータサイエンスの最前線を発信すべく,でもユル~く活動していく予定です.

 第 3 回目の今回は,2016 年度から開始されました医薬品製造販売承認申請時電子データ提出に
 関して製薬業界の皆様が非常に興味を持っておられる「実務経験談に基づくお話」,
 近年益々その重要性を増す欠測のあるデータに対する解析手法のトピック,さらには巷で大変な
 盛り上がりを見せる「人工知能」の技術を医薬品開発にて適用した事例等々,最新かつ無料では
 なかなか拝聴できない話題を提供させて頂きます.ナニワ発・関西発の本研究会を通じて,少し
 でもデータサイエンスに関わる方々に活力を与えることができれば幸いです.
 
 開催日時:2017年6月26日(月)13:00 ~ 17:40            (受付開始:12:30)
 開催場所:武田薬品工業 大阪本社 御堂筋ビル 11階大ホール   (地図は上記リンク先の案内に記載)
 参加費用:無料(消費税込)
 主  催:ナニワデータサイエンス研究会
 企  画:武田薬品工業株式会社、塩野義製薬株式会社
 プログラム(開場:12:30):
 13:00:開会挨拶
 
 第一部:CDISCセッション
 13:05:【電子データ申請の経験から】小田 拓馬,野田斐子(ヤンセンファーマ株式会社)
 13:45:「Awareness from Electronic Data Submission to PMDA and FDA - Lesson & Learnt from hands-on experiences」
          中嶋 優一,北原 孝志,小南 真由美(ノバルティスファーマ株式会社)
 14:25:休憩(1)
 
 第二部:統計解析セッション
 14:40:「Mixed effect model における仮定について考える ~変量効果の分布の誤特定~ (仮) 」坂口 弘樹(塩野義製薬)
 15:20:「欠測データの感度分析について」北川 忠行(武田薬品工業)
 16:00:休憩(2)
 
 第三部:人工知能セッション
 16:15:「強化学習と人工知能 前編」
 16:30:「強化学習と人工知能 中編」
 17:20:「強化学習と人工知能 後編」
          三河幸平(シオノギデジタルサイエンス)木口亮,藤原正和,北西由武(塩野義製薬)
 17:35:閉会挨拶

utils パッケージの Rd ファイルの翻訳が終わりました

間瀬茂 (2017-02-18 (土) 19:11:21)

utils パッケージの Rd ファイルの翻訳が終わりました.
いずれ中間さんのサイトから入手できると思います.

ほぼ一年かかりましたが,これで基本パッケージ群の
Rd ファイルの翻訳が全て済んだと思います(?)

訳してみた結果,R-Core メンバーと全世界の
R ユーザの共同作業の偉大さを痛感しました.
これは商用ソフトではなかなか不可能な成果だと
思います.

一方で R のヘルプは初心者向けではなく理解が
難しく,この訳もどこまで役に立つかは不明です.

私自身意味不明のまま訳しているところが結構ありますので,
「使用は自己責任で」を言い訳に提供したいとおもいます.
どうすれば良いのかわかりませんが,日本語訳とオリジナルを
必要に応じてどちらも参照できるようにするのが安全かなとおもいます.

今後は中間さんのサイトのセットを元に,バージョンと
翻訳方針の統一,間違い訂正作業を行いたいと思います.


どのプログラミング言語で幸せなコメントor怒りのコメントが多いのかランキング

(2017-01-16 (月) 07:51:56)

http://gigazine.net/news/20170116-programming-language-happiest-comment


methods パッケージの Rd ファイルの翻訳

間瀬茂 (2016-12-19 (月) 06:13:59)

methods パッケージの翻訳が終わりましたので
いつもの場所で公開します.いずれ中間さんの
サイトに置いてもらえるとおもいます.

このパッケージは S4 方式のクラスとメソッドの
詳細を解説していますが,一つ一つのドキュメントが
かなり長く,手間取りました.また読んでも今一意味が
つかみにくいです.

S4 クラスとメソッドは特にメソッド選択の機構との関連で
かなり複雑にならざるを得ないようです.第一の理由は
クラスがスーパークラスやサブクラスを多重に含むことが出来
るため,関数の(複数の)引数のクラスに対応してどのメソッドを
選択適用(dispatch)するかが複雑にならざるを得ないからの
ようです.一般ユーザは比較的簡単なクラスとメソッドを
使うため問題はあまり起きないかもしれませんが,一般的に
完全な機構を実装するのはかなり困難のようです.

今回始めて知り驚いたのは methods ? generic_function と
いう形式の二項演算子で総称的関数のメソッドの情報を得ることが
出来るということです.

Rd 関数の翻訳はあと utils パッケージが残っています.年内に
終わらせる予定でしたが,年を跨ぐことになりそうです.


統計数理研究所 R研究集会(第11回 Rユーザ会)のお知らせ

なかま (2016-11-19 (土) 00:40:02)
研究集会HP

2016年度統計数理研究所共同研究集会「データ解析環境Rの整備と利用」を、
下記の日程で開催致します。興味のある方は、ぜひご参加ください。
   
   藤野 友和(福岡女子大学)、中野 純司(統計数理研究所) 

日程
   2016年11月26日(土)
場所
   統計数理研究所(東京都立川市)3階セミナー室1(D305)
参加費
   無料
参加登録
   不要
Ustreamによるネット中継(録画なし、ライブのみ)を予定しています。
http://www.ustream.tv/channel/rlangism

2016年11月26日(土)
09時55分-10時00分
   開会挨拶および諸連絡 
10時00分-10時25分 鈴木了太(ef-prime)
   データ解析のためのR GUI 
10時25分-10時50分 福島真太朗(株式会社トヨタIT開発センター)
   Python,Juliaとの比較によるRの特徴に関する考察 
10時50分-11時15分 岡田昌史(東京大学)
   RによるCDISCデータの検査 
11時15分-11時40分 本多啓介・浜田ひろか(統計数理研究所)
   書誌データ分析のためのR 
11時40分-12時05分 樋口千洋(東京医科歯科大)
   miRNA発現情報の機械学習 
12時05分-13時00分 昼食・休憩
13時00分-13時25分 里洋平(Datum Studio)
   Rによる機械学習/データマイニングのビジネス活用事例のご紹介 
13時25分-13時50分 前田和寛(比治山大学短期大学部)
   全国のR勉強会の近況 
13時50分-14時15分 服部恒太(徳島大学)
   Topic modeling with TED talk 
14時15分-14時30分 休憩
14時30分-14時55分 合崎英男(北海道大学)・中谷朋昭(北海道大学)・佐藤和夫(酪農学園大学)
   表明選好法向けパッケージの開発 
14時55分-15時20分 佐藤正衛(農業・食品産業技術総合研究機構)
   Rによる農業経営分析 
15時20分-15時45分 中間栄治(Com-One)・中野純司(統計数理研究所)
   Rにおけるさらに別の多倍長精度パッケージ 
15時45分-16時00分 休憩
16時00分-16時25分 谷村晋(三重大学)
   RとGISソフトの連携 
16時25分-16時50分 中野康人(関西学院大学)
   DDIRを利用したreproducibleな社会調査分析環境 
16時50分-17時15分 石田基広(徳島大学)
   RでWebスクレイピング 
17時15分- 総合討論
注意
   講義室では持ち込んだノートパソコンが使えます。 
統計数理研立川キャンパスについて
   アクセスなどは統数研のホームページ をご覧ください。
   近隣にはレストラン、コンビニなどはほとんどありません。昼食は立川駅などで買ってこられることをお勧めします。
   なお、平日のお昼頃には、研究所の入口のところで弁当の出張販売があります。
   本案内はご自由に転載・転送していただいてかまいません。

第2回ナニワデータサイエンス研究会のお知らせ

ナニワデータサイエンス研究会 (2016-10-24 (月) 12:00:00)


第 2 回 ナニワデータサイエンス研究会 が開催されます! 第 2 回の研究会は 2016/11/08 に大阪・京橋にて開催予定(無料),ご案内及びお申し込みはこちら からお願い致します.
定期的なカンファレンスを開催し,医薬品開発におけるデータサイエンスの最前線を発信すべく,
でもユル~く活動していく予定です.

 開催日時:2016年11月8日(火)13:00 ~ 17:45 (受付開始:12:30)
 開催場所:富士通株式会社 関西システムラボラトリ(地図は上記リンク先の案内に記載)
 参加費用:無料(消費税込)
 主  催:ナニワデータサイエンス研究会
 企  画:武田薬品工業株式会社、塩野義製薬株式会社
 プログラム(開場:12:30):
 13:00:開会挨拶
 
 第一部:CDISCセッション
 13:10:「蓄積したCDISC 準拠データを活用するためのデータウェアハウスの構築」海老 邦仁(富士通株式会社)
 FDAやPMDAへのCDISC準拠データの提出義務化に備えるため,多くの国内製薬企業が各臨床試験データのCDISC対応を進めているが,
 作成したCDISC準拠データが蓄積されたときに,そのデータセットをいかに活用するかまでを考慮して対応を進めている製薬企業は
 まだまだ少ないものと思われる.
 本発表では,FDAのJanus Clinical Trials RepositoryやPMDAの品目横断的解析データベースの事例を検討しながら,製薬企業に
 とっても有用となり得る,CDISC準拠データを用いたデータウェアハウス構築について考察する.
 
 13:50:「CDISC・電子データ提出における悩ましき問題を語る」坂井 絵理(塩野義製薬),高浪 洋平(武田薬品工業)
 ついに2016年10月から本邦においても医薬品製造販売承認申請時電子データ提出が開始された.電子データ提出に関する要件については,
 種々の通知類・ガイダンス等が発出されているが,まだまだ対応に追われている製薬企業・CROは多い.本発表では,CDISC・電子データ提出に
 関する実務上の悩ましい問題点をいくつか取り上げ,某製薬企業における事例や経験談を踏まえたQ&A形式による討論をお届けする.
 
 14:30:休憩(1)
 
 第二部:統計解析セッション
 14:45:「凱旋記念講演:Why do Japanese people evaluate the hazard ratio routinely?」長谷川 貴大(塩野義製薬株式会社)
 In recent years, the development of new drugs is becoming more and more difficult. Also, it is required to develop new drugs with 
 distinctive characters like a delayed onset time and an existence of long-term survivors in cancer vaccines. 
 Therefore, we need efficient and reliable procedures to obtain robust, clinically interpretable results. When statistical 
 interpretations are translated into clinical interpretations, it is important to obtain a reference value from the control group 
 and have a unit of treatment effect metric. A conventional way to quantify the treatment effect in survival analysis is to calculate 
 the hazard ratio (HR) under the assumption of proportional hazards (PH). However, even if the PH assumption was valid, 
 it is difficult to interpret the HR because the hazard is not a probability measure and the HR is not interpreted as a relative risk. 
 In addition, the reference value for the hazard is lacking. Alternatively, a use of restricted mean survival time (RMST) is proposed 
 as model-free and clinically interpretable metrics in survival analysis. The RMST is defined as the expected survival time 
 for a future patient followed for a specified time. Recently, some letters to the editor were published in major medical journals. 
 And the RMST is now generally understood as the clinically meaningful summary. As a result, we could assess the benefit/safety profile 
 of a new treatment strategy for decision-making.
 
 15:25:「安全性帳票の標準化(仮題)」藤原 正和(塩野義製薬株式会社)
 臨床試験における安全性評価は,有効性評価と同じく極めて重要である.また,電子データ提出が始まったことは,規制当局が表以外のデータの
 見方を始める可能性があることを意味しており,申請側としても,"表" 以外の見方も踏まえた安全性評価を行っていくべきである.
 そこで本講演では,まずFDA Safety Reviewer Guidance及びCIOMSのワーキンググループⅥが公表したPaperを基にして,そもそも安全性評価が
 どうあるべきかについて考察する.加えて,データをビジュアル化して,視覚的な方法により安全性を評価するアプローチについても紹介する.
 
 16:05:休憩(2)
 
 16:20:「Mann-Whitney のU 検定とROC 曲線との奇妙な関係」工藤 健太郎(武田薬品工業株式会社)
 まず,Mann-Whitney の U 統計量と,Receiver Operating Characteristic(ROC)曲線の曲線下面積(AUC,Area Under the Curve)との間の
 奇妙な関係を紹介する.次に,2 群間の比較において Mann-Whitney の U 検定を適用した場合,本検定に対応する推定方法としては 
 Hodges-Lehmann 推定量が有名であるが,解析を行う状況によっては本推定方法が適切でない場合がある.
 本発表では,Wilcoxon-Mann-Whitney オッズ(WMWodds)による推定方法を概説し,SASとRで推定を行う方法を紹介した後,いくつかの
 シミュレーションを行い,Hodges-Lehmann による推定との比較を行う.
 
 17:00:「用量設定試験におけるMCP-Mod の実行例 ~SAS とR を用いた多重比較と用量反応関係のモデリング~」清水 康平(武田薬品工業株式会社)
 「MCP-Mod(Multiple Comparison Procedure - Modelling)」は,主に第2相試験における有効性評価に適用され,「多重比較法」と
 「用量-反応モデルを用いた解析」を組み合わせた手法である.本手法を用いることで,多重性を調整した上で目的とする適応に対する薬剤の
 用量-反応関係を明らかにすることが出来,第3相(検証的)試験で用いる適切な用量(Target Dose)を選択することも出来る.
 また,内部補完により,第2相試験で設定していない用量に関する推定も実施することが可能となる.本発表では,MCP-ModをSASとRで実行する方法を紹介する.
 
 17:40:閉会挨拶

splines , tcltk パッケージの Rd ファイルの翻訳

間瀬茂 (2016-10-10 (月) 16:21:44)

splines と tcltk パッケージの翻訳が完了しましたので
公開します.どちらも小ぶりのパッケージです.
tcltk はスクリプト言語 Tcl とその GUI ツールキットの
Tk を R 内部から操作するためのパッケージで,膨大な数の関数が
用意されていますが,説明は簡単か全く無いです.一般ユーザが使うことを
期待してはおらず,我々が目にするのは関数が選択肢をポップアップメニューから
マウスクリックで選択する際が主だとおもいます.


grid パッケージの Rd ファイルの翻訳

間瀬茂 (2016-10-04 (火) 15:25:38)

パッケージ grid の Rd ファイルの翻訳が完成しましたのでいつものところに
置いておきます(library.jp.tgz).このパッケージは R の標準的グラフィックスの代替機能を提供するものですが,標準的グラフィックスとは同時には使えません.兄弟パッケージの lattice はいずれ翻訳予定です.このパッケージは
Paul Murrel 氏が独力で開発管理しているパッケージです.


tools パッケージの Rd ファイルの翻訳

間瀬茂 (2016-09-21 (水) 10:22:32)

パッケージ tools の Rd ファイルの翻訳が完成しましたのでいつものところに
置いておきます(library.jp.tgz).このパッケージは一般ユーザが直接使うような
ものではなく,パッケージや R 本体の管理者用です.R という巨大なプロジェクトを
首尾一貫したシステムにまとめるための様々なツールが用意されています.
一般ユーザにとっては R CMD xxx という命令の裏方実働関数といえば
イメージがわかりやすいかもしれません.

なお中間さんからの連絡ではこれまで日本語化出来なかったタイトルの
日本語化が出来るようになったそうですので,タイトルも日本語訳してあります
(オリジナルはコメント化して残してあります).

関心のある方はしばらくしてから中間さんのサイトを覗いてみてください.


stats4, datasets パッケージのRdファイルの和訳

間瀬茂 (2016-09-08 (木) 15:45:50)

パッケージ stats4 と datasets の Rd ファイルの翻訳が完成しましたのでいつものところに置いておきます.どちらも訳すところが比較的少なかったので迅速に訳せました.datasets パッケージは R 組み込みのデータ77種類の集まりですが,専門用語が多いため,訳語に問題があるかもしれません.stats4 はS4方式による統計機能用のパッケージですが,内容は最尤推定に関するものだけです.
S4方式はどれくらい普及しているんでしょうか.


パッケージ grDevice の Rd ファイルの翻訳

間瀬茂 (2016-09-03 (土) 16:41:09)

パッケージ grDevice の Rd ファイルの翻訳が完成しましたので公開します.これまでと同じ場所に library.jp.tgz という名前で置いておきます.既翻訳済みのものも含みます.

なお中間さんが丁寧に整理整頓してくれていますのでpdf ファイル等は中間さんのサーバーから(しばらくしてから)入手してください.


R の stats パッケージのヘルプドキュメント(Rd 書式)の翻訳 †

間瀬茂 (2016-08-16 (火) 23:11:46)

stats パッケージの Rd ファイルの翻訳が出来ましたので公開します.
stats パッケージは統計解析環境としての R の中核となる統計と確率分布,乱数関係の関数(S3)を集めたものです.
翻訳した Rd ファイルは(これまでの翻訳と一緒に)
library.jp.R-3.3.1.tgz (の stats/man)にあります.PDF ファイルは
R-3.3.1.Rd.stats.jp.pdf です.タイトルが日本語化出来ない代わりに \alias マクロでタイトル相当の内容を日本語で索引に加えました.


R の compiler, parallel パッケージのヘルプドキュメント(Rd 書式)の翻訳

間瀬茂 (2016-06-29 (水) 16:48:31)

compiler, parallel パッケージの Rd ファイルの翻訳が済みましたので公開します.今後次々と翻訳が増えていく予定なので,翻訳パッケージはオリジナルソースの library ディレクトリ構造に従って提供することにします.翻訳が済んでいないところは空です.Rd ファイル以外も除いてあります.バージョンがバラバラですが,全部完成した折にでもアップデートの予定です.

これまで翻訳済みの Rd ファイルは
library.jp.20160629.tgz
に全て入っています.compiler, parallel パッケージの Rd ファイルの翻訳一覧は
R-3.3.1.Rd.compiler.parallel.jp.pdf
です.(実は compiler パッケージには Rd ファイルが一つしかありませんので二つまとめてみました.)


R のgraphicsパッケージのヘルプドキュメント(Rd 書式)の翻訳

間瀬茂 (2016-06-26 (日) 04:55:52)

base パッケージに続いて graphics パッケージの Rd ファイルを翻訳しました. base パッケージと同じ所におきました.ファイル名は R-3.3.0.Rd.graphics.jp.tgz です.それから作った PDF ファイルは R-3.3.0.Rd.graphics.jp.pdf です.これには画像ファイルが3つありますが 自動では大きさがおかしくなるので手作業で調整しています.


R の基本(base)パッケージのヘルプドキュメント(Rd 書式)の翻訳(番外編:Windows対応)

せーだ (2016-06-10 (金) 13:14:51)

Windows版ユーザが多いと思われるので,人柱になってみました.
64bit版Windowsではまだおかしな部分があるとのことなので,インストーラを作成しない方法の手順だけ記します.
たぶん質問には答えられないと思います.腕に覚えのある方のみ,自己責任でどうぞ.

  1. CRANからRtools34.exeをダウンロード&インストール.
    tcltkパッケージのコンパイルに関係なくTcl/Tk関連は選択しないで良い.
  2. CRANからR-3.3.0.tar.gzをダウンロード&解凍する(任意の場所で).
    tar --no-same-owner -xf R-3.3.0.tar.gz
  3. 環境変数R_HOMEをR-3.3.0フォルダに設定する.
    set R_HOME="C:\hoge\fuga\R-3.3.0"
  4. https://github.com/rwinlib/r-base から
    画面右側の"Clone or download"⇒"Download ZIP"でダウンロード&解凍する.
    r-base-masterフォルダの下にいろいろできるが、その中のextsoftフォルダを
    %R_HOME%の下にコピー.tcltkパッケージも作成するには,Tcl32/64フォルダのうち,
    自分のOSに合うものをTclとリネームして%R_HOME%の下にコピー.残りは不要なので消去.
  5. %R_HOME%\src\library\base\manの中身を,間瀬先生謹製のRdファイルに差し替える.
    ※現在ダウンロードできるRdファイルは\encoding{UTF-8}が最後尾に入ってないので
     手動で追加しなければならない.
    ※encodingコマンドは1ファイルに複数あるとエラーになるので注意.
     lengths.Rdは途中に\encoding{UTF-8}が紛れ込んでいる.
  6. %R_HOME%\src\library\tools\R\Rd2txt.Rを下記の記事通りに修正する.
  7. tcltkのコンパイルが不要なら,%R_HOME%\src\library\tcltk\Makefile.winの
    BUILD_TCLTKをnoにする.
  8. %R_HOME%\src\gnuwin32に移動してMakeする.
    make all recommended
  9. %R_HOME%\library\baseをインストール済みのRと差し替える(バックアップ必須).
screenshot.jpg

R の基本(base)パッケージのヘルプドキュメント(Rd 書式)の翻訳(2)

間瀬茂 (2016-06-07 (火) 22:01:10)

中間さんが Windows で日本語ヘルプが使えるか確かめてくれました.
それによると各 Rd ファイルに

 \encoding{UTF-8}

という一行を加える必要があるそうです.付け加えたものに置き換えておきました.
(但し最後の行という変なところに入っています.)

また src/library/tools/Rd2txt.R 中の

txt <- strsplit(txt, "\n", fixed = TRUE)[[1L]]

という行を次のように変更する必要があるらしいです.

txt <- strsplit(txt, "\n", fixed = TRUE, useBytes = TRUE)[[1L]]

但し 64 ビット版 Windows ではまだおかしな部分があるんだそうです.

ということでまだ初心者はいじらないほうが良さそうです.


R の基本(base)パッケージのヘルプドキュメント(Rd 書式)の翻訳

間瀬茂です.R の日本語化で唯一手付かずだったヘルプドキュメントの翻訳を試みてみました.とりあえず base パッケージの Rd ファイルの訳が完成しましたので公開します.オリジナルと同じライセンスで自由に使用,転載,編集可です.元になったのは R-3.2.3 です.今後他の推奨パッケージのヘルプドキュメントも訳してみたいと思っています.

ファイルはここにあります

ファイル名は R-3.2.2.base.Rd.jp.tgz です.先に訳した公式マニュアルのLaTeX ソースも置いておきますので使ってください.

翻訳 Rd ファイルから作成した PDF ファイル(R-3.2.2.Rd.base.jp.pdf)もあります(索引込みで614ページ).

既に中間さんと岡田さんにご足労願い Linux と OS X では本体に組み込み無事に日本語ヘルプが利用できることを確認済みです. Windows では未確認ですが恐らく同じように使えるのではないでしょうか(請確認).

翻訳 Rd ファイルを R で利用するには R のソースの src/library/base/man の
中身を翻訳した Rd ファイルで置き換え,R を一からビルドする必要があるようです(ビルド済の一部を置き換えるだけですまないのかわかりません).

Rd 書式は簡易 LaTeX 風の書式で書かれいてます.R では Rd ファイルから man, LaTeX, HTML などの書式に変換できます.但し一部日本語化が出来ない部分が残っています(\title マクロや用法欄の見出し等).ソース Rd ファイルにはオリジナルが後半にコメントアウトして残してあります.また Rd ファイルにはUnix 固有と Windows 固有の説明があることがあり,これらは変換時に使用プラットフォームに応じて取捨選択されます.ですから PDF ファイルR-3.2.2.Rd.base.jp.pdf には Windows 固有の説明部分は抜けています.
もしこれの Windows 版を作られた方がいれば提供願えれば幸いです.

日進月歩の R のヘルプドキュメントの翻訳はきりのない作業になりかねませんが,各 Rd ファイルの先頭にあるライセンスの年号を見る限りかなり部分的な改訂で済みそうです.将来はこの Wiki ででも共同で保守出来る体制ができれば良いなと考えています.

なお,この手のヘルプドキュメントの通例として翻訳しても初心者にはさっぱり何のことだかわからないことになりかねません.実際私にも何のことやらわからない部分がかなりありましたが,そしらぬ風でそれらしく訳しておきました.
翻訳をみても意味不明なら恐らく原文でも意味不明です(??).

Rd ファイルを LaTeX ソースに変換したうえで PDF ファイルに変換するシェルスクリプト R-3.2.2.Rd.base.jp.sh も置いておきました.
base パッケージ全体の PDF ファイルを作るソース LaTeX ファイルは R-3.2.3.Rd.base.jp.tex です.その際 Rd.sty というスタイルファイルが必要になりますが,見出し等を日本語化した Rd.sty も同じ場所にあります.
(Sweave.sty もありますが恐らくこれは不要です.)

第1回ナニワデータサイエンス研究会のお知らせ

ナニワデータサイエンス研究会 (2015-12-28 (月) 22:05:42)

ナニワ発・関西発の研究会が要るなぁ~,ということで ナニワデータサイエンス研究会 という研究会が立ち上がりました. 第 1 回の研究会は 2016/3/10(木)に大阪・淀屋橋にて開催予定(無料です).定期的なカンファレンスを開催し,医薬品開発におけるデータサイエンスの最前線を発信すべく, でもユル~く活動していく予定です.奮ってご参加ください.
☆ご案内及びお申し込みはこちらよりアクセス下さい☆

開催日時:2016 年 3 月 10 日(木)13:00 ~ 17:40 (受付開始:12:30 ) 
開催場所:武田薬品工業 大阪本社 御堂筋ビル 11 階大ホール (地図は上記案内に記載)
参加費用:無料(消費税込)
主   催:ナニワデータサイエンス研究会
企   画:武田薬品工業株式会社、塩野義製薬株式会社
プログラム(開場:12:30 ):
13:00 :開会挨拶

第一部:CDISC セッション
13:05 :「もしも,日米で申請電子データ提出するとしたら…」高浪 洋平(武田薬品工業)
13:45 :「もしも,とある開発品目 X を申請電子データ提出するとしたら…」坂井 絵理(塩野義製薬)
14:25 :休憩(1)

第二部:統計解析セッション(Missing Data on Clinical Trials)
14:40 :「もしも,この機に統計担当者が NAS レポートを振り返ったら…(前編)」藤原 正和(塩野義製薬)
15:20 :「もしも,この機に統計担当者が NAS レポートを振り返ったら…(後編)」黒田 晋吾(武田薬品工業)
16:00 :休憩(2)

第三部:グラフ頂上決戦
16:15 :「もしも,SAS の sgplot と R の ggplot2 を比較したら…」舟尾 暢男(武田薬品工業)
16:55 :「もしも,Spotfire と Visual Analytics で OpenData を眺めてみたら」北西 由武(塩野義製薬)
17:35 :閉会挨拶

{cran,bioc}.ism.ac.jp のミラーについて

cran.ism.ac.jp (2015-12-10 (木) 12:02:40)

現在, {cran,bioc}.ism.ac.jpにおいて従来のhttpと, httpsにての運用を開始しております.
USER_AGENTにMozillaが含まれる場合は, httpへの要求の場合でもhttpsに転送(余計なお世話ですが)しております.
一方で, 一寸環境の古いLinuxのディストリビューションやPROXY等の環境によってhttpsのミラーがアクセス出来ない方のために従来のhttpもそのまま運用しております.
お手元のRがパッケージのダウンロードをHTTPSで可能か(libcurlに依存しているので)調べるには,

> capabilities("libcurl")
libcurl 
   TRUE 

等としてTRUEであれば対応しています.
現在のRはlibcurlのバージョン7.28.0以上を要求しますので, これ以前のlibcurlの入っている環境でビルドを行っている場合は, HTTPでの運用を従来通り行えばよいでしょう.
本来は公衆WiFiなどでHTTPでCRANのミラーを使うのは危険(インストールしますから)過ぎると言うお話ですので, クラスターを運用されてる方が直ちに対応に迫られると言う訳ではないです.


統計数理研究所 R研究集会(第10回 Rユーザ会)のお知らせ

ふじの (2015-11-04 (水) 15:27:07)

本年度も、下記の要領で統計数理研究所 R研究集会を開催することとなりました。ぜひご参加ください。どうぞご自由に転送・転載をお願いします。変更や追加情報は、原則としてR研究集会HPにアナウンスしますので、そちらをご覧下さい。
なお、Ustreamライブ配信今年もやります。http://www.ustream.tv/channel/rlangism


2015年度統計数理研究所共同研究集会

「データ解析環境Rの整備と利用」 開催のお知らせ

2015年度統計数理研究所共同研究集会「データ解析環境Rの整備と利用」を、下記の日程で開催致します。興味のある方は、ぜひご参加ください。

日程:2015年12月5日(土)
場所:統計数理研究所(東京都立川市)3階 セミナー室1
参加費:無料
参加登録:不要
研究集会HP:<https://prs.ism.ac.jp/useRjp/>

プログラム

09:55-10:00
  開会挨拶および緒連絡

10:00-10:30 鈴木了太(ef-prime)
  「データ解析のためのGUI: R AnalyticFlow 3(仮)」
10:30-11:00 岡田昌史(東京大)
  「RとIoT」
11:00-11:30 中澤港(神戸大)
  「エコポイントチェックのweb調査結果に対してsemとlavaanパッケージを用いた構造方程式モデル(仮)」
11:30-12:00 谷村晋(三重大)
  「RとTikZを組み合わせた統計データのインフォグラフィック」

□□12:00-13:00 昼休み□□

13:00-13:30 福島真太朗(株式会社トヨタIT開発センター)
  「Python,Juliaとの比較によるRの特徴に関する考察(仮)」
13:30-14:00 中間栄治(Com-One)・中野純司(統数研)
  「パッケージ Rhpc の状況(仮)」
14:00-14:30 山本義郎・船山貴光(東海大)
  「Rを利用した災害情報の収集と解析・可視化(仮)」
14:30-15:00 久保田貴文(多摩大)
  「Rによるデータ視覚化のための動的グラフの利活用」

□□15:00-15:30 休憩□□

15:30-16:00 服部恒太(徳島大)
  「Where are good hitchhiking points? - Data analysis and visualization of Hitchwiki」
16:00-16:30 石田基広(徳島大)
  「API(周り)の話」
16:30-17:00 樋口千洋(東京医科歯科大)
  「Bioconductor update」

17:00- 総合討論

詳細は、研究集会HP:<https://prs.ism.ac.jp/useRjp/>の2015年度分をご覧下さい。
本案内はご自由に転載・転送していただいてかまいません。

藤野 友和(福岡女子大学)、中野 純司(統計数理研究所)

10/11-12 ISM HPC on R Workshop開催のお知らせ

本多 (2015-08-28 (金) 15:32:06)

統数研本多です。

10月11日(日)-12日(月 祝日)にRにおけるHPCの取り組みを議論するWorkshopとして
[[HPC on R Workshop:http://ura3.c.ism.ac.jp/hpccon/index.html#hprws_day1]
を開催します。

RcppのDirk Eddelbuettel (Debian)や
pbdRのGeorge Ostrouchov (Oak Ridge National Laboratory)
らによるセッションを予定しております。
皆様の参加をお待ちしております。

統数研ではISM HPC Week(10/8-12)としてHigh Peformance Computingに関するイベントを
予定しております。本Wokshopもこの一環です。

10月8日(木) ISM HPCプログラミングセミナー
10月9日(金)-10日(土) 国際研究集会ISM High Peformance Computing Conference (HPCCON)
10月11日(日)-12日(月 祝日) HPC on R Workshop

Webサイト
HPCCON / HPC on R Workshop

http://ura3.c.ism.ac.jp/hpccon/index.html
http://ura3.c.ism.ac.jp/hpccon/regist.html

HPCプログラミングセミナー

http://www.ism.ac.jp/events/2015/meeting1008.html

translation.R プロジェクト

岡田 (2015-07-29 (水) 17:33:06)

R-help メーリングリストをチェックされている方は既にご存知と思いますが、Chel Hee Lee氏により、Rのマニュアル(FAQ, extensions, data import/export, language definitionsなど) の多国語翻訳を行おうとするプロジェクトが提案されています。日本語は既に間瀬先生の翻訳されたものが公開されていますので、ご紹介しておきましたが、下記のページで翻訳をされているようです。HTMLの文書は1画面を2分割して対話的に翻訳を進めることができるWebアプリを使われているので、作業しやすそうに思えました。

http://homepage.usask.ca/~chl948/
http://translate-r.r-forge.r-project.org


統計数理研究所 R研究集会(第9回 Rユーザ会)のお知らせ

なかたに (2014-10-16 (木) 18:53:53)

本年度も、下記の要領で統計数理研究所 R研究集会(通称「Rユーザー会」第9回)を開催することとなりました。ぜひご参加ください。どうぞご自由に転送・転載をお願いします。変更や追加情報は、原則としてR研究集会HPにアナウンスしますので、そちらをご覧下さい。


2014年度統計数理研究所共同研究集会

「データ解析環境Rの整備と利用」 開催のお知らせ

2014年度統計数理研究所共同研究集会「データ解析環境Rの整備と利用」を、下記の日程で開催致します。興味のある方は、ぜひご参加ください。

日程:2014年11月29日(土)(本年度は、都合により1日だけの開催となります)
場所:統計数理研究所(東京都立川市)3階 セミナー室1
参加費:無料
参加登録:不要
研究集会HP:<https://prs.ism.ac.jp/useRjp/>

◯11月29日(土) 国内ユーザによる報告
場所:3階 セミナー室1

 10時00分−10時30分    樋口千洋(東京医科歯科大)
  Rとゲノムワイド関連解析(GWAS)

10時30分−11時00分    岡田昌史(筑波大学)
  RとCDISC

11時00分−11時30分    中澤港(神戸大)
  『Rで学ぶ人口分析』とfmsbパッケージ

11時30分−12時00分    谷村晋(兵庫医科大)
  Rによる数理疫学

12時00分−13時00分    昼食

13時00分−13時30分    中間栄治(Com-One)・中野純司(統数研)
  RdRand on R

13時30分−14時00分    中野康人(関西学院大)
  Reproducible Social Research Environment with DDIR and dlcm

14時00分−14時30分    合崎英男(北海道大)・中谷朋昭(北海道大)・佐藤和夫 (酪農学園大)
  Rによる表明選好法

14時30分−15時00分    藤野友和(福岡女子大)
  vdmR:ggplot2グラフによるMultiple Linked Viewの実現

15時30分−16時00分    休憩

15時30分−16時00分    鈴木了太(ef-prime)
  R AnalyticFlow3: A Real GUI for R

16時00分−16時30分    中野純司(統数研)・中間栄治(Com-One)
  Rと統計数理研究所のスーパーコンピュータ

16時30分−17時00分    石田基広(徳島大)
  『Rの基礎とプログラミング技法』改訂に見るRの進化

17時00分−    総合討論

統計数理研立川キャンパスについて
アクセスなどはホームページ <http://www.ism.ac.jp/> をご覧ください。
近隣にはレストラン、コンビニなどはほとんどありません。
昼食は立川駅などで買ってこられることをお勧めします。
本案内はご自由に転載・転送していただいてかまいません。

----------------------------------------------------------
中谷 朋昭(北海道大学)、中野 純司(統計数理研究所)

Rの公式マニュアルの翻訳

間瀬茂 (2014-06-30 (月) 20:22:01)

間瀬@元東工大です。定年退職し、毎日が日曜日の生活を楽しんでいます。家事、愛犬の世話、野菜作り(私の真の情熱の対象)に勤しんでいますが、いかんせんそれだけでは少々暇を持て余し気味なので、「晴耕雨DOC」をモットーにRの公式ドキュメントの翻訳を始めました。かれこれ10年(?)前に一度訳したことがあり、CRANにも登録されていますが、最新版はすっかり内容を一新していました。私が読んでも参考になる内容が幾つも有ります。

とりあえず R-FAQ と R-intro の訳が完成しましたので、私の Google Doc に一般公開扱いでアップロードしました。参考になれば幸いです。オリジナルと同じ条件で利用、配布が可能です。今後他のマニュアルの翻訳も予定しています。またバグが見つかれば随時更新していく予定です。またいずれCRANにも登録を依頼する予定です。

URLは以下の通りですが、問題なく覗けるでしょうか?

R-manulas


R で物理乱数 お手軽編

なかま (2014-06-17 (火) 10:20:44)

最近のIntelCPU(Ivy bridge以降)にはRdRandと言う物理乱数が付いているので,
比較的新しい(ここ1〜2年)ハードをお持ちの方は物理乱数を使えるかもしれません.
RdRand自体は1CPUで40MB/s(手元のマシン)の生成速度をもっており, 物理CPU数までの並列取得で150MB/s程度は生成出来ました.
物理CPU以上になると, 一時的に生成速度は向上しますが, 論理CPUまで増やすと完全にエラーのレートの方が高くなって生成速度が低下しました.
Rの場合は, "user-supplied"と言うユーザー定義の乱数が利用出来るのですが
オーバーヘッドが大きい為に, 並列取得しても効果が無いのと, ポータブルなスレッド処理を書くのが手間だったので, シングルタスクのみにして, Rrdrandと言うパッケージにしてCRANに上げました.
もし, 動作しなかったらお知らせください(そんなに沢山のマシンは持ってないので)

$ R -q
> library(Rrdrand)
> hasRDRAND()                       # このマシンがRdRandを利用可能か
[1] TRUE
> RNGkind()
[1] "user-supplied" "Inversion"    
> system.time(runif(3e3^2))
   ユーザ   システム       経過  
     1.018      0.000      1.017 
> RNGkind("default")               # Mersenne-Twister に変更
> system.time(runif(3e3^2))
   ユーザ   システム       経過  
     0.236      0.005      0.242

もし, RdRandが使えないマシンだと

$ R -q
> library(Rrdrand)
 警告メッセージ: 
This CPU does not support RDRAND:  RNGkind has not been changed.
> hasRDRAND()
[1] FALSE

となって, RNGkindはそのままです.


統計数理研究所 R研究集会(第8回 Rユーザ会)のお知らせ

なかたに (2013-10-18 (金) 17:29:48)

本年度も、下記の要領で統計数理研究所 R研究集会(通称「Rユーザー会」第8回)を開催することとなりました。ぜひご参加ください。また、スケジュールの拡散もよろしくお願いします。変更や追加情報は、原則として研究集会HPにアナウンスしますので、そちらをご覧下さい。


2013年度統計数理研究所共同研究集会

「データ解析環境Rの整備と利用」 開催のお知らせ

2013年度統計数理研究所共同研究集会「データ解析環境Rの整備と利用」を、下記の日程で開催致します。興味のある方は、ぜひご参加ください。

日程:2013年11月29日(金)- 30日(土)
場所:統計数理研究所(東京都立川市)3階 セミナー室1
参加費:無料
参加登録:不要
研究集会HP:<https://prs.ism.ac.jp/useRjp/>

◯11月29日(土) 国内ユーザによる報告
場所:3階 セミナー室1

09:25-09:30    開会挨拶および諸連絡

09:30-09:55    合崎英男(農村工学研究所)
  RによるBest-Worst Scaling

09:55-10:20    中間栄治(Com-One)・中野純司(統数研)
  ハイパフォーマンスコンピューティングのためのRhpcパッケージ

10:20-10:45    奥村晴彦(三重大)
  TeX Liveと美文書第6版とR

10:45-11:00    休憩

11:00-11:25    中谷朋昭(北海道大)
  仮想状況評価法のためのパッケージDCchoice

11:25-11:50    小池祐太・野村亮介(東京大院)
  Rによる確率過程の統計解析

11:50-13:00    昼食

13:00-13:25    谷村晋(兵庫医科大)
  Rによる多変量疾病地図

13:25-13:50    中澤港(神戸大)
  人口モデルに基づくウクライナの人口予測

13:50-14:15    中野康人(関西学院大)
  日刊新聞読者投稿欄の計量テキスト分析

14:15-14:30    休憩

14:30-14:55    藤野友和(福岡女子大)
  Rによるインタラクティブグラフ生成とその応用

14:55-15:20    鈴木了太(ef-prime)
  データ解析のためのR GUIフロントエンド

15:20-15:45    神田善伸(自治医科大)
  Rコマンダーに多彩な解析メニューを追加したEZR(Easy R)の開発

15:45-16:00    休憩

16:00-17:00    Japan.R Lightning Talk 大会
  Japan.Rから5名の若手による実践報告

17:00-        総合討論・閉会挨拶

統計数理研立川キャンパスについて
アクセスなどはホームページ <http://www.ism.ac.jp/> をご覧ください。
近隣にはレストラン、コンビニなどはほとんどありません。
昼食は立川駅などで買ってこられることをお勧めします。
本案内はご自由に転載・転送していただいてかまいません。

----------------------------------------------------------
中谷 朋昭(北海道大学)、中野 純司(統計数理研究所)

Rによる統計教育ケーススタディ分析システム説明会のご案内

wada (2013-03-05 (火) 09:18:03)

説明会のお知らせを代理投稿させていただきます。

統計教育用にフリーで授業に活用できるStatistics Lab. は、ドイツの統計教育大学間連携プロジェクト"New Statistics"で開発・利用されているシステムです。
 今回、日本の統計教育大学間連携ネットワークでその主要メンバーであるUlrich教授を招聘し、実際の操作や授業利用・試験での活用の実際を解説していただくことになりました。
 ーーーーーーーーーーーーーーーーー 
Rによる統計教育ケーススタディ分析システム
   Statistics Lab. 操作および授業利用説明会

 日時:3月6日午後5時から1時間程度
 場所:立教大学11号館A301教室
 講師:Ulrich Rendtel教授
     (ベルリン自由大学統計・計量経済学研究所)
 主催:立教大学社会情報教育研究センター
     (統計教育大学間連携ネットワーク)
ーーーーーーーーーーーーーーーーーーー
[ご参考]
Statistics Labのダウンロードページ
http://www.statistiklabor.de/en/Download/SetupAndInstallation/index.html

 Stat Labは、デフォルト環境としてドイツ語を使用している。
プルダウンメニューを、ドイツ語から英語に切り替えるには、以下の操作を行う。
1.プルダウンメニュー左から2番目の"Bearbeiten"(ドイツ語で「編集」)をクリック
2.その一番下にある"Sprachen"(ドイツ語で「話す」)をクリックして、そこで英語を選択



なお、説明会は、登録不要・無料で、使用言語は英語、Stat LabはWindowsのみ対応です。


商業出版物へのRjpWikiスクリーンショットの掲載について

wakakumo (2013-02-13 (水) 16:15:58)

お世話になっております。商業出版物(研修教材)において、RjpWikiの紹介の目的でトップページのスクリーンショットを掲載したいと考えています。利用(引用、転載)規約を見つけることができませんでしたので、念のため確認させてください。

「Web上の情報は英語が多いが、RjpWikiに日本語の情報が集約されている」という文脈で、本サイトのトップページのスクリーンショットを掲載したいのですが、問題ありませんでしょうか。


統計数理研究所 R研究集会(第7回 Rユーザ会)のお知らせ

なかたに (2012-10-19 (金) 11:46:57)

本年度も、下記の要領で統計数理研究所 R研究集会(通称「Rユーザー会」第7回)を開催することとなりました。ぜひご参加ください。また、スケジュールの拡散もよろしくお願いします。

2012年度統計数理研究所共同研究集会

「データ解析環境Rの整備と利用」 開催のお知らせ

2012年度統計数理研究所共同研究集会「データ解析環境Rの整備と利用」を、下記の日程で開催致します。興味のある方は、ぜひご参加ください。

日程:2012年11月29日(木)-12月1日(土)
場所:統計数理研究所(東京都立川市)3階 セミナー室2(D304)ほか
参加費:無料
参加登録:不要
研究集会URL:<http://jasp.ism.ac.jp/~nakanoj/workshop12/2012Rmeeting.htm>
Program:
◯11月29、30日: 海外ゲスト講師によるチュートリアル講演 (英語)
場所:3階 セミナー室2

Speaker: Professor John Fox (Department of Sociology, McMaster University, Canada)

29 November (Thu.)
10:30-12:00 : Structural Equation Modeling in R with the sem Package (1)

12:00-13:30 Lunch

13:30-15:00 : Structural Equation Modeling in R with the sem Package (2)
15:15-16:45 : Structural Equation Modeling in R with the sem Package (3)

30 November (Fri.)
10:00-11:00 : Visualizing Regression Models in R with the effects Package (1)
11:10-12:10 : Visualizing Regression Models in R with the effects Package (2)

12:10-13:30 Lunch

13:30-14:30 : Writing R Commander Plug-in Packages (1)
14:40-15:40 : Writing R Commander Plug-in Packages (2)
15:40-16:00 : Questions & Discussion

注意:アブストラクトは<http://jasp.ism.ac.jp/%7Enakanoj/workshop12/JohnFoxAbstracts.pdf>から入手可能です。
   講義室では持ち込んだノートパソコンが使えます。

◯12月1日(土) 国内ユーザによる報告
場所:2階 大会議室(変更になりました)

9:50-10:00 開会挨拶および諸連絡

10:00-10:30 奥村 晴彦(三重大学)
     Rによる大震災データ解析
10:30-11:00 牧山 文彦(名桜大学共同研究員)
     plotKMLとGoogleEarth
11:00-11:30 樋口 千洋(大日本住友製薬)
     オミックス研究とR

11:30-11:35 Japan.Rからのお知らせ
11:35-13:00 昼食

13:00-13:30 鈴木 了太(株式会社 ef-prime)
     データ解析のためのGUIフロントエンド
13:30-14:00 石倉 究(北海道大学大学院)
     新しいBayesデータ解析プログラムRStanの使い方
14:00-14:30 岡田 昌史(筑波大学)
      MPIクラスタとRstudioを併用した中規模データの分析レポート作成の実際
14:30-15:00 谷村 晋(兵庫医科大学)
      Rによるマルチエージェントシミュレーション

15:00-15:30 休憩

15:30-16:00 奥村泰之(国立精神・神経医療研究センター)
      臨床疫学におけるRの普及活動
16:00-16:30 中澤 港(神戸大学)
      人口予測の可視化
16:30-17:00 藤野 友和(福岡女子大学)
      Rによる人口動態・健康指標分析システムの構築

17:00-17:30 討論

統計数理研立川キャンパスについて
アクセスなどはホームページ <http://www.ism.ac.jp/> をご覧ください。
近隣にはレストラン、コンビニなどはほとんどありません。
昼食は立川駅などで買ってこられることをお勧めします。
なお、平日のお昼頃には、研究所の入口のところで弁当の出張販売があります。
本案内はご自由に転載・転送していただいてかまいません。

----------------------------------------------------------
中谷 朋昭(北海道大学)、中野 純司(統計数理研究所)

fmsbパッケージ0.3.0公開

中澤 港 (2011-12-29 (木) 20:40:16)

拙著『Rによる保健医療データ解析演習』のサポートパッケージとして開発したfmsbですが,この度日本の人口関係のデータや人口分析関連の関数を追加して0.3.0としました。CRANに登録したというメールが届いたので,そのうちミラーにも入ると思います。

自分で作ったものではありますが,オプションを覚えきれないので,日本語訳も含むマニュアルページを作成中です。まだ不備だらけですが,例えばJpoplのページの下の方などは面白いかもしれません。
まだ開発途上なので,コメントなどいただければ幸いです。


ShapeFileデータ

とある者 (2011-11-24 (木) 11:47:00)

StdMesh05_JGD_21_SHP.zipをダウンロードしたいのですが、リンク切れのようでした。どうしたらよいでしょうか?


統計数理研究所 R研究集会(第6回 Rユーザ会)のお知らせ

なかたに (2011-09-30 (金) 23:51:38)

本年度も、下記の要領で統計数理研究所 R研究集会(通称「Rユーザー会」第6回)を開催することとなりました。ぜひご参加ください。

2011年度 統計数理研究所共同研究集会
「データ解析環境Rの整備と利用」開催のお知らせ

2011年度の統計数理研究所共同研究集会「データ解析環境Rの整備と利用」
を、下記の日程で開催いたします。興味のある方は、ぜひご参加ください。

日程:2011年11月24日(木)− 11月26日(土)
場所:統計数理研究所(東京都立川市) 3階 セミナー室 2 (D304)ほか
参加費:無料
参加登録:不要

スケジュール:

○11月24、25日: 海外ゲスト講師によるチュートリアル講演 (英語)
  場所:3階 セミナー室2
  Speakers:
    Dr. Martin Maechler (ETH Zurich, Switzerland)
     <http://stat.ethz.ch/people/maechler>

    Prof. Wayne Oldford  (University of Waterloo, Canada)
     <http://sas.uwaterloo.ca/~rwoldfor/>

 Program:
 24 November (Thu) "Research seminar"
   13:30-15:00 Talk by Wayne Oldford
     Visual clustering and ensemble clustering methods
     (joint work with Adrian Waddell and Wu Zhou)

   15:00-15:15 Discussion

   15:30-17:00 Talk by Martin Maechler
     Modelling Hieracrhival Dependencies with Copulas
     (joint work with Marius Hofert)

 25 November (Fri) "R related tutorial"
   10:00-11:00 Tutorial(a1) by Martin Maechler
     R Package Authoring - Why and How NAMESPACES in R
 
   11:00-12:00 Tutorial(b1) by Wayne Oldford
     Graph-theoretic methods for Data Visualization I:
     Pairwise display and the PairViz R package

   12:00-13:30 Lunch

   13:30-15:00 Tutorial(a2) by Martin Maechler
     The Matrix Package in R - Using S4 Classes in R:
     The Matrix Classes and Sparse Matrices.

   15:15-16:45 Tutorial(b2) by Wayne Oldford
     Graph-theoretic methods for Data Visualization II:
     Navigating high-dimensional spaces and RnavGraph R
     package

注意: 1. ラップトップコンピュータを持ち込み可能です。
        2. アブストラクトは
           < http://jasp.ism.ac.jp/~nakanoj/workshop11/2011Rmeeting.html >
           に掲載します。

○11月26日 国内ユーザによる報告
  場所:3階 セミナー室1
プログラム
 11月26日(土) 9:50 - 17:30
    9:50-10:00    開会挨拶および諸連絡
   10:00-10:30    鈴木 了太(株式会社ef-prime)
                    データ解析のためのGUIフロントエンド
   10:30-11:00    鈴木 由美子(北里大学)
                    Rとリモートセンシングを用いた農地環境のモニタリング
   11:00-11:30    奥村 晴彦(三重大学)
                    Rによる震災データ処理
   11:30-13:00  昼食
   13:00-13:30    中澤 港(群馬大学)
                    Rのoptim()関数を使った死亡モデルの当てはめ
   13:30-14:00    合崎 英男(農村工学研究所)
                    Rによる選択実験/選択型コンジョイント分析
   14:00-14:30    土居 主尚(放射線医学総合研究所)
                    RによるGPUを用いた行列演算を行うパッケージ
   14:30-15:00    岡田 昌史(筑波大学)
                    doc/NEWS.Rdより ― 最近の新機能抄出
   15:00-15:30    休憩
   15:30-16:00    里 洋平(Japan.R)ほか
                    2011年 x.Rの活動報告
   16:00-16:30    荒引 健(株式会社ディー・エヌ・エー)
                    RではじめるTwitter解析
   16:30-17:00    谷村 晋(兵庫医科大学)
                    Sweaveを用いた統計解析プロセスの可視化と再現性の保証
   17:00-17:30    討論

 研究集会に関する追加情報や、プログラムに変更のある場合は
 < http://jasp.ism.ac.jp/~nakanoj/workshop11/2011Rmeeting.html >
 に掲載します。
 
 なお、26日(土)9:50-17:30 に 3階セミナー室 2 において、全国の
 Rコミュニティ合同集会「Japan.R」が開催されます。
 詳細は< http://www.japanr.org/ >をご覧ください。
 
統計数理研立川キャンパスについて
   アクセスなどはホームページ < http://www.ism.ac.jp/ > をご覧ください。
   近隣にはレストラン、コンビニなどはほとんどありません。
   昼食は立川駅などで買ってこられることをお勧めします。
   平日のお昼頃、研究所入り口のところで弁当の出張販売がありますが、
   売り切れることも多いです。

本案内はご自由に転載・転送ください。
-------------------------------------------------
中谷朋昭(北海道大学)、中野純司(統計数理研究所)
  • Ust 中継ありますか? -- 2011-10-01 (土) 01:52:50
  • ネットを通じた配信は特に検討しておりません。 -- なかたに 2011-10-01 (土) 11:26:17
  • 研究集会のURLを変更しました。 -- なかたに 2011-10-03 (月) 11:11:15
  • もしご許可いただければUst中継担当します。開始時刻から遅れての到着になるかもしれませんが... -- 岡田 2011-10-11 (火) 13:17:04
  • 岡田先生の報告タイトルを確定しました。Ust中継の可否については、少し時間をいただきたいと思います。 -- なかたに 2011-10-11 (火) 14:27:05
  • 海外ゲスト講師の報告タイトルを掲載しました。アブストラクトは、統数研のページでご確認下さい。 -- なかたに 2011-11-11 (金) 15:14:28
  • 明日の「国内ユーザによる報告」は、Ust中継いたします(画質はあまりよくないかもしれません)。 配信URLは http://ustre.am/Fcwg , Twitterハッシュタグは #rjpusers でいかがでしょう -- 岡田 2011-11-25 (金) 21:58:02
  • 中継とハッシュタグのお知らせ、ありがたいです。 -- 2011-11-25 (金) 23:34:06
  • R研究集会は無事に終了いたしました。皆様のご支援ありがとうございました。 -- なかたに 2011-11-27 (日) 15:13:55

第1回 Japan.R

里 洋平 (2010-11-13 (土) 00:29:09)

すぐ下のスレッドでも紹介してもらっていますが、第1回 Japan.Rを開催いたします。

開催要領は、下記の通りです。

日時:11/27 (土) 10:00-16:00
場所:統計数理研立川キャンパス(セミナー室 2 (D304) )
概要:
午前の部(10:00-12:30):初心者向けワークショップ
午後の部(13:00-16:00):R 利用者の交流を目的とした各種企画
費用:無料
申込:(下記サイトよりお申込ください)
午前の部:http://atnd.org/events/9223
午後の部:http://atnd.org/events/9806
--
「Japan.R」は、Tsukuba.R、Tokyo.R、Osaka.R、Nagoya.R など、全国各地の
R コミュニティが集まって行われる勉強会です。
午前は、「はじめての『R』」と題し、R の入門者・初心者向けワークショップを開催いたします。
午後は、各地域コミュニティの活動紹介、R の活用事例の紹介を目的として、
各種ブースが設けられ、研究や業務で R をお使いの方々と情報交換が直接できる場が提供されます。

以上、どうぞよろしくお願いいたします。


第5回 Rユーザー会のご案内

なかたに (2010-10-15 (金) 17:24:09)

本年度も、下記の要領でRユーザー会を開催することとなりました。すぐ下のスレッドで里さんが提案している「Japan.R」も併せて開催されますので、皆様、ぜひご参加ください。

2010年度 統計数理研究所共同研究集会
「データ解析環境Rの整備と利用」開催のお知らせ

2010年度の統計数理研究所共同研究集会「データ解析環境Rの整備と利用」
を、下記の日程で開催いたします。興味のある方は、ぜひご参加ください。

日程:2010年11月25日(木)− 11月27日(土)
場所:統計数理研究所(東京都立川市) 2階 セミナー室1 (D305) 
                                    ( 25日のみ セミナー室 2 (D304) ) 
参加費:無料
参加登録:不要

スケジュール:

○11月25、26日: 海外ゲスト講師によるチュートリアル講演 (英語)
  Speakers:
     Prof. Hadley Wickham (Rice University, USA) 
                     < http://had.co.nz/ >
     Prof. Uwe Ligges, (Technische Universitat Dortmund, Germany)
                     < http://www.statistik.tu-dortmund.de/ligges.html >

Program:

25 November (Thu)  10:30 - 17:00
   10:30-12:00 Tutorial of ggplot2 (1)   by Hadley Wickham
   12:00-13:00 Lunch
   13:00-14:00 Tutorial of ggplot2 (2)   by Hadley Wickham
   14:10-15:10 Prospects and Challenges for CRAN - with a glance on 
                             64-bit Windows binaries   by Uwe Ligges
   15:10-15:30 Break
   15:30-16:30 Tutorial of ggplot2 (3)   by Hadley Wickham
   16:30-17:00 Discussion

26 November (Fri)  10:30 - 17:00
   10:30-12:00 My first R package (1)    by Uwe Ligges
   12:00-13:00 Lunch
   13:00-14:00 My first R package (2)    by Uwe Ligges
   14:10-15:10 One future of interactive graphics in R   by Hadley Wickham
   15:10-15:30 Break
   15:30-16:30 My first R package (3)    by Uwe Ligges
   16:30-17:00 Discussion

注意: 1. ラップトップコンピュータを持ち込み可能です。
        2. アブストラクトが
           < http://jasp.ism.ac.jp/~nakanoj/workshop10/2010Rmeeting-e.htm >
           にあります。

○11月27日 国内ユーザによる報告(Rユーザー会)

プログラム

 11月27日(土) 9:50 - 17:30
    9:50-10:00    開会挨拶および諸連絡
   10:00-10:30    鈴木 了太(株式会社ef-prime)
                     Rによるデータ解析ツールの新提案
   10:30-11:00    長島 健悟(城西大学)
                     Rパッケージの開発・登録とメンテナンス
   11:00-11:30    青木 繁伸(群馬大学)
                     統計学・データ解析におけるRの活用
   11:30-11:40    岡田 昌史(筑波大学)
                    『Rパッケージ本』プロジェクトのご紹介 
   11:40-13:00   昼食
   13:00-13:30    村井 潤一郎(文京学院大学)
                     心理統計教育におけるRの利用
   13:30-14:00    里 洋平(Tokyo.R)
                     地域コミュニティ「x.R」の活動とJapan.R
   14:00-14:30    牧山 文彦(データキューブ株式会社)
                     今更ながらのrcom/DCOM解説
   14:30-15:00    合崎 英男(農村工学研究所)
                     RExcelによるデータ解析
   15:00-15:30    休憩
   15:30-16:00    奥村 晴彦(三重大学)
                     TeX+Rによる美文書・美グラフ作成
   16:00-16:30    山本 義郎(東海大学)
                     Rによるデータの視覚化について
   16:30-17:00    谷村 晋(兵庫医科大学)
                     Rを用いたデータ分析における再現性の保証
   17:00-17:30    討論

 なお、27日(土)10:00-16:00 に セミナー室 2 (D304) において、
 全国のRコミュニティ合同集会「Japan.R」< http://lab.sakaue.info/wiki.cgi/JapanR2010 >が開催されます。

 研究集会に関する追加情報や、プログラムに変更のある場合は
 < http://jasp.ism.ac.jp/~nakanoj/workshop10/2010Rmeeting.htm >
 に掲載します。

統計数理研立川キャンパスについて
   アクセスなどはホームページ < http://www.ism.ac.jp/ > をご覧ください。
   近隣にはレストラン、コンビニなどはほとんどありません。
   昼食は立川駅などで買ってこられることをお勧めします。
   平日のお昼頃、研究所入り口のところで弁当の出張販売がありますが、
   売り切れることも多いです。


本案内はご自由に転送ください。
-------------------------------------------------
中谷朋昭(北海道大学)、中野純司(統計数理研究所)

Japan.Rの提案

里 洋平 (2010-05-10 (月) 22:55:36)

はじめまして。
Tokyo.R( http://groups.google.co.jp/group/r-study-tokyo )というR勉強会を主催してる里 洋平と申します。

いつもRjpWikiで勉強させてもらっております。



さて、表題の件ですが、最近、各地でRコミュニティが出来てきており、Rが盛り上がってきているように感じます。


そこで、全国のRコミュニティ合同でJapan.Rというイベントを開催したいと考えております。

まだ、詳細は全く決まってないのですが、開催する際には、是非Rユーザー会の皆さんともご一緒に出来たらなと思い、こちらに書かせていただきました。



もし宜しければご検討の程、よろしくお願いします。


rpsychiパッケージがCRANに登録されました

奥村泰之 (2010-02-07 (日) 22:07:46)

中澤先生に倣い,開発・報告いたします。

現在,画面左の「本日更新パッケージ」に表示されているrpsychiというパッケージは,拙作のものです。以前から徐々に開発・公開していた関数を,ようやく,パッケージという形で纏めることができました (早速,バグが見つかっており修正版をCRANに登録しております)。また,開発過程等は拙Webサイト内で後日報告いたしたく存じます。


pyramidパッケージがCRANに登録されました

中澤 (2010-01-08 (金) 18:22:29)

久々の書きこみが宣伝で恐縮ですが,現在,画面左の「本日更新パッケージ」の一番下に表示されているpyramidというパッケージは,拙作のものです。
数年前に間に合わせで作ったものの,うまくパッケージ化できずにいたのですが,最近ふとアイディアが浮かんで,満足のいく形にできたので,調子に乗ってパッケージ化を試みたら,いつの間にか自分のWindows XP Professional (SP3)環境でもちゃんとパッケージ化が成功するようになっていて,さらに調子に乗ってCRANへの登録申請をしたら通ったのです。
人口ピラミッドを描画したい方は,お使いいただければ幸いです。
なお,開発過程や使用例などは,自分のサイト内にメモしてありますので,そちらも併せてご覧いただければ幸いです。


第4回Rユーザー会のご案内

なかま (2009-10-30 (金) 14:54:23)
統数研さんにおいて, 2005年度〜2007年度にかけて間瀬先生が主催されました「Rユーザ会」を本年度も開催する運びとなりました.
今年は日程の関係で英語の日と日本語の日が連続して行われませんので都圏以外の方にはご不便をおかけします.
また, 前回いらした方はご注意頂きたいのですが, 統数研さんが引っ越されましたので, 地図をご確認の上お越しください.

本年度の研究集会「データ解析環境Rの整備と利用」を11月27日(金)、
12月5日(土)の2回に分けて開催します。興味のある方はご自由にご参加く
ださい。

なお、開催場所は統計数理研究所ですが、統数研は10月に東京都港区広尾か
ら東京都立川市緑町に移転しました。それに付随して、このメールの最後にいく
つかご注意させていただきますので、参加予定のかたは必ずご覧ください。


研究集会「データ解析環境Rの整備と利用」(1)

  英語でのチュートリアル講演
  "Introduction to High-Performance Computing with R"

    Speaker:  Dirk Eddelbuettel <edd@debian.org>

    Date and time: 27th (Fri.) November, 2009     9:50-16:15
    Place: Seminar room 2, ISM, Tachikawa, Tokyo

    Program:
        9:50-10:45: Introduction + Motivation leading Profiling to
                  identify bottlenecks
       10:50-11:45: An overview of useful tools: Scripting extension
                  and profiling
         Lunch

       13:00-13:55: Performance enhancements using vectorisation and
                  compiled code
       14:00-14:55: An overview of Parallel computing with R
       15:00-15:55: Extending memory limits using packages biglm, ff
                  and bigmemory
       15:55-16:15: Discussion.

      Abstract:
          R users are often limited by available memory, cpu power or
        both. The tutorial will cover a number of available options
        to enhance or accelerate R processing. We will cover
        profiling approaches to identify bottlenecks. We will
        introduce scripting extensions to R which we will use
        throughout for our examples. Performance improvements from
        vectorisation as well as from compiled code will be studied
        using different packages.  Next, parallel computing using
        multicore, nws, Rmpi.  snow and schedulers like slurm will
        examined.  Another sections concerns out-of-memory / large
        memory computing.  
          This tutorial is based on the one given at UseR! 2009 in
        Rennes, France: http://bit.ly/1gXlV5


研究集会「データ解析環境Rの整備と利用」(2)
    日本の R ユーザによる講演(日本語)

    日時: 2009年12月5日(土) 9:50 - 17:20

    場所: セミナー室 5、統計数理研究所、東京都立川市

    プログラム:
 
         9:50- 9:55                 開会挨拶など
        9:55-10:25    牧山 文彦(データキューブ株式会社)  
                        KMLとR
      10:30-11:00    石田 基広(徳島大学) 
                        RとExcelのインターフェイス RExcel パッケージの紹介
      11:05-11:35    谷村 晋(兵庫医科大学)
                        Rによる環境疫学 -大気汚染の健康影響-

      11:35-13:00                  ランチ

      13:00-13:30    舟尾 暢男(武田薬品工業株式会社)
                        HTML アプリケーションを用いた簡易 R ツール
                        の作成方法
      13:35-14:05    鈴木 了太(株式会社ef-prime)
                        オープンなビジネスデータ分析環境
      14:10-14:40    岡田 昌史(筑波大学)
                         RとFOSS4G(仮題)
      14:45-14:55    岡田 昌史(筑波大学)
                         R running on mobile gadgets
      14:55-15:05    吉田 康久(筑波大学) 
                         Tsukuba.Rの活動(仮題)

      15:05-15:20                          休憩

      15:20-15:50    中谷 朋昭(北海道大学)
                         パッケージccgarchによる
                         多変量GARCHモデルの推定
      15:55-16:25    門脇 正史(エーザイ(株))
                         インタラクティブPDF作成ライブラリPDF2の紹介
      16:30-17:00    荒木 孝治(関西大学)
                          Rcmdrによる教育用パッケージの開発
                          品質管理の場合
      17:00-17:20                          討論
                       

統計数理研立川キャンパスについて
  アクセスなどはホームページ http://www.ism.ac.jp/ をご覧ください。
  近隣にはレストラン、コンビニなどはほとんどありません。
  昼食は立川駅などで買ってこられることをお勧めします。
     平日のお昼頃、研究所入り口のところで弁当の出張販売があります
     が、売り切れることも多いです。

本案内は転載可能です.

------------------------------------------------
               中野純司(統計数理研究所)、中間栄治(株式会社COM-ONE)

FOSS4G 2009 Tokyo / Osaka

岡田 (2009-09-25 (金) 14:52:46)

地理空間情報を扱うオープンソースツールの利用と開発の促進を目的に活動しているOSGeo財団 ( http://www.osgeo.jp ) が開催する年次カンファレンス、FOSS4G 2009 ( http://www.osgeo.jp/foss4g2009-in-tokyo/ , 11月1-2日) へ、Rコミュニティからも参加のお誘いをいただきました。

東京、大阪で開催されますが、東京での1日目のコミュニティデイでは、20分ほど時間をいただけるので、日本におけるRコミュニティについて僭越ながら私が紹介してまいりたいと考えています。
また、懇親会ではジオデータに関する5分間のライトニングトークの時間もいただけるということです。
共同発表をしていただける方、ライトニングトーク向きの話題を提供していただける方、ご興味をお持ちの方、ぜひ一緒にご参加いただければ大変嬉しく思います。

また、コミュニティからの協賛も無料で受け付けているそうです。RもGIS分野でのプレゼンスが大分高まってきていますし、オープンソースツールが好きな人々の集まりですから、個人的には「RjpWikiコミュニティ」のような名前で協賛させていただきたいなと考えています。ただ、RjpWikiは公開されているいちWebサイトにすぎないし、私は場所を提供しているにすぎないので、訪問してくださる方の中にはこの名前での協賛に賛成されない方もいらっしゃるのではと思います。これについては皆さんのご意見をいただきたいので、匿名でもかまいませんのでコメントをお寄せいただければ幸いです。
よろしくお願いいたします。


ハイライト機能

hatener (2009-09-22 (火) 06:05:45)

はてな使ってますが

>|r|
hoge <- function(x) cat("hogehoge")
||<


で自動的ハイライトされるのがとても便利です。

ここでも
http://beck.boo.jp/pukiwiki/pukiwiki.php/%A5%BD%A1%BC%A5%B9%A5%B3%A1%BC%A5%C9%A4%CE%A5%CF%A5%A4%A5%E9%A5%A4%A5%C8%C9%BD%BC%A8/

みたいなのを導入してほしいです。


日本統計学会活動賞

間瀬茂 (2009-09-15 (火) 00:47:57)

間瀬です。私事(?)ですが、7月に日本統計学会から突然、統計学会活動賞をあげるという連絡がありました。そんな賞があることも知りませんでした。日本におけるRの普及に貢献したという理由だそうです。ご存知の様に、Rの普及活動は私一人という個人レベルのものではなく、岡田さんを中心とした自然発生的コミュニティの成果です。というわけで、私個人が受賞するというのは気が引けましたが、Rが統計ユーザーの最初の(そしてもしかすると唯一の)選択になりつつある現在、日本のR普及に情熱を持ち邁進された多くの「同志」の活動を記憶に留めるためにも意味があるかと考えありがたく頂戴することにしましたのでこの場を借りてお知らせします。何よりも、日本統計学会がRの存在をいわば公認した証しとも考えられますね。私自身はこのWikiからはすでに引退状態ですが、変わらず活発なやりとりがされているようで安心もし、頼もしくも思っています。


秀丸エディタでR

山岡 (2009-08-13 (木) 03:43:32)

Rのプログラムを書くときに
秀丸エディタをお使いの方ってどのくらいいらっしゃいますか?

私は最近学生はタダなのを知り使うようになったのですが
(正確には学生かつ難儀(?)していなければならないらしいのですが)、
Rに直接文を渡すような
(例えばエディタ上でctrl+Rを押したら選択している部分が直接Rで実行される)
マクロがあったらみなさん使いますか?

emacs+ESSやtinn-Rでは実装されているみたいですが、
実際便利なのかと思いまして。


PDFビューアーからEmacs上のSweaveにカーソルジャンプする方法

せーだ (2009-08-04 (火) 22:18:47)

Emacs上のSweave(Rnw)ファイル⇔PDFの相互連携のうち、PDFビューアをダブルクリックしてRnwの該当箇所にカーソルを飛ばす方法が判りました。Windows限定ですが、参考までにご紹介します。

  1. 最新の TeX Live または W32TeX をインストールすれば、LuaLaTeX で日本語 TeX ファイルが処理できる。
    フルインストールすれば OK。LuaLaTeX で日本語の TeX ファイルを処理する場合は LuaTeX-ja プロジェクト wiki の LuaTeX-jaの使い方 を参考にする。
  2. R-forgeからpatchDVIをRにインストールする
  3. SumatraPDF(高速軽量なフリーのPDFビューアー)をPATHの通った場所に置く
  4. Sweave.styの最後に次の記述を加えておく
    \newcommand{\Sconcordance}[1]{%
    \ifx\pdfoutput\undefined%
    \csname newcount\endcsname\pdfoutput\fi%
    \ifcase\pdfoutput\special{#1}%
    \else\immediate\pdfobj{#1}\fi}
  5. Sweaveファイルを編集し、LaTeXプリアンブル部に
    \usepackage{luatexja}
    \usepackage[ipaex]{luatexja-preset}
    \usepackage{Sweave}
    \SweaveOpts{concordance=TRUE}
    を入れる。
  6. R から Sweave の処理を行う(ファイル名:foo.Rnw)。この処理後に、LaTeX ファイルと図の PDF ファイルができる。
    Sweave("foo.Rnw")
  7. 上記の LaTeX ファイルを LuaLaTeX で -synctex=1 オプション付きでコンパイルする。foo.synctex.gz というファイルが同じ場所に作成されたことを確認する。foo.synctex.gz はそのままでは使えないので、別途同じ場所に解凍しておくこと。
    lualatex -synctex=1 foo.tex
  8. 出来上がったPDFファイルに、R側からパッチを当てる。
    library(patchDVI)
    patchSynctex("foo.synctex")
    ロケールの設定上、Warning が多数出るかもしれないが、処理には影響ない(はず)。
  9. これで foo.pdf ができたので、Windows PowerShell またはコマンド プロンプトから SumatraPDF で開く。
    SumatraPDF.exe -inverse-search "gnuclientw.exe +%l %f" foo.pdf
  10. SumatraPDF 上でダブルクリックすると Emacs が起動し、該当する部分(行単位の精度)にカーソルが合った状態で foo.Rnw が表示される。

patchDVI は WinEdt+Miktex を前提としているため、LuaLaTeX を経由しないと、日本語を含む Rnw ファイルは正しく処理されないないようです。手順は結構複雑ですが、後からバッチファイル化しておけば良いでしょう。
~/.emacs.d/init.el で適切な関数を設定すれば、Emacs⇒ビューアーの移動も可能です。

【補足】現在の LuaLaTeX は、[u]j[s][article/report/book]などの 日本語 (u)pTeX 用クラスファイルでは動作しません。ltj[s][article/report/book] などの LuaTeX-ja のクラスファイルまたは [article/report/book].cls などの欧文用クラスファイルを使いましょう。

SweaveでエディタとDVIビューア間の相互移動参照


RスクリプトからR関数名の抽出

谷村 (2009-05-15 (金) 13:03:03)

myuheさんが書かれたauto-complete.elを拡張するR用のelispに自分が頻用するコマンドを追加することを目的として、日々残しているRスクリプトからR関数名を抽出するPerlをスクリプトを書きました。必要な方がいらっしゃればどうぞ使ってください。

#!/usr/bin/perl
# getRcommands.pl 

my %count;
while (<STDIN>) {
#   while(/[\w\.]+( ?)*\(/g){ push(@words, $&) } #関数名と()の間に空白を入れる人向け
    while(/[\w\.]+\(/g){ push(@words, $&) }
}
@words = grep {!$count{$_}++} @words; 
chop(@words);
foreach $i (@words) { print "$i\n" }
exit;


Rスクリプトを標準入力からこのgetRcommands.plに与えればR関数名のリストを標準出力に出します。


$ cat 20090326.R | perl getRcommands.pl
read.table
paste
rbind
names
c
coordinates
library
readShapePoly
readShapeLines
proj4string
CRS
spTransform
plot
points
text
as.character
point.in.polygon
rep
round
nrow
cbind
function
spDistsN1
return
which.min
row.names
head
for 
length
findps
findss
sample
sapply
if 
as.logical
sum
unname
unlist
findaf
write.csv
e00toavc
read.coverage

注意:自作の関数名を除く処理を入れていないため、上記の例だとfindaf、findps、findpsのようにRスクリプトの中で定義した自作関数も混ざります。

ホームディレクトリの全てのRスクリプトからR関数名を取り出してみます。

$ find ~/ -name "*.[r|R]" | wc -l
442

今、私のホームディレクトリには442個のRスクリプトがあるようです。getRcommands.plを使って、この全てから(重複を除いて)R関数名を取り出します。大量に出力される結果をこの掲示板に全て表示することは無理なので、先頭の10個を表示させます。

$ find ~/ -name "*.[r|R]" -exec cat {} \; | perl getRcommands.pl | head
function
epidemic.sim
save
if
print
sformat.output
write.table
return
cat
length

全部で何個あるのか数えてみると

$ find ~/ -name "*.[r|R]" -exec cat {} \; | perl getRcommands.pl | wc -l
4351

多いのか少ないのか分かりませんが、諸先輩方はもっと多いでしょう。


長崎観光はいかが

(2009-02-06 (金) 00:17:52)

日本行動計量学会 第12回春のセミナー


日本からのパッケージャーがあまり育って無いこと

okinawa (2009-01-08 (木) 08:46:06)

なかまさんが、おっしゃっていましたが、「日本からのパッケージャーがあまり育って無いこと」は、Rの国際化やメンテをされている方々の心配(もしくはやる気をそいでいる?)の種になっていると思います。
私もいろいろやっているわりにはパッケージを作っていないので、申し訳ないと思っているのですが、皆さん何が問題だと思いますか?


GEditのLaTeX pluginがデフォルトでR Sweaveをサポート

谷村 (2008-12-11 (木) 11:20:27)

GEditにLaTeX pluginがあるのですが、これがデフォルトでBuild LaTeX Documentメニューリストの中に「R Sweave PDF」メニューを持っていました。ユーザが自分でカスタマイズしてR+Sweaveを追加するのではなく、デフォルトで用意されていることに驚いたので、報告します。Sweaveの普及も進んだのでしょうか。Sweaveって何?という人は、The R Bookの第19章をご覧ください。The R Bookでは、Linux環境のときSweave.shを使うように書いていますが、最近のバージョンでは、

R CMD Sweave hoge.Rnw

でhoge.texと画像ファイルが作成されます。

gedit-latexplugin.png

ひながた氏にメモリ消費に関するレポートを投稿してほしい

(2008-12-06 (土) 23:49:58)

どんな内容だったのか激しく気になる

選択肢 投票
ぜひお願いします 11  
どっちでもいい 0  
興味ない 1  
このサイトには不適切 0  
この掲示板には不適切 1  

軽くしました(Q&A (初級者コース)/10からお引越し)

[[ ]] (2008-11-26 (水) 22:05:34)

画像等も退避・復旧したつもりですが不具合があったらごめんなさい
前にもお願いしたけど,画像の退避・復旧等も含めて,一ユーザがやるのは面倒くさいんです
この記事はしばらくしたら消去しますので,不具合の指摘以外,コメント不要です


R Graphical Manualデータ更新

小笠原 (2008-11-18 (火) 19:23:21)

しました。年に一度になってしまってまして、申し訳なしです。(目に見えないところを改良したら、目に見える新しいバグが入ってしまってる ...)


recodingの訳について

モテキ ユタカ (2008-11-01 (土) 21:04:34)

Dalgaardの翻訳の231頁についてです。
Recodingの訳は、直訳すれば「再コード化」になると思います。


アドバンスドRチュートリアル 平成20年12月5日(金) のおしらせ

なかま (2008-09-24 (水) 15:12:32)
このチュートリアルは有償(演者旅費支援の為)です

日時: 12月5日(金)  午前10:30(受付:10:00)〜午後5:00まで
場所: 横浜市中区日本大通11番地
       横浜情報文化センター
       (最寄り駅: みなとみらい線「日本大通り駅」 情文センター口)
参加費: 15,000円 <- でもUseR!より安い!

10:30 - 11:40
	 Peter Dalgaard
13:00 - 14:10
	 Duncan Murdoch
14:20 - 15:30
	 Thomas Lumley
15:40 - 16:50
	 Simon Urbanek


申込および詳細はhttp://jasp.ism.ac.jp/~iasc2008/tutorial.html からお願い致します.


SPSSからRが利用できる(@_@)??


RjpWiki開設5周年記念公開座談会

(2008-07-07 (月) 09:27:15)

RjpWiki開設5周年を記念して公開座談会を開催したいと思います。Rのバージョンアップ・日本語化対応、ユーザー会の開催、R初心者の増加やR本出版ラッシュ等々、なにかと忙しい5年間だったのではないかと思います。


九天社ホームページより

(2008-06-12 (木) 00:49:01)

************
九天社は2008年06月10日に営業を停止しました。
************
このページは、元サイト管理者の判断により一時的にサーバーを移転して公開しています。書籍のデータのダウンロード等、必要な方はなるべくお早めにダウンロードしてください。


Rプログラミング&グラフィックス
[著]高階知巳 [価格]3,990 円(税込)


Rで学ぶデータマイニングII シミュレーションの視点から
[著]熊谷悦生、舟尾暢男 [価格]3,990 円(税込)


R Commander ハンドブック
[著]舟尾暢男 [価格]3,360 円(税込)


Rで学ぶデータマイニング I データ解析の視点から
[著]熊谷悦生、舟尾暢男 [価格]3,780 円(税込)


The R Tips データ解析環境 R の基本技・グラフィックス活用集
[著]舟尾 暢男 [価格]3,675 円(税込)


The R Book データ解析環境「R」の活用事例集
[著]岡田 昌史 [価格]3,990 円(税込)



BRugsのマニュアルをゆずってください

BRugsはどこへ行った? (2008-06-07 (土) 08:27:02)

豊田先生の本を購入し、BRugsをいじって遊んでみようかと思っていたところBrugsのパッケージがCRANから取り除かれていました。私自身、BRugs自体はインストールしてあるのですがPDFのマニュアルを持っておりません。参照したいことがありますので、どなたかマニュアルをゆずっていただけないでしょうか。お願いします。


Rと民族愛

one of R users (2008-05-25 (日) 01:40:02)

R本体の組み込みデータセット中の volcano は filled.contour() 関数の例としてRユーザーにはお馴染みですが、火山名 Maunga Whau を久しくハワイのマウナロア(Mauna Loa)火山のことと思い込んでいました(そんな粗忽者は私だけ?)。今回ヘルプ文章をじっくり眺めていてとんでもない勘違いと気づきました。これはニュージーランドのオークランド火山帯(50あまりの火山があるのだそうです)の中の(死?)火山のイーデン山(Mt. Eden)のことだそうです。Eden とはニュージーランドがイギリス植民地になった時の初代統治者オークランド伯爵の名前だそうです。一方 Maunga Whau とはこの山のマオリ族名で Whau tree の山という意味だそうです。地形図からこのデータセットを作ったのは Ross Ihaka 氏で、ご存知のようにマオリ族出身で、そのことを誇りに思っている人物です。このデータセットの解説には Mt. Eden という言葉は一切ありません。つまり彼の強い民族意識が背景にある(?)。~


参考:Maunga Whau。ちなみに whau tree とはマオリ族がその苦い葉をお茶代わりにしていた木なんだそうです。


GARCHオプション価格をRで求めるには?

田中 (2008-05-23 (金) 20:41:51)

RでDuanによる局所リスク中立によるオプション価格をもとめるサンプルプログラムを知っている方などいらしゃいますでしょうか。ぜひとも教えていただけませんでしょうか。


RとFDA関連の情報求む

okinawa (2008-04-22 (火) 14:43:22)

仕事柄、FDA(アメリカ食品医薬品局)への薬の申請にかかわる資料を集めております。RとFDAの関係については、いくつかの資料を発見することができたのですが、もっと集めたいと思っております。また、それと関連して日本では薬の申請がどうなっているのかご存知の方がいらっしゃいましたら、教えていただけませんでしょうか?
ちなみに、FDA内部ではすでにRが使われており、2007年からはオフィシャルに利用されるようになったようです。
以前、トップページのコメントに出ていたRStatも、どうやらこの流れで発生したもののようですね。


R以外でベクトル演算ができる言語

okinawa (2008-03-17 (月) 18:56:45)

皆さんに相談があります。R以外のプログラム言語でベクトル演算ができる言語にはどのようなものがありますか。ご存知の方は、教えていただけませんでしょうか。(言語にはあまり明るくないので・・・)


Ra システム & jit (Just in time compiler)

(2008-03-08 (土) 12:30:02)

パッケージ jit。少し気になる、Tierney 氏の R byte compiler みたいなもの? R をこの機能用に拡張したという Raシステムの元で動くそうだ。

 
The Ra Extension to R
Ra is functionally identical to R but provides just-in-time  
compilation of loops and arithmetic expressions in loops. This usually  
makes Ra arithmetic much faster than R. Ra will also typically run 
faster than standard R even when just-in-time compilation is not enabled.
An example

   jit(1)                     # turn on just-in-time compilation
   for(i in 1:na)             # example convolution code 
     for(j in 1:nb)
       ab[i + j] <- ab[i + j] + a[i] * b[j]

With na and nb bigger than about 100, the loop runs about 30 times 
faster. With na and nb equal to 10, the loop runs about 10 times 
faster. See here for timing details.
 
The R code is compiled to byte code which is executed internally by 
an interpreter in C.
  • 面白い取り組み方法ですね。RaってR advance って感じでしょうか。jitがどれくらい効くのか色々試してみようと思います。(日本語RでもRaはそのまま動いています) -- okinawa 2008-03-09 (日) 11:11:59
  • Rコード最適化のコツと実例集の最初にある説明用コードで試してみました。(MacBookCore2Duo2G,VMWareFusion&Win2000) 結果:純正R2.6.2=5.58sec Ra(R2.6.2)=0.58sec 純正R2.6.2(ベクトル化)=0.22sec Ra(R2.6.2)(ベクトル化)=0.18sec でベクトル化しても高速化されるようです。plotなどの描画関係の関数は利用できないようで、jitを停止「 jit(0) 」にしたあとplotさせるときちんと動きます。 -- okinawa 2008-03-09 (日) 15:35:40
  • 早速の使用報告ありがとうございます。こうした取り組みが将来的にR本体に取り込まれれば良いですね。 -- ものぐさな元記事投稿者 2008-03-09 (日) 19:05:28
  • 使ってみて、私もそう思いました。(^_^) -- okinawa 2008-03-10 (月) 08:23:21

数学ソフトウェアとフリードキュメント VI

hamada (2008-02-22 (金) 18:15:53)

3月22日に近畿大学でワークショップ「数学ソフトウェアとフリードキュメントVI」を開催します。
今回は、Mathematica6 の新機能に関する講演や、偏微分方程式境界値問題解析ツール FreeFem++ 等についての講演を予定しております。皆様のお越しをお待ちしております。


「空間回帰分析による地価の予想」

風と落ち葉... (2008-02-15 (金) 17:36:09)

地理情報システム学会 土地利用・地価GIS分科会
日時 平成20年2月29日(金)PM4:00〜6:00 受付開始PM3:30

場所 大阪NPOセンター 3階  会議室Fhttp://www016.upp.so-net.ne.jp/PtRights_Kansai/Osaka_NPO_Plaza.htm

予定ですが「R言語のGWRコマンド利用方法」が発表されるようです。
spgwr かな?それとも...

詳細は↓
http://www.gissoken.org/semina.html


レーダーチャートを描く関数

中澤 (2008-02-13 (水) 16:04:01)

Rではstars()でレーダーチャートを描けますが,Excel風の(というか,通常イメージする)ものとは随分見栄えが違っていました。Excel風のレーダーチャートを描く関数を探したのですが見つからなかったので作ってみました。
http://phi.med.gunma-u.ac.jp/swtips/radarchart.R
においてありますので,同じ悩みをお持ちの方にお試しいただければと思い,勝手ながら紹介させていただきます。


※未承認広告※ useR!2008

なかま (2008-02-04 (月) 19:59:31)

みなさま, useR!2008の宣伝です.(汗
みなさまの会社や研究室にPoster等張ってもらえるとうれしいです.
私で出来ることでしたら, なんなりと御申しつけ下さい.
abstractの登録と初期登録の〆切は3/末です.
以下,組織委員会からのメールです.

Dear useR! 2008 program committee members,
 
online registration and abstract submission are finally available
from the conference Web page at and we can start motivating useRs
to participate or (even better) give a presentation at the
conference.

 useR! 2008
 August 12-14, 2008
 Technische Universitaet Dortmund
 http://www.R-project.org/useR-2008/

As members of the PC, I would like to ask you to advertise the
conference: at your university, in your community/ies, on the
SIG (special interest group) mailing lists (if available), at
conferences and workshops etc. Also encourage useRs to present
their packages or applications at the conference.

If you want to organize a session focused on your area of
interest, we will try our best to provide a suitable platform
for that. Just ask the prospective participants of the session
to submit their abstracts as usual via the Web site. We will
organize the abstracts into sessions after the submission deadline
and you can simply indicate wich abstracts you have solicited
for your session. The deadline for submission (and early
registration) is

 Submission deadline: 2008-03-31

Some additional advertising material such as
 o a call for papers,
 o a poster (with your name on it :-)) that you can put
   up on your office door or within your department,
 o a flyer (two on one A4 page) that you can take to
   conferences/workshops you are attending,
 o the logo as a .png (in different resolutions) that you can
   use for hyperlinks on your homepage,
is available from the conference web page at
 http://www.R-project.org/useR-2008/

Thanks to all of you for your help in organizing this event.
If you have any questions, ideas, recommendations, don't hesitate to
contact us!

For the organizing committee,
Achim

VineLinux用のRパッケージ

谷村 (2008-01-17 (木) 21:49:05)

皆さんに、相談があります。
CRANで配布されているVineLinux用のrpmパッケージの更新が、私の異動など諸事情によりR 2.4.1で止まっております(VinePlusの方には別な方が2.6.0に更新してくれています)。先ほど、Rプロジェクトな方からメールをいただきまして、any chance for an update\?と尋ねられました。VineLinuxの現状と想像されるニーズを考えますと、CRANからVineLinuxのディレクトリを削除してもらってもよいのではと愚考いたします。
日本発のLinuxディストリビューションのディレクトリが削除されるのは、残念なことではありますが、もう潮時かと思います。
Vine用のrpmパッケージを作り続けて欲しいという方はいらっしゃいますか?
VinePlusにあれば、CRANには不要とも思いますが、いかがでしょうか?
ご意見をお願いします。


Rマルチリンガル化

なかま (2008-01-12 (土) 16:30:33)

先頃, R教授より赤紙が参りまして戦地に赴いて参りました.
Winコンソール方面にてUnicode上陸作戦が行われましたが, 局地戦に終始してしまい, 戦況の大開を図るに至らず一時撤退しました.
現在, RegisterClass はANSIのままですので, さほど困らない状況ですが, いぜれにせよサロゲートペア方面の問題もあるのでgraphappのUnicode化は持久戦になると思います.
現在, ローケル方面の局地的戦闘を挑みましたが, 戦線が何故か広大な範囲に延びきってしまい
いよいよ収集がつかなくなってしまいました...
これまでは, 9x式M$のおかげ(良くも悪くも)でこの作戦議論は棚上げでしたが, 2008年度より,
9x式M$は退役し00式以降のM$のみとなります.
閑話休題...
最新のR-develはRguiのコンソールが一部Unicode化されています.
目的としては、例えば日本語Windowsなのにウムラウトが書きたいとか
そういうのが出来るようにしたいと言うことです.(現状ではまだです)
R教授はUCS2ですすめて行くと言ってますが, それだと困るとか, そんなら
私がやります!とか. 意見などございましたらお願いします.

ついでに, IMEのキャレットを直したので, ATOKでも大丈夫かどなたか試して
頂けると幸いです.
最新のR-devel for win はこことかダウンロード可能です.


Rユーザー会2007発表スライド

okinawa (2007-12-10 (月) 16:43:58)

下記のURLにて発表スライドを随時公開してゆくとのことです。
http://jasp.ism.ac.jp/meetings/R2007/


Rユーザー会終了

okinawa (2007-12-09 (日) 12:26:41)

Rユーザー会が盛況のうちに終了しました。(関係者の皆様本当にご苦労様でした)。今回は、前回よりも実用的かつ深い内容のものばかりで、更にレベルアップしていたように感じました。個人的には、NTT西日本のRグリッドが興味を引かれましたが、時間が無かったのか、プレゼンがXXで今ひとつ良くわからなかったです。可能ならばRjpwikiで詳しく説明してほしいですね。


Rユーザー会のプログラム(最終)

間瀬茂 (2007-10-27 (土) 16:00:36)

間瀬です.統計数理研究所の共同研究集会(通称Rユーザー会)のプログラムが概略決まりましたので、参考までにおしらせします.参加は三日間ともどなたも自由です.場所は昨年と同様統計数理研究所の大講堂です。なお、土曜日は研究所の鉄柵が閉まっておりますので,鉄柵の通用口からお入りください。

-----------------------------
7 December 2007
10:30 - 11:30  Simple Parallel Statistical Computing in R by Luke Tierney
11:45 - 13:30  Lunch
13:30 - 14:30  R Behind the Scenes: Using S the (un)usual Way 
        by Friedrich Leisch
14:45 - 15:45  Code Analysis and Parallelizing Vector Operations in R 
        by Luke Tierney
16:00 - 17:00  Flexible Implementations of Cluster Analysis and Mixture 
        by Friedrich Leisch
18:00 -        Dinner
Each talk has one hour length and followed by about 10 minutesdiscussion.
------------------------------------
12.8 
 9:40--10:30 牧山文彦(データキューブ)「R+M=?−Rとオブジェクトデータベースの
                                       新次元−」
10:30--11:20 樋口千洋(大日本住友製薬)「Bioconductorの概要とその利用方法」
11:20--12:10 鈴木了太(ef-prime)「ビジネスデータ分析の現場から」
12:10--13:20 昼休み
13:20--14:10 舟尾暢男(武田薬品工業)
            「今日からあなたも統計ソフト開発者!
             〜 R Commander の概要,改造,数式処理機能の実装例 〜」
14:10--15:00 石田基広(徳島大学総合科学部)「Rと自然言語研究」
15:00--15:20 休憩
15:20--16:10 谷村晋(立命館アジア太平洋大学)「疫学におけるRの活用」
16:10--16:50 小笠原理(遺伝研DDBJ)「R Graphical Manualのつかいかた」
16:50--17:20 山本寛(NTT西日本),福崎昭伸(NTT西日本),中野純司(統計数理研究所)
            「グリッドコンピューティングとR」

なお6日に関連して次の講演が予定されていますので、併せておしらせします.

6 December 2007
13:30 - 14:30  Finite Mixtures of Generalized Linear Regression Models   
                by Friedrich Leisch
14:45 - 15:45  MRI Tissue Classification Using Bayesian Hidden Markov Normal Mixture Models 
                by Luke Tierney


R Graphical Manuals Web API

小笠原 (2007-10-10 (水) 13:27:59)

r-helpにメールを出したら早速「web APIは無いのか?」という返事だったので、作ってみました。詳しくは http://cged.genes.nig.ac.jp/RGM2/webAPI.php をご参照ください。


R Graphical Manuals本サイト

小笠原 (2007-10-08 (月) 09:48:28)

R Graphical Manualsは http://cged.genes.nig.ac.jp/RGM2/index.php を本サイトとすることにしました。昔のURLをブックマークしてくださってるかたは、お手数ですが、ブックマークの変更をお願いします。


ビデオアーカイブ「計算による数理科学の展開」

hamada (2007-10-03 (水) 16:47:30)

先日、東北大学で行われたワークショップ「数学ソフトウェアとフリードキュメント V」の講演ビデオが神戸大学「計算による数理科学の展開」プロジェクトから公開されました。間瀬先生による R に関する講演ビデオも含まれていますので、よろしければ御覧ください。

http://www.math.kobe-u.ac.jp/cm/

からビデオアーカイブへ進むと一覧が表示されます。


変数名の無造作な生産

なかま (2007-10-02 (火) 14:33:19)

関数のテスト等を行うときに, 色んなデータを造り, 変数名をhoge.1,hoge.2 等ととりあえず作りながら, どんな変数名にしたかls()等で確認して, 「さっきは13まで作った」と言う方もいらっしゃるかも(私だけか?)しれません.
そこで, この枝番とも言うかを自動で生成してくれればと思い立って, 以下のような物を作りました.

`:=` <- function (x, value)
{
    penv<-as.environment(-1)
    pat<-paste("^",deparse(substitute(x)), sep="")
    patnames<-ls(pat=pat,envir=penv)
    oldname<-make.names(patnames,unique=T)
    newname<-make.names(c(patnames,deparse(substitute(x))),unique=T)
    addname<-newname[!newname%in%oldname]
    assign(addname, value, envir = penv)
    comment(penv[[addname]])<-deparse(substitute(value))
    addname
}


これによって, 例えば,

   num   <- 1:1000
   num.1 <- 1:10000
   num.2 <- 1:20000


   num   := 1:1000
   num  := 1:10000
   num  := 1:20000

と, することにより, num,num.1,num.2 の名前が自動的に付けられます.
キー操作が格段に減ります.
式もコメントに保存して,

   comment(num.2)

なにやら, 「おおっ!」と言う感じです.
そして, 私は気持ち良く, データをデータ名を気にすること無く作り始めました.
やがて, 大きなミスを侵していることに気づきます.

TEST <- rnorm(1000, sd=30)

全ては水泡と消えました....とさ.(;_;)


R Graphical Manuals テストサイト

小笠原 (2007-10-01 (月) 15:45:51)

長らく更新していなかった(ので死んでいるのかと思われていたかもしれない)R Graphical Manualsですが、新しいインタフェイスを http://cged.genes.nig.ac.jp/RGM2/index.php にてテスト中です。本サイトに反映されるのはもう少しかかりそうですが、不具合報告、御意見御感想など教えていただけると幸いです。cran task viewのお題にも挑戦してますが...どうでしょう。


R パッケージ開発のための R-Forge

偶然 R-Forge というウェッブサイトを見付けました.R パッケージ開発プロジェクト用のサイトらしいです.~ (2007-08-18 (土) 07:47:41)

RForge strives to provide a colaborative environment for R package developers. 
The ultimate goal is to offer SourceForge-like services (such as SVN repository, 
place for documentation, downloads, mailing lists, bugzilla, wiki etc.) with 
additional features specific to R package development, such as make check 
on-commit, nighlty builds of packages, testing on various plarforms and full 
CRAN-like reposity access. The focus is on R-specific features that are not 
offered by SourceForge or GForge.

Currently the RForge contains over a dozen R packages (and other  
projects) with public and developer SVN access. Snapshot source 
packages are created upon commit and become available from the 
repository right away. Also make check is run automatically and 
documentation is generated. See RForge Documentation page for details.

今年度の統計数理研究所のR集会について

間瀬茂 (2007-08-17 (金) 23:19:28)

間瀬です.統計数理研究所の中野先生から今年度のR集会を12月7,8日(金、土)開催に確定したいとのご連絡がありましたのでおしらせします.今回の外国からのお客さんはRコアチームのLuke Tierny (LispStat、R Byte compiler 作者)と Friedrich Leisch さんだそうです.8日(おそらく)の日本語集会の出し物について自選、他薦よろしくお願いします.


秋の数学会に関連した講演会のお知らせ

間瀬茂 (2007-08-17 (金) 11:22:31)

間瀬です。数学会の直前に「数学ソフトウェアとフリードキュメント」という集会が毎年開催されています。趣旨は数学研究に役立つ各種ソフトウェアを紹介するということのようで、今回で5回目になります。自作ソフトウェアの紹介講演が主なようですが、今回主催者の福岡大学の濱田さん(Knoppix/Math プロジェクトの中心人物です)からのご依頼で一時間のR紹介講演を引き受けました。Rは既に統計ユーザにはかなり認知を受けていると思いますが、非統計ユーザー、特に数学者における認知度は低いのではと思います。これはもったいないと日頃感じていましたので、海外出張直前で日程的に厳しかったのですが、講演をお引き受けしました。聴衆は非統計ユーザという前提で話すつもりですので、RjpWikiの関係者にはお役に立たない(さらに昨年度のRユーザー会の講演の焼き直しです)と思いますが、周囲の非統計ユーザでご関心を持ちそうな方がいらっしゃいましたら、ご周知願えれば幸いです。以下講演会情報:

9月20日(木)午後(数学会の会期は9/21-24)
数学ソフトウェアとフリードキュメントV


2007年度日本OSS貢献者賞の推薦

okinawa (2007-08-12 (日) 13:19:27)

2007年度日本OSS貢献者賞の推薦が開始されていますが、Rで出しませんか?すばらしい貢献をされている方が大勢いらっしゃいますので。http://www.ipa.go.jp/software/open/ossc/2007/contribute/ossaward2007.html


「Rプログラミングマニュアル」、御報告とお願いの件

間瀬茂 (2007-08-08 (水) 10:41:22)

先日他の頁で一寸ほのめかした「Rプログラミングマニュアル」の原稿を昨日出版社(数理工学社)に提出しました。予定通りなら10月に刊行予定です。こうしたことがらは、刊行後に誰か気づいた人がタレコミするのが奥ゆかしいやりかたですが、敢えて刊行前に著者自ら案内するという「はしたない」ことをするのは事情があります。この本は以下のような章建てで、計算機言語としてのRの機能(だけ)を出来るだけ網羅的に紹介することを目標にしています。各章末(最終章)には章題に関連したTipsを紹介しています。このTipsは、Rユーザが実際にRを使用した際に出会った困難を紹介するという趣旨から、RjpWikiの記事、特に Q&A コーナー、をおもな参考ソースにしています。質問された方、解答を寄せられた方双方(多くは匿名ですが、お名前のわかる方も含め一々引用はしておりません)に、勝手に引用(かつ一部編集)したことをご報告すると共に、ご了解をお願いしたいと思います。この意味でこのマニュアルは「The R Tips」と同様に RjpWiki の産物と言えます。勿論、参照結果の適切さ、正確さの責任はひとえに著者にあります。お詫びの印として印税の一部を R Foundation に寄付させて頂きたいと思います。なお、最初「初心者には一年早い」という副題を付けようと考えましたが、出版社が嫌な顔をすると思いましたので取り止めました。しかし、内容は初心者向きでは無く、ある程度 R を使いこなしている方を念頭においております。以上、よろしくお願いします。

 目次
    序
 1. 論理オブジェクトと論理演算
 2. 繰り返しと選択
 3. ベクトル
 4. 文字列とマッチング
 5. 行列
 6. 配列
 7. リスト
 8. データフレーム
 9. 因子
10. 関数
11. apply関数族
12. 作表関数
13. 数値関数
14. 日付、時間
15. 入出力
16. 環境
17. 言語オブジェクト
18. クラスとメソッド
19. Rの便利な関数とその他のTips集
20. Rコードの高速化のヒント
    文献
    索引

Ryacas

(2007-08-05 (日) 14:19:03)

既に御存じの方もいらっしゃるかも知れませんが、Mathematica 風のフリーの計算機代数システム yacas を R から使うパッケージ Ryacas というのがあることを r-help 記事で知りました。多倍長精度演算や数式微積分等ができるようです.参考リンク:Ryacas.pdf,
もっと詳しい情報
ついでに見かけた Wikipedia 記事 統計パッケージの比較


sqldf

okinawa (2007-07-23 (月) 10:29:10)

どこかで、データフレームでSQLが使えたらいいなという書き込みを見た記憶があるのだが、今日更新パッケージをみていたら、それらしき物が出ていた。
R魔人の先生方には不要な代物のような気もするが、SQLも「それなりに」使えば役に立つので有難い。
ここまできたら、データフレームの永続化(DB化)もほしいところですが、どなたかご存じないですか?


[r-help 記事より] Improved Windows Vista compatibility

(2007-07-12 (木) 09:18:11)

subject		[R] Improved Windows Vista compatibility	 
Duncan Murdoch and I have been working on Vista compatibility.

The first build of R-2.5.1-win32.exe was built with a version of the
installer that had some compatibility issues, and it has been rebuilt
under the latest version.  What now happens is that if you want to install
R in an adminstrative area you need to select 'Run as Administrator' when
running the installer: otherwise the default installation directory
offered will be in your user area (e.g. c:/Users/ripley/Documents).

The Tcl support files came with obsolete Winhelp 4 .hlp files that are not
readable under Vista, and .chm help has been added.  (As from the next
release .hlp will be dropped.)

Rtools.exe has also been rebuilt with newer versions of the tools that
work on Vista.  There is still a compiler path issue, and you need to add

c:\Rtools\MinGW\libexec\gcc\mingw\3.4.5

(or similar) to your path.  When that is done I have successfully built
and run R-patched and R-devel on 64-bit Vista.

Brian D. Ripley
  • "R-devel on 64-bit Vista"って??? -- 2007-07-13 (金) 14:21:43
  • R-patched は現在バージョン R 2.5 にパッチをあてたもの、R-devel は開発中の次期バージョン R 2.6 のことでしょう。 -- 2007-07-13 (金) 15:01:56
  • 情報ありがとうございます。いよいよ RもWIn64 時代到来ですか。 -- 2007-07-13 (金) 18:10:25
  • 64bitのWindows上で32bit版のRが動くようになったと言う意味ですよ. -- なかま 2007-07-16 (月) 19:29:25
  • なかまさん、情報ありがとうございます。R for Win64 はまだなんですね。MinGW for 64 bit がまだ出てないからかな。 -- 2007-07-17 (火) 10:13:52

STEMがオープンソースに

okinawa (2007-06-11 (月) 17:33:40)

STEM(Spatio-Temporal Epidemiological Modeler:時空間的疫学モデラー)」というソフトウェアで、IBMのアルマデン研究所(米国)、ハイファ研究所(イスラエル)、ワトソン研究所(米国)が共同で開発し、Eclipseコミュニティを統率するEclipse財団に寄贈され、EclipseOHF(Eclipse Open Healthcare Framework Project)を通じて提供されるそうです。
これどんなものか知っている方いらっしゃいますか?


ドイツ語版 R Wiki

(2007-06-07 (木) 22:11:30)

今日のパッケージ更新情報で気づきましたが、ドイツ語版 R Wiki があるようですね。やはり自国語で情報を得たいとのことでしょうか、共感。パッケージ wikibooks はこの Wiki の投稿内容をまとめたもののようです。


パッケージ timsac

(2007-06-03 (日) 06:21:01)

今日のパッケージ更新情報で気づきましたが、統計数理研究所で赤池氏を中心に開発された時系列解析用のフォートランライブラリ TIMSAC がRパッケージとして公開されているようですね。統計数理研究所の中野先生が R パッケージにして、研究所のウエッブサイトで密かに公開されていると聞いていましたが。


r-help での問答

間瀬茂 (2007-06-02 (土) 20:24:23)

初心者:「行列の最大サイズは?」
中級者:「本来制限はない、メモリ量次第。」
上級者:「行列の内容にもよる。同じメモリでも整数ならより大きなサイズが可能」
Wizard:「いや制限はある。ベクトルとしての添字は最大整数 .Machine$integer.max = 2147483647 を越えることはできないから(例え、64bit機でも)。」
神様:「今どうすればその制限を無くせるか考慮中。」

もちろん神さまとはR教授です。


パッケージ inline

(2007-05-31 (木) 08:41:18)

inline (バージョン0.2.1)というパッケージはRコード中にC,C++コードを直接書き込めば、それを動的にR関数に変換してくれるようです。RからC,C++関数を呼び出す作業を簡単にしてくれるかもしれません。どうしても for ループが必要な状況では試してみては。


パッケージ R.huge

間瀬茂 (2007-05-24 (木) 20:43:53)

CRAN にある R.hugeと言うパッケージを試してみました。R の既定であるオブジェクトを全てメモリ上に置くという流儀は、巨大なオブジェクトを扱うことができず、不満を持つユーザーがしばしばいるようです。R.huge はオブジェクトの本体をファイルに置くことにより、巨大なベクトル、行列をRで処理することを可能にするようです。こうした巨大オブジェクトの処理はSASが得意らしいのですが、ある説明によれば、これはSASが作られた時代はメモリ量が限られていたため、外部記録装置に本体を置く処理が不可欠であったためだそうです。たしかに X <- runif(1e8) (0.75GB!)を苦もなく実行してくれました。日頃大きなオブジェクトを扱っている方は試してみたらいかがでしょうか。ただし、おそらく処理の遅さ(想像、未確認)に、やはり必要な部分だけ処理する事になりそうですが。


0乗について

samejima (2007-05-21 (月) 17:20:07)

初めて投稿します。

EXCELでは
NA^0=#VALUE!
0^0=NUM!
ですが、

Rでは両方とも1になってしまうのですね。
これは問題ではないのでしょうか?

> NA^0
[1] 1

> 0^0
[1] 1

Windows Vista issue

間瀬茂 (2007-04-14 (土) 20:00:56)

r-help にR教授が Windows Vista にRをインストールする実験をした結果を報告しています。参考までに転記します(ついでながら、年度末に入手したパソコンは不幸にも Windows Vista 版で、Microsoft 流いらぬお節介の程度が一層増したようでいらいらさせられます)。

It seemed FUD [*] has been prevailing here and elsewhere on Vista security
features.

I asked our sysadmins to set up a Vista box for me on which I have access
to all levels of accounts.  Many of the issues I found were covered by
earlier answers and all in the upcoming rw-FAQ (currently available at
http://www.stats.ox.ac.uk/pub/R/rw-FAQ.html and in the 2.5.0 pre-releases)
but a quick reprise may help.
 
Most of my testing was of 2.5.0 beta, but I did some quick tests of 2.4.1.

1) The R installer and uninstaller are from an 'unidentified publisher'
and you may have to agree that you trust them.  This is a problem of the
Inno Setup installer kit we use.  An ultra-cautious sysadmin could
configure Vista to stop you installing via such a program.

2) Permission problems:

If you install R as an ordinary user (into your own file space) you should
see no permissions problems.  (There would have been problems, including
under XP, with some recent daily binary builds as the installer kit had
changed one of its defaults to disallow non-administrator installs, but
these have been fixed.)

I also encountered no problems installing R under the Administrator
account (normally hidden) and installing packages under the same account.

Things are more complicated if you use an account which is in the local
administrator group (but is not Administrator itself).  Such accounts are
no longer (by default) equivalent to Administrator, and run programs as
ordinary user accounts. They need to 'Run as Administrator' to do things
in the system area such as C:\Program Files.  You will be asked if you
want to run as administrator if you try to install software such as R, but
you will not be asked if you try to install packages in the main R library
(since asking is something that applies to a program, not part of a
particular session).  One simple solution is to elevate your credentials
when running an R session to install packages in the same way that you
needed to when installing R.  (Unix and MacOS X users will recognize a
somewhat automated reincarnation of 'sudo'.)

It looks like the best practice will be to change the (full) ownership of
the R installation to the account used to install it, something which
would be standard practice in the Unix world.  Also, we are encouraging
people as from 2.5.0 to install packages into a site or personal library
where these permission issues should not arise (except when updating
recommended packages).

3) The most worrying problem is that Vista is reporting quite incorrectly
file permissions through the POSIX interfaces used by file.info() and
file.access(), and furthermore allowed me as a standard user to create
directories in areas over which it says I do not have write permission. We
will look further into possible solutions, but it seems the Win32 API
functions are giving the same answers.

Problems with 'access' (the C call underlying file.access()) mean that the
MinGW compilers do not currently run on Vista without a lot of
hoop-jumping.

[*] http://en.wikipedia.org/wiki/Fear,_uncertainty_and_doubt
--
Brian D. Ripley,                  ripley@stats.ox.ac.uk
Professor of Applied Statistics,  http://www.stats.ox.ac.uk/~ripley/
University of Oxford,             Tel:  +44 1865 272861 (self)
1 South Parks Road,                     +44 1865 272866 (PA)
Oxford OX1 3TG, UK                Fax:  +44 1865 272595

ubuntu (dapper, edgy)版最新 R

間瀬茂 (2007-04-11 (水) 09:32:24)

Linux のディストリビューションのひとつ Ubuntu 用の R は既定のリポジトリには依然として R 2.3.1 しかありませんが、CRAN に最新版 R 2.4.1 があることをやっと気づきました。Ubuntu 版最新R。リポジトリに登録するには正規に認証されたサイトであることを教えるための手続きが必要です。注意書き Readme を読んでください。

なお、 Vmware 版 Ubuntu をしばらく使っていますが、Windows に寄生できるという利点のほかに、Vmware 版 Ubuntu は Windows にとっては単にディレクトリに過ぎないので、チューンアップした Ubuntu をハードディスクにコピーし、容易に他の機械に引越しできるというメリットがあることに気づきました。


R ユーザであることの幸せ

(2007-04-07 (土) 01:12:41)

SPSSの値段


RSiteSearch 用の Firefox plugin

(2007-04-06 (金) 00:38:07)

Firefox のサイドバーから RSiteSearch 機能を使うプラグインを見つけました。便利かどうかは一寸わかりません。
Firefox Plugin


V. Zoonekynd 氏の新しいマニュアル

間瀬茂 (2007-04-01 (日) 09:52:59)

r-help 記事で知りましたが、あの華麗なRグラフィックスで知る人ぞ知るオンラインマニュアル Statistics with R の作者の V. Zoonekynd 氏が又素晴らしいオンラインマニュアル Programming in R を公開しています。Rプログラミング全体に関する事項が要領よくまとめられています。まだ書きかけのようです(今回は最初から英語版)が、参考になります。


Vista は R ユーザーを(不)幸せにするか?

間瀬茂 (2007-03-30 (金) 23:21:02)

r-help で Vista で R を使うことができるかどうか議論になっています。R 自体のインストールは問題ないようですが、貢献パッケージのインストールに関しては Vista の管理者特権機構(?)から問題が起こる(特に会社のパソコンで管理者権限無しで使っている場合)らしいです。以下の R 教授のコメントがヒントになりそうです。関連スレッドにはUSB経由でパッケージを使う裏技があるとのコメントも。

On Wed, 28 Mar 2007, christian.ritter@shell.com wrote:
> The Vista issue is not innocent as it threatens the life of R within~
> large corporations. So any posts on how R runs under Vista and what has~
> to be done to make it work and what cannot be done etc will be very~
> useful.

See the rw-FAQ in the R-2.5.0 alpha versions and later.  That contains all
that we have seen reported, wiht documented workarounds.

My understanding is that there are no Vista issues per se with R, but
there are permission issues just as there are under 2000/XP if set up to
the same levels of security as are the defaults in Vista.  (Further,
that agrees with advice from someone within Microsoft who uses R.)

We do not intend to roll out Vista for several months, and it would
surprise me if 'large corporations' would do so without ensuring that
there is full software compatibility.

関連文書


DSC 2007 レポート

鈴木@ef-prime (2007-03-12 (月) 17:51:21)

ef-prime鈴木です。もう1ヶ月経ってしまいますが、2月15・16の二日間、Rの故郷ニュージーランドのオークランド大学で行われた国際学会 "Directions in Statistical Computing 2007" に参加してきました。
http://www.stat.auckland.ac.nz/dsc-2007/

目的は弊社開発の無償データ分析ソフト "Natto" と、NattoをRから利用するライブラリ "nattoR" の紹介だったのですが、Rコアメンバーの中でどんなことが議論されているのかと若干のミーハー根性を抱きつつ参加してまいりました。

仕事を抱えながらの参加で集中して聞くことのできた講演は数えるほどしかないのですが、印象的だったものをご紹介します。

■Ross Ihaka, "Common Lisp as a Vehicle for Implementing Statistical Environments"

第0回(?)Rユーザー会でも来日してくださったRoss Ihaka先生の講演。「初歩的なLispの実装にSとの互換性を持たせた」というRの実装に対して、「最初から完全なLispの上に統計システムを構築する」という発想で進めているという最近の研究成果について報告されていました。

恥ずかしながら、RがLispベースのシステムだということを初めて知りましたが、すでに「ポストR」の開発が始まっているのだなぁと感慨深い思いでした。「まだ実験段階」だと前置きがありましたが、実験ではRよりも効率的な計算が実現できているようでした。

■Thomas Lumley, "Memory profiling in R"

"R is well-known to be slow and able to handle only small data sets."という印象的(かつ自虐的?)なアブストラクトに惹かれて覗いてみました。関数ごとの計算時間を計測してくれるRのプロファイリング機能 "Rprof" は大掛かりな自作関数を作られる方ならおなじみの機能ですが、同様にメモリの効率についても計測してみよう、という趣旨のようです。(R-2.4.0以降で追加?)

結果はなかなか衝撃的でした。ちょっとした回帰モデルをひとつ作成するのに、なんと元データを6回もコピーしていることが判明!その実例ではfomulaにlogが入っている場合に、logをとるためだけにデータがコピーされてしまう…というもので、以下に類似例があります。
http://developer.r-project.org/memory-profiling.html

Rの最大の利点とも言えるお気楽プログラミングに慣れてしまった我々にはたいへん衝撃的な結果なのですが、結論としては「関数書くときはメモリの利用効率も気をつけよう!プロファイラ使ってね!」ということのようでした。やはりこのあたりは人手で最適化するしかないようです。

■Aaron Ping, "Beyond Line Charts: Graphing market trends with R"

日本からの参加者は統数研の中野先生と私だけ…かと思いきや、意外なところにもう1名いらっしゃいました。なんと、あのP&G社からの講演です。それも日本から!

内容はディベロッパーというよりユーザー寄りといった感じでしたが、マーケティング観点からの分析と視覚化のセンスの良さに脱帽です。日本企業からもどんどんこういった報告が上がって、マーケティングデータ分析全体がレベルアップしていくといいなぁと個人的に感じた発表でした。

■Paul Murrell and Ross Ihaka, "Display Lists in R"

最後の講演はこちらも以前来日されたPaul Murrel先生。R上でダイナミックグラフィックスを扱う方法について実例を交えて紹介されていました。プロット画面上に収まるようにグラフをレイアウトする例や、ウィンドウサイズが変更されても文字がはみ出ないlegendの例など「Rでそんなこともできるのか!」という驚きに満ちた内容でした。

ただし、Rの標準グラフィックは「システムに多くを任せすぎ」で、対して講演内容の手法は「ユーザーに負担を与えすぎ」とのことで、「ちょうどいい中間地点は存在しない」という結論でした。ともあれ、選択肢が増えることは有意義なことだと感じました。

Paul先生のスライドはこちらから入手できます:
http://www.stat.auckland.ac.nz/~paul/


他にもRコアメンバーや統数研の中野先生、統計ベンチャーなどから面白い内容の講演を聞くことができ、たいへん有意義な学会でした。人類の共有資産、というとやや大げさかも知れませんが、多くの優秀な研究者・開発者の地道な貢献がRの発展を支えているのだなぁ、と感慨深い思いで帰国の途に着いたのでした。

ちなみに、弊社ソフトウェア Natto とRパッケージ nattoR は下記ウェブサイトから無償でご利用いただけます。フィードバックなどいただければ幸いです。
http://www.ef-prime.com/

それでは、長文失礼いたしました。


こんな集会もあります

間瀬茂 (2007-03-06 (火) 14:46:40)
日本統計学会の春季集会(今年から新設)です。計算機統計のセッションでR関係の講演が複数あります.そのうちひとつは岡田さんが話されます.統計学会会員は(のふりをすれば)無料です.


日本統計学会 会員の皆様

庶務会計担当理事の川崎です。3月10日(土)に東京理科大学を会場に開催されます、春季集会の再度のご案内です。既に会報に同封で、春季集会のプログラムをお届けしておりますが、会員の皆様の積極的参加をお待ちしております。

# 学会ウェブサイトでも引き続きご案内中です。http://www.jss.gr.jp/ja/

なお、集会終了後18時〜20時に、東京理科大学理窓会館におきまして、懇親会を企画しております。会費は3,000円です。
http://risoukai.rikadai.jp/risoukai/activities/hall.html

準備の都合上、参加人数を把握しておきたいと考えますので、懇親会への参加を希望される方は、3月3日(土)までに,瀬尾隆会員宛にメール(seo__at__rs.kagu.tus.ac.jp)あるいは~FAX(03-3260-4293)にてご連絡くださいますようお願いします。

先日広報担当・坂本理事からご連絡がありましたように、この週末に学会サーバー移転が計画されている関係で、やや早めのremindとなりましたが、宜しくお願い申し上げます。

川崎能典 統計数理研究所

# __at__ はアットマークです


こんな集会があります(ただし有料) ~ [#ve7045e5]

間瀬茂 (2007-03-06 (火) 14:46:35)
統計ML stats 投稿記事より転載

STATS の皆様
 
大阪大学の坂本 亘と申します。

下記の案内を送信いたします。ぜひご参加ください。
僭越ながら、私も講演者の一人です。

-----

特定非営利活動法人・医学統計研究会
特定主題シンポジウム
「臨床評価における計算環境Rとその周辺」―S-Plusによる妥当性確認―

日時: 2007年3月17日(土)9時30分〜17時00分
場所: TKP新宿モノリスB1大会議室
参加費:会員 5,000円,非会員 10,000円
共催: (株)数理システム

<プログラム>

 9:30- 9:40 開会挨拶 魚井 徹(特定非営利活動法人・医学統計研究会)

座長 田澤 司((株)数理システム)
 9:40-10:55 「計算環境 R とそれに基づく統計実践」
山本義郎(東海大学)
10:55-11:05 休憩
11:05-12:20 「R による統計的シミュレーション入門」
坂本 亘(大阪大学)

12:20-13:30 昼食休憩

座長 武田 純(アステラス製薬(株))
13:30-14:45 「R による計量データの解析:パッケージと開発環境」
下川敏雄(山梨大学)
14:45-15:00 休憩
15:00-16:15 「R による離散データの解析:パッケージと開発環境」
越智義道(大分大学)

16:15-16:30 閉会挨拶 後藤昌司(特定非営利活動法人・医学統計研究会)

下記のウェブページからもご覧になれます。
http://www.bra.or.jp/event.html

----------------------------------------------
 坂本 亘 (Wataru Sakamoto)
 sakamoto__at__sigmath.es.osaka-u.ac.jp
# __at__ はアットマークです
----------------------------------------------

Ubuntu Linux 6.10ja + R 2.4.1

小笠原理 (2007-02-13 (火) 04:26:58)

日本語版Ubuntu Linux6.10(ubuntu-ja-6.10-desktop-i386.iso)に対してR-2.4.1のソースコードをコンパイルするためには、ちょっと一手間いるようです。(Ubuntuのr-baseパッケージは現在version 2.3.1-1ですからもっと新しいバージョンが好きな人はコンパイルが要るわけです。)

Ubuntuの日本語版では、OpenOfficeの日本語化に伴ってlibx11-6なるパッケージのバージョンが

1.0.3-0ubuntu4 => 1.0.3-0ubuntu4ja1

に変更になっています。そのせいでlibxt-devパッケージをapt-getしようとすると(libxt-devはlibx11-devに依存し、これはlibx11-6に依存しているので)
依存関係の計算がおかしくなりapt-getできません。

結局libx11-devのソースコードを入手して、依存関係のルールを1.0.3-0ubuntu4ja1も許すよう、ちょっとだけ変更することで解決しました。

sudo apt-get source libx11-dev
cd libx11-1.0.3/

libx11-1.0.3/debian/controlファイルの該当部分を以下のように編集

Package: libx11-dev
Architecture: any
Depends: ${shlibs:Depends}, ${misc:Depends}, libx11-6 (>= ${Source-Version}), <=この'>'を入れるだけ

パッケージを作ってインストール

dpkg-buildpackage -rsudo
sudo dpkg -i libx11-dev_1.0.3-0ubuntu4_i386.deb
sudo apt-get libxt-dev

Rのコンパイル

./configure --x-includes=/usr/include/X11 \
 --x-libraries=/usr/lib/X11 --enable-R-shlib
make
sudo make install

useR! 2007 アナウンス

間瀬茂 (2007-02-11 (日) 23:06:39)

始めてウィーン(ヨーロッパ)以外で開かれるようです。

R Users and Developers,

Plans are being made to hold the first North American useR! will be
held at Iowa State University, Ames, Iowa, August 8&#8211;10, 2007, which
will be a week after JSM'07.

This follows successful meetings in Vienna, Austria, in 2006 and 2004,
and also Directions in Statistical Computing (DSC) meetings in
Auckland, NZ (Feb 2007), Seattle (2005), and Vienna (1999, 2001,
2003).

Information about the meeting can be found at
http://www.user2007.org/

If you have suggestions for the meeting please email the program
committee at user2007@iastate.edu.

Regards,
useR! 2007 Program Committee
Douglas Bates, Dianne Cook, Dave Henderson, Heike Hofmann, Luke  Tierney

RODBC

takahashi (2007-02-09 (金) 08:59:11)

windowsにmysqlとmyODBCインストールしてRODBCで接続してみたんですが、
動作が遅くないですか?

約8600 x 15程度のデータフレームをセーブするのに数分時間がかかったんですけど、そんなもんなんでしょうか?

write.tableであれば、数秒で保存されるのに・・・

似たような環境で運用してる方がいたら、ご意見を伺えるとうれしいです。


MSWindows + Vmware + Ubuntu + R, 使いものになる?

間瀬茂 (2007-02-04 (日) 21:39:46)

二年ほど前(?)から、私の愛用の Knoppix が新しいパソコンで起動しない、起動してもHDにインストールできないことが、たびたび起きて困っています。これまで、少なくともデスクトップ機では一発で起動、インストールできていたのに。というわけで、ウィンドウズしか動かないしょうもない計算機で Linux が動かせると話題の Vmware と、これまた最近話題の新しい Linux distribution Ubuntu (Vmware 用仮想マシン版) を試してみました。Ubuntu 自体はあっさり動き、家主の Windows の気配も感じさせず、文句なく動きました(GNOME ベースなので慣れなくて使いにくいですが)。しかし、仮想マシンとは所詮居候の身、「三飯目にはそっと出し」ではないが、R の実行速度はかなり落ちるのではと疑い、次の簡単なコードで時間を計ってみました。

system.time({n <- 2e3; x <- matrix(runif(n^2),n,n); y <- x %*% x; z <- det(y)})

結果は、結構意外で、 居候 Ubuntu は16.2秒、家主 Windows では 37.0秒、そして Knoppix では 12.8秒(いずれも三回の平均)。Windows しか動かない馬鹿な機械も、これで書類書き専用機以外の使い道ができそうです。


Rが得意な方のための御仕事です(若干名)

瀧本 ( ttakimoto@kansatobunseki.co.jp ) (2007-01-22 (月) 21:58:15)

Rを使ったプログラミングとデータ解析の仕事をしていただける方を探しています。主に大量なデータを利用した回帰分析に関するものです。
雇用期間は数ヶ月間を予定していますが、延長も可能です。
大学院生歓迎です。
パートタイムベースで条件等については相談に応じますので、研究との両立が可能です。

仕事場は、千代田区大手町です。
詳細は監査と分析、瀧本までお問い合わせください。

(以上の内容で独立したページができていましたが、おそらく掲示板への掲載を意図したものと思われたので転載しました)


gnomeGUI

谷村 (2007-01-17 (水) 16:48:25)

新規ページを起こすまでもないのでR掲示板に書き込んでおきます。
gnomeGUIはgladeのライブラリに依存していますが、これはglade2でもglade3でもなく、何とglade (初期バージョン)です。これに気がつかないでちょっとはまったので、VineLinux4.0にgnomeGUIをインストールする手順を書いておきます。ターミナルでルート権限になり

# apt-get install  libglade-devel

これでgladeライブラリの開発ファイルが入ります。次に、ルート権限でRを起動し、

> install.packages("gnomeGUI", configure.args='--includedir=/usr/include/libglade-1.0')

とします。これで問題がなければ、gnomeGUIが入ります。gnomeGUIが入ったら、Rを終了して、ユーザ権限に戻り、ターミナル上で

$ R --gui=gnome

とするとRのGOMEグラフィックインターフェイスが起動します。

gnomeGUI.png

文字化けした場合は適当なフォントを指定するか、LANG=Cを頭につけて英語版で起動してください。


PS3LinuxでR

gamer (2006-12-26 (火) 01:38:54)

単純にCellプロセッサでベンチをとりたいだけなんですが、どなたかPlayStation3 LinuxでRを動作させた方はいらっしゃいませんか?ppc64アーキテクチャなので、ビルドにはPowerMac G5のppc64アーキテクチャでのビルドの情報が役立ちそうな気がしているのですが...


「Rの基礎とプログラミング技法」Uwe Ligges 著

間瀬茂 (2006-12-25 (月) 20:03:29)

表題の本、やっと暇ができたので流し読みしました。良い本だと思います。私も知らない話題が数多くありました。といって、蘊蓄を傾けてすぎてもいず、バランスが良いです。入門書には少し程度が高いと思いますが。訳も良くこなれて丁寧です。中でも環境、検索パス、スコープ規則、S4 クラス・メソッドの解説は、簡潔かつ要領を得ていてお勧めです。ドイツ語から訳された石井さんにお礼を申し上げます。


R-2.4.1-0vl1.i386.rpm

谷村 (2006-12-21 (木) 11:29:26)

VineLinux4.0用にRのrpmパッケージを作成しました。VinePlus 4.0 extrasにputしました。

# apt-get install R

でバージョンアップされると思います(/etc/apt/source.listのextrasは有効にしておいてください)。
2.4.0からのパッケージングの変更点は、(1) 日本語PostScriptフォントをデフォルトにすることはやめた(VineLinux用Rprofile.siteの追加をやめた)、(2) リビルド時に指定できるオプションが追加された:最適化オプション(LINUXOPT)、Webブラウザ指定オプション(R_BROWSER)、PDFビューア指定オプション(RPDFVIWER)、infoヘルプ生成オプション(INFO)。これらは、本家のオプション追加に追従しています。なお、Webブラウザのデフォルトはfirefox、PDFビューアのデフォルトはevinceと、VineLinux4.0のデフォルトにあわせてあります。

VinePlus FTPサーバへのアップロードが不調な関係で、ひょっとしたらsrc.rpmが壊れているかもしれません。その際は、ご一報ください。また、何か不具合がありましたら、ご連絡ください。


盛会御礼

間瀬茂 (2006-12-09 (土) 19:55:35)

本日の第三回(本当は第二回) R ユーザー会日本語デーに御参加頂いた皆さん、特に御講演頂いた皆さん、ありがとうございました。想像以上の参加者に驚きました。あの広い統数研の講堂が決して広すぎるとは感じられませんでした。R の普及がそれだけ進んでいる証拠だと思いました。内容も、前回の集会が多分にそうだったような「R オタク」の集会ではなく、実際の利用に根ざした、聞きごたえのあるものだったように思います。集会の本当の主催者の中野先生に厚くお礼を申し上げます。

英語デーの講演も含め、多くの話のスライドがいずれ統数研のホーム頁から入手できる予定だそうですので、聞きそびれた方は御覧ください。

8日に講演した韓国の若手の Park さんが、挑発的に計算機言語としての R の欠点を幾つも指摘し、もしかして R 教授と激論になるかと心配(少し期待)しましたが、あっさり無視。R 教授を前にこんな話をする元気さに感心しました。

Park さんについてもう一つびっくりしたのは、片言の日本語を話す事。聞いたら日本のアニメおたくなんだそうです。隣のトトロの主題歌を日本語で歌ってくれました。更に驚いたのは、彼が銀河鉄道スリーナインのファンだったという話を始めたら、Iacus さんが自分も知っている、と言い出した事(笑)。これからは、子どものころ日本製アニメに洗脳された海外若手研究者が喜んで日本に来てくれるかも知れないなと思いました。

PS. 私の講演で統計学者ナイチンゲールの話を披露しましたが、後で思いだしたことがあります。ナイチンゲールは統計学の重要性を訴え、オクスフォード大学に応用統計学の講座を作るべく運動したそうです。ところで、R 教授はオクスフォード大学の応用統計学の講座の教授ですね。つまり、ナイチンゲールと R には不思議な縁があるわけです(笑)。


R ユーザー会プログラム再掲

間瀬茂 (2006-11-24 (金) 18:58:45)

間瀬です。先にお知らせしたRユーザー会のプログラムの完全なプログラムが公表されましたので、
再度お知らせします。R教授が本当に来てくれるか心配でしたが、大丈夫のようです(笑)
R教授と後藤さんは日を変えて二回講演をお願いできるようです。
なお土曜日は研究所入口の鉄柵がしまっていると思いますが、一部が開閉出来るようになっておりますからご心配なく。

統計数理研究所共同研究「Rの整備と利用」研究会開催のお知らせです。(前
にもお知らせしましたが、未定だった英語講演のタイトルおよびアブストラク
トを付けました。)

また、Professor Ripley と Dr. 後藤には日を変えて追加の講演をお願いでき
ることになりました。どの講演も参加は無料で自由ですので、皆様の多数のご
参加をお願い申し上げます。

<<追加講演>>

● "Visualization for data mining"
       by Brian Ripley (Univ. of Oxford, UK)

日    時: 2006年12月7日(木)   10:30 - 11:30 (12:00 まで延長可)
場    所: 統計数理研究所 新館2階 研修室
Abstract:
The talk will start with an introduction to data mining, and the types
of data and questions that occur in that field.  It will then consider
ways to visualize such high-dimensional datasets via for example
projection pursuit and multidimensional scaling, and show some
examples from real-world consulting problems using R and GGobi.

● "GotoBLAS チュートリアル"
       by 後藤和茂 (Univ. of Texas, US)

日    時: 2006年12月11日(月)   10:30 - 11:30 (12:00 まで延長可)
場    所: 統計数理研究所 新館2階 研修室
Abstract:
GotoBLAS は複数のアーキテクチャをサポートする最適化 BLAS の実装の 1 つ
であるが、GotoBLAS 上で施されている種々の最適化の手法ついてはあまり知
られていない。そこで、本講演では、最適化を行う上での基本的な考え方を解
説するとともに、BLAS の Level 1 〜 Level 3 の特性及びこれらの関数を呼
び出す場合の注意点等に関して議論を行う。


世話人:
間瀬茂 (東京工業大学)
中野純司 (統計数理研究所)

-----------------------------------------------------

統計数理研究所共同研究「Rの整備と利用」研究会

日          時: 2006年12月8日(金)   9:30 - 17:00
                2006年12月9日(土)   9:30 - 16:20
場          所: 統計数理研究所 講堂
                地図 http://www.ism.ac.jp/access/index_j.html
参  加  費  用: 無料
使  用  言  語: 12月8日は英語、9日は日本語

■ プログラム

●12月8日 (各 talk の abstract が下にあります)

09:30 - 10:30
     Brian Ripley (University of Oxford, UK)

     Title: Software for Statistical Developments

10:45 - 11:45
     Kazushige Goto (The University of Texas, US) 

     Title: Various optimization and performance tips for processors

13:30 -14:30
     Stefano Iacus (Universita degli Studi di Milano, Italy)

     Title: Two R specific optimization techniques for speed and data management~

14:45 - 15:45
     Sungwoo Park (Pohang University of Science
                            and Technology, Korea)
     Title: A critique of R from the perspective of programming
            language theory

16:00 - 17:00
     Junji Nakano (ISM, Japan) and
     Ei-ji Nakama(COM-ONE Inc., Japan)

     Title: R on super-computers at ISM

( 18:00 -      Dinner)

●12月9日

09:30 - 10:15
   舟尾暢男
   武田薬品工業(株)医薬開発本部
   日本開発センター  統計解析部 統計グループ
  「Rでデータハンドリング 〜 データフレーム 30 分クッキング〜」

10:15 - 11:00
 久保拓弥
   北海道大学・地球環境科学研究院・環境生物科学部門 陸域生態学分野
  「MCMC 計算まわりでさまよう R ユーザー」

11:00 - 11:45
   鈴木了太
   (株) ef-prime
  「Rで起業!フリーソフトウェアとデータ分析ビジネスの現在」

 (11:45 - 13:00 昼休み)

13:00 - 13:45
   小笠原理(国立遺伝学研究所 生命情報・DDBJ研究センター)
   服部恵美((株)情報数理研究所)
   三十尾潔高((株)情報数理研究所)情報数理研究所
  「R graphical manualsの開発と今後の展開」

13:45 - 14:30
 牧山文彦
   特定医療法人敬愛会 ちばなクリニック 健康管理センター
  「GoogleEarth とR言語」

 (14:30 - 14:50 休憩)

14:50 - 15:35
 谷村晋
   長崎大学 熱帯医学研究所 社会環境分野
  「地理空間分析のためのベクタデータモデル共通基盤 −
    sp パッケージのクラスとメソッド−」

15:35 - 16:20
   間瀬茂
   東京工業大学 情報理工学研究科 数理・計算科学専攻
  「R 紹介のためのオープンソース原稿」

■ Abstracts of talks on 8 December:

Title: Software for Statistical Developments
Speaker: Brian Ripley

To make statistical methodology available to end-users, especially to
those outside statistics, we need to make available software to
implement the method.  That software should ideally be readily
available, easy to use, flexible (as R is) and work correctly (and R
has a great record for rapidly fixing bugs).

The talk will discuss the process of moving new statistical
methodology from ideas to practical implementation(s) (with R
providing a near-idea vehicle for a reference implementation),
illustrated by some case studies of state-of-art statistical analyses
made possible by having code in S or R.


Title: Various optimization and performance tips for processors
Speaker: Kazushige Goto

Most developers don't like doing optimization, because they
believe it's a compiler's job, or optimization makes their code
dirty. Unfortunately they confused algorithmic optimization and
instruction optimization. Actually you don't have to do instruction
optimizations which make your code dirty. Instead you need to
think good algorithm to avoid various traps that CPU hates.

This talk will discuss the key to perform your application better
and how to avoid wrong coding.

Sweaveでコメント

なかま (2006-11-20 (月) 19:35:32)

Sweaveでコメントが出るよう(100%パズル...)に弄ってみました.
人柱お願いします.
コメントを出す場合は, deparse(主に整形)されません.
チャンクのオプションに例えば,

<<fig=T,pdf=F,eps=T,echo=T,eval=T,keep.source=TRUE>>=

keep.source=T を加えます.
ここから
パズルちっくなので不具合は多いかもしれません.m(_|_)m


r-help 記事より

なぜでしょう? (2006-11-18 (土) 23:04:41)

r-help に整数の和が associative (もちろん数学的ではなく R 的に)でない以下の例が紹介されていました。なぜこうなるのか、わかる方教えて下さい。

> as.integer(2^(30))
[1] 1073741824
> as.integer(2^(31))
[1] NA
Warning message:
強制変換により NA が生成されました
> as.integer(2^(30))+as.integer(2^(30))+1
[1] NA
Warning message: 
整数の桁あふれにより NA が生成されました in: as.integer(2^(30)) + as.integer(2^(30))
> as.integer(2^(30))+(as.integer(2^(30))+1)
[1] 2147483649
> as.integer(2^(30))+(as.integer(2^(30))+2)
[1] 2147483650
> as.integer(2^(30))+as.integer(2^(30))+2
[1] NA
Warning message:
整数の桁あふれにより NA が生成されました in: as.integer(2^(30)) + as.integer(2^(30))
> (as.integer(2^(30))+2)+as.integer(2^(30))
[1] 2147483650
> (as.integer(2^(30))+5)+as.integer(2^(30))
[1] 2147483653

Bioconductor チュートリアル

統計数理研究所の中野さんからのお知らせを転記します。間瀬茂 (2006-11-07 (火) 20:21:47)

Bioconductor のチュートリアルをやります。興味があれば、ご参加、または情報の
配布をお願いいたします。
 
中野

-------------------------------------------------
 
             Tutorial: Introduction to Bioconductor
 
Time and Date:  13:30-17:00, 1 December 2006

Speaker: Eun-kyung Lee (Seoul National University, Korea)

Venue: Auditorium of the Institute of Statistical Mathematics (ISM)
       http://www.ism.ac.jp/

Language: English

Program:

13:30 - 15:00  Part 1 : Overview of the Bioconductor project

15:30 - 17:00  Part 2 : Statistical analysis using Bioconductor

Abstract:

Introduction to Bioconductor

Bioconductor is an open-source and open-development software project
for the analysis of biomedical and genomic data. This project repository 
has a lot of packages for the analysis of genomic data, e.g. data I/O, 
image preprocessing, data normalization, pathway analysis, data visualiation,
meta analysis, annotation facilities(MIAME, GeneBank, LocusLink, Unigene,
etc), reference crawling over the PubMed and GO, design of experiments, 
gene selection, classification, clustering, ROC curves, Cox regression 
and much more. In this talk, we will browse Bioconductor project first. 
After then, we will talk about statistical issues in genomic data.

Part 1 : Overview of the Bioconductor project

In this talk, we will discuss what Bioconductor Project is, focusing on  
Bioconductor software design. We also talk about the Vignetts and Sweave, 
a special documentation paradigm in the Bioconductor. We will browse
Bioconductor packages.

Part 2 : Statistical analysis using Bioconductor

In this talk, we will focus on statistical issues to analyze genomic
data. Using real example, we wll discuss how to analyze genomic data
(microarray) using packages in Bioconductor and statistical issues in 
each step of analyses.

------------------------------------------------
                      中野純司(統計数理研究所)
                    

第三回 R ユーザー会

なかま (2006-11-06 (月) 12:04:25)

みなさま,
このたび, 岡田先生,間瀬先生,中野先生,の御手を煩わせること...てんこもり...(爆)...により.
たぶん, 無事,「第三回 R ユーザー会」を開催する運びとなりました.
苦情,お叱りその他はなかままでお願いいたします.


統計数理研究所共同研究「Rの整備と利用」研究会開催のお知らせです。

データ解析環境Rに関する研究集会を以下のように行います。
(なお、都合により若干の変更を行う場合があります。)

参加は無料で自由ですので、皆様の多数のご参加をお願い申し上げます。


世話人:
    間瀬茂  (東京工業大学)
    中野純司 (統計数理研究所)

-----------------------------------------------------

     統計数理研究所共同研究「Rの整備と利用」研究会

日          時: 2006年12月8日(金)   9:30 - 17:00
                 2006年12月9日(土)   9:30 - 16:20
場          所: 統計数理研究所 講堂
                 地図 http://www.ism.ac.jp/access/index_j.html
参  加  費  用: 無料
使  用  言  語: 12月8日は英語、9日は日本語

■ プログラム

●12月8日

09:30 - 10:30
      Brian Ripley (University of Oxford, UK)

      Title:  Software for Statistical Developments

10:45 - 11:45
      Kazushige Goto (The University of Texas, US)

      Title: Various optimization and performance tips for processors

13:30 -14:30
      Stefano Iacus (Universita degli Studi di Milano, Italy)

      Title: Two R specific optimization techniques for speed and data management

14:45 - 15:45
      Sungwoo Park (Pohang University of Science 
                             and Technology, Korea) 
      Title: A critique of R from the perspective of programming
             language theory

16:00 - 17:00
      Junji Nakano (ISM, Japan) and
      Ei-ji Nakama(COM-ONE Inc., Japan)

      Title: R on super-computers at ISM

( 18:00 -      Dinner)

●12月9日

09:30 - 10:15
    舟尾暢男
    武田薬品工業(株)医薬開発本部
    日本開発センター  統計解析部 統計グループ
   「Rでデータハンドリング 〜 データフレーム 30 分クッキング〜」

10:15 - 11:00
   久保拓弥
    北海道大学・地球環境科学研究院・環境生物科学部門 陸域生態学分野
   「MCMC 計算まわりでさまよう R ユーザー」

11:00 - 11:45
    鈴木了太
    (株) ef-prime
   「Rで起業!フリーソフトウェアとデータ分析ビジネスの現在」

 (11:45 - 13:00 昼休み)

13:00 - 13:45
    小笠原理(国立遺伝学研究所 生命情報・DDBJ研究センター)
    服部恵美((株)情報数理研究所)
    三十尾潔高((株)情報数理研究所)情報数理研究所
   「R graphical manualsの開発と今後の展開」

13:45 - 14:30
   牧山文彦
    特定医療法人敬愛会 ちばなクリニック 健康管理センター
   「GoogleEarth とR言語」

 (14:30 - 14:50 休憩)

14:50 - 15:35
   谷村晋
    長崎大学 熱帯医学研究所 社会環境分野
   「地理空間分析のためのベクタデータモデル共通基盤 −
     sp パッケージのクラスとメソッド−」

15:35 - 16:20
    間瀬茂
    東京工業大学 情報理工学研究科 数理・計算科学専攻
   「R 紹介のためのオープンソース原稿」

------------------------------------------------
                       中野純司(統計数理研究所)
                       nakanoj@ism.ac.jp

R programming contest

間瀬茂 (2006-10-23 (月) 19:57:18)

r-help 投稿記事より

-------- Original Message --------
Subject: [AGDG-LIST:405] R Computing Contest
Date: Sat, 21 Oct 2006 12:08:13 -0400
From: Larry Schaeffer <lrs@uoguelph.ca>
Reply-To: lrs@uoguelph.ca
To: Animal Geneticist's Discussion <agdg-list@colostate.edu>

For those that are interested only:

R Computer Programming Challenge

Given:  y = Factor A + Factor B + b1(Covariate1) + b2(Covariate2) +  ...
+ bp(Covariate p) + animal + e
where y is a single trait - vector of observations,
Factors A and B are fixed with ma and mb levels respectively,
Covariates 1 to p are fixed regressions and p is a general number but
less than 20.
Heritability is a variable and should be requested by the program.

You are given a list of the animal IDs of animals with records, and
their sires and dams.  Sire and dam
IDs are smaller than the IDs of their progeny, and all IDs go from 1  to
n where n can be up to 10 million
animals.

Tasks:
1) Estimate the EBVs of all animals using BLUP and mixed model  equations
and
  list the top 10 largest EBVs with associated animal IDs,
  first ten levels of Factor A with solutions,
  first ten levels of Factor B with solutions,
  and all estimated regression coefficients. 

Submit your R program to Bill Szkotnicki (bszk@uoguelph.ca) by January
5, 2007.  Submissions
will be dated by their arrival date.  Provide any special functions or
details that might be needed to run your program.

All R programs will be run on the same test data sets, computer  (Linux),
and timed.

Winner: Earliest submitted R program that runs the fastest and gives  the
correct answers.

Prize: Free registration for the Kennedy Conference in 2008 in Guelph.

--
Lep pozdrav / With regards,
   Gregor Gorjanc
----------------------------------------------------------------------
University of Ljubljana     PhD student
Biotechnical Faculty
Zootechnical Department     URI: http://www.bfro.uni-lj.si/MR/ggorjan
Groblje 3                   mail: gregor.gorjanc <at> bfro.uni-lj.si

SI-1230 Domzale             tel: +386 (0)1 72 17 861
Slovenia, Europe            fax: +386 (0)1 72 17 888

既に気づかれているかたもいらっしゃるでしょうが...

間瀬茂 (2006-10-16 (月) 16:35:43)

R の新しい公式マニュアル 「R internals」 が公開されています。R 開発者向けに R システムの内部言語仕様情報やコーディングスタイルが紹介されています。どう見ても末端ユーザー向けでは無い。それと、R 2.4.0 の変更点で「システム関数の再定義ができなくなった」と書いてあるように読めるのですが本当でしょうか。Debian パッケージの公開が遅れているので確認できません

韓国語メッセージ

岡田 (2006-09-25 (月) 16:14:03)

Windowsインストーラ関係の日本語訳は無事送りましたが、韓国語の翻訳者に連絡がとれなくなってしまい困っているそうです。どなたか2つ下の「Windows版インストーラの日本語メッセージ」にある文章の韓国語訳をしてくださる方がいらっしゃいましたら、こちらにコメントしていただくか、までメールで送っていただけませんか?
よろしくお願いいたします。


R-2.4.0の日本語メッセージ

岡田 (2006-09-21 (木) 00:18:09)

1つ下の記事にWindowsインストーラの日本語メッセージのお願いも出しましたが、こちらはOSにかかわらないRの出力メッセージの英日翻訳ご協力のお願いです。今回は95%からのスタートです。

※翻訳システム Pootleのバージョンアップを行いました。

  • 翻訳システムにはhttp://pootle.okada.jp.org/ でアクセスできますが、大幅なバージョンアップのため、ログインアカウントはいったんリセットされています。お手数ですがもういちどアカウントを取得してください。
  • ページ右上の"Register"から、メールアドレスを入力してパスワードを決めるだけで登録できます。登録すると"activation code"がメールで届きますから、それをWeb上で入力すれば登録完了です。
  • ログインすると"Projects"に"R-2.4.0"があります。さらに"ja"とたどると、本体のメッセージ("po"フォルダ)およびバンドルパッケージのメッセージ("src"フォルダ)があります。それぞれのフォルダ内にあるファイルをクリックすると1文ずつ翻訳できます。
  • フォルダ一覧がでているところで、"Show Editing Functions"をクリックすると、"Quick Translate"(未翻訳やFuzzyな部分だけをピックアップして翻訳)などの便利な機能がつかえます。
  • WindowsでもMacでも、Firefoxを使うとフォントが大きめに出てしまうようです。WindowsではIE, MacではSafariを使うと適切な大きさになるようです...
  • "%s" "%d" "?n" のような記号はそのまま訳文中にも残してください。
  • "%s" "%d"のような記号が2つ以上ある文では、訳文中でも出現順序がかわらないようにご注意ください。

    今回は9月26日締め切り(Prof. Ripley said, "This really is a hard deadline, "だそうです)ということなので、みなさまどうぞご協力よろしくお願いします。

Windows版インストーラの日本語メッセージ

岡田 (2006-09-20 (水) 22:36:14)

R-2.4.0のリリースが迫っていますが、今回はWindows版のインストーラも若干メッセージが追加されるようです。私はWindowsをあまり使わないので、Windowsらしい翻訳文を作ることができないのですが(^_^;; 、どなたかWindowsっぽく見える訳文を教えていただけませんでしょうか?

なお、"="の左側はプログラム内部で使われるメッセージの識別記号ですので、"="の右側の訳文案をお寄せください。

(9/22追記: とりあえず下記のような文案で送っておきました。おかしなところがあればどんどんご指摘ください)

  • 追加されるメッセージ ここから
    ja.startupt=起動時オプション
    ja.startupq=起動時オプションをカスタマイズしますか?
    ja.startupi=「はい」または「いいえ」を選択し、「次へ」をクリックして下さい
    ja.startup0=はい (カスタマイズする)
    ja.startup1=いいえ (デフォルトのまま)
    ja.MDIt=表示モード
    ja.MDIq=MDIとSDI, どちらの表示方法にしますか?
    ja.MDIi=「MDI」または「SDI」を選択し、「次へ」をクリックして下さい
    ja.MDI0=MDI (Rを1つの大きなウィンドウで表示)
    ja.MDI1=SDI (複数のウィンドウを使用して表示)
    ja.HelpStylet=ヘルプの表示方法
    ja.HelpStyleq=ヘルプはどのような表示方法にしますか?
    ja.HelpStylei=テキスト形式, CHMヘルプ, HTMLヘルプのどれかを選び、「次へ」をクリックして下さい
    ja.HelpStyle0=テキスト形式
    ja.HelpStyle1=CHMヘルプ(Windowsのデフォルト)
    ja.HelpStyle2=HTMLヘルプ
    ja.Internett=インターネット接続
    ja.Internetq=internet2.dll を使って、RがInternet Explorer のプロキシ設定を参照するようにしますか?
    ja.Interneti=「標準」か「Internet2」を選択し、「次へ」をクリックして下さい
    ja.Internet0=標準
    ja.Internet1=Internet2
    ja.adminprivilegesrequired=Rをインストールするためには、管理者権限のあるユーザでログインするべきです
    ja.adminexplanation=注意: Rを完全にインストールするためには管理者権限が必要でが、
    現在のユーザでは権限が十分でないようです。このまま続けると、DCOMサポートをインストールできず、
    またRを拡張子.RDataのファイルに関連付けることもできません。
    また、書き込み権限のあるディレクトリにしかインストールすることができません。
    ja.recordversion=バージョン番号をレジストリに保存する
  • ここまで

第三回 R ユーザー会(予告)

間瀬茂 (2006-09-19 (火) 12:31:34)

間瀬です.第三回の R ユーザー会が12月8、9日(金土)に統計数理研究所で行われる予定です.これまでと同様に8日(金)に招待講演者(言語英語)、9日(土)にユーザー会(言語日本語)を予定しています。招待講演者については現在交渉中ですが、大物の来日が予定されています(guess who!)。正式に決まりましたらまたお知らせします。関連してユーザー会で講演いただける方を募集しますので振るって御参加ください。こちらからご講演をお願いした場合はよろしくお願いします。内容はこれまで同様幅広く考えていただいて結構です.講演の申し込みは私(m a s e s h i g e r u @ g m a i l. c o m)までお願いします。


Firefox用のR Site Searchエクステンション

谷村 (2006-09-01 (金) 22:27:59)

A firefox extension for R Site Searchが出ていました。
RSiteSearch()に慣れてしまった人にもひと味違う2ペインです。

rsitesearch.smaller.png

CRAN パッケージ数

夏休み中の暇人 (2006-08-21 (月) 15:41:26)

今日現在の CRAN パッケージ数は817。


R で物理乱数

間瀬茂 (2006-08-20 (日) 20:19:50)

本日公開のパッケージ random は R から物理乱数を使うことを可能にするようです。ネットでリアルタイムで生成公開されている物理乱数を R 経由で取り寄せるようです。Mersenne-Twister 乱数でもまだ不安な方はお試しあれ。速度は当然遅い。http://www.random.org には生成済み乱数ファイルが用意されているから、それを使ったほうが早そう。

  • Linuxのカーネルモジュールのhw_randomモジュールがロード出来てrng-toolsをインストールしてrngdデーモンを起動していれば,(要するに一部のハードでしか動きません) /dev/randomで物理乱数が使えます(hw_randomがロード出来なければ加速度的にマウスを動かせばもしかしたら...ハイパーオリンピックなるゲームを思い出すかも...)。こちらから人柱の方はどうぞ。間違っても乱数生成競技など誤った御利用方法による諸問題について責任は追い兼ねますので御了承下さい. -- なかま 2006-09-06 (水) 00:26:52

国際化R普及調査に御協力お願いします

なかま (2006-08-08 (火) 16:07:50)

2005年度中に
1.「査読付き論文」
2.「その他の論文・寄稿記事」
等にRの国際化機能(CJKフォント,ファイル名,オブジェクト名)を使われた方は

Title :
Author :

郵便番号 :
住所 :
電話番号 :
氏名 :

以上を御書き添えの上, eiji.nakama@gmail.com までお送り願えると幸いです.
御協力頂いた方には抽選で豪華(個人差はあるでしょうが)商品をお送り致します.
データの利用目的はIPAでの開発成果に関する論文数の調査に利用いたします.
尚, 開示頂いた個人情報は商品発送目的以外での利用は致しません.
個人データの開示が嫌な方は抽選から洩れますが御協力頂ければ幸いです.

当選者の発表は発送をもってかえさせて頂きます.抽選はRで行います.

〆切は 8/10 AM 9:00をもって終了します.(だって今日来たんだもん)


エレガントな解を追求するクイズ---#1

クイズマニア (2006-07-18 (火) 23:24:19)

各行が,二項係数になるような行列を作る
もっと短く,もっとエレガントに

p <- matrix(0, 20, 20)
p[1,1] <- 1
for (i in 2:20) {
	p[i,] <- p[i-1,]+c(0,p[i-1, 1:19])
}

pukiwiki-mode.el

Emacs user (2006-07-18 (火) 13:30:03)

スクリーンショット

pukiwiki-mode.png

pukiwiki-mode.elはここからダウンロードできます。


useR! 2006 の講演スライド公開

間瀬茂 (2006-07-01 (土) 05:59:12)

Dear useRs,

the useR! 2006 conference took place in Vienna two weeks ago: it was an
exciting and interesting meeting with about 400 useRs from all over the
world and more than 150 presentations.

Especially for those of you who could not make it to the conference, we
have made 4up PDF versions of the presentations slides available.

The slides for the keynote lectures are available at

http://www.R-project.org/useR-2006/Keynotes/

and the user-contributed presentations at

http://www.R-project.org/useR-2006/Presentations/


Finally, some materials for the panel discussion on "Getting recognition
for excellence in computational statistics" are provided at

http://www.R-project.org/useR-2006/PanelDisc/

including a summary, the short presentation slides of the panelists and
the full discussion as a video.

A big thank you to everyone who contributed to the conference and...
best wishes from Vienna!

The organizing team
Achim, Torsten, David, Bettina, Fritz and Kurt.


MacOSX版でrgdalをインストール

谷村 (2006-06-22 (木) 18:15:34)

2006年6月29日のTutorial of Analysing Spatial Data in Rに出席されるMacOSXユーザの方への連絡事項なのですが、多少の公益性があるので、この掲示板を借ります。

MacOSXでは、install.views("Spatial")でもrgdalは入りません。下記の手順を参考にしてインストールして下さい。

  1. Darwin Portsをインストールします。手順はここを参照。
  2. 下記のコマンドでgdalのインストールを試みます。
    $ sudo /opt/local/bin/port install proj
    $ sudo /opt/local/bin/port install gdal
    projの方は成功すると思いますが、gdalの場合は依存パッケージであるreadlineのインストール段階で失敗すると思います。
    --->  Fetching readline
    --->  Attempting to fetch readline51-001 from  ftp://ftp.cwru.edu/pub/bash/readline-5.1-patches/
    --->  Attempting to fetch readline51-001 from http://distfiles-od.opendarwin.org/
    --->  Attempting to fetch readline51-001 from http://distfiles-msn.opendarwin.org/
    --->  Attempting to fetch readline51-001 from http://distfiles-bay13.opendarwin.org/
    Error: Target com.apple.fetch returned: fetch failed
    Error: The following dependencies failed to build: readline
    Error: /opt/local/bin/port: Status 1 encountered during processing.
    ダウンロードに失敗したファイルをwgetで落とせば後の処理はうまくいきます。wgetをまだ入れていない方は先にwgetをインストールして下さい。
    $ cd /opt/local/var/db/dports/distfiles/readline
    $ sudo /opt/local/bin/wget ftp://ftp.cwru.edu/pub/bash/readline-5.1-patches/readline51-00{1,2,3,4}
    $ cd -
    $ sudo /opt/local/bin/port install gdal
  3. 次に、rgdalのソースをとってきて展開します。configureをCVSのものと差し替える必要があります。
    $ wget http://cran.md.tsukuba.ac.jp/src/contrib/rgdal_0.4-4.tar.gz
    $ tar xvzf rgdal_0.4-4.tar.gz
    $ cd rgdal
    $ wget http://rgdal.cvs.sourceforge.net/*checkout*/rgdal/rgdal/configure?revision=1.6
    $ mv configure?revision=1.6 configure
    $ sudo R CMD INSTALL ./
    gdal-configへのパスが通っていればこれでrgdalがインストールされます。

    私の場合はパスが(意図的に)通っていないので、
    $ sudo R CMD INSTALL --configure-args='--with-gdal-config=/opt/local/bin/gdal-config' ./
    としました。

    うまくインストールできなかった方は遠慮なくご相談ください。

Postscriptの取り込みと描画

谷村 (2006-06-21 (水) 15:36:13)

任意のベクトル画像をプロットすることが長い間の課題でしたが、今日、grImportパッケージを使うと、Postscriptを取り込めることを知り、さっそく試してみました。スケールを小さくした場合につぶれてしまうなど微妙な問題があるようです。 例えば、no_entry.pngを使って大きさを変えながら描画してみると
表示例no_entry_result.png
標識中央の白線左側が正しく描画できていません。また、小さいものは赤白の比率がおかしくなっています。
ソース

library(grImport)
a <- PostScriptTrace("tmp4.eps")
b <- readPicture("tmp4.eps.xml")
grid.newpage()
pushViewport(viewport(x=0.5, y=0.5, w=0.8, h=0.8,xscale=c(0,10), yscale=c(0,10)))
grid.rect(); grid.xaxis(); grid.yaxis()
for (i in 1:20/100) {
  grid.symbols(b,size=unit(i,"npc"),x = unit(runif(1), "npc"), y = unit(runif(1), "npc"))
}
popViewport()

ミラーサイトの接続できません。

Ryuu (2006-06-19 (月) 21:27:44)

パッケジをインストールしようとしたところ、ミラーサイトを選んだときに

chooseCRANmirror()
以下にエラーopen.connection(file, "r") : コネクションを開くことができません
追加情報: Warning message:
'cran.r-project.org' をポート 80 でコネクトできません

というエラーメセッジが出た。どうすればいいでしょうか。教えていただきませんか。


R は静かにひろまっているか?

間瀬茂 (2006-06-16 (金) 00:39:18)

私の研究室を昨年修了したもと院生(The R Book の一章を書いている人物)から近況メイルをもらいました。彼は現在ある銀行で為替リスクを計量するシステムの仕事をしているそうですが、その部署でも既に R を使っている人がいて驚いたそうです。なかなか表には聞こえてきませんが、統計をヘビーに使うような業種では結構つかわれているのかなとおもいました。


R graphical manuals公開

小笠原 (2006-06-14 (水) 18:53:09)

Rの各パッケージに付属するマニュアルのExampleを実行すると美しいグラフィックスを表示するものがたくさんあります。そのようなグラフィックスを集めて表示するページを(株)情報数理研究所より公開しました。 ( http://bg9.imslab.co.jp/Rhelp/ )
ご意見いただけると幸いです。


Rによる空間データ分析のチュートリアルとワークショップ

谷村 (2006-06-07 (水) 21:16:56)

Rを用いた空間データ分析のチュートリアルが6月29日に開催されます。講師は、Rの主要な空間データ分析関連パッケージ(spパッケージやmaptoolsなどいろいろ)の作者であるRoger Bivand先生です。参加費は無料ですが、会場スペースの都合で先着順60名のみを受け付けます。詳細はここを参照してください。なお、チュートリアルに引き続き6月29-30日に空間データ分析のワークショップを開催しますので、こちらもあわせてご参加ください。


世界で最も有名な統計家は誰れ?

間瀬茂 (2006-06-07 (水) 15:53:37)

馬齢を重ねてもまだまだ「本当!知らなかった!」という話を聞くことがあります。つい最近知って仰天した話を紹介します。クイズ形式で

(1) 世界で最も有名な統計家は?
(2)円グラフを発明した人は?
(3) 英国王立統計学会の最初の女性会員は?

答えはフローレンス・ナイチンゲール、そうあの近代的看護学の母です。実は彼女は数学の才に恵まれ、統計学者として有能な人物だったそうです。円グラフ(coxcomb diagram)は彼女がクリミヤ戦争の悲惨さを政府のお偉がたに納得させる(彼らは数字が大嫌い)ための有効な方法として考案したのだそうです。そのグラフは、戦争による死者は、戦闘そのものよりは、怪我の処置の不足で死ぬ方が多いことを雄弁に立証することに効果があったそうです。

ただし、彼女の円グラフは、いわゆる円グラフとは少し異なるもので、パイ(扇形)の半径が異なるものだったようです。実例はここでみられます

電車でたまたま一緒になった東工大の宮川先生とこの話で盛り上がったさい、次の近刊本を紹介されました。「統計学を拓いた異才たち」(日本経済新聞社)。まだ読みかけですが、面白い話がいっぱいでお薦めです。宮川先生から聞いたもう一つの「本当!」は、仮説検定論の基礎である Neyman-Pearson の補題(最近は定理というらしい)で有名な Pearson はあの統計学者 Karl Pearson の子供 (Egon S. Pearson) だということ。危うく同一人物と信じたまま棺桶に入るところでした。K. Pearson は Fisher 流の数理統計学は大嫌い(理解不能だった)ようです。


日本計量生物学会でR利用のチュートリアル

QDU (2006-05-15 (月) 17:49:58)

日本計量生物学会でRのチュートリアル二つが予定されています。うちひとつは中澤先生によるもの。以下のURLを参照してください。


lapply 関数に対するR教授のコメント

QDU (2006-05-15 (月) 17:44:09)

apply 関数族は単に for loop を隠しているだけと思っていたら lapply 関数は実際に早くなることもあるそうです。r-help のR教授のコメントを引用:(また日本語スパム投稿があったようですね。)

> Can someone tell me why apply (and apply) are faster in performing
> repeated operations than a for (or do) loop? I am looking for a
> technical explanation.

apply() is just a wrapper for a for loop.  So it is not faster that at
least one implementation using a for loop: it may be neater and easier to
understand than an explicit for loop.

lapply() can be faster than a carefully crafted for() loop (since C-level
code is more efficient in memory allocation), but its main rationale is
clarity (and especially to avoid traps like

ans <- vector("list", n)
for(i in 1:n) ans[[i]] <- fun(i)

if n turns out to be zero or fun(i) to be NULL).

R Foundation と Google

間瀬茂 (2006-04-26 (水) 12:27:54)

R の開発を支援する公式団体 R Foundation という組織があることは御存じの方も多いと思います。CRAN にある Foundation への寄付者一覧に Google の名前があることに気づき驚きました。他にも製薬会社の Merck やアメリカ統計学会(IMS)の名前もあります。実は私(そして中澤さん)も印税の一部を寄付しております。他にも supporting member 制度があります。わずかな年会費(カードがあれば支払いも簡単です)で CRAN に名前がでますので少し気分が良いです。日頃 R 無しでは生きていけない方は参加如何でしょうか。


R-2.3.0

間瀬茂 (2006-04-24 (月) 21:48:26)

R-2.3.0 が本日公開されました。


IPAX2006

間瀬茂 (2006-04-18 (火) 20:51:43)

中間さんの勤める COM-ONE 社が IPA 事業の一環として R の日本語化プロジェクトを昨年度行ったことはご存知の方も多いとおもいますが、5月17日(水)から19日(金)に IPAX2006 という催し物(東京ビッグサイト, 西展示棟)にブース出展するそうです。幾つか R を使った作業例のパネル展示もされるようです。一番の出し物は中間さん本人と思われますから、まだ実物を見たことがない方、日本語化 R を日ごろ感謝して使って使っていらっしゃる方、は見物がてらお出かけください。IPAX2006 の公式URLは以下の通りです(一見したところ COM-ONE 社の出展に関する記事はまだ見当たりませんが)。
http://www.ipa.go.jp/event/ipax2006/
なお入場には上のURLからダウンロードした招待状に必要事項を記入したものを受付に(名刺と一緒に、なければそれはそれで良いとおもうのですが)提出する必要があるようです。

  • 今日,上記URLが公開されたようです. ついでにプレゼン時間も上記で知りました...ありがとうございます... -- なかま 2006-04-18 (火) 22:40:05
  • IPAX2006招待券が必要な方は `eiji.nakama@gmail.com' まで郵便番号,住所,所属,氏名をお書き添えの上、メール(電子メール)をお送り頂ければ、メール(郵便メール)にて招待状を発送致します。 -- なかま 2006-04-24 (月) 11:49:13
  • プレゼンようのPCがお亡くなりになってしまいました.(汗; 今からリカバリー作業を開始します... -- なかま 2006-05-17 (水) 19:30:32

Rが得意な方のための御仕事(数ヶ月間)です。

竹澤 (2006-04-10 (月) 18:57:27)

Rを使ったプログラミングとデータ解析の仕事をしていただける方(博士号が必須、日本以外の国籍の方も可)を探しています。主に、ノンパラメトリック回帰やニューラルネットワークを含む、広い意味での回帰分析に関するものです。雇用期間は数ヶ月間(2006年度)を予定しています。仕事場は中央農業総合研究センター(つくば市 観音台 3-1-1)です。詳細については竹澤(http://cse.naro.affrc.go.jp/takezawa/index.html)に御連絡ください。


R News, volume 6, issue 1

QDU (2006-04-03 (月) 12:10:35)

R News, volume 6, issue 1 が公開されたようです。


祝、GotoBLASソース公開

なかま (2006-03-30 (木) 14:41:15)

あげておきます.
http://www.tacc.utexas.edu/resources/software/祝公開!


UseR 2006 プログラム公開

間瀬茂 (2006-03-28 (火) 06:32:30)

UseR 2006 プログラム


統計ML 記事の転載

間瀬茂 (2006-03-22 (水) 22:40:21)

統計ML stats 投稿記事を転載します。 R の故郷 Auckland 大学で開催されます。R に関する集会も開かれるようです。

stats のみなさま、

Professor David Scott より、ASC/NZSA 2006 の案内の投稿依頼がありましたの
で、代理投稿します。
------------------------------------------------
                      中野純司(統計数理研究所)
                      nakanoj@ism.ac.jp
_________________________________________________________________
 David Scott Department of Statistics, Tamaki Campus
       The University of Auckland, PB 92019
       Auckland    NEW ZEALAND
 Phone: +64 9 373 7599 ext 86830     Fax: +64 9 373 7000
 Email:  d.scott@auckland.ac.nz
 
 Australian Statistical Conference / New Zealand Statistical  Association
 Conference
 Statistical Connections
 SKYCITY, Auckland, New Zealand 3 - 6 July 2006
 
 Please submit abstracts via the website www.statsnz2006.com
 <http://www.statsnz2006.com>
 
 The extended deadline for abstract submissions is Wednesday 22 March 2006.
 
 Early bird registrations close Tuesday 25 April 2006.

 Keynote Speakers who will present a plenary session are David Donoho,
 Peter Hall, Xiao-li Meng and Ray Chambers (Foreman Lecturer).~
 
 There are more than 20 Invited Sessions organized with noted
 speakers. A list of Invited Sessions and Speakers may be found at
 http://www.statsnz2006.com/invitedsp.asp
 
 There have already been over 100 abstracts submitted including many
 from outside Australasia.
 
 Brian Pink from Stats NZ and Dennis Trewin from the Australian Bureau
 of Statistics are to speak at the Official Statistics Forum on Tuesday, July 4.
 
 A number of workshops have been organised around ASC/NZSA 2006.
 
 Introduction to Distance Sampling Workshop 28-30 June 2006
 presented by Steve Buckland
 For further information, see
 <http://www.creem.st-and.ac.uk/NZ2006/Enquiries.htm>
 http://www.creem.st-and.ac.uk/NZ2006/Enquiries.htm
 <http://www.creem.st-and.ac.uk/NZ2006/Enquiries.htm>
 
 Stochastic Processes Workshop 7 July 2006
 For further information, contact Dr Ilze Ziedins:
 ilze@stat.auckland.ac.nz <mailto:ilze@stat.auckland.ac.nz>
 
 R-Fest: Workshops on S, R, and Bioconductor
 S Programming: Bill Venables, CSIRO,
 9:30--13:00, Friday, July 7, 2006
 R Graphics: Paul Murrell, University of Auckland,
 14:00--17:30, Friday, July 7, 2006
 Bioconductor: Robert Gentleman, Fred Hutchinson Cancer Center
 9:00--5:00, Saturday, July 8, 2006
 For further information or to register your interest, email:
 r-fest@stat.auckland.ac.nz

複数のRセッションの並列実行

間瀬茂 (2006-03-21 (火) 23:21:35)

最近の r-help 記事で、R は single-threded だから dual-core CPU マシンで実行してもその分早くならないが、複数のRセッションの並列実行が高速に出来るというメリットがある、と解説があったのが気になり少し実験してみました。次のクイックソートプログラムを複数のRセッションで並列実行してみました。結果は少し理解不能なものになりました。実験例が適当でなかったのか?

>  quicksort <-
     function (x) {
       if (length(x) <= 1) return(x)
       if (length(x) == 2) {if (x[1] <= x[2]) return(x) else return(x[2:1])}
       fence = sample(x,1)  
       return( c(quicksort(x[x < fence]), x[x == fence], quicksort(x[x  > fence])) )
     }
> gc(); set.seed(1111); x<- runif(1e6); system.time(y <- quicksort(x))

結果は次のようになりました。 
 1セッション 30秒
 2セッション 30秒、32秒、
 3セッション 33秒、31秒、33秒、
 4セッション 31秒、31秒、31秒、32秒


ページをWeb翻訳した場合のRコード表示部分の崩れについて

okinawa (2006-03-17 (金) 17:07:54)

最近、色々な国の方がRjpWikiを見ているようで、自分のWebページを自動翻訳リンク(日=>英)しようとしたのですが、Rコードを表示させている部分(薄いブルーになる部分)が崩れてしまいます。どなたか回避方法をご存知の方はいらっしゃいませんでしょうか?ちなみに、excite,Google他いくつか試したのですが×でした。(全部英語で作れば?という突っ込みはなしですよ。)


第二回Rユーザー会?

間瀬茂 (2006-03-14 (火) 20:43:38)

私が代表で応募中の第二回Rユーザー会(正式名は共同研究集会?)の申請が認められたと今日統計数理研究所から連絡がありました。というわけで、よろしくご協力ください。出し物等ご要望があれば、この場なり、わたし宛にお寄せください。なお、今年の5月ごろにもう一つRに関係する催し物(Rプロパーではありません)の予定があるとさる筋から極秘情報がありました。はっきりしましたら、またご紹介します。


Linux, Windows or Mac ?

間瀬茂 (2006-03-11 (土) 15:47:59)

r-help では何度も取り上げられる話題に「R を動かす最適プラットホームは何か?」というのがあります。私の考えでは、R だけのためにOSを乗り換えるほどの人は少ないと思うので、この種の話題はお国自慢めいてきます。関心は

ハードとOSの差違(32,64ビット版の違いを含む)による使用可能メモリ量と速度性能、
dual processor の有効性

ということのようです。最新の r-help にまたこの問題が蒸しかえされ、R 教授が次の URL を参考に挙げていましたのでご紹介します。Linux versus Mac OS X and G5 versus Opteron Benchmarks。 なおスレッドの内容をまとめると次のようになるようです(未確認)。
(1) 巨大なデータセットには64ビット版Rが有効(ただし Windows 版ではまだ64ビット版Rを構築するツールが無い)。
(2) 高速なSCSIディスクが I/O 速度の向上に有効。
(3) 64ビット版Rでは実行速度が遅くなる。
(4) dual (or dual-core) Opterons/Athlon 64s, Linux では32,64ビット版Rが動き、メモリー・速度に応じて使い分けられる。
(5) dual processor は R 自体が single-threaded だからそのままでは速度向上は無い。ただし複数のセッションを同時に実行できる利点がある。
(6) 標準ライブラリを使う限り Linux と Windows の実行速度は概ね同じだが、Linux の方が 10-20% 早い。
(7) Windows のメモリ管理は Linux や Mac OS に比べて劣る。


20万分の1日本地質シームレス地図

間瀬茂 (2006-03-04 (土) 07:28:16)

産総研が開発した面白そうな地図データがあるようです。R でも扱えるのでしょうか。
20万分の1日本地質シームレス地図


Rのライセンス_HELP/HELP

ssuzuki (2006-02-21 (火) 09:26:22)

会社に帰属する小職が会社のPCにRをインストールして、業務に使用する場合においても、Rはフリーソフトとして認められるのでしょうか?
“GNU 一般公衆利用許諾契約書(GNU General Public License)”を見てもどうもよくわかりません。その準拠条項など是非ともアドバイスをお願いします。


他のソフト起動が浮動小数点演算結果に影響を与える!?

間瀬茂 (2006-02-18 (土) 20:12:10)

r-help 記事より。ゼロとなるべき分散がゼロにならないという質問に対して、議論がありました。それによると、人により真のゼロになったり、「ほとんどゼロ」になったりすることがあるらしく、次のようなコメントがありました。つまり、R セッション途中で他のソフトを起動(この場合ネット検索結果のブラウザー画面表示)すると浮動小数点演算結果が微妙に変わることがある、ということです。実質的に問題になる程度の差ではないようですが、すこし気になります。以下にそのコメントを引用します。

My guess is that you've got a video driver or some other software that's
messing with your floating point processor, reducing the precision from
64 bit to 53 or less.  I can reproduce the error after running
RSiteSearch, which messes with my fpu in that way:

 > var(rep(0.2, 100))
[1] 0
 > RSiteSearch('fpu')
A search query has been submitted to http://search.r-project.org
The results page should open in your browser shortly
 > var(rep(0.2, 100))
[1] 1.525181e-31

添付ファイル: fileR422jp.jpg 190件 [詳細] filegazo.png 3378件 [詳細] fileno_entry_result.png 4203件 [詳細] filersitesearch.png 3321件 [詳細] file0pow0.png 3926件 [詳細] filersitesearch.smaller.png 3781件 [詳細] fileno_entry.png 3948件 [詳細] filegnomeGUI.png 4059件 [詳細] filepukiwiki-mode.png 4211件 [詳細] filescreenshot.jpg 2198件 [詳細] filegedit-latexplugin.png 3503件 [詳細]

トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2023-03-25 (土) 11:19:16