RjpWiki自体へのコメントでも、雑談でもOKな掲示板です

注意:新規記事用の入力欄は以下の目次の直後にあります。各記事への追加コメントの入力欄は、各記事の後にあります。


過去の記事のアーカイブ 。アーカイブ中の記事への追加コメントは自由です。ただしあまり古い記事の場合は、最新の「なんでも掲示板」に新規に項目を立てられた方が良いかも知れません。



回答を期待する記事は原則 質問コーナー Q&A にお願いします。「なんでも掲示板」はそれ以外の本来の(長めの)コメント専用にすることを提案したいと思います。




経済学における統計的有意の記号

y.a. (2004-11-23 (火) 01:01:55)

Q&A (初級者コース)にて,経済学の記号のつけ方の慣習に激しく異議が唱えられましたので,不安になって少し調べてみました.
結論から言うと,人やジャーナルによって異なるものの,特にトップジャーナルを中心に「t値を示して記号はつけない」派が主流であるという暫定的な結論を下しました.

ただ,

cutpoints= c(0, 0.01, 0.05, 0.1), symbols = c("***", "**", "*")

記法は,少なくとも経済学の分野には少なからず存在はするといえると思います.

以下,経済学のトップジャーナル群の論文,掲載予定論文からの例です:

1) t値を示して星はつけない(でもp値はつけない)派


R からキーワード検索する関数 (from r-help)

QDU (2004-11-20 (土) 20:51:33)

今日の r-help に面白い関数が紹介されていましたので紹介します。R の検索サイト rking に接続して、キーワード検索する関数です。具体的には検索結果をブラウザーに表示する仕掛けです。

help.search.archive<-function(string){
  RURL="http://www.google.com/u/newcastlemaths"
  RSearchURL=paste(RURL,"?q=",string,sep='')
  browseURL(RSearchURL)
  return(invisible(0))
}

たとえば help.search.archive("plot3d") を試してみて下さい。

  • やはり r-help 投稿の同様の関数: -- QDU 2004-11-25 (木) 15:12:43
Inspired by the functions that Barry Rawlingson and Dave Forrest posted for
searching Rwiki and R-help archive, I've made up a function that does the
search on Prof. Baron's site (Thanks to Prof. Baron's help on setting up the
query string!):

RSiteSearch <- function(string, restrict="Rhelp", format="long",
                        sortby="score", matchesPerPage=10) {
    URL <- "http://finzi.psych.upenn.edu/cgi-bin/htsearch"
    qstring <- paste(URL, "?config=htdigrun1", sep="")
    ## replace spaces with "%20" in the query
    string <- paste("words=", gsub(" ", "%20", string), sep="")
    mpp <- paste("matchesperpage=", matchesPerPage, sep="") 

    format <- charmatch(format, c("long", "short"))
    if (format == 0) stop("format must be either long or short")
    format <- paste("format=builtin-", switch(format, "long", "short"), sep="")
    sortby <- charmatch(sortby, c("score", "time", "title", "revtime"))
    if (sortby == 0) stop("wrong sortby specified")
    sortby <- paste("sort=",
                    switch(sortby, "score", "time", "title", "revtime"),
                    sep="")                     
    res <- charmatch(restrict, c("Rhelp", "doc", "function", "doc/fun"))
    if (res == 0) stop("wrong restriction specified")
    res <- switch(res, "Rhelp00/archive|Rhelp01/archive|Rhelp02a/archive",
                  "finzi.psych.upenn.edu/R/doc",
                  "finzi.psych.upenn.edu/R/library",
                  "finzi.psych.upenn.edu/R/doc|finzi.psych.upenn.edu/R/library")
   res <- paste("restrict=", res, sep="")
   qstring <- paste(qstring, res, format, sortby, string, mpp, sep=";")
   browseURL(qstring)
   invisible(qstring)
}

The options roughly correspond to the options on that search page.  Hope
some people find this somewhat helpful.  Comments/suggestions for
improvement are much appreciated.

Best,
Andy

The hidden costs of GPL softwares

間瀬茂 (2004-11-18 (木) 22:54:56)

今日の R-help は表題の投稿への反応で盛り上がりました。いずれも英語いっぱいで全部を読む気になりませんが、最初の投稿の要旨は R のような GPL ソフトに対しては商用のかっこ良い GUI インタフェイスが提供されないから、学習コストが高いという不満のようです。賛成意見もありましたが、R-help の主要投稿者は多く CUI 方式の熱烈支持者ですから、議論はかみあいません。GUI 方式はとっつき易いが所詮それだけだなどと。R のヘルプ機能の unfriendliness も嘆きの的のようです。これは Unix 関係のオンラインヘルプと同列ですね。すでに内容を知っている人にはとても役に立つが、初心者にはほとんど混乱の源。しかし初心者にもわかり易いヘルプは、結局初心者だけにしか役立たないものになりそうですから、これを開発者に求めるのは筋違いでしょう。結局 R は万人のための統計ソフトにはなりそうもありません。「無料だから」つかうのではなく「自分が何をやりたいのか弁え、そのための努力は惜しまない」人用のソフトに留まるのではと思います。


S-Plus や R の関数のカテゴリー化された検索システム

間瀬茂 (2004-11-18 (木) 17:42:15)

r-help に S-Plus や R の膨大な関数を用途別にカテゴリ化した検索システムが紹介されていました。便利そうですので紹介します。リンク集にもメモしておきました。~

S-Plus/R Function Finder


R 2.0.1 for VineLinux 3.0

谷村 (2004-11-16 (火) 20:39:12)

本家(CRAN)にR-2.0.1-0vl1.i386.rpmをputしました。これはオリジナル版です。日本語版が必要な方は、なかまさんのサイトから入手して下さい。


どこかでみたような

なかま (2004-11-14 (日) 00:55:59)

中文TeX
ユーザー数ってどれくらいいるんでしょ.


Rで物理乱数

垂水共之 (2004-11-10 (水) 17:21:09)

FDKという会社がUSB接続の物理乱数発生器を製造しています。
Windows版のRで使えるようにDLLも作ってもらいました。
Rユーザーの方はサポートCD-ROM特別サンプルも手に入れてください。


かんたんな入力チェックを入れるのは

なかま (2004-11-08 (月) 01:21:09)

--- article.inc.php.orig
+++ article.inc.php
@@ -189,7 +189,24 @@
 	$article_rows = article_ROWS;
 	$article_cols = article_COLS;
 	$string = <<<EOD
-<form action="$script" method="post">
+<script>
+  <!--
+  function isNull(elem,jname){
+    if(elem.value==''){
+      elem.focus();
+      alert(jname+'がはいっていると嬉しいかも.');
+      return true;
+    }
+    return false;
+  }
+  function chkArticle(myform){
+    if(isNull(myform.name,'お名前'))return false;
+    if(isNull(myform.subject,'題名'))return false;
+    return true;
+  }
+  -->
+</script>
+<form action="$script" method="post" onSubmit="return chkArticle(this);">
  <div>
   <input type="hidden" name="article_no" value="$article_no" />
   <input type="hidden" name="plugin" value="article" />


まあ,気休めですが効果はあるかも.


R とアメリカ大統領選挙

(2004-11-03 (水) 20:00:03)

 今回も米大統領選挙は接戦ですね。

 今回はオハイオ州が注目の的ですが、R の car パッケージには前回の郡別のフロリダの投票データ(Florida )がありますね。


日本人によるアドオンパッケージ Zelig

(2004-10-23 (土) 14:48:44)

今日初めて気がつきましたが MNP というアドオンパッケージの著者(の一人) の Imai Kosuke 氏(Princeton 大学政治学部) は今一つのパッケージ Zelig の著者の一人でもあるようです。


中国のR事情

間瀬茂 (2004-10-19 (火) 23:28:09)

集会で中国にいって来ました。桂林にある広西師範大学が会場でしたが、日本の大学にひけをとらない新しい建物、プロジェクターを備えた講義室等、噂に聞いていた最近の中国の発展ぶりに驚いてきました。中国側の参加者も備えつけのパソコンや、自前のノートパソコンを使った発表が少なくなく、ここでも日中の差は確実に縮小しているようです。OSは専ら中国版 MS Windows と powerpoint, acroreader でした。私が linux と xdvi で発表を行なったら、中国人学生が関心を持ったらしく、すこし話をしましたが、linux のことを知っていてもあまり使われていない気配で、R のことも全く聞いたことが無いようでした。中間さんの国際化 R もまだまだ中国進出は先のことと感じました。しかし、資本主義化の著しい中国のこと、10年後は全く事情が違っているかも知れません。はて、中国に R を広めるには何が有効なのか?


Mac 版 R 2.0.0

青木繁伸 (2004-10-18 (月) 11:27:03)

まだ筑波大学のmirrorには現れていない
working directry の設定で,メニューからやると設定できないことがある
注釈に日本語を使っている関数のリストを表示する(関数名だけを入力する)と,R が異常終了する
一部パッケージがまだ対応できていない(MASS などが使えない。というか,ない)
環境設定メニューがない(なくてもいいようにはできていないようにおもうが)

というような具合で,R2.0.1の出現を待ちたい。


R 2.0.0 のリリース近し? => ついに公開されました(祝^祝)

間瀬茂 (2004-10-02 (土) 00:17:53)

今日の r-help に R の 2.0.0 に関する問い合わせがあり、R 教授が返答の最後に次のようにメモしています。これって、来週月曜日に R 2.0.0 beta が公開されるという意味でしょうか?

Or just wait for the release on Monday October 4th.
As was the case with R 1.0.0, this new version represents a coming of age
more than a radical change to R. We do plan to celebrate the new major version
with press releases and such.
No, I don't think we have arrived (would we want to?). We still
have unresolved issues in byte compiling and event loops, and the
formal methods techniques are only just there now. There's the whole
Bayesianfront, too - important even for us hardcore frequentists.

pukiwiki-mode

谷村 (2004-09-29 (水) 21:57:08)

今日、pukiwiki-modeというものを見つけたのですが、これはemacsから直接PukiWikiに書き込むことができるものらしいです。

ブラウザから書き込むのと比べて効率がよさそうなのですが、どなたか使っていますか?


Rwebに入力された驚くべき物

なかま (2004-09-27 (月) 23:40:17)

たまーにビックリするような物が実行されたりしますんですが、今月の始めのなかに凄いものが入ってました。

[18時 20分 40秒] [緑茶] 1 個を手に入れました。
[18時 20分 41秒] [緑茶] 1 個を手に入れました。
[18時 20分 42秒] [銀杏] 1 個を手に入れました。
[18時 20分 45秒] [緑茶] 1 個を手に入れました。
[18時 20分 52秒] 経験値が 64 上がりました。
[18時 21分 13秒] 経験値が 104 上がりました。
[18時 21分 24秒] コンボで5度目の攻撃に成功すると、コンボフィニッシュが発動されます。
[18時 21分 25秒] 経験値が 64 上がりました。
[18時 21分 27秒] 経験値が 104 上がりました。


これをいったいどうしようと思ったのか非常に気になります(笑)....


sink 関数のネスト

QDU (2004-09-27 (月) 21:15:06)

たまたま 2ch の R 関連のやりとりを見ていて次のことに気づきました。この方はどうも sink 関数の使い方を試行錯誤しているうちに、前の sink 関数による出力切替が有効なうちに次の sink 関数を実行したらしく(私にはそう見えました)、sink() を使っても出力が元に戻らず、sink(NULL) でやっと元に戻ったと書いていらっしゃいました。sink() と sink(NULL) は全く同じ命令ですから、事実は知らぬ間に sink による出力のネストを行なっていたということのようです。?sink によれば sink 関数は20回までネスト(というべきなのか)できるらしいです。こうした機能が重要になる局面は一寸想像もできませんが。

    'sink()' or 'sink(file=NULL)' ends the last diversion (of the
    specified type).  As from R version 1.3.0 there is a stack of
    diversions for normal output, so output reverts to the previous
    diversion (if there was one).  The stack is of up to 21
    connections (20 diversions).


# 参考例
> example(lm)
> sink("test.summary")
> sink("test2.summary")   # sink 関数のネスト
> summary(resid(lm.D9) - resid(lm.D90)) # test2.summary に書き込み
> sink()                  #   
> summary(resid(lm.D9) - resid(lm.D90)) # test.summary に書き込み
> sink()
> summary(resid(lm.D9) - resid(lm.D90)) # 標準出力に戻った
      Min.    1st Qu.     Median       Mean    3rd Qu.       Max. 
-7.772e-16 -6.245e-17  2.776e-17  1.405e-17  1.145e-16  3.331e-16

Excel からコピーしたセル範囲を R に読み込む

青木繁伸 (2004-09-19 (日) 14:56:45)

エクセルのセル範囲を R に読み込むために,今まではわざわざファイルに書き出してやっていましたが,面倒なので,簡単なラッパーを作ってみました。

from.excel <- function(nc)
{
	matrix(scan(""), byrow=TRUE, nc=nc)
}

エクセルで必要な部分をコピーします。

x <- from.excel(2)

などとして,プロンプトが出たらペーストします。
入力の終わりはMacintoshだとcommand+.
汎用関数にする価値もないのでこのまま。

  • ?scan によれば Linux だと CTRL+D, MS Windows では CTRL+Z で終了すれば良いようですね。 -- 2004-09-19 (日) 23:41:39
  • これはいいですね。 -- 林 啓一 2004-09-27 (月) 23:32:17
  • 参考になりました -- 田中 2007-08-05 (日) 09:55:51

CRAN のすべてのパッケージを含むドキュメントからの全文検索

間瀬茂 (2004-09-12 (日) 22:35:51)

r-help に「これこれするには何を使えばよいでしょう」タイプの質問専用の新 ML を設けたらという提案があり、しばらく盛り上がりましたが、大勢は r-help で十分という論調でした。一つ興味を引いたのは、CRAN 登録の全パッケージと Bioconductor 関連パッケージをインストールしたら 1GB を越えたという報告でした。これだけの量から必要な情報を取り出すのは確かに至難の技ですが、よくしたものでそれを可能にする検索システムがあることも報告されていました。 R site search は Jonathan Baron 氏による膨大な R 関連ドキュメントからの全文検索システムで、対象は R マニュアル、4種の R メイリングリスト(プラス R-sig-geo)、CRAN 登録の全パッケージ(プラス Jim Lindsey 氏のパッケージ、 Bioconductor の基本パッケージ, Zelig) を含むそうです。早速、Q&A(初級者コース)にあった ANOVA の simple main effect を検索したら、過去に質問が一件ありましたが、回答は実質無し。R 関係者には馴染みがないか、興味がないかどちらかのようです。リンク集にもメモしておきましたので、「困った時の R site search」をどうぞ。


Rの宣伝講演をします

谷村 (2004-09-08 (水) 23:57:14)

2004年9月10日東京大学本郷キャンパス山上会館で「空間疫学分析における統計解析環境Rの活用」という演題で発表します。
http://www.csis.u-tokyo.ac.jp/japanese/research_activities/symposium/7th/index.htm


大男総身に知恵が周りかね?

間瀬茂 (2004-09-08 (水) 19:37:45)

最新の r-help 記事に 64 bit の Sun Sparc マシンで R を動かしたら数割遅くなったという記事があり、R 教授が次のようにコメントしていました。データマイニング屋を除けば、64 bit マシンを羨ましがる必要は(まだ)無い?

It uses more memory at all times and so gc() takes longer.  There *is* a
slowdown, for example 90 vs 80 secs for a run of R-devel's stats-Ex.R (for 
either Sun's Forte 7 or gcc 3.4.1 compilers).  But `25-30% slower' is
unexpected and needs investigation.

The only difference between 32-bit and 64-bit versions of R on Solaris will
be the size of the pointers and (probably) less efficient PIC code. There is
no reason to expect a performance boost with 64-bit applications: they have
to do more work and are only worthwhile if you need the address space (in
memory or also on disc as 64-bit applications use large files natively).

データセットの引用

間瀬茂 (2004-08-26 (木) 17:38:14)

「工学のためのデータサイエンス入門」執筆の際、執筆者の間で議論になった点は、既刊の本やウェッブで公開されたデータの引用に関する(倫理、法律的な)権利関係という点でした。これはいずれ R のパッケージを公開してやろうという野心をお持ちの方にも気になる点ですね。出版界の慣例では、既刊の本、雑誌に載せられたデータ(解析結果は?これも独自に解析しさえすればおそらく問題は無い?グラフ・表等をそのまま写真製版する場合は出版者の許可をえた旨の注意が載せられていることが多いですね)は引用情報を明確にすれば、必ずしも著者に了解を求めなくても、データそのものの引用は可能、ということのようです。ウェッブで公開されているデータについてはおそらく慣習法はないと思いますが、最近の r-help に以下のようなやりとりがありましたのでご紹介しておきます。データそのものには著作権は無いという主張ですが。しかし、世の中には利用について(採取者による)制限が設けられているデータも結構あるようです。アメリカでは政府の金で採取したデータは公開すべしという原則があるようですが、残念ながら日本では科研費等国の予算で採取したデータも私物化されることの方が多いようです。統計学の研究、勉強には現実のデータの利用が欠かせません。R およびそのパッケージの魅力の一つは豊富なデータセットを組み込みで持っていることですが、それらに適用されている GPL ライセンスがデータにどのように及ぶのかは気になるところです。関連する情報をお持ちの方はぜひ教えて下さい。

Dear Arne,

I'm not a lawyer, but I believe that data per se are not
copyrightable.

Regards,
 John 
~
>> -----Original Message-----
>> From: r-help-bounces@stat.math.ethz.ch 
>> [mailto:r-help-bounces@stat.math.ethz.ch] On Behalf Of Arne   Henningsen
>> Sent: Wednesday, August 25, 2004 12:06 PM
>> To: r-help@stat.math.ethz.ch
>> Cc: jfox@mcmaster.ca
>> Subject: [R] License for including datasets in packages
>> 
>> Dear All,
>> 
>> I would like to publish a function for 'heckit' estimations 
>> together with two examples from Greene's and Wooldridge's 
>> econometric textbooks. 
>> These examples use the dataset of Mroz (1987) that is also 
>> available in John Fox' "car" package. However, not all 
>> variables that are used in my examples are available in the 
>> "car" package. Therefore, I want to put the full Mroz dataset 
>> in my package. This full dataset can be downloaded from some 
>> internet sites (e.g. 
>> pages.stern.nyu.edu/~wgreene/Text/econometricanalysis.htm,
>> www.stata.com/texts/eacsap/), but I did not find any license 
>> information. 
>> 
>> Whom do I have to ask wether I am allowed to put these data 
>> in a GPLed R package? (Mr. Mroz, Mr. Greene, STATA, 
>> University of Michigan (PSID), . . . )
>> 
>> @John: Do you have any license information on these data?
>> 
>> Thanks,
>> Arne

女子マラソンの金メダリスト

(2004-08-26 (木) 00:52:23)

アテネオリンピック女子マラソンの金メダリストの所属会社が「グローバリ」(商品先物取り引き会社)という新聞記事を見て気づきましたが、これは R マニュアルの翻訳を始めた山本和彦さんの会社のようですね。野口選手については「先物買い」で見事にあてましたね :-)


IBM developerWorks の記事

nanashi (2004-08-14 (土) 11:47:22)

ちょっと古いですが、Rの紹介記事です。興味があったら読んでみてください

http://www-6.ibm.com/jp/developerworks/linux/040116/j_l-sc16.html


sas2R

(2004-08-13 (金) 12:13:34)

(いささか古い r-help 記事によると) SAS から R プログラムへの変換パーサー sas2R というものがあるようです。詳細は不明。それよりプログラム R2sas が欲しい SAS ユーザがいるかも知れない :-)


車輪で特許をとった男の話(オフトピック)

間瀬茂 (2004-08-09 (月) 14:56:10)

暑いですね、を口実に仕事もせずに無駄知識を紹介します。「車輪を二度発明する」というイディオムは RjpWiki でも数度登場していますが、2001 年に車輪の発明で特許をとったオーストラリア人(ジョン・ケオ)がいるそうです。正確には「環状の運搬補助用具」というのが特許対象だそうですが、要するに車輪のことです。どうしてこんなことが起きたかというと、オーストラアリでは特許取得に要する期間と費用を削減するために、特許期間が短いが取得がたやすい(どうやらほとんど無審査)イノベーション特許制度というのが同じ年に設けられたのに抗議した弁理士のジョン・ケオが、新制度の欠陥を指摘するために請願したら案の定認められたのだそうです。この快挙に対しジョン・ケオとオーストラリア特許局は「イグ・ノーベル・技術賞」授賞の栄誉を授けられました。なお、その後オーストラアリ特許局のHPには「車輪の特許を申請しないこと」という注意が掲載されたそうです。出典は「イグ・ノーベル賞」マーク・エイブラハムズ著、福島俊造訳、阪急コミュニケーションズ社。なおこの本によれば確率・統計に関する研究での授賞も多くあり見逃せません。紹介すると

(1) 相続税の低下の見込みが延命効果を持つことの研究
(2) 落下するバタートーストの力学的研究
(3) 米国の各州毎の地獄へ行く人数の推計
(4) ミハイル・ゴルバチョフが反キリストでない確率の算出
(5) ビスケットを紅茶に浸す理想的な方法の考察

L^2 = (γ x D x t)/(4 x η) ここで
L は紅茶にビスケットを浸す幅、γ は紅茶の表面力、D はビスケットに空いた穴の直径平均値
t は浸す時間、η は紅茶の粘性率

また英国規格協会(BSI)には紅茶の正式ないれ方に関する6頁の規格(BS6008)があるそうです。Fisher's Tea Drinker データというのがあります( help(fisher.test) 参照)が、英国人の紅茶への入れ込み方は半端で無いようですね。皆さんも、イグ・ノーベル賞に挑戦してみましょう。意外に日本は授賞大国です。自薦もできるようです。ただし、授賞式への参加費用は自弁だそうです。


現在の CRAN 登録パッケージ数

(2004-08-05 (木) 01:40:16)

数えてみたら 2004.08.05 現在 CRAN 登録パッケージ数は 381 でした。これは Bioconductor 等のプロジェクトを除いた数です。一年少しで約 170 あまり増えた勘定になります。


BLAS for Pentium4 512kB(Windows, Linux)

後藤 (2004-08-03 (火) 22:41:42)

現在改良版の BLAS のリリースを準備しているのですが、とりあえずβ版を作ってみましたので、興味のある方はお試しください。Level1 と Level2 ルーチンの性能が向上しています。

http://www.cs.utexas.edu/users/kgoto/libraries/libgoto_p4_512-r0.95.so.gz
http://www.cs.utexas.edu/users/kgoto/win2k/libgoto_p4_512-r0.95.zip

にありますので、wget で取ってください。なお、R のインストールメモには、complex が使えない旨書いてありますが、何も特殊なことはしていないので普通に動作するはずです(古いライブラリに関しての記述なので、できれば更新してほしいな)。


数学者は如何にしてパン屋の不正を見抜いたか

間瀬茂 (2004-08-03 (火) 20:55:57)

(最近読んだ本から紹介)

数学者ポアンカレは、毎日買っているパン屋の1kgのパンがしばしば軽目なのに気づきました。しかし、彼は実際のパンの重量は一つ一つランダムに変動することは先刻承知でした。そこで一年間購入したパンの重量を計り、それがほぼ正規分布に従うことを確認した上で、平均が950gであることを警察に届けで、パン屋に警告させました。それからまた一年パンの重量を計り続けたポアンカレは、今度はその分布が正規分布とは異なり、右に裾が長いことを見出し、再び警察に届けでてパン屋の不正を正したそうです。つまり、彼はパン屋が反省することなく、単に毎日一番目方の重そうなパンを選んでポアンカレ家に売り付けていたことをデータから見抜いたわけです。

R でシミュレーションすると次のようになるでしょうか。y は正規乱数の最大値をシミュレーションしています。

x <- rnorm(365, mean=950, sd=30)
y <- sapply( 1:365, function(i) max(rnorm(500, mean=950, sd=30)) )
par(mfrow=c(1,2))
hist(x); hist(y)
poincare2.png

お手軽 WinR で ATLASクッキング

なかま (2004-07-28 (水) 10:02:42)

セレロンの人でも早くなると思います.1世代前のATLASがいいでしょうか.
あまり知らない指令が来てもCPUは遅くなるでしょうし.

http://toucan.stats.ox.ac.uk/R/RWin/ATLAS/

から適当なRblas.dllをダウンロードしてR_HOME/bin にコピーすればよいです.


お手軽Rで後藤クッキング

なかま (2004-07-27 (火) 22:33:31)

http://www.cs.utexas.edu/users/kgoto/ から自分のCPUにあった

libgoto と xerbla.c をダウンロード.
gzip -d  libgoto_p4_128-r0.94.so.gz
gcc -c xerbla.c
gcc -shared -o libgoto.so ~/libgoto_p4_128-r0.94.so xerbla.o 

Rgoto と言うシェルスクリプト作成

#!/bin/bash
export LD_PRELOAD=~/libgoto.so:/usr/lib/libm.so
${RPROG:-R} -q $* 

起動

$ ./Rgoto

で, R を実行すれば標準BLASやATLASの変わりに後藤(日本語訳はどうすべき?)を使うと思います。
元もとATLAS使っているなら劇的には早くはならないと思いますが。


FreeBSDのportsから日本語化済Rをインストールする

aki (2004-07-27 (火) 14:17:01)

http://www.fifthdimension.jp/index.php?R%2FTips
に半自動化スクリプトも含めて書いておきました。
余計なこともやってますがとりあえずパッチの適用までは確認しました(コンパイルは今やってます)。
動作確認が取れましたらこちらのTipsにでもミラーしていただければ幸いです。


ELT

(2004-07-27 (火) 12:37:19)

率直に言って、RはELT(※)には向いていないと思うのですが、どのアプリケーションの助けを借りていますか?
?*nixな人だとAWK,PERL等になるのでしょうか?
さすがに、SASをELTに使ってRで分析する人はいないですよね。

※ELT
Extraction(抽出)、Load(ロード)、Transformation(変換)


予約キーワード

青木繁伸 (2004-07-27 (火) 01:23:05)

名前付きの引数の指定の時,名前は前方から数文字で指定できる
しかし,以下のようなこともある

> x <- c(3.1, 2.4, 1.3, 4.2, 5.3)
> hist(x, breaks=1:6) # フルネーム(当然ながら,ちゃんと動く)
> hist(x, b=1:6) # b で始まる引数が2つあるので,識別不能となりエラーになる
Error in hist.default(x, b = 1:6) : argument 2 matches multiple formal arguments
> hist(x, br=1:6) # ちゃんと動く
> hist(x, bre=1:6) # ちゃんと動く
> hist(x, brea=1:6) # ちゃんと動く
> hist(x, break=1:6) # break は予約キーワードなので,エラー
Error: syntax error

ちょっと釈然としない。
自作関数でも当然ながら,同じ問題は生じる。

> a <- function(fortran=0) print(fortran)
> a(f=3)
[1] 3
> a(fo=4)
[1] 4
> a(for=5)
Error: syntax error
> a(fort=6)
[1] 6

Eclipse Plug-in

(2004-07-26 (月) 20:06:05)

 とうとう出ました。r-help に情報がありました。

 まだ試していません。

 Eclipse 3.0用で以下の機能があるようです。

 シンタックスのハイライト、括弧のマッチングチェック、IDEのCVS等の機能が利用可能

 以下より入手可能です。


 http://www.walware.de/rplugin.zip


TV や映画に出ていたR言語

(2004-07-24 (土) 01:51:01)

てなことないでしょうね、


浮動小数演算の怪

QDU (2004-07-21 (水) 11:01:10)

これまた r-help 記事ネタ。次の一見無邪気な引き算の結果はびっくりしませんか。ただしこれは R のバグではなく、R が採用している IEEE 浮動小数点演算規則に忠実な結果(私も良く理解していませんが、実数の内部的な2進数表現演算と結果の10進数表現との微妙な齟齬?)だそうです。ちなみに、Excel や OpenOffice ではこうはならないそうで、その理由は「ほとんど零」に近い数を強制的に零にする関数をかませてあるからだそうです。その意味で IEEE 仕様から逸脱しているわけですが、一般の使用者はとても理解してくれないのでこうしているのでしょう。

> 0.6-0.3-0.3
[1] 0
> 0.6-0.4-0.2
[1] -5.551115e-17
> 0.6-0.5-0.1
[1] -2.775558e-17
> 0.6-0.2-0.4
[1] -5.551115e-17
> (0.6-0.2)-0.4
[1] -5.551115e-17
> 0.6-(0.2+0.4)
[1] -1.110223e-16

バージョン4のS言語はコンパイル機能を持つ!

(2004-07-18 (日) 23:40:54)

たまたまベル研のHPで J. Chambers によるバージョン4のS言語の解説文を見つけ読んでいたら、バージョン4のS言語はコンパイル機能を持つとかいてあり、えっと思いました。もっともこれは構文的な解析によるミニコンパイルで、定数とおける部分を定数化する、総称的関数をあらかじめ特定のメソッドへ置き換える、関数やメソッドのコードへのインライン化、といったレベルの話しのようです。これでどれだけ実行スピードが上がるのかは? R でこうした機能がいつ採り入れられる(まだだと思いますが)のかも?


THE R BOOK の続編【R入門+セミコマンドリファレンス】

舟尾 (2004-07-17 (土) 00:00:53)

来年あたりに出版して頂けるであろう THE R BOOK の続編を私が執筆することになりました.内容は R の入門書で,コマンドリファレンスとしても使えるように索引などを充実させたものにする予定です.ただ,私は R も 統計もあまり良く分かっておりませんし,本などを書かせて頂いたこともありませんので,私が一人で好き勝手に書いてしまうと,出版社の方にも読者の方にも土下座して謝らなければいけないようなものが出来上がってしまいます.
書籍として刊行するということで,ある程度は差別化を図る予定ですが,元ネタは R-Tips
http://cse.naro.affrc.go.jp/takezawa/r-tips/r.html
です.そこで,もし良ければ皆様に R-Tips のダメ出しをお願いしたいと思います.「ここが分かり難い!」「そこは間違いだ!」「あの内容は不適当だ!」「どうしたもんだかなぁ〜」等々,ご意見を頂ければ幸いです.ご意見は専用掲示板にカキコお願いします.頂いた意見の全てを反映させることは難しいかもしれませんが,分かり易い本を作成させるために,出来る限りたくさんの意見を本に反映させたいと思っております.(管理されている岡田さん,RjpWikiを私物化してしまいまして申し訳ありません・・・)

source() 関数のネスト

QDU (2004-07-12 (月) 22:08:24)

r-help におもしろい話題がありました。普通 source() 関数をネストして使うことなど考えないでしょうが、source() 関数を使っているコードを他の関数から呼び出す時など起こり得ることですね。いつでもうまくいくとは限らないかも知れません。

# ファイル  "a.R"
a <- function(x) x^2
source("b.R")


# ファイル  "b.R"
cat(a(10),"?n") # 単に  a(10) では何故か何も表示されない?


# 実行結果
> source("a.R") # 中で source("b.R") を実行し、a(10) を計算した。
100

goto

なかま (2004-07-08 (木) 19:26:32)

「ゴーツー」では無く「ごとう」なんですね。(^_^;

test2 <- function ( n=500 )
{
	A<-array(rnorm(n^2), dim=c(n,n))
	B<-array(rnorm(n^2), dim=c(n,n))
	C<-array(rnorm(n^2), dim=c(n,n))
	D<-array(rnorm(n^2), dim=c(n,n))
	BA <- B%*%A 
	return (system.time(A%*%solve(t(BA)%*%BA+C)%*%BA%*%D ))
}

貧乏な私のマシン(ここでRのビルドとかしてるんですが)

> test2()
[1] 23.69  0.07 23.99  0.00  0.00

貧乏なRweb-jpマシン

> test2() 
[1] 10.91  0.11 11.08  0.00  0.00 

某所R-1.8.1

> test2()
[1] 9.822266 0.015625 9.839844 0.000000 0.000000

某所R-1.9.1 --with-blas=-lgoto

> test2()
[1] 1.01757812 0.02050781 1.04199219 0.00000000 0.00000000

ディスク欲しさにCPUをCeleronに落としてはいけない訳ですね。(^-^;


RjpWiki トップページについて

間瀬茂 (2004-07-08 (木) 17:42:18)

ここ数日私等がトップページをいじくっております。どうしても個人的趣味が入り勝ちなのをお断りしておきます。個人的意見としては、(複数のブラウザを使用する人がいることを考慮した上で)主要な内容がスクロール無しで一度に眺められる(つまり過剰にならない範囲でできるだけ詰め込む)、その上で見栄えを考慮する、という方針を勧めたいとおもいます。こうした意見も考慮の上、やはりこうした方が見やすいとおもわれる場合は、遠慮無く改訂お願いします。


R で データマイニング

(2004-07-06 (火) 18:21:43)

r-help に以下のサイトの情報が流れていました。

http://www.liacc.up.pt/~ltorgo/DataMiningWithR/


漸近回帰モデル

間瀬茂 (2004-07-05 (月) 14:42:49)

最近、R の stats パッケージに漸近回帰モデル (asymptotic regression model) と呼ばれる一連の関数があることを発見し、驚いています。要するに非線形回帰モデルですが、モデル曲線の漸近線値がモデルパラメータの一部になることが多いので、こういう名前が付けられているようです。興味深いのは、いくつかの代表的非線形モデル(logistic, Weibull, Gompertz, Michaelis-Mentel, compartment)に対し、そのパラメータの初期推定値(example によればこれはさらに nls() 関数で改良しても変わらないことが多いほど良い推定値らしい)を計算するメカニズムをモデル自身に含めることができる「自己開始(SS, Self-Start)」モデルと呼ばれる関数がたくさんあること。経験者は苦労されるように、非線形モデルではパラメータの良い初期推定値を試行錯誤で求めるのが作業の半ばを占めることがありますから、これはとても嬉しい。今まで気づかなかったのは比較的最近登場したのでしょうか?興味のある方は help.search("SS"), help.search("Asymptotic") で検索してみて下さい。


誕生日のパラドックス

(2004-07-02 (金) 23:43:29)

pbirthday は正しい値(?)を返さない
これぞ,まさしく,パラドックス(^_^;)


64 bit 版 R !

(2004-07-02 (金) 23:01:19)

r-help 記事より。お金持ちには64ビット版 R で 4 Gigabyte 以上のメモリが使えるようですね。私のような貧乏人には関係ない話ですが。R でも既に南北問題が存在するようです。

Did you compile R as 64-bit executable on the Irix?  
If not, R will be subjected to the 4GB limit of 32-bit systems.

anti-R vitriol

間瀬茂 (2004-07-01 (木) 17:10:54)

昨日の r-help に表題のようなタイトル(vitriol というのは硫酸をかける、という意味から辛辣な意見という意味になるようです)の記事が投稿され、それに対する意見・反論で賑わいました。要するに R で大規模データを読み込もうとして、うまくいかなかった人物が逆上している雰囲気(もしかすると熱烈 SAS ユーザーの悪意あるコメントかも知れません)ですが、それに対して R ユーザーがいろいろ意見を述べているのがむしろ興味深かったです。一体どのようなデータをどのように読み込もうとしたのか説明がないので、ある意味で不毛な議論にならざるをえません。しかし近年データマイニングはやりで、ともかく大量のデータを統計ソフトにぶちこめば何か金塊が得られると勘違いしている人が多いようなので、こうした憎まれ口も多くなるのでしょう。R で他のソフトが出来ることは大抵(よりうまく)出来る、ただしピザの注文は別との意見に、いや R でピザの注文も出来る(インタネットにアクセスできるのだから)という反論もありました。R で何でもできるというのは勘違いでしょうが、大量のデータを扱うにはそれなりの工夫がいる(ある)ということのようです。一度読み込んでから R の内部形式で書き出せば、二度目からは相当早く読み込めるはずだという意見や、read.table() 関数の colClasses オプションでデータのフィールドの書式を教えてやれば早くなるはずという意見もありました。こうした問題で苦労した人の tips を期待したいところです。

A colleague is receiving some data from another person. That person reads the data in
SAS and it takes 30s and uses 64k RAM. That person then tries to read the data in R
and it takes 10 minutes and uses a  gigabyte of RAM. Person then goes on to say:
  It's not that I think SAS is such great software,
  it's not.  But I really hate badly designed
  software.  R is designed by committee.  Worse,
  it's designed by a committee of statisticians.
  They tend to confuse numerical analysis with
  computer science and don't have any idea about
  software development at all.  The result is R.
  I do hope [your colleague] won't have to waste time doing
  [this analysis] in an outdated and poorly designed piece
  of software like R.
Would any of the "committee" like to respond to this? Or shall we just slap our
collective forehead and  wonder how someone could get such a view?
  >system.time(spam <- read.table("data_dmc2003_train.txt", 
                          header=T, 
                          colClasses=c(rep("numeric", 833), # 833個の数値欄の後に文字列欄
                                              "character")))
 [1] 15.92  0.09 16.80    NA    NA
 > system.time(spam <- read.table("data_dmc2003_train.txt", header=T))
 [1] 187.29   0.60 200.19     NA     NA

なんで runif はランダムなの?

(2004-07-01 (木) 13:20:06)

意味不明なタイトルと思われるでしょうが、つぎの結果をどう解釈したら良いのでしょう: (つまり百万個一様乱数を発生する手間は同じはず、念には念を入れ乱数種も同じにした)

test <- function (i) {set.seed(222); system.time(runif(1e6))[1]}
x <- sapply(1:1000, test)
fivenum(xx)
[1] 0.24 0.28 0.30 0.30 0.47


添付ファイル: filepoincare.png 1404件 [詳細] filegoto.png 1626件 [詳細] filepoincare2.png 2825件 [詳細]

トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2023-03-25 (土) 11:19:16