パッケージ 'datasets' の情報
著作者: R Development Core Team and contributors worldwide 維持管理者: R Core Team <R-core@r-project.org> 維持管理者: R Core Team <R-core@r-project.org> ライセンス形態: GPL (>= 2)
パッケージ 'datasets' の情報
著作者: R Development Core Team and contributors worldwide 維持管理者: R Core Team <R-core@r-project.org> ライセンス形態: GPL (>= 2)
1949〜1960年の月別国際航空旅客数(単位:千人)。Box & Jenkinsによる古典的な航空路線データ。 時系列データ 長さ144
BJsales
売上高と先行指標データ 時系列データ 長さ150 Start=1, End=150, Frequency=1 BJsales 売上高 BJsales.lead 先行指標
BOD
水質評価における生物化学的酸素要求量 データフレーム 6×2 time 測定時間(日) demand 生物化学的酸素要求量(mg/l)
CO2
イヌビエ(Echinochloa crus-galli)の低温耐性実験における二酸化炭素吸収量 データフレーム 84×5 適用手法:漸近指数曲線へのあてはめ Plant 植物の同定用の順序付factor変数 Qn1 < Qn2 < Qn3 < Qc1 < Qc3 < Qc2 < Mn3 < Mn2 < Mn1 < Mc2 < Mc3 < Mc1 Type 植物の採取地を示すfactor変数 Quebec, Mississippi Treatment 処理を示すfactor変数 nonchilled, chilled(実験前日一晩冷却) conc 大気中の二酸化炭素濃度(mL/L) uptake 二酸化炭素吸収率(μモル/平方メートル・秒)
飼料によるひな鳥の週数と体重 データフレーム 578×4 weight 雛の体重(g) Time 孵化から体重測定までの日数 Chick 雛を識別する順序付factor変数 18 < 16 < 15 < 13 < 9 < 20 < 10 < 8 < 17 < 19 < 4 < 6 < 11 < 3 < 1 < 12 < ... < 48 Diet 4種類の餌を表すfactor変数 1,2,3,4
DNase
ラットの血清中のタンパク質組換え DNase のイライザ法による分析法の開発時のデータ データフレーム 176×3 Run 実験の区別のための順序付factor変数 10 < 11 < 9 < 1 < 4 < 8 < 5 < 7 < 6 < 2 < 3 conc タンパク質の濃度(既知) density 測定された光学濃度(1つのconcに対し,2つずつの測定値がある)
1991〜1998年のヨーロッパの主要株式指標の終値 多変量時系列データ(4変数,長さ1860,Start = c(1991, 130),End = c(1998, 169),Frequency = 260) 営業日のデータなので,週末や休日のデータは除外されている Germany DAX (Ibis) Switzerland SMI France CAC UK FTSE
Formaldehyde
フォルムアルデヒドの定量 データフレーム 6×2 carb 炭化水素(ml) optden 光学濃度
統計学受講学生592人の性別の髪と目の色 元々はSnee(1974)が,髪と目の色についてデラウエア大学の学生の調査結果を報告したもの。後に,Friendly(1992)が教育的な意図で性別の分割を加えた。 Brown hair, Brown eye のセルの数値はFriendlyの用例(2000)に合うようにR2.6.0で変更された。 クロス集計による3次元配列 Hair Black, Brown, Red, Blond Eye Brown, Blue, Hazel, Green Sex Male, Female
Harman23.cor
ハーマンの例2.3(Harman, H. H. (1976) Modern Factor Analysi) 7〜17歳の女子305人の身体計測値の相関係数行列 height 身長 arm.span 指極(両腕を水平に伸ばしたときの左右の中指間の距離) forearm 前腕長(length of forearm) lower.leg 下腿長(length of lower leg) weight 体重 bitro.diameter 臀囲(正面から見て腰の一番張っている箇所の周囲径?, bitrochanteric diameter) chest.girth 胸囲 chest.width 胸幅
Harman74.cor
ハーマンの例7.4(Harman, H. H. (1976) Modern Factor Analysi) HolzingerとSwinefordによる,シカゴ郊外の7,8学年の子供145人の24項目の心理学的検査項目の相関係数行列 VisualPerception 視覚認識 Cubes PaperFormBoard Flags 旗 GeneralInformation PargraphComprehension 段落の把握 SentenceCompletion 文章完成 WordClassification 単語の分類 WordMeaning 単語の意味 Addition 足し算 Code CountingDots 点の個数を数える StraightCurvedCapitals WordRecognition 単語認識 NumberRecognition 数値認識 FigureRecognition 形の認識 ObjectNumber NumberFigure FigureWord Deduction 推論 NumericalPuzzles 数値パズル ProblemReasoning 問題論証 SeriesCompletion 数列完成 ArithmeticProblems 幾何問題
Indometh
インドメタシンの薬物動力学。6人の被検者はインドメタシンの静脈注射をされ,時間経過ごとに採血されインドメタシンの血清中濃度が測定された データフレーム 66×3 Subject 対象者コードを示す順序付きfactor変数 1 < 4 < 2 < 5 < 6 < 3 time 血液サンプルが取られた時間 conc 血清中のインドメタシンの濃度
殺虫剤の有効性。異なる殺虫剤で処理された農業試験区における昆虫の数。 データフレーム 72×2 count 昆虫の数 spray 6種類の殺虫剤を表すfactor変数 A B C D E F
1960〜1980年の,ジョンソン&ジョンソンのシェアあたりの四半期収益 時系列データ 長さ84
1875〜1972年のヒューロン湖の水位(単位:フィート) 時系列データ 長さ98,Start = 1875,End = 1972,Frequency = 1
国別のライフサイクル貯蓄データ データフレーム 50×5 sr 合計個人貯蓄 pop15 15歳以下の人口比率 pop75 75歳以上の人口比率 dpi 一人あたりの可処分所得 ddpi dpiの成長率
Loblolly
テーダマツの生育 データフレーム 84×3 height 樹高(フィート) age 樹齢(年) Seed 種の由来を表す順序づけられたfactor変数(木の直径が大きくなる順番)
Nile
1871〜1970年の,アスワンにおけるナイル川の年間流量 時系列データ 長さ100,Start = 1871,End = 1970,Frequency = 1
Orange
オレンジの木の生長 データフレーム 35×3 Tree 木の番号を表す順序づけられたfactor変数(木の直径が大きくなる順番) age 樹齢(1968年12月31日からの日数) circumference 木の周囲径(森林調査における標準である胸高周囲径だろう)
ラテン方格を用いて,ミツバチを忌避する能力のある果樹用殺虫剤の成分の効能について実験を行った。蔗糖液に計量された量の石灰硫黄合剤を溶かしたものを用いた。1/100〜1/1562500までの1/5希釈をし,7段階の濃度が使われた。8つめは対照として石灰硫黄合剤は含まないものを用意した。100匹のミツバチを2時間放し,その後液の減少量を測定した。 データフレーム 64×4 decrease 反応(ミツバチの現象) rowpos 区画の行位置 colpos 区画の列位置 treatment 処置 A(最高濃度) B C D E F G(最低濃度) H(濃度0)
植物の生長実験の結果。2種の条件と1つの対照において,植物の生産高(植物の乾燥重量)の比較実験結果。 データフレーム 30×2 weight 乾燥重量 group グループ(factor変数) ctrl trt1 trt2
Puromycin
ピューロマイシンで処理された場合とそうでない場合における酵素反応の基質濃度と反応速度 データフレーム 23×3 conc 基質濃度(ppm) rate 瞬間反応率(放射性生産物の生産個数/分^2) state 前処理されたかどうか treated,untreated
Theoph
テオフィリンの薬物動力学 データフレーム 32×5 Subject 観察されたテオフィリンの最高濃度が小さい順に順序づけられたfactor変数 1〜12 Wt 対象の体重(kg) Dose 対象者に経口投与された体重あたりのテオフィリンの量(mg/kg) Time 経口投与から試料が採取されたときまでの経過時間(hr) conc 試料中のテオフィリン濃度(mg/L)
Titanic
タイタニックの乗客の生死のデータ 4次元配列 2201人,4変数を集計したもの Class 1st, 2nd, 3rd, Crew Sex Male, Female Age Child, Adult Survived No, Yes
モルモットの歯の生長へのビタミンCの影響。10匹ずつのモルモットに,オレンジジュースまたはアスコルビン酸(ビタミンC)のいずれかにより,3段階のビタミンC濃度(0.5, 1, 2 mg)を与え,歯牙母細胞の長さを測定した。 データフレーム 60×3 len 歯牙母細胞の長さ supp 投与方法を表すfactor変数(VC:アスコルビン酸,OJ:オレンジジュース) dose 投与量(mg)
UCBAdmissions
1973年の,カリフォルニア大学バークレー校への入学志願者について,6つの学部別,性別の合否結果 3次元配列 4526人について3変数 Admit Admitted, Rejected Gender Male, Female Dept A, B, C, D, E, F
Seatbelts(UKDriverDeaths)
英国における1969〜1984年の自動車運転者の死傷者数。期間中の1983年1月31日にシートベルトの着用が義務づけられた。 時系列データ 長さ1536 以下の8項目 DriversKilled 自動車運転者死亡数 drivers 死亡または重症数(UKDriverDeaths と同じ) front 前の座席の同乗者の死亡または重傷数 rear 後ろの座席の同乗者の死亡または重傷数 kms 走行距離数 PetrolPrice ガソリン価格 VanKilled バン(軽貨物車)運転者の死亡数 law シートベルトの着用義務 0/1
1974〜1979年の,英国における肺疾患(気管支炎,肺気腫,喘息)による月間死亡者数 注:UKLungDeathsという名前のデータセットはない。実際は以下の3つのデータセット 時系列データ 長さ72 ldeaths 全数 fdeaths 女 mdeaths 男
UKgas
1960〜1986年の,英国の四半期ごとのガス消費量 時系列データ 長さ108
アメリカにおける1973〜1978年の不慮の事故死者数 時系列データ 長さ72
USArrests
アメリカの州別の暴力犯罪発生率(人口10万対) データフレーム 50×4 Murder 殺人による逮捕数(人口10万対) Assault 暴行による逮捕数(人口10万対) UrbanPop 都市部の人口割合 Rape 強姦による逮捕数(人口10万対)
弁護士によるアメリカの高等裁判所判事43人の評価 データフレーム 43×12 CONT 弁護士が裁判官と接触した回数 INTG 判決の無欠性 DMNR 態度 DILG 勤勉 CFMG 裁判の進行管理 DECI 迅速な判決 PREP 裁判に備える準備 FAMI 法律に熟知 ORAL 口頭による適切な判決 WRIT 書面による適切な判決 PHYS 身体的能力 RTEN 立派な人物(?)Worthy of retention
アメリカのカテゴリー別個人消費データ(単位:10億ドル) データ行列 5×5
VADeaths
1940年のバージニア州の死亡率(人口1000対) データ行列 5×4
WWWusage
1分あたりのインターネット利用者数 時系列データ 長さ100,Start = 1,End = 100,Frequency = 1
世界の電話台数(単位:1000台) データ行列 7×8
ability.cov
112人に対して,6種類の能力・知能検査を行った結果の分散共分散行列 分散共分散行列 6×6 general Cattellの文化中立的テストによる非言語的一般的知能 picture 絵画完成テスト blocks ブロック・デザイン maze 迷路 reading 読解力 vocab 語彙
airmiles
1937〜1960年のアメリカ航空会社の旅客マイル(単位:1名1マイル) 時系列データ 長さ = 24,Start = 1937,End = 1960,Frequency = 1
airquality New York Air Quality Measurements
1973年5月から9月の毎日の,ニューヨークの大気質測定値 データフレーム 154×6 Ozone オゾン(ppb) Solar.R 日射量(langley) Wind 風速(mph; mile/hr) Temp 最高気温(華氏) Month 月 Day 日
anscombe
Anscombeの4つの(x,y)ペア。平均値,標準偏差,相関係数,回帰係数と切片が同等な二変数のデータセット。 データフレーム 11×8 x1〜x4 平均値=9,標準偏差=3.316625 y1〜y4 平均値≒7.50,標準偏差≒2.03 (x1, y1), (x2, y2), (x3, y3), (x4, y4) の相関係数≒0.816 yi~xi の回帰係数≒0.5,切片≒3.0
attenu The Joyner-Boore Attenuation Data
複数の観測所で記録された,カリフォルニアの23の地震の最大加速度 データフレーム 182×5 event 番号 mag モーメント・マグニチュード station 観測所番号 dist 震源地から観測所までの距離(km) accel ピーク加速度(ガル)
attitude The Chatterjee-Price Attitude Data
Chatterjee-Priceの態度データ 金融団体の30の部署における35人ほどの事務職員を対象として,好ましい回答をしたものの割合。 Y 総合評価 complaints 従業員の不満の処理 privileges 特権を認めない learning 学ぶ機会 raises 成果による昇給 critical 批判的すぎる advace 昇進
austres
1971年3月〜1994年3月のオーストラリア居住者数の四半期ごとの時系列データ 時系列データ 長さ89
beavers(実際はbeaver1,beaver2というデータフレーム)
2匹のビーバーの体温の時系列データ beaver1 データフレーム 114×4 beaver2 データフレーム 100×4 day 1990年1月1日からの経過日数 beaver1は12月12-13日 beaver2は11月3-4日 time 0330は午前3時30分を表す temp 体温(摂氏温度) activ 隠れ家の外での活動
cars
車の速度と停止距離(1920年代のデータ) データフレーム 50×2 speed 時速(マイル/h) dist 停止までの距離(フィート)
chickwts Chicken Weights by Feed Type
餌の添加物の種類による雛鳥の体重 データフレーム 71×2 weight 孵化から6週間後の体重 type 飼料の種類 casein,horsebean(ソラマメ),linseed(アマニ),meatmeal,soybean,sunflower
co2
1959〜1997年の毎月のマウナ・ロア火山の大気中の二酸化炭素濃度(ppm単位) 1964年2月〜4月は欠損データだったので直線補間している 時系列データ 長さ468
crimtab
Student(William Sealy Gosset)による,20歳以上の男性犯罪者3000人のデータ 集計表 42×22 行名は左中指の長さ(センチ),列名は身長(センチ)
discoveries
1860〜1959年の年間の「偉大な」発明と科学的発見の数 時系列データ 長さ100,Start = 1860,End = 1959,Frequency = 1
esoph
フランスにおける喫煙・飲酒と食道癌のケース・コントロール研究の結果 データフレーム 88×5(生データではない) agegp 年齢 順序付き因子 25-34 < 35-44 < 45-54 < 55-64 < 65-74 < 75+ alcgp アルコール摂取量 順序付き因子 0-39g/day < 40-79 < 80-119 < 120+ tobgp タバコ接種量 順序付き因子 0-9g/day < 10-19 < 20-29 < 30+ ncases 対象群例数 ncontrols 対照群例数
euro
ヨーロッパ通貨の交換比率(1ユーロと等価な通貨) ベクトルデータ 長さ11
euro.cross
ヨーロッパ通貨の交換比率 outer(1 / euro, euro) により作られるもの 行列 11×11
eurodist
ヨーロッパの21都市間の道路距離(キロメートル) distオブジェクト(行列の対角成分を含まない下三角行列)
faithful
イエローストーン公園にあるオールド・フェイスフル間欠泉のデータ データフレーム 272×2 eruptions 噴出時間(分) waiting 次の噴出までの時間(分)
freeny(実際には,freeny.y, freeny.x, freenyの3つのデータセット)
四半期ごとの収入データと説明変数 freeny.y 1962年第2四半期から1971年第4四半期までの収入データ 時系列データ 長さ39 freeny.x 説明変数の行列 列はfreeny.yのラグ1のデータ, 価格指標, 収入レベル, マーケット・ポテンシャル freeny freeny.y, freeny.xからなるデータフレーム
infert
条件付きロジスティック回帰の適用可能性における自然流産,誘発流産後の不妊についての症例・対照研究データ education 教育年数 age 年齢 parity パリティー induced 過去の誘発流産回数 case 状態 spontaneous 過去の自然流産回数 stratum 層 pooled.stratum プールされた層
iris
フィッシャーの(または,エドガー・アンダーソンの)として知られる,有名なアヤメのデータ Iris setosa,I. versicolor,I. virginica,それぞれ50個体についての萼片と花弁の長さと幅のデータ データフレーム 150×5 Sepal.Length 萼片の長さ(cm) Sepal.Width 萼片の幅(cm) Petal.Length 花弁の長さ(cm) Petal.Width 花弁の幅(cm)
iris3
フィッシャーの(または,エドガー・アンダーソンの)として知られる,有名なアヤメのデータ Iris setosa,I. versicolor,I. virginica,それぞれ50個体についての萼片と花弁の長さと幅のデータ 配列 50×4×3
islands
10000平方マイル以上の,世界の主要な陸塊の面積(単位:1000平方マイル) 名前付きベクトルデータ 長さ48
lh
10分ごとの血液サンプル中の黄体ホルモン量 時系列データ 長さ48 Start = 1,End = 48,Frequency = 1
longley
1947〜1962年の高度の多重共線性を持つ年度マクロ経済データ データフレーム 16×7 GNP.deflator GNP implicit price deflator(1954年を100とした指標) GNP GNP Unemployed 失業者数 Armed.Forces 軍関係者数 Population 14歳以上の施設に収容されていない人口数 Year 年 Employed 就業者数
lynx
1821〜1934年に罠に掛かったカナダ・オオヤマネコの数 時系列データ 長さ114 Start = 1821, End = 1934, Frequency = 1
morley
MichaelsonとMorleyの光の速度の測定データ データフレーム 100×3 Expt 実験番号 1〜5 Run 実験セット番号 1〜20 Speed 測定値
mtcars
1974年の「Motor Trend」誌から抽出した32車種の,燃費の他,デザインなどの評価データ データフレーム 32×11 mpg 1ガロンあたり走行距離(miles/gallon) cyl エンジンのシリンダー数 disp 排気量 hp 総馬力 drat Rear axle ratio wt 重量(lb/1000) qsec 1/4マイル時間 vs V/S am トランスミッション(0:オートマティック,1:マニュアル) gear 前進ギヤ数 carb キャブレター数
nhtemp
1912〜1971年の,コネチカット州ニューヘブンの年平均気温(単位:華氏) 時系列データ 長さ60 Start = 1912, End = 1971, Frequency = 1
occupationalStatus
父親とその息子の仕事上の地位の集計表 tableクラスの集計表 8×8
nottem
1920〜1939年のノッティンガムの月平均気温(単位:華氏) 時系列データ 長さ240
precip
アメリカの都市とプエルト・リコにおける年間降水量 ベクトルデータ 名前付き,長さ70
presidents
1945年第1四半期〜1974年第4四半期までの,アメリカ大統領の四半期ごとの支持率 時系列データ 長さ120(途中に欠損値あり)
pressure
温度の関数としての水銀蒸気圧 データフレーム 19×2 temperature 温度(摂氏温度) pressure 蒸気圧(mmHg)
quakes
フィージー沖で1964年以降に発生したマグニチュード4以上の地震の発生場所 データフレーム 1000×5 lat 緯度 long 経度 depth 深度(km) mag マグニチュード stations 報告した観測所数
randu
VMS 1.5でVAX FORTRANの合同乗算法による乱数発生関数RANDUにより得られた連続する三つ組乱数400個の乱数 データフレーム 400×3 x, y, z はそれぞれ一番目,二番目,三番目の乱数 これらの乱数は3次元空間で15枚の平行な平面上に存在する
rivers
北アメリカの141の主要な川の長さ(単位:マイル) ベクトルデータ 長さ141
rock Measurements on Petroleum Rock Samples
油田の岩48サンプルの測定値 area 256×256ピクセルのうちの孔隙面積(ピクセル) peri 周囲径 shape peri/sqrt(area) perm 透過率(透過率の単位:ミリ・ダーシー)
sleep Student's Sleep Data
2種類の睡眠薬の投与により増加した睡眠時間のデータ データフレーム 20×2 extra 睡眠時間の増加量(時間) group 睡眠薬の種類(factor)
stackloss Brownlee's Stack Loss Plant Data
アンモニアを酸化して硝酸を作る工場の操業データ データフレーム 21×4 Air.Flow 冷却空気の流量 Water.Temp 注入口における冷却水の温度 Acid.Conc. 硝酸濃度(/1000, -500) stack.loss stack loss
state US State Facts and Figures
state.abb 州名(2文字の略称) state.area 州の面積(平方マイル) state.center 州のほぼ中心の経度(x)と緯度(y)のリスト state.name 州名(フルネーム) state.region 州の区域分け(Northeast, South, North Central, West) state.x77 データ行列 50×8 各州の以下のデータ Population 1975年7月1日の推定人口 Income 一人あたり収入(1974年) Illiteracy 非識字率(人口100対,1970年) Life Exp 平均余命(年,1969〜1971年) Murder 殺人事件率(人口10万対,1976年) HS Grad 高校卒業率(1970年) Frpst 州都や大都市で最低気温が氷点下になる平均日数(1931〜1960年) Area 面積(平方マイル)(注:state.areaとは若干の相違あり)
sunspot.month
1749〜1997年の月別太陽黒点数 時系列データ 長さ2988
sunspot.year
1700〜1988年の年間太陽黒点数 時系列データ 長さ289 Start = 1700, End = 1988, Frequency = 1
sunspots
1749〜1983年の月別平均相対太陽黒点数 1749〜1960年まではスイス連邦天文台,1961年以降は東京天文台での観測 時系列データ 長さ2820
swiss Swiss Fertility and Socioeconomic Indicators(1888) Data
1888年のスイスの出生率,社会経済的指標データ データフレーム 47×6 Fertility 普通に標準化された出生率測定値 Agriculture 男性の農業従事者率(%) Examination 徴兵検査で最高位にマークされる召集兵の割合 Education 召集兵のうち小学校以上の学歴のあるものの割合 Catholic カソリック信者の割合 Infant.Mortality 1年未満で死亡する乳児の生産児に対する割合
treering
BC.6000〜1979年の正規化された年輪のデータ(次元なし,無名数) 時系列データ 長さ7980
trees
伐採された31本のアメリカザクラの直径,樹高,容積データ。周囲径は地上から4フィート6インチの高さでの周囲径。 データフレーム 31×3 Girth 直径(インチ) Height 樹高(フィート) Volume 容積(立方フィート)
uspop
1790〜1970年の10年ごとのアメリカの国勢調査人口(単位:100万人) 時系列データ 長さ19
volcano
オークランドのMaunga Whau火山の10メートル格子点の地形情報 行列 87×61 行は東西,列は南北
warpbreaks
織物を織るときの縦糸の織機当たり(一定の紡ぎ糸の長さ当たり)の切断数 データフレーム 54×3 breaks 切断数 wool ウールのタイプ(A, B) tension 糸の引っ張り度(L, M, H)
women
30〜39歳のアメリカ人女性の身長と体重 データフレーム 15×2 height 身長(インチ) weight 体重(ポンド)