Amazon Ads

2014年3月18日 星期二

【R筆記】R內建資料集

R中,有一些內建的資料集,在學習或練習時,可以用來當做原始資料,如:
> CO2
   Plant        Type  Treatment conc uptake
1    Qn1      Quebec nonchilled   95   16.0
2    Qn1      Quebec nonchilled  175   30.4
3    Qn1      Quebec nonchilled  250   34.8
4    Qn1      Quebec nonchilled  350   37.2
(以下略)
上列結果會列出CO2這資料集中的欄位和資料,若只是要看某一欄位內的資料,可以使用「資料集名稱$欄位名稱」的指令來取得,如:
> CO2$Plant
 [1] Qn1 Qn1 Qn1 Qn1 Qn1 Qn1 Qn1 Qn2 Qn2 Qn2 Qn2 Qn2 Qn2 Qn2 Qn3 Qn3 Qn3
[18] Qn3 Qn3 Qn3 Qn3 Qc1 Qc1 Qc1 Qc1 Qc1 Qc1 Qc1 Qc2 Qc2 Qc2 Qc2 Qc2 Qc2
[35] Qc2 Qc3 Qc3 Qc3 Qc3 Qc3 Qc3 Qc3 Mn1 Mn1 Mn1 Mn1 Mn1 Mn1 Mn1 Mn2 Mn2
[52] Mn2 Mn2 Mn2 Mn2 Mn2 Mn3 Mn3 Mn3 Mn3 Mn3 Mn3 Mn3 Mc1 Mc1 Mc1 Mc1 Mc1
[69] Mc1 Mc1 Mc2 Mc2 Mc2 Mc2 Mc2 Mc2 Mc2 Mc3 Mc3 Mc3 Mc3 Mc3 Mc3 Mc3
12 Levels: Qn1 < Qn2 < Qn3 < Qc1 < Qc3 < Qc2 < Mn3 < Mn2 < ... < Mc1
當我們要知道這些資料集中欄位意思等資訊,可以使用help()這個函式來開啟資料的相關文件:
> help(CO2)
或是
> ?CO2
就可以看到資料集描述、欄位定義與用法等資訊:


若要看目前可以使用的資料集有那些,可以使用data()這個函式:
> data()
執行後,就會出現資料集的說明文件:


若我們想要使用其他套件的資料集的話,也是可以使用data(),但此時要傳入兩個參數,第一個參數是我們要引入的「資料集名稱」,第二個參數是該資料集所在的「套件名稱」,如在MASS套件中,有一名為Cars93的資料集,在引入之前使用他,會得這樣的結果:
> Cars93
錯誤: 找不到物件 'Cars93'
若我們先執行下列指令:
> data(Cars93, package="MASS")
再看一次Cars93的內容,就會看到他的資料結構:
> Cars93
    Manufacturer          Model    Type Min.Price Price Max.Price
1          Acura        Integra   Small      12.9  15.9      18.8
2          Acura         Legend Midsize      29.2  33.9      38.7
3           Audi             90 Compact      25.9  29.1      32.3
4           Audi            100 Midsize      30.8  37.7      44.6
5            BMW           535i Midsize      23.7  30.0      36.2
6          Buick        Century Midsize      14.2  15.7      17.3
7          Buick        LeSabre   Large      19.9  20.8      21.7
8          Buick     Roadmaster   Large      22.6  23.7      24.9
9          Buick        Riviera Midsize      26.3  26.3      26.3
(以下略)
若我們己經有使用library()函式去引入MASS這個套件,則我們可以直接使用Cars93這個資料集。

要什麼引入與缷除套件,可以參考【R筆記】R的套件載入與缷除

如果你需要進一步地認識 R,我推薦:

還有只有 Kindle 版本的這本: