Veergude valimine

Tavaline lähenemine. Saame kasutada valimiseks ridade ja veergude numbreid.

# veeru eraldamine
tabel[,1]#kõik read, aga ainult esimesest veerust
tabel[,"ekstravertsus"]#saab teha ka veeru nime alusel

Kui ei taha järjestikkuseid veerge eraldada:

data.frame(tabel$ekstravertsus,tabel$neurootilisus)

Veergude valimine dplyr paketis oleva select() funktsiooniga:

library(dplyr) #pakett tuleb enne installeerida (vt. slaididelt)
#uus_tabel <- select(tabel, sotsiaalsus, ekstravertsus) #teeme uue tabeli, kus on 2 veergud: sotsiaalsus ja ekstravertsus

Loogikaavaldiste kasutamine

# Loogikaavaldise kasutamine. Andmetest kindlate väärtuste eraldamine.
tabel[(tabel$vanus <= 30 & tabel$ekstravertsus > 100),] #jäävad osalejad, kelle vanus on väikesm või võrdne 30'ga. Nendest omakorda jäetakse osalejad, kelle ekstravertsuse skoor on üle 100.
##     vanus elukoht sotsiaalsus meelekindlus ekstravertsus neurootilisus
## 4      27     maa         153          114           123            58
## 9      23     maa         100           97           131            67
## 16     23     maa         132          126           131            72
## 20     25     maa         155          132           129           104
## 26     27    linn         130          127           107           112
## 34     21    linn         138          129           116            52
## 61     24     maa         124          108           105            69
## 62     30    linn         142          112           107            98
## 68     24     maa         133          141           105           109
## 82     30    linn         122           88           118           114
## 85     28     maa         106          131           127            52
## 89     19     maa         135          114           107            70
## 101    23    linn         150          178           150           100
## 104    28     maa         137          126           144            64
## 112    18    linn         128           88           103           107
## 119    30    linn         145          119           149            42
## 120    22     maa         101           99           107           116
## 126    29    linn         126          124           107            85
## 137    26     maa         116          108           110            76
## 143    26    linn         145           87           136            68
## 151    24     maa         131          134           112           111
## 152    20    linn         124           97           113           130
## 154    23    linn         159          136           117            93
## 165    25    linn         136          111           124            82
## 175    29     maa         112          125           116            87
## 198    19    linn         135          112           103           110
##     avatus depressioon traitanx stateanx
## 4      138           3       29       29
## 9      121           3       27       38
## 16     131           7       39       44
## 20     157          13       46       48
## 26      88          18       37       59
## 34     125           4       27       24
## 61     101           5       33       33
## 62     173           6       34       23
## 68     152           5       40       31
## 82     118          14       46       54
## 85     135           1       23       40
## 89     121           5       29       32
## 101    158           6       30       33
## 104    108           7       31       28
## 112    115           6       42       35
## 119    142           0       25       27
## 120    132           7       41       40
## 126    132           4       37       45
## 137    125           5       39       38
## 143    116           2       29       26
## 151    128          11       34       34
## 152    122          22       44       52
## 154    124           8       46       38
## 165    104          22       52       55
## 175    116           1       43       43
## 198    143           4       39       39
#kandilised sulud tähistavad eraldamist

Andmete sorteerimine ja järjestamine

#sorteerimine
sort(tabel$ekstravertsus)
# Järjestab tabeli vanus alusel:
tabel[order(tabel$vanus),]

#juhul kui vanused on võrdsed, siis järjestab sotsiaalsuse alusel
tabel[order(tabel$vanus, tabel$sotsiaalsus),]
# Tabeli järjestamine arrange() funktsiooniga
library(plyr)
arrange(tabel,vanus)
arrange(tabel,desc(vanus))

NA väärtused

# Mitu NA väärtust on andmetes
sum(is.na(tabel))
## [1] 4