Tavaline lähenemine. Saame kasutada valimiseks ridade ja veergude numbreid.
# veeru eraldamine
tabel[,1]#kõik read, aga ainult esimesest veerust
tabel[,"ekstravertsus"]#saab teha ka veeru nime alusel
Kui ei taha järjestikkuseid veerge eraldada:
data.frame(tabel$ekstravertsus,tabel$neurootilisus)
Veergude valimine dplyr paketis oleva select() funktsiooniga:
library(dplyr) #pakett tuleb enne installeerida (vt. slaididelt)
#uus_tabel <- select(tabel, sotsiaalsus, ekstravertsus) #teeme uue tabeli, kus on 2 veergud: sotsiaalsus ja ekstravertsus
# Loogikaavaldise kasutamine. Andmetest kindlate väärtuste eraldamine.
tabel[(tabel$vanus <= 30 & tabel$ekstravertsus > 100),] #jäävad osalejad, kelle vanus on väikesm või võrdne 30'ga. Nendest omakorda jäetakse osalejad, kelle ekstravertsuse skoor on üle 100.
## vanus elukoht sotsiaalsus meelekindlus ekstravertsus neurootilisus
## 4 27 maa 153 114 123 58
## 9 23 maa 100 97 131 67
## 16 23 maa 132 126 131 72
## 20 25 maa 155 132 129 104
## 26 27 linn 130 127 107 112
## 34 21 linn 138 129 116 52
## 61 24 maa 124 108 105 69
## 62 30 linn 142 112 107 98
## 68 24 maa 133 141 105 109
## 82 30 linn 122 88 118 114
## 85 28 maa 106 131 127 52
## 89 19 maa 135 114 107 70
## 101 23 linn 150 178 150 100
## 104 28 maa 137 126 144 64
## 112 18 linn 128 88 103 107
## 119 30 linn 145 119 149 42
## 120 22 maa 101 99 107 116
## 126 29 linn 126 124 107 85
## 137 26 maa 116 108 110 76
## 143 26 linn 145 87 136 68
## 151 24 maa 131 134 112 111
## 152 20 linn 124 97 113 130
## 154 23 linn 159 136 117 93
## 165 25 linn 136 111 124 82
## 175 29 maa 112 125 116 87
## 198 19 linn 135 112 103 110
## avatus depressioon traitanx stateanx
## 4 138 3 29 29
## 9 121 3 27 38
## 16 131 7 39 44
## 20 157 13 46 48
## 26 88 18 37 59
## 34 125 4 27 24
## 61 101 5 33 33
## 62 173 6 34 23
## 68 152 5 40 31
## 82 118 14 46 54
## 85 135 1 23 40
## 89 121 5 29 32
## 101 158 6 30 33
## 104 108 7 31 28
## 112 115 6 42 35
## 119 142 0 25 27
## 120 132 7 41 40
## 126 132 4 37 45
## 137 125 5 39 38
## 143 116 2 29 26
## 151 128 11 34 34
## 152 122 22 44 52
## 154 124 8 46 38
## 165 104 22 52 55
## 175 116 1 43 43
## 198 143 4 39 39
#kandilised sulud tähistavad eraldamist
#sorteerimine
sort(tabel$ekstravertsus)
# Järjestab tabeli vanus alusel:
tabel[order(tabel$vanus),]
#juhul kui vanused on võrdsed, siis järjestab sotsiaalsuse alusel
tabel[order(tabel$vanus, tabel$sotsiaalsus),]
# Tabeli järjestamine arrange() funktsiooniga
library(plyr)
arrange(tabel,vanus)
arrange(tabel,desc(vanus))
# Mitu NA väärtust on andmetes
sum(is.na(tabel))
## [1] 4