dplyr
Cieľom druhého cvičenia je osvojiť si použitie funkcií pre cyklické spracovanie, nacítať dáta z rôznych súborov a predspracovať ich pomocou knižnice dplyr
.
apply()
Funkcia apply()
sa používa na evaluáciu funkcie v rámci ohraničení poľa.
To znamená, že si vyberiem pole (často sú to riadky alebo stĺpce matice), na ktoré aplikujem zvolenú funkciu.
Prvý uvedený príklad aplikuje funkciu sum
na stpĺce a následne na riadky matice M. Spusti skript a sleduj čo sa udeje v druhom príklade.
lapply()
, sapply()
Funkcia lapply()
sa používa pri zoznamoch (list), pričom výsledok je opäť zoznam (list). Ak máme na vstupe iný dátový typ, môžeme ho jednoducho zmeniť prílazom as.list()
. Funkcia sapply()
sa snaží zjednodušiť výsledok lapply()
.
Výsledkom sapply()
je:
lapply()
. mapply()
Na základe nasledujúcich príkladov popíšte funkciu mapply()
:
tapply()
, split()
Funkcia tapply()
vypočíta zadanú funkciu pre každú faktorovú premennú vo vektore.
Je to veľmi užitočná funkcia, ktorá vám umožňuje vytvoriť podmnožinu vektora a potom aplikovať niektoré funkcie na každú z podmnožín.
Vstupom je vektor a dátovy typ ktorý je alebo môže byť prevedený na faktor.
Funkcia split()
rozdelí vstup do skupín podľa faktorov.
Vo vašom pracovnom priečinku si vytvorte prieňčinok DATA. nastavte cestu do tohto priečinka a na základe nasledujúceho skriptu stiahnite dáta, ktoré pomenujeme iris.csv:
Pokračujte stiahnutím dát z úlohy 2.1.
Textové súbory načítavame pomocou read.table()
. Pre .csv súbory existuje špeciálny
typ funkcie read.table()
a to read.csv()
a read.csv2()
, pričom:
read.csv()
ma default separátor , a desatinnú čiarku .read.csv2()
ma default separátor ; a desatinnú čiarku ,head()
a tail()
.
Pokračujte načítaním dát z úlohy 2.2.
Otvorte v prehliadači tento JSON súbor a oboznámte sa s jeho štruktúrou.
Následne načítajte tento JSON súbor do R a vykonajte nasludujúce príkazy: Pokračujte úlohou 2.3.Stihanite si dáta zo web stránky http://people.tuke.sk/viera.maslej.kresnakova/JDA/camera.csv, uložte ich do priečinku DATA a pomenujte ich camera.csv
Načítajte dáta camera ako tabuľku, csv alebo csv2 a vypíšte prvých 5 riadkov.
Načítajte dáta z https://api.github.com/users/jtleek/repos, vypíšte zo stĺpca OWNER všetky LOGIN.