Andmeanalüüsi lahendused R-keeles (IFI6098.DT)
Õppeaine kood
IFI6098.DT
vana ainekood
IFI6098
Õppeaine nimetus eesti k
Andmeanalüüsi lahendused R-keeles
Õppeaine nimetus inglise k
Statistical Analysis Solutions in R
Õppeaine maht EAP
4.0
Orienteeruv kontakttundide maht
56
Õpetamise semester
sügis-kevad
Kontrollivorm
eksam
2019/2020 sügissemestri õppejõud
Jaagup Kippar (eesti keel) e-toega kursus
2019/2020 kevadsemestri õppejõud
õppejõud on määramata
Õppeaine eesmärgid
Luua eeldused automatiseeritud andmeanalüüsi oskuste ja vilumuste kujundamiseks, sobivate mooduste leidmiseks konkreetsete andmete esitamiseks ning nende põhjal järelduste tegemiseks.
Õppeaine sisu lühikirjeldus
Andmeanalüüsi põhiteemade kordamine reaalsete uurimisprojektide näitel. R-keele kasutusvaldkonnad, võimalused ja piirangud. R-keele kasutamine koos teiste arendusvahendite ja tehnoloogiatega. Matemaatilise modelleerimise näited. Reaalsete nähtuste tunnuste kohandamine modelleeritavale kujule. Seoste ja sõltuvuste leidmine ja kontrollimine. Arvutuste tulemuste interpreteerimine reaalses keskkonnas, algsel kohandamisel tehtud piirangute arvestamine. Mudelid ökosüsteemides, meteoroloogias, liikluses. Multidimensionaalne skaleerimine, kasutatavad valemid. R-keele süntaks. Avaldised, vektorid, maatriksid, standardsed statistikafunktsioonid. Tulemuste graafiline esitamine. Lisapakettide kasutamine. Sisend failist ja väljund faili. Iteratsioonid. Veebist kättesaadavate andmete kohandamine analüüsiks sobivale kujule. Andmebaaside ning XML-allikate kasutamine.
Iseseisev töö
Viidatud materjalidega tutvumine, tunnis alustatud lahenduste kodus lõpetamine. Kodutööde koostamine:
* Põhiliste statiliste seoste kuvamine ning graafikute joonistamine näitandmete põhjal
* SQL-andmebaasidest ning XMLina veebist tõmmatud andmete põhjal statistilise kokkuvõtte tegemine
* Multidimensionaalse skaleerimise näite loomine ning tulemuste esitamine.
* Tegelikult kasutatava loodusteadusliku mudeli tutvustus ja analüüs
* Loodusteadusliku modelleerimisülesande koostamine ja lahendamine.
* Grupitööna mitmetasemelise modelleerimisülesande koostamine ja lahendamine. Lihtsustuste kirjeldamine, samale ülesandele mitmesuguse täpsusega algoritmi loomine, iteratsioonide läbimine ning tulemuste interpreteerimine ja esitamine.
* Õppeaine kordamisküsimuste seminaril aktiivne osalemine
* Eksamiülesande lahendamine ning kaasneva teoreetilise poole selgitamine
Õppeaine õpiväljundid
Tunneb automatiseeritud andmeanalüüsi võimalusi ja piiranguid
Oskab kavandada ning programmeerida reaalse nähtuse jaoks kasutatava mudeli ning selle abil saadavaid tulemusi interpreteerida
Hindamismeetodid
Eksam koosneb praktilisest ja teoreetilisest osast.
Hinde kujunemisel arvestatakse kodutööde taset ja aktiivset osalemist seminarides.
Õppejõud
Jaagup Kippar
Kohustuslik kirjandus
The R Book ftp://ftp.tuebingen.mpg.de/pub/kyb/bresciani/Crawley%20-%20The%20R%20Book.pdf
Lisainfo
Aines osalemiseks on soovitatavad eelteadmised aine IFI7041 "Andmeanalüüs: statistiline andmestik ja kirjeldav statistika" või IFI6201.DT " Teaduslik mõtteviis" mahus.
Asenduskirjandus
Kursuse asenduskirjanduse alusel läbimine lubatud vaid eraldi kokkuleppel õppejõuga.