Infootsing ja andmekaeve (INT6081.DT)
space
Õppeaine kood
INT6081.DT
vana ainekood
Õppeaine nimetus eesti k
Infootsing ja andmekaeve
Õppeaine nimetus inglise k
Information Retrieval and Data Mining
Õppeaine maht EAP
5.0
Orienteeruv kontakttundide maht
45
Õpetamise semester
sügis
Kontrollivorm
eksam
2020/2021 sügissemestri õppejõud
Sirje Virkus (eesti keel) e-kursus
2020/2021 kevadsemestri õppejõud
õppejõud on määramata
Õppeaine eesmärgid
Kursuse eesmärgiks on arendada teadmisi infootsingu ja andmekaeve põhimõistetest,- tehnikatest ja rakendusvaldkondadest. Eesmärgiks on omandada teadmisi infootsingust ja andmehulkadest tähenduslike mustrite väljaselgitamise viisidest.
Õppeaine sisu lühikirjeldus
Andmete mõistmine, ettevalmistamine. Modelleerimine. Tulemuste hindamine. Rakendused. Tekstide indekseerimine, relevantsus, veebikasutuse analüütika, tekstianalüütika, hindamiskriteeriumid. Otsingumehhanismid ja andmekaeve rakendused.
Iseseisev töö
Andmekaeve rakenduste hindamine
Õppeaine õpiväljundid
Kursuse läbimisel üliõpilased:
tunnevad infootsingu tehnikaid (dokumentide indekseerimist ja -otsingut, päringutöötlust);
infootsisüsteemide kvantitatiivseid hindamismeetodeid ja andmekaeve tehnikaid;
tõenäosuslikke otsingumeetodeid ja järjestamise põhimõtteid;
praktilise infootsingu tehnikaid ja algoritme ning andmekaeve süsteeme nagu veebi otsingumootorid ja soovitussüsteemid;
MapReduce, portfooliootsingu ja onlinereklaami tehnikad ja väljakutsed.
Hindamismeetodid
Kirjalik eksam
Õppejõud
prof Sirje Virkus
Asenduskirjandus
Bishop, C. M. (2006). Pattern Recognition and Machine Learning. Springer.
Grossman, D.A., Frieder, O. (2004). Information Retrieval: Algorithms and Heuristics. Springer.
Hollink, V., Kamps, J., Monz, C., de Rijke, M. (2004). Monolingual document retrieval for European languages, IR 7(1): 33-52.
Singhal, A. (2005). Challenges in running a commercial search engine. SIGIR.
Witten, I. H., Moffat, A., Bell T. C. (1999). Gigabytes. 2nd ed. Morgan Kaufmann, San Francisco, California.
space