Infootsing ja andmekaeve (INT6081.DT)
Õppeaine kood
INT6081.DT
vana ainekood
Õppeaine nimetus eesti k
Infootsing ja andmekaeve
Õppeaine nimetus inglise k
Information Retrieval and Data Mining
Õppeaine maht EAP
5.0
Orienteeruv kontakttundide maht
45
Õpetamise semester
sügis
Kontrollivorm
eksam
2019/2020 sügissemestri õppejõud
Sirje Virkus (eesti keel) tavaline kursus
2019/2020 kevadsemestri õppejõud
õppejõud on määramata
Õppeaine eesmärgid
Kursuse eesmärgiks on arendada teadmisi infootsingu ja andmekaeve põhimõistetest,- tehnikatest ja rakendusvaldkondadest. Eesmärgiks on omandada teadmisi infootsingust ja andmehulkadest tähenduslike mustrite väljaselgitamise viisidest.
Õppeaine sisu lühikirjeldus
Andmete mõistmine, ettevalmistamine. Modelleerimine. Tulemuste hindamine. Rakendused. Tekstide indekseerimine, relevantsus, veebikasutuse analüütika, tekstianalüütika, hindamiskriteeriumid. Otsingumehhanismid ja andmekaeve rakendused.
Iseseisev töö
Andmekaeve rakenduste hindamine
Õppeaine õpiväljundid
Kursuse läbimisel üliõpilased:
tunnevad infootsingu tehnikaid (dokumentide indekseerimist ja -otsingut, päringutöötlust);
infootsisüsteemide kvantitatiivseid hindamismeetodeid ja andmekaeve tehnikaid;
tõenäosuslikke otsingumeetodeid ja järjestamise põhimõtteid;
praktilise infootsingu tehnikaid ja algoritme ning andmekaeve süsteeme nagu veebi otsingumootorid ja soovitussüsteemid;
MapReduce, portfooliootsingu ja onlinereklaami tehnikad ja väljakutsed.
Hindamismeetodid
Kirjalik eksam
Õppejõud
prof Sirje Virkus
Kohustuslik kirjandus
Attewell, P., Monaghan, D. B, Kwong, D. (2015). Data Mining for the Social Sciences: An Introduction. Oakland, California: University of California Press.
Baeza-Yates, R., Ribeiro-Neto, R. (2010). Modern Information Retrieval: The concepts and technology behind search. Addison-Wesley.
Croft, W. B., Metzler, D., Strohman, T. (2009). Search Engines: Information Retrieval in Practice. Addison-Wesley.
Manning, C. D., Raghavan, P., Schütze, H. (2008). Introduction to Information Retrieval. Cambridge University Press.
Tan, P-N., Steinbach, M., Kumar, V. (2006). Introduction to Data Mining. Addison-Wesley.
Asenduskirjandus
Bishop, C. M. (2006). Pattern Recognition and Machine Learning. Springer.
Grossman, D.A., Frieder, O. (2004). Information Retrieval: Algorithms and Heuristics. Springer.
Hollink, V., Kamps, J., Monz, C., de Rijke, M. (2004). Monolingual document retrieval for European languages, IR 7(1): 33-52.
Singhal, A. (2005). Challenges in running a commercial search engine. SIGIR.
Witten, I. H., Moffat, A., Bell T. C. (1999). Gigabytes. 2nd ed. Morgan Kaufmann, San Francisco, California.