Latviešu Krievu Angļu Vācu Franču
Statuss(Aktīvs) Izdruka Arhīvs(0) Studiju plāns Vecais plāns Kursu katalogs Vēsture

Kursa nosaukums Ievads datu zinātnē
Kursa kods InfTD019
Zinātnes nozare Informācijas tehnoloģija (nav zn)
Kredītpunkti (ECTS) 3
Kopējais stundu skaits kursā 81
Lekciju stundu skaits 12
Semināru un praktisko darbu stundu skaits 12
Studenta patstāvīgā darba stundu skaits 57
Kursa apstiprinājuma datums 28/09/2022
Atbildīgā struktūrvienība Datoru sistēmu un datu zinātnes institūts
 
Kursa izstrādātājs(-i)
Dr. agr., prof. Līga Paura
Dr. sc. ing., prof. Irina Arhipova
Doktora(līm.), Paolo Mignone
Doktora(līm.), Domenico Redavid
Dr. sc. ing., prof. Gatis Vītols

Priekšzināšanas
Kursam priekšzināšanas nav nepieciešamas
 
Kursa anotācija
Studiju kursā tiek apskatīta datu bāzu pārvaldība un datizraces algoritmi (data mining algorithms), kas sniedz atbalstu vairāku jautājumu risināšanai un efektīvai lēmumu pieņemšanai.
Pēdējo desmit gadu laikā ir piedzīvotas dziļas sociāli ekonomiskās pārmaiņas un vairākās jomās vērojama lielāka interese un nozīme datu un informācijas apkopošanai un apstrādei. Postindustriālajā sabiedrībā informācija netiek uzskatīta tikai par palīginstrumentu, bet par rīku pareizu lēmumu pieņemšanai, kas nepieciešama uzņēmuma vai organizācijas attīstībai.
Studiju kursa apgūšanas mērķis – sniegt studējošiem padziļinātas zināšanas un prasmes datu bāzu pārvaldībā un datizraces algoritmos (data mining algorithm) pielietošanā, kā arī datu apstrādes un analīzes rezultātu interpretācijā un prezentēšanā.
Kursa rezultāti un to vērtēšana
Zināšanas:
•spēj parādīt padziļinātas zināšanas un izpratni par datizraces algoritmiem - patstāvīgais darbs ar aprēķiniem;
•zināšanas un izpratne par datizraces algoritmu izvēles pamatprincipiem pēc izvirzītajiem pētījuma uzdevumiem - izpildīti praktiskie darbi un patstāvīgais darbs;
Profesionālās un vispārīgās prasmes:
•Spēj patstāvīgi veikt projekta realizāciju, sākot ar datu iegūšanu, datu atlasi, pirmsapstrādi un transformāciju, izmantojot datu apstrādes rīkus - izpildīti praktiskie darbi, patstāvīgais darbs ar aprēķiniem.
•Spēj argumentēti izskaidrot un diskutēt par datu ieguves algoritmiem, to pielietošanu un realizēšanu konkrētās problemātikas pētījumam - izpildīti praktiskie darbi, patstāvīgais darbs ar aprēķiniem, prezentēts patstāvīgais darbs;
Kompetences:
•Spēj patstāvīgi veikt datu vizualizāciju un apstrādi, izmantojot datu apstrādes programmatūru – patstāvīgais darbs ar aprēķiniem;
•Spēj patstāvīgi interpretēt iegūtos rezultātus, formulēt secinājumus, pamatot lēmumus un veikt to analīzi – izstrādāts un aizstāvēts patstāvīgais darbs ar aprēķiniem;
Komunikācijas prasmes:
•Spēj izskaidrot kursa programmā iekļautās tēmas, izmantojot profesionālo terminoloģiju - aizstāvēts patstāvīgais darbs.
Spēja mācīties:
•Spēj patstāvīgi apgūt tēmas, kas ir iekļautas studiju kursa programmā - izstrādāts patstāvīgais darbs.
Kursa saturs(kalendārs)
1.Ievads CRISP-DM industriālajā metodoloģijā. [Lekcijas - 1h]
2.Zināšanu atklāšana datu bāzēs (KDD). [Lekcijas - 1h]
3.Datu vadības risinājumu pielietošanas sfēru izpratne . [Lekcijas - 1h]
4.Datu masīva izveidošana: datu tīrīšana, datu pirmsapstrāde, datu samazināšana. [Lekcijas - 2h]
5.Datu izvēles uzdevuma izvēle. [Lekcijas - 1h]
6.Datu izvēles algoritma(-u) izvēle. [Lekcijas - 1h]
7.Datizraces šablonu interpretācija [Lekcijas - 1h]
8.Datu pirmsapstrādes, transformācijas and validācijas metodes un modeļi. [Lekcijas - 2h]
9.“Well-Known” datu ieguves algoritmi. [Lekcijas - 2h]
10.Mainīgo sakarības analīzes metodes. [Lekcijas - 1h]
11.Regresijas analīze [Lekcijas - 1h]
12.Naivais Beijesa algoritms. [Lekcijas - 2h]
13.Praktiskie darbi: datu atlase, pirmapstrāde un transformācija izmantojot datu izvēles programmatūru. [Praktiskie darbi - 8h]
14.Praktiskie darbi: datizraces rīku lietošana prognožu un raksturojošo zināšanu izgūšanai dažādās sfērās. Praktiskos darbos akcentētas uzņēmējdarbības un zinātnes sfēras. [Praktiskie darbi - 8h]
Patstāvīgais darbs: balstoties uz izvēlēto datu masīvu, veikt masīva pirmsapstrādi, aprēķinus un iegūto rezultātu interpretāciju.
Prasības kredītpunktu iegūšanai
Kursa ietvaros paredzēti praktiskie darbi, kas veicami praktisko darbu laikā auditorijā. Viens patstāvīgais darbs, kas veicams patstāvīgi. Studiju kursa noslēguma vērtējums – ieskaite. Lai saņemtu kredītpunktus, studentiem ir sekmīgi jāizpilda Zināšanu atklāšanas datu bāzē (KDD) (Knowledge Discovery in Databases) process izvēlētajai datu kopai.
Studējošo patstāvīgo darbu organizācijas un uzdevumu raksturojums
Studiju kursa ietvaros patstāvīgām studijām atvēlēts 48 stundas individuālā darba izstrādei.
Nepieciešams izpildīt visus soļus, kas paredzēti procesā: Zināšanu Atklāšanas Datu bāzēs (KDD). Biznesa procesu izzināšana tiek uzsākta ar konkrētu datu kopu, kas simulēta reālajā situācijā. Citi KDD procesa soļi tiek realizēti vadoties pēc CRISP-DM standarta. Doktorantiem ir nepieciešams prezentēt visas KDD procesa fāzes, lietojot CRISP-DM, kuru ietvaros studenti apstrādā konkrētas jomas datu kopu, kas iegūta no publicētajām datu kopām tīmeklī.
Studiju rezultātu vērtēšanas kritēriji
Studiju kurss ir ieskaitīts, ja ir izpildīti visi praktiskie darbi, izstrādāts un aizstāvēts mājas darbs. Darba vērtējums ir atkarīgs no patstāvīgā darba izpildes pakāpes. Patstāvīgā darba sagatavošana (40 punkti), prezentēšana (20 punkti) un iegūto rezultātu interpretācija (40 punkti). Darbs ir ieskaitīts, ja ir iegūti 50 punkti.
Obligātā literatūra
1.Ethem Alpaydin. Introduction to Machine Learning. Fourth Edition: The MIT Press, 2020. - 659 p.
2.Laura Igual, Santi Seguí. Introduction to Data Science. A Python Approach to Concepts, Techniques and Applications. – Switzerland: Springer International Publishing, 2017. - 217 p.
3.Oded Maimon, Lior Rokach. Data Mining and Knowledge Discovery Handbook. Springer New York, NY, 2010. - 1285 p.
Papildliteratūra
1.Ian H. Witten, Eibe Frank and Mark A. Hall. Data Mining: Practical Machine Learning Tools and Techniques. - Elsevier Science, 2011. – 1190 p.
2.Data science & big data analytics: discovering, analyzing, visualizing and presenting data / EMC Education Services. - Indianapolis, IN: John Wiley and Sons, 2015. - xviii, 410 p.
3.Weka Wiki: The University of Waikato. Pieejams: https://waikato.github.io/weka-wiki/documentation/
Periodika un citi informācijas avoti
1.Journal of Data Analysis and Information Processing: ISSN Online: 2327-7203, www.scirp.org/journal/jdaip
Piezīmes
Izvēles kurss LBTU doktora studiju programmu studentiem.