Kursa kods InfT5050

Kredītpunkti 4

Datu zinātnes un mašīnmācīšanās algoritmi

Zinātnes nozareInformācijas tehnoloģija (nav zn)

Kopējais stundu skaits kursā160

Lekciju stundu skaits24

Semināru un praktisko darbu stundu skaits24

Studenta patstāvīgā darba stundu skaits112

Kursa apstiprinājuma datums29.01.2020

Atbildīgā struktūrvienībaDatoru sistēmu katedra

Kursa izstrādātājs

author doc.

Vitālijs Komašilovs

Dr. sc. ing.

Kursa anotācija

Kurss ir vērsts uz mašīnmācīšanās praktiskajiem aspektiem. Kursa ietvaros studenti gūs priekštatu par priekšapstrādes un vizualizācijas metodēm datu analīzei. Kursā tiek dots pārskats par visbiežāk sastopamajiem algoritmiem uzraudzītai un nepārraudzītai mācīšanām, kā arī sniegts ievads dziļajā mašīnmācīšanā.

Kursa rezultāti un to vērtēšana

Kursa apgūšanas rezultātā studenti:
• apgūst mašīnmācīšanās algoritmu teorētiskos aspektus – teorijas testi;
• attīsta praktiskas iemaņas, lai strādātu uz datiem balstītos projektos – praktiskie darbi;
• apgūst prasmes, kā Python lietot mūsdienīgās zinātniskās bibliotēkas (piemēram, NumPy, Pandas vai Scikit-learn) – praktiskie darbi;
• iegūst kompetenci strādāt ar datu analīzes un vizualizācijas rīkiem – praktiskie darbi.

Kursa saturs(kalendārs)

Šis ir lekciju tēmu [L] un praktisko darbu tēmu [P] grafiks:
1. [L] Ievads mašīnmācīšanā. [L / P] Jupyter vides un Ipython darba burtnīcu instalācija un izmantošana – 2 st
2. [P] NumPy apmācība. [L] Datu izpēte 4 st.
3. [P] Pandas apmācība I. [P] Pandas apmācība II – 4 st.
4. [P] Datu vizualizācijas rīki (Matplotlib un Seaborn) – 2 st
5. Datu analīzes tests un praktiskais darbs – 2 st
6. [L] Llineāra regresija. [L] Logistiskā regresija 2 st
7. [L] Validācija un normalizēšana. [P] Ievads Scikit-learn – 4 st
8. [L] Pārraudzīti mašīnmācīšanas modeļi. [L] Modeļu ansambļi 4 st.
9. [P] Validācija un konvejerapstrāde Scikit-learn bibliotēkā. [P] Pārraudzītas mašinmācīšanas piemērs 4 st.
10. [L] Nepārraudzīta mašīnmācīšanās. [P] Nepārraudzītas mašīnmācīšanās piemērs 4 st.
11. Mašīnmācīšanās tests un praktiskais darbs – 2 st.
12. [L] Ievads dziļā mašīnmācīšanā. [P] Ievads Google Colab un Keras 4 st.
13. [L] Neironu tīklu pamati. [P] Pilnsaistes neironu tīklu implementēšana 4 st.
14. [L] Konvolūciju neironu tīkli (CCN). [P] CNN realizācija Keras 4 st.

15. Dziļās mašīnmācīšanās tests un praktiskais darbs 2 st.

Prasības kredītpunktu iegūšanai

Kursa ietvaros studentiem jānokārto trīs teorijas testi un trīs praktiskie darbi par tēmām:
1. Datu analīze;
2. Mašinmācīšanās;
3. Dziļā mašīnmācīšanās.
Visiem praktiskiem darbiem ir jābūt obligāti izpildītiem un ieskaitītiem ar pozitīvu vērtējumu (vismaz 4 punkti).

Studējošo patstāvīgo darbu organizācijas un uzdevumu raksturojums

Studentiem patstāvīgi jāizpilda trīs praktiskie darbi. Studentiem nedēļas laikā no uzdevuma uzdošanas brīža, jāizanalizē darba uzdevums un jāuzsāk tā izpildīšana. Praktiskais darbs ir jāizpilda un jāiesniedz e-studijās trīs nedēļu laikā pēc tā uzdošanas.

Studiju rezultātu vērtēšanas kritēriji

Par katru testu un praktisko darbu tiek piešķirts punktu skaits (max 10 punkti), no kuriem tiek apreķināts vidējais aritmētiskais punktu skaits katram darba veidam atbilstoši.
Gala vērtējumu veido: teorijas testu vidējais aritmētiskais (30% no gala vērtējuma) un praktisko darbu vidējais aritmētiskais (70% no gala vērtējuma).

Pamatliteratūra

1. Russell S.J., Norvig P. Artificial intelligence: a modern approach. Malaysia: Pearson Education Limited, 2016. Nav lielākajās b-kās
2. Mitchell T. Machine Learning. New York: McGraw-Hill, 1997. N

3. McKinney W. Python for Data Analysis. Beijing: O’ Reilly, 2013. Han, Jiawei. Data mining : concepts and techniques / Jiawei Han, Micheline Kamber. 2nd ed. San Fransisco : Morgan Kaufmann ;Amsterdam [etc.] : Elsevier, c2006. xxviii, 770 lpp

Papildliteratūra

1. Grus J. Data Science from Scratch. Beijing: O’ Reilly, 2015.
2. Han J., Kamber,, M. Data Mining: Concepts and Techniques. San Fransisco: Morgan Kaufmann, 2001. , ir 2006 g. 1 eks
Han J., Kamber M. Data mining: concepts and techniques. 2nd ed. San Fransisco: Morgan Kaufmann; Amsterdam [etc.]: Elsevier, 2006. 770 p.

Periodika un citi informācijas avoti

MOOC course on Machine Learning: https://www.elementsofai.com/

Piezīmes

ITF maģistra akadēmiskā studiju programma „Informācijas tehnoloģijas”