Kursa kods InfT5050

Kredītpunkti 6

Datu zinātnes un mašīnmācīšanās algoritmi

Zinātnes nozareInformācijas tehnoloģija (nav zn)

Kopējais stundu skaits kursā162

Lekciju stundu skaits24

Semināru un praktisko darbu stundu skaits24

Studenta patstāvīgā darba stundu skaits114

Kursa apstiprinājuma datums06.09.2022

Atbildīgā struktūrvienībaDatoru sistēmu un datu zinātnes institūts

Kursa izstrādātājs

author asoc. prof.

Vitālijs Komašilovs

Dr. sc. ing.

Kursa anotācija

Studiju kursa mērķis ir apgūt mašīnmācīšanās praktiskos aspektus. Kursa ietvaros studenti gūs priekštatu par priekšapstrādes un vizualizācijas metodēm datu analīzei. Kursā tiek dots pārskats par visbiežāk sastopamajiem algoritmiem uzraudzītai un nepārraudzītai mācīšanām, kā arī sniegts ievads dziļajā mašīnmācīšanā.

Kursa rezultāti un to vērtēšana

Kursa apgūšanas rezultātā studenti:
•zina mašīnmācīšanās algoritmu teorētiskos aspektus – teorijas testi;
•prot izmantot praktiskas iemaņas, lai strādātu uz datiem balstītos projektos – praktiskie darbi;
•spēj lietot mūsdienīgās zinātniskās bibliotēkas (piemēram, NumPy, Pandas vai Scikit-learn) – praktiskie darbi;
•iegūst kompetenci strādāt ar datu analīzes un vizualizācijas rīkiem – praktiskie darbi.

Kursa saturs(kalendārs)

Šis ir lekciju tēmu [L] un praktisko darbu tēmu [P] grafiks:
1. [L] Ievads mašīnmācīšanā. [L / P] Jupyter vides un Ipython darba burtnīcu instalācija un izmantošana – 2 st
2. [P] NumPy apmācība. [L] Datu izpēte 4 st.
3. [P] Pandas apmācība I. [P] Pandas apmācība II – 4 st.
4. [P] Datu vizualizācijas rīki (Matplotlib un Seaborn) – 2 st
5. Datu analīzes tests un praktiskais darbs – 2 st
6. [L] Llineāra regresija. [L] Logistiskā regresija 2 st
7. [L] Validācija un normalizēšana. [P] Ievads Scikit-learn – 4 st
8. [L] Pārraudzīti mašīnmācīšanas modeļi. [L] Modeļu ansambļi 4 st.
9. [P] Validācija un konvejerapstrāde Scikit-learn bibliotēkā. [P] Pārraudzītas mašinmācīšanas piemērs 4 st.
10. [L] Nepārraudzīta mašīnmācīšanās. [P] Nepārraudzītas mašīnmācīšanās piemērs 4 st.
11. Mašīnmācīšanās tests un praktiskais darbs – 2 st.
12. [L] Ievads dziļā mašīnmācīšanā. [P] Ievads Google Colab un Keras 4 st.
13. [L] Neironu tīklu pamati. [P] Pilnsaistes neironu tīklu implementēšana 4 st.
14. [L] Konvolūciju neironu tīkli (CCN). [P] CNN realizācija Keras 4 st.

15. Dziļās mašīnmācīšanās tests un praktiskais darbs 2 st.

Prasības kredītpunktu iegūšanai

Kursa ietvaros studentiem jānokārto trīs teorijas testi un trīs praktiskie darbi par tēmām:
1. Datu analīze;
2. Mašinmācīšanās;
3. Dziļā mašīnmācīšanās.
Visiem praktiskiem darbiem ir jābūt obligāti izpildītiem un ieskaitītiem ar pozitīvu vērtējumu (vismaz 4 punkti).

Studējošo patstāvīgo darbu organizācijas un uzdevumu raksturojums

Studentiem patstāvīgi jāizpilda trīs praktiskie darbi. Studentiem nedēļas laikā no uzdevuma uzdošanas brīža, jāizanalizē darba uzdevums un jāuzsāk tā izpildīšana. Praktiskais darbs ir jāizpilda un jāiesniedz e-studijās trīs nedēļu laikā pēc tā uzdošanas.

Studiju rezultātu vērtēšanas kritēriji

Par katru testu un praktisko darbu tiek piešķirts punktu skaits (max 10 punkti), no kuriem tiek apreķināts vidējais aritmētiskais punktu skaits katram darba veidam atbilstoši.
Gala vērtējumu veido: teorijas testu vidējais aritmētiskais (30% no gala vērtējuma) un praktisko darbu vidējais aritmētiskais (70% no gala vērtējuma).

Obligātā literatūra

1. Russell S.J., Norvig P. Artificial intelligence: a modern approach. Malaysia: Pearson Education Limited, 2016.
2. Mitchell T. Machine Learning. New York: McGraw-Hill, 1997.
3. McKinney W. Python for Data Analysis. Beijing: O’ Reilly, 2013.

Papildliteratūra

1. Grus J. Data Science from Scratch. Beijing: O’ Reilly, 2015.
2. Han J., Kamber M. Data mining: concepts and techniques. 2nd ed. San Fransisco: Morgan Kaufmann; Amsterdam [etc.]: Elsevier, 2006. 770 p.

Periodika un citi informācijas avoti

MOOC course on Machine Learning. Pieejams: https://www.elementsofai.com/

Piezīmes

ITF maģistra akadēmiskā studiju programma „Informācijas tehnoloģijas”