Kursa kods InfT4030

Kredītpunkti 3

Datizraces pamati

Zinātnes nozareElektrotehnika, elektronika, informācijas un komunikāciju tehnoloģijas

Zinātnes apakšnozareDatorvadība

Kopējais stundu skaits kursā81

Lekciju stundu skaits16

Semināru un praktisko darbu stundu skaits16

Studenta patstāvīgā darba stundu skaits49

Kursa apstiprinājuma datums12.01.2016

Atbildīgā struktūrvienībaDatoru sistēmu un datu zinātnes institūts

Kursa izstrādātājs

author lekt.

Ingus Šmits

Mg. sc. ing.

Kursa anotācija

Kursa ietvaros studenti tiek iepazīstināti ar datizraces uzdevumiem, to risināšanas un rezultātu analīzes metodēm. Praktisko nodarbību laikā tiek pētītas datizraces algoritmu pielietošanas iespējas reālu uzdevumu risināšanā. Praktisko darbu ietvaros apskatāmo algoritmu realizācijas tiek veidotas lietojot C# programmēšanas valodu.

Kursa rezultāti un to vērtēšana

• Zināšanas datizraces principiem;
• prasmes izvēlēties piemērotu risināšanas metodi datizraces problēmām;
• kompetence patstāvīgi pielāgot datizraces algoritmus konkrētas problēmas risināšanai, analizēt iegūtos rezultātus.

Kursa saturs(kalendārs)

1 Datu pirmapstrāde
2 „Naivā” Beijesa klasifkācijas metode, tuvākā kaimiņa klasifikācijas metode
3 Lēmumu koku izveides algoritms, entropijas izmantošana atribūtu iedalījumu noteikšanai, frekvenču tabulas iedalījumu
4 Klasificēšanas precizitātes noteikšana
5 Algoritms globālai diskretizācijai
6 Nevienozīmīgas klasifikācijas gadījumu apstrāde
7 Lēmumu koka atzarojuma līmeņa samazināšana datu pirmsapstrādē un pēcapstrādē.
8 Prism algoritms
9 Klasifikatora veiktspējas noteikšana
10 Asociāciju likumu iegūšana
11 Asociatīvo likumu ģenerēšana un to nozīmīguma mērīšana
12 Klāsterizēšanas algoritmi - k-mean algoritms
13 Klāsterizēšanas algoritmi - hierarhiskie klāsterizēšanas algoritmi
14 Klāsterizēšanas algoritmi - ātrie klāsterizēšanas algoritmi
15 Datizraces algoritmi darbam ar teksta kopām
16 Kursa projekta aizstāvēšana

Prasības kredītpunktu iegūšanai

Ir izstrādāts kursa projekts un laicīgi iesniegta un aizstāvēta vismaz puse praktisko darbu.
Studenta kopējais vērtējums priekšmetā sastāvēs no šādām komponentēm:
1.praktisko darbu vērtējums (60%);
2.projekta vērtējums (40%).

Obligātā literatūra

1. McKnight P.E., McKnight M., Sidani S., Figueredo A.J. Missing Data. A gentle introduction. The Guilford press, New York, London, 2007.
2. Bramer M. Principles of Data Mining, London: Springer Verlag, 2007.
3. Барсегян А.А., Куприянов М.С., Цтепаненко Б.Б., Холод И. И. Технологии анализа данних: Data Mining, Visual Mining, Text Minig, Olap, Санкт-Петербург: БХВ- Петербург, 2007. 375 c.

Piezīmes

Obligātais izvēles studiju kurss ITF akadēmiskās bakalaura studiju programmas „Datorvadība un datorzinātnes”.