Excel
Kursa nosaukums Datizraces pamati
Kursa kods InfT4030
Zinātnes nozare Elektrotehnika, elektronika, informācijas un komunikāciju tehnoloģijas
Zinātnes apakšnozare Datorvadība
Kredītpunkti (ECTS) 3
Kopējais stundu skaits kursā 81
Lekciju stundu skaits 16
Semināru un praktisko darbu stundu skaits 16
Studenta patstāvīgā darba stundu skaits 49
Kursa apstiprinājuma datums 12/01/2016
Atbildīgā struktūrvienība Datoru sistēmu un datu zinātnes institūts
 
Kursa izstrādātājs(-i)
Mg. sc. ing., lekt. Ingus Šmits

Priekšzināšanas
Kursam priekšzināšanas nav nepieciešamas
 
Kursa anotācija
Kursa ietvaros studenti tiek iepazīstināti ar datizraces uzdevumiem, to risināšanas un rezultātu analīzes metodēm. Praktisko nodarbību laikā tiek pētītas datizraces algoritmu pielietošanas iespējas reālu uzdevumu risināšanā. Praktisko darbu ietvaros apskatāmo algoritmu realizācijas tiek veidotas lietojot C# programmēšanas valodu.
Kursa rezultāti un to vērtēšana
• Zināšanas datizraces principiem;
• prasmes izvēlēties piemērotu risināšanas metodi datizraces problēmām; • kompetence patstāvīgi pielāgot datizraces algoritmus konkrētas problēmas risināšanai, analizēt iegūtos rezultātus.
Kursa saturs(kalendārs)
1 Datu pirmapstrāde
2 „Naivā” Beijesa klasifkācijas metode, tuvākā kaimiņa klasifikācijas metode
3 Lēmumu koku izveides algoritms, entropijas izmantošana atribūtu iedalījumu noteikšanai, frekvenču tabulas iedalījumu
4 Klasificēšanas precizitātes noteikšana
5 Algoritms globālai diskretizācijai
6 Nevienozīmīgas klasifikācijas gadījumu apstrāde
7 Lēmumu koka atzarojuma līmeņa samazināšana datu pirmsapstrādē un pēcapstrādē.
8 Prism algoritms
9 Klasifikatora veiktspējas noteikšana
10 Asociāciju likumu iegūšana
11 Asociatīvo likumu ģenerēšana un to nozīmīguma mērīšana
12 Klāsterizēšanas algoritmi - k-mean algoritms
13 Klāsterizēšanas algoritmi - hierarhiskie klāsterizēšanas algoritmi
14 Klāsterizēšanas algoritmi - ātrie klāsterizēšanas algoritmi
15 Datizraces algoritmi darbam ar teksta kopām 16 Kursa projekta aizstāvēšana
Prasības kredītpunktu iegūšanai
Ir izstrādāts kursa projekts un laicīgi iesniegta un aizstāvēta vismaz puse praktisko darbu.
Studenta kopējais vērtējums priekšmetā sastāvēs no šādām komponentēm:
1.praktisko darbu vērtējums (60%); 2.projekta vērtējums (40%).
Obligātā literatūra
1. McKnight P.E., McKnight M., Sidani S., Figueredo A.J. Missing Data. A gentle introduction. The Guilford press, New York, London, 2007.
2. Bramer M. Principles of Data Mining, London: Springer Verlag, 2007. 3. Барсегян А.А., Куприянов М.С., Цтепаненко Б.Б., Холод И. И. Технологии анализа данних: Data Mining, Visual Mining, Text Minig, Olap, Санкт-Петербург: БХВ- Петербург, 2007. 375 c.
Piezīmes
Obligātais izvēles studiju kurss ITF akadēmiskās bakalaura studiju programmas „Datorvadība un datorzinātnes”.