Příprava dat je nutnou podmínkou jakékoli následné analýzy. Chybná nebo nekvalitní příprava má za následek chybné závěry či nevhodné modely. V dataminingové metodologii CRISP-DM je přípravě dat věnována jedna fáze, kterou uživatelé hodnotí jako časově nejnáročnější. V praxi neexistují data, která by nevyžadovala žádné úpravy před analýzou a modelováním. Typické operace ve fázi přípravy dat zahrnují slučování zdrojů, agregování, restrukturalizaci, prosté i sekvenční odvozování atributů, formátování, výběry, doplňování vynechaných hodnot či hledání duplicit. Ačkoli lze mnohé operace zapsat v SQL nebo nějakém programovacím jazyce, tento přístup je časově náročný, nepřehledný a odvádí pozornost dataminera od cíle projektu.
Cílem kurzu je naučit účastníky připravovat si data pomocí vizuálního programování v prostředí IBM SPSS Modeler. Naučí se pracovat s procesními uzly tohoto softwaru, osvojí si i speciální manipulační funkce jazyka CLEM. Společně s přípravou dat se budeme věnovat i jejich vizualizaci, neboť interaktivní grafika IBM SPSS Modeler umožňuje generovat mnoho datových manipulací ad hoc přímo z grafů.
Kurz je určen pro analytiky, dataminery a datové specialisty, kteří budou pro svou práci používat nebo používají software IBM SPSS Modeler.
Pro úspěšné absolvování kurzu postačí uživatelská znalost práce na počítači, ovládat software IBM SPSS Modeler se účastníci naučí na kurzu.
IBM® SPSS® Modeler: Příprava dat pro modelování
13.6.2023 – 15.6.2023 Praha 1 Krakovská 7, 110 00 Praha 1 Upřesnující informace k termínu
09:00 – 16:30 hod.
česky