Power BI slovník - Plochý (flat file) a dělený zdroj (delimited file) vs. nestrukturovaný (unstructured file) a částečně strukturovaný zdroj
28.7.2022Datové zdroje rozlišujeme na ploché, dělené a nestrukturované podle toho,
jak jsou v nich uloženy informace.
Plochý zdroj (Flat file)
Obsahuje data uspořádané do jednotlivých sloupců a řádků, typickým příkladem jsou soubory CSV a jednotlivý list Excelu. Plochý datový zdroj je do Power BI načten automaticky ihned, jakmile uživatel určí soubor k načtení. Často se při načtení dat načtou i datové typy (například chytré tabulky excelu nebo SQL databáze). Ploché zdroje jsou nejpřátelštější na načítání dat do Power BI a práci s daty.
Dělený zdroj (Delimited file)
Také obsahuje data uspořádaná do sloupců, ale data jsou ve formě textových řetězců, kdy příslušnost hodnot k jednotlivým sloupcům určuje buď pořadí znaků, nebo dělení pomocí pomocných rozdělovacích znaků (například hvězdiček, kolmítek, tabulátorů). Dělený zdroj vyžaduje uživatelovu interakci pro korektní načtení, protože uživatel musí dělit řádek textu na jednotlivé oblasti (ať dle pozice, nebo dle rozdělovacích znaků) a získané hodnoty převádět na datové typy. Dělené zdroje jsou pro Power BI načítání méně přátelské než ploché zdroje.
Nestrukturovaný zdroj
Obsahuje data bez jasné sloupcové struktury. Nestrukturovaným zdrojem je například text knihy, wordovský dokument, obrázek. Načítání dat z nestrukturovaného zdroje je možné, ale je typicky velmi pracné a výpočetně náročné.
Částečně strukturovaný zdroj
Obsahuje nestrukturovaná data, která jsou však organizována do nadřazené struktury. Příkladem je například JSON, celý excelový soubor (tzn. několik excelovských listů), XML. Aby mohlo Power BI pracovat s daty, potřebuje získat data ve formě plochého zdroje. Jednotlivé ploché zdroje mohou být mezi sebou relačně propojeny, čímž vytvoří datový model. Každý Power BI report musí obsahovat datový
model – jinak nemá co zobrazovat, ani jak pracovat (chybí mu data).
Pokračování zase příště :).
Ing. Martin Haman
Vystudoval obor Veřejná ekonomika a správa na Masarykově univerzitě. Absolvoval mnoho odborných zkoušek (Microsoft Certified Solutions Associate: BI Reporting, Microsoft Office specialist na úrovni Master, Microsoft Certified Application Specialist na úrovni Master, ECDL, Master in Presentation Skills…). Od roku 2005 se věnuje školení Office aplikací s pozdějším zaměřením na Power BI, DAX jazyk, analýzu dat a reporting. Specializuje se na tvorbu reportů na zakázku. Power nástroje si velmi rychle oblíbil a využil je na řešení problémů, které běžný Excel neumí. Novou úroveň reportingu nabídl Power BI Desktop, který se stal jeho nejoblíbenější aplikací.