Preskočiť na obsah
{ RBH } TECHNOLOGY
Späť na blog
Stratégia · 8 min čítania

Microsoft Fabric: oplatí sa naň prejsť?

Microsoft Fabric je najväčší krok Microsoftu v dátovej platforme za posledné roky. Pozrieme sa úprimne na to, pre koho má zmysel — a kto by mal ešte počkať.

Richard Böhmer

Microsoft Fabric architektúra s OneLake v strede

Microsoft Fabric je v posledných dvoch rokoch téma, ktorej sa nedá vyhnúť. Ak ste zákazník Microsoftu, určite ste o ňom počuli — či už od svojho account managera, alebo z LinkedIn-u, kde to niektorí konzultanti predávajú ako „revolúciu, ktorá rieši všetko”.

Realita je triezvejšia. Pozrime sa na to bez marketingu.

Čo Fabric vlastne je

Skrátene: Microsoft zobral viacero existujúcich produktov a zabalil ich do jednej platformy s jednotnou licenciou, jednotným úložiskom (OneLake) a jednotným UI.

V jednom „Fabric workspace” dnes máte:

  • Data Factory — orchestrácia ETL/ELT, dataflowy, pipeliny.
  • Synapse Data Engineering — Spark notebooky, lakehouse.
  • Synapse Data Warehouse — T-SQL data warehouse (následník dedicated SQL pool).
  • Synapse Data Science — ML experimenty, MLflow.
  • Synapse Real-Time Intelligence — KQL databázy, event streaming.
  • Power BI — semantic modely, reporty, dashboardy.
  • Data Activator — reaktívne alerty/akcie nad dátami.

OneLake je „OneDrive pre dáta” — jeden Delta-formátovaný úložný priestor pre celú organizáciu. Všetky služby čítajú a píšu do toho istého miesta, bez nutnosti kopírovania.

Čo je na tom skutočne dobré

1. Koniec „silá medzi nástrojmi”

Keď máte dnes Data Factory v Azure, Synapse v inom resource group, Databricks niekde inde a Power BI ďalej, veľa času sa stratí na prepojeniach a duplikátoch. Fabric tieto bariéry odstraňuje.

2. OneLake + Delta = otvorenosť

Dáta v OneLake sú v Delta formáte (otvorený štandard). Vie si ich prečítať Databricks, Snowflake, Trino, akýkoľvek Python script. Nezamykáte sa do proprietárneho formátu.

3. Direct Lake mode v Power BI

Power BI vie čítať priamo z OneLake bez importu a bez DirectQuery latencie. Pri veľkých datasetoch je to významný posun v rýchlosti aj nákladoch.

4. Capacity-based licencovanie

Platíte za kapacitu (F SKUs), nie za jednotlivé služby. Pri vysokom využívaní viacerých zložiek je to výhodné a predvídateľné.

5. Postupné dozrievanie

Fabric vyšiel GA v r. 2023 a Microsoft do neho investuje masívne — každý mesiac pribúdajú features. Dnešný stav je výrazne ďalej ako pred rokom.

Kde si treba dať pozor

1. Capacity je tupý nástroj

Kapacita je shared resource. Jeden „zabehnutý” notebook alebo zlý Power BI report vie spotrebovať toľko, že iné workloady začnú spomaľovať alebo throttle-ovať. Potrebujete monitoring a governance hneď od začiatku.

2. Niektoré veci sú stále „mladé”

  • Data Warehouse vo Fabric je výborný pre väčšinu workloadov, ale niektoré T-SQL features chýbajú alebo sa správajú inak ako dedicated SQL pool.
  • Real-Time Intelligence je výkonné, ale governance a CI/CD okolo KQL databáz je stále predmetom vývoja.
  • Data Activator je zaujímavý koncept, ale produkčne ho nasadzuje málokto.

3. Migrácia zo Synapse nie je „lift & shift”

Microsoft komunikuje Synapse ako „naďalej podporovaný”, ale smer je jasný — Fabric. Migrácia dedicated SQL pool → Fabric DW však nie je triviálna. Treba prerobiť pipeliny, otestovať T-SQL kompatibilitu, prehodnotiť bezpečnosť.

4. Cena pri malom využití

Najmenšia produkčná kapacita (F2/F4) stojí niekoľko sto eur mesačne. Ak máte len pár Power BI reportov a malý ETL, Power BI Premium Per User alebo Pro licencia môže vyjsť výhodnejšie.

5. Lock-in cez Power BI

OneLake je síce otvorený, ale Power BI semantické modely, Direct Lake, Data Activator sú špecifické pre Fabric. Čím viac tieto features využívate, tým väčšia väzba.

Pre koho má Fabric zmysel — dnes

Áno, prejdite, ak:

  • Už máte Power BI Premium kapacitu a vyťažujete ju.
  • Plánujete nový dátový sklad a Microsoft stack je vaša voľba.
  • Máte tím, ktorý kombinuje SQL, Spark a Power BI a chcete im to dať pod jednu strechu.
  • Vaše dáta sú v Microsoft 365 / Dynamics 365 / Fabric prostredí — natívna integrácia šetrí týždne práce.
  • Začínate od nuly a chcete moderný lakehouse model bez nutnosti skladať si platformu z 5 produktov.

Ešte počkajte / zvážte iné, ak:

  • Máte stabilný Synapse setup, ktorý funguje a nemá business dôvod sa meniť.
  • Vaša infraštruktúra je primárne AWS alebo GCP.
  • Plánujete silné ML/AI workloady na úrovni veľkých modelov — Databricks je v tomto vyspelejší.
  • Máte veľmi malý reporting use case — Power BI Pro stačí.
  • Máte tím, ktorý práve teraz mení technológie inde a nemá kapacitu na ďalší migration projekt.

Náš pohľad

Fabric je strategická voľba pre väčšinu Microsoft-centric firiem v horizonte 2–4 rokov. Microsoft tam smeruje všetku investíciu a postupne tam presúva aj zákazníkov.

To ale neznamená, že treba migrovať dnes a všetko naraz. Najčastejší rozumný scenár:

  1. Pilot na novom use case — postavte jeden nový dataset/report priamo vo Fabric, naučte sa to.
  2. Existujúce systémy nechajte bežať — kým neexistuje silný dôvod ich meniť.
  3. Plánujte migráciu postupne — modul po module, s jasnými kritériami úspechu.

Pomáhame firmám rozhodovať sa o dátovej platforme bez vendor bias — naším cieľom je, aby vám to dlhodobo dávalo zmysel. Ak zvažujete prechod na Fabric alebo si neviete vybrať medzi platformami, napíšte nám — radi sa pozrieme na vašu konkrétnu situáciu.

Tagy: #microsoft-fabric #data-platform #onelake #power-bi

Potrebujete pomoc s podobným projektom?

Začnime nezáväzným rozhovorom o tom, ako môžeme priniesť hodnotu vašim dátam.