Када бирате шему базе података за складиште података, пахуљица и звездасте шеме имају тенденцију да буду популарни избори. Ово поређење говори о погодности схема звезда против пахуљица у различитим сценаријима и њиховим карактеристикама.
Схема сњежних пахуљица | Звездана шема | |
---|---|---|
Једноставност одржавања / промене | Нема сувишних података, па је шеме пахуљица лакше одржавати и мењати. | Има сувишне податке, а самим тим и мање лако одржавање / промену |
Лакоћа коришћења | Сложенији упити, а самим тим и мање лако разумљиви | Нижа сложеност упита и лако разумљив |
Перформансе упита | Више страних кључева, а самим тим и дуже време извршења упита (спорије) | Мањи број страних кључева, а самим тим и краће време извршења упита (брже) |
Тип складишта података | Добро је користити за језгро складишта података за поједностављење сложених односа (пуно: много) | Погодно за датамартс са једноставним односима (1: 1 или 1: много) |
Придружује се | Већи број придруживања | Мање придруживања |
Табела димензија | Схема пахуљица може имати више таблица димензија за сваку димензију. | Звездана шема садржи само једну димензионалну табелу за сваку димензију. |
Када користити | Када је таблица димензија релативно велике величине, пахуљице су боље јер смањују простор. | Када табела са димензијама садржи мањи број редова, можемо одабрати Звездину схему. |
Нормализација / денормализација | Таблице димензија су у нормираном облику, али табела чињеница је у де-нормираном облику | Таблица димензија и чињеница су у нестандардираном облику |
Модел података | Приступ одоздо према горе | Одозго на доле приступ |
Размотрите базу података за малопродају која има много продавница, при чему свака продавница продаје много производа у многим категоријама производа и различитих брендова. Складиште података или март података за такву трговину треба аналитичарима да омогуће да извештавају о продаји груписани по продавници, датуму (или месецу, кварталу или години) или категорији производа или марке.
Ако је овај март података користио звјездану схему, изгледао би овако:
Пример Звездине шемеТабела чињеница била би евиденција продајних трансакција, док постоје табеле са димензијама за датум, продавницу и производ. Таблице димензија су повезане са таблицом чињеница преко свог примарног кључа, који је страни кључ за табелу чињеница. На пример, уместо да сачува стварни датум трансакције у низу таблица чињеница, датум_ид се чува. Овај дате_ид одговара јединственом ретку у Дим_Дате табели, а у њему се налазе и други атрибути датума који су потребни за груписање у извештајима. нпр. дан у недељи, месец, квартал године и тако даље. Подаци су денормализирани за лакше извјештавање.
Ево како би се добили извештај о броју телевизија које се продају по бренду и по земљи уз помоћ унутрашњих прикључака.
Исти сценариј може користити и схему пахуљица, која би у том случају била структурирана на следећи начин:
Пример схеме снежинке (кликните да бисте је увећали)Главна разлика, у поређењу са схемом звезда, је та што су подаци у димензионалним табелама нормализованији. На пример, уместо да похрањују месец, квартал и дан у недељи у сваки ред Дим_Дате табеле, оне се даље рашчлањују у сопствене табеле димензија. Слично за Дим_Сторе табелу, држава и земља су географски атрибути који су уклоњени један корак - уместо да се чувају у Дим_Сторе табели, они се сада чувају у посебној Дим_Геограпхи табели.
Исти извештај - број телевизија продатих по земљама и према бренду - сада је мало сложенији него у звезданој шеми:
СКЛ упит да бисте добили број производа који се продају по земљи и бренду, када база података користи схему пахуљица.