Схема сњежне пахуље вс.

Када бирате шему базе података за складиште података, пахуљица и звездасте шеме имају тенденцију да буду популарни избори. Ово поређење говори о погодности схема звезда против пахуљица у различитим сценаријима и њиховим карактеристикама.

Упоредни графикон

Упоредна шема сњежне пахуље у односу на Звездану схему
Схема сњежних пахуљицаЗвездана шема
Једноставност одржавања / промене Нема сувишних података, па је шеме пахуљица лакше одржавати и мењати. Има сувишне податке, а самим тим и мање лако одржавање / промену
Лакоћа коришћења Сложенији упити, а самим тим и мање лако разумљиви Нижа сложеност упита и лако разумљив
Перформансе упита Више страних кључева, а самим тим и дуже време извршења упита (спорије) Мањи број страних кључева, а самим тим и краће време извршења упита (брже)
Тип складишта података Добро је користити за језгро складишта података за поједностављење сложених односа (пуно: много) Погодно за датамартс са једноставним односима (1: 1 или 1: много)
Придружује се Већи број придруживања Мање придруживања
Табела димензија Схема пахуљица може имати више таблица димензија за сваку димензију. Звездана шема садржи само једну димензионалну табелу за сваку димензију.
Када користити Када је таблица димензија релативно велике величине, пахуљице су боље јер смањују простор. Када табела са димензијама садржи мањи број редова, можемо одабрати Звездину схему.
Нормализација / денормализација Таблице димензија су у нормираном облику, али табела чињеница је у де-нормираном облику Таблица димензија и чињеница су у нестандардираном облику
Модел података Приступ одоздо према горе Одозго на доле приступ

Садржај: Сњежна пахуљица вс Звезда шема

  • 1 Примери
    • 1.1 Стар Стар Схема
    • 1.2 Пример шеме пахуљица
  • 2 Референце

Примери

Размотрите базу података за малопродају која има много продавница, при чему свака продавница продаје много производа у многим категоријама производа и различитих брендова. Складиште података или март података за такву трговину треба аналитичарима да омогуће да извештавају о продаји груписани по продавници, датуму (или месецу, кварталу или години) или категорији производа или марке.

Пример схеме звезда

Ако је овај март података користио звјездану схему, изгледао би овако:

Пример Звездине шеме

Табела чињеница била би евиденција продајних трансакција, док постоје табеле са димензијама за датум, продавницу и производ. Таблице димензија су повезане са таблицом чињеница преко свог примарног кључа, који је страни кључ за табелу чињеница. На пример, уместо да сачува стварни датум трансакције у низу таблица чињеница, датум_ид се чува. Овај дате_ид одговара јединственом ретку у Дим_Дате табели, а у њему се налазе и други атрибути датума који су потребни за груписање у извештајима. нпр. дан у недељи, месец, квартал године и тако даље. Подаци су денормализирани за лакше извјештавање.

Ево како би се добили извештај о броју телевизија које се продају по бренду и по земљи уз помоћ унутрашњих прикључака.

Пример шеме пахуљица

Исти сценариј може користити и схему пахуљица, која би у том случају била структурирана на следећи начин:

Пример схеме снежинке (кликните да бисте је увећали)

Главна разлика, у поређењу са схемом звезда, је та што су подаци у димензионалним табелама нормализованији. На пример, уместо да похрањују месец, квартал и дан у недељи у сваки ред Дим_Дате табеле, оне се даље рашчлањују у сопствене табеле димензија. Слично за Дим_Сторе табелу, држава и земља су географски атрибути који су уклоњени један корак - уместо да се чувају у Дим_Сторе табели, они се сада чувају у посебној Дим_Геограпхи табели.

Исти извештај - број телевизија продатих по земљама и према бренду - сада је мало сложенији него у звезданој шеми:

СКЛ упит да бисте добили број производа који се продају по земљи и бренду, када база података користи схему пахуљица.

Референце

  • википедиа: Сновфлаке_сцхема
  • википедиа: Стар_сцхема