Израз Биг Дата слушамо већ дуже време, али шта су тачно Велики подаци? Количина података које производи Интернет ствари драматично се повећавала током година и стално расте са експоненцијалном брзином. Обрада ових огромних количина података које нису погодне за традиционалне методе за обраду назива се великим подацима. Ова врста података представља изазов традиционалним РДБМС системима који се користе за чување и обраду података. Моћ обраде потребна за благовремено и економично складиштење и обраду ових података је огромна. Да би се ријешио овај проблем, потребна су нова и побољшана рјешења Биг Дата која су посебно дизајнирана за обраду великих неструктурираних података. Од многих технологија, Хадооп и МонгоДБ су два популарна избора када је у питању складиштење и обрада великих података. Иако су обојица прилично слични у основи онога што раде, али њихов приступ томе како то раде је сасвим другачији. Погледајмо.
МонгоДБ је база података докумената отвореног кода која је прерасла у де-фацто НоСКЛ базу података са милионима корисника, од малих стартап до компанија Фортуне 500. Водећа предузећа и потрошачке ИТ компаније искориштавају могућности МонгоДБ-а у својим производима и решењима. Писано на Ц ++, МонгоДБ је цросс-платформа, база података оријентисана на документа која ефикасно решава ограничења база података заснованих на СКЛ схеми пружајући решења за високе перформансе, велику доступност и лако скалабилност. То је база података дизајнирана за савремени веб. Као и друге НоСКЛ базе података, МонгоДБ се не придржава принципа РДБМС-а без појмова табела, редова и ступаца. Своје податке чува у БСОН документима, где су сви повезани подаци сједињени у једном документу.
Хадооп је опен-соурце оквир дизајниран за складиштење и обраду огромних количина података преко кластера рачунара. То је апликација заснована на Јави и колекција различитог софтвера који ствара оквир за обраду података. Идеја је обрадити податке великих размера уз разумну цену у најмање могуће време. Хадооп се састоји од три примарна ресурса: дистрибутивног датотечног система Хадооп (ХДФС), Гоогле-ове програмске платформе МапРедуце и читавог Хадооп екосистема. Хадооп екосистем састоји се од модула који помажу у програмирању система, управљању и конфигурирању кластера, управљању и складиштењу података у кластеру и обављању аналитичких задатака. Хадооп МапРедуце помаже аналитичким подацима обрадити веома велике количине структурираних и неструктурираних података. Хадооп је регистровани заштитни знак компаније Апацхе Софтваре Фоундатон, а МапРедуце је његов оквир за паралелну обраду.
- Иако се оба сматрају решењима великих података, МонгоДБ је у основи платформа опште намене намењена замени или побољшању постојећих РДБМС система. МонгоДБ је база података докумената отвореног кода и једна од водећих база података НоСКЛ која користи документе уместо реда и табела како би била флексибилна, скалабилна и брза. Хадооп је, с друге стране, опен-соурце оквир дизајниран за складиштење и обраду огромне количине података преко кластера рачунара. Хадооп није намијењен замјени постојећих РДБМС система; у ствари, служи као додатак за помоћ аналитичким подацима који обрађују велике количине структурираних и неструктурираних података.
- Екосистем Хадооп је збирка алата који користе или седе поред Гооглеове програмске платформе МапРедуце и ХДФС (Хадооп Дистрибутед Филе Систем) за складиштење и организовање података и управљање машинама које покрећу Хадооп. ХДФС је дизајниран за стреаминг приступ подацима. МонгоДБ, с друге стране, нуди другачији приступ; заснован је на Некус архитектури која користи могућности НоСКЛ-а уз задржавање темеља релацијских база података. Чува податке као документе у бинарном представљању под називом БСОН (Бинари ЈСОН), где су обично организовани као збирке.
- Највећа снага Хадоопа је МапРедуце. Данас је Хадооп најбољи МапРедуце оквир на тржишту. Концепт који стоји иза МапРедуце-а је да се улаз може поделити у логичке делове, где се сваки део може независно обрадити задатком карте. Задатак карте може се изводити на било којем рачунајућем чвору у кластеру, а више задатака мапирања може се покренути паралелно кроз кластер. МонгоДБ је, с друге стране, база података која може поднијети оптерећења у распону од покретачких МВП-ова и ПОЦ-ова до корпоративних апликација са стотинама сервера. МонгоДБ је прерастао из решења за нишне базе података у де фацто НоСКЛ базу података. Појам докумената је заиста експресиван и флексибилан.
Иако су обојица прилично слични у основи онога што раде, али њихов приступ томе како то раде је сасвим другачији. МонгоДБ чува податке као документе у бинарном представљању званом БСОН, док се у Хадоопу подаци чувају у блоковима фиксне величине и сваки се блок дуплира више пута у систему. Екосистем Хадооп је збирка алата који користе или седе поред Гооглеове програмске платформе МапРедуце, док је МонгоДБ заснован на Некус архитектури који користи могућности НоСКЛ-а истовремено одржавајући темеље релацијских база података.