Дата Мининг вс ОЛАП
И рударство података и ОЛАП две су од уобичајених технологија Бусинесс Интеллигенце (БИ). Пословна интелигенција односи се на рачунарске методе за препознавање и вађење корисних информација из пословних података. Ископавање података је област рачунарске науке која се бави извлачењем занимљивих образаца из великих скупова података. Комбинује многе методе вештачке интелигенције, статистике и управљања базама података. ОЛАП (мрежна аналитичка обрада) као што име сугерира, је компилација начина за претраживање вишедимензионалних база података.
Ископавање података познато је и као Откривање знања у подацима (КДД). Као што је већ поменуто, то је област рачунарске науке, која се бави извлачењем до сада непознатих и занимљивих података из сирових података. Због експоненцијалног раста података, посебно у областима као што је пословање, вађење података је постало веома важно средство за претварање овог великог богатства података у пословну интелигенцију, јер је ручно вађење образаца наизглед било немогуће у последњих неколико деценија. На пример, тренутно се користи за разне апликације као што су анализа друштвених мрежа, откривање преваре и маркетинг. Ископавање података обично се бави следећа четири задатка: групирање, класификација, регресија и удруживање. Кластерирање идентификује сличне групе из неструктурираних података. Класификација је правила учења која се могу применити на нове податке и обично укључују следеће кораке: претходна обрада података, дизајнирање модела, селекција учења / могућности и процена / валидација. Регресија је проналажење функција са минималном грешком за моделирање података. А асоцијација тражи односе између променљивих. Ископавање података обично се користи за одговор на питања попут који су главни производи који би могли да помогну у остваривању високог профита следеће године у Вал-Марту.
ОЛАП је класа система која пружа одговоре на вишедимензионалне упите. ОЛАП се обично користи за маркетинг, буџетирање, предвиђање и сличне апликације. Подразумијева се да су базе података кориштене за ОЛАП конфигуриране за сложене и ад-хоц упите с брзим перформансама на уму. Обично се користи матрица за приказ излаза ОЛАП-а. Редови и ступци формирани су димензијама упита. Често користе методе здруживања на више табела како би добили сажетке. На пример, да ли се може користити за сазнање о продаји ове године у Вал-Марту у односу на прошлу годину? Каква је предвиђања о продаји у наредном кварталу? Шта се може рећи о тренду гледајући промене у процентима?
Иако је очигледно да су Дата мининг и ОЛАП слични јер делују на подацима како би добили интелигенцију, главна разлика долази у начину на који раде на подацима. ОЛАП алати омогућавају вишедимензионалну анализу података и дају сажетке података, али контрастно, рударство података се фокусира на омјере, обрасце и утицаје у скупу података. То је ОЛАП посао са агрегацијом, који се своди на рад података „додавањем“, али дата мининг одговара „подели“. Друга приметна разлика је да док алати за вађење података моделирају податке и враћају делотворна правила, ОЛАП ће спроводити упоредне и контрастне технике дуж пословне димензије у реалном времену.