Разлика између варијанце узорка и варијанце популације

Објашњење

У статистици се термин узорковање односи на избор дела збирних статистичких података ради добијања релевантних информација о целини. Скуп или читава статистичка информација о одређеном карактеру свих чланова обухваћених истрагом назива се „становништво“ или „универзум“. (Дас, Н.Г., 2010). Изабрани део популације који се користи за добијање карактеристика становништва или универзума назива се „узорком“. Популација се узима од појединачних јединица или чланова, а неке јединице су укључене у узорак. Укупан број јединица популације назива се величином популације, а количина узорка назива се величином узорка. Популација и узорак могу бити коначни или бесконачни и слично могу бити постојећи или хипотетички.

Променљив: Варијанца је бројчана вредност која показује како се широко појединачне фигуре у низу података расподељују око средње вредности. То је колико је сваки број удаљен од средње, а самим тим и од другог. Варијанта нулте вредности значи да су сви подаци идентични. Што је више варијансе, то су више вредности раширене око просека, дакле једна од друге. Мање одступања, мање су вредности раширене око средње, дакле једна од друге, а варијанца не може бити негативна.

Разлика између варијанце популације и варијанце узорка

Главна разлика између варијанце популације и варијанце узорка односи се на израчунавање варијанце. Варијација се израчунава у пет корака. Прво се израчунава средња вредност, затим израчунавамо одступања од средње вредности, а треће одступања су квадратна, четврта се одступања од квадрата и на крају та сума дели на број ставки за које се рачуна варијанца. Тако је варијанца = Σ (ки-к -) / н. Где је ки = с. Број, к- = средња вредност и н = број предмета ...

Сада, када се одступање треба израчунати из података о популацији, н је једнако броју предмета. Дакле, ако се одступање крвног притиска од свих 1000 људи израчуна из података о крвном притиску свих 1000 људи, тада је н = 1000. Међутим, када се одступање израчунава из узорка података 1 треба одузети од н пре дељења збир квадратних одступања. Према томе, у горњем примјеру ако узорак података садржи 100 предмета, називник би био 100 - 1 = 99.

Због тога је вредност одступања израчуната из података о узорцима већа од вредности која се могла сазнати употребом података о популацији. Логика тога је да надокнадимо наш недостатак података о популацијским подацима. Немогуће је пронаћи варијанту висина у људским бићима, за наш апсолутни недостатак информација о висинама свих живих људских бића, а да не говоримо о будућности. Чак и ако узмемо један умерени пример, попут података о насељености о висини свих живих мушкараца у САД-у, то је физички могуће, али трошкови и време у то укључени би умањили сврху израчуна. То је разлог због којег се узорци узимају у већини статистичких сврха, а то је праћено недостатком података о већини података. Да би се ово надокнадило, вредност варијанце и стандардне девијације, која је квадрат корена варијанце, већа је у случају података о узорку, него одступања од података становништва.

Ово делује као аутоматски штит за аналитичаре и доносиоце одлука. Логика се односи на одлуке о капиталном буџетирању, личним и пословним финансијама, грађевинарству, управљању саобраћајем и многим применљивим областима. Ово помаже власнику улога да буде на сигурној страни током доношења одлуке или других закључака.

Резиме: Варијација популације односи се на вредност варијанце која се израчунава из података о популацији, а варијанца узорка је варијанца израчуната из података о узорку. Због ове вредности називника у формули за варијанцу у случају података о узорку је 'н-1', а за податке популације то је 'н'. Као резултат тога, и варијанса и стандардна девијација изведени из података о узорку су више од оних утврђених из података о популацији.