Разлика између стандардног одступања и стандардне грешке

Увод

Стандардно Девијација (СД) и Стандард Еужас (СЕ) наизглед су сличне терминологије; међутим, они су појмовно толико разнолики да се у литератури о статистици готово наизменично користе. Оба термина обично претходе знаку плус-минус (+/-) који указује на чињеницу да они дефинишу симетричну вредност или представљају распон вредности. Неизмерно се оба термина појављују са просеком (средња вредност) скупа измерених вредности.

Занимљиво је да СЕ нема никакве везе са стандардима, са грешкама или са комуникацијом научних података.

Детаљан поглед на порекло и објашњење СД и СЕ откриће зашто професионални статистичари и они који то радо користе, обоје имају тенденцију да греше.

Стандардно одступање (СД)

СД је дескриптивни статистика која описује ширење дистрибуције. Као метрика је корисно када се подаци нормално дистрибуирају. Међутим, мање је корисна када су подаци високо искривљени или бимодални, јер не описује баш добро облик дистрибуције. Обично користимо СД при пријављивању карактеристика узорка, јер то намеравамо опишите колико се подаци разликују око средње вриједности. Остале корисне статистике за описивање ширења података су интерквартилни распон, 25. и 75. постотил и распон података.

Слика 1. СД је мјера ширења података. Када су подаци узорак из нормално расподељене дистрибуције, тада се очекује да две трећине података леже унутар 1 стандардне девијације средње вредности.

Варијанца је дескриптивни такође је статистика и она се дефинише као квадрат стандардне девијације. Обично се не извештава када се описују резултати, али је математички формула која се може пратити (а.к.а. збир квадратних одступања) и игра улогу у прорачуну статистике..

На пример, ако имамо две статистике П & К са познатим одступањима вар(П) & вар(К), онда варијанца суме П + К је једнак збиру варијација: вар(П) +вар(К). Сада је очигледно зашто статистичари воле да разговарају о одступањима.

Али стандардна одступања имају важно значење за ширење, посебно када се подаци нормално дистрибуирају: Средња вредност +/ - 1 СД може се очекивати да ће узети 2/3 узорка и средњу интервал +- 2 СД може се очекивати да ће узети 95% узорка.

СД пружа индикацију у којој мери појединачни одговори на питање варирају или одступају од средње вредности. СД каже истраживачу како су раширени одговори - да ли су концентрисани око средине, или су раштркани далеко и широко? Да ли су сви ваши испитаници оценили ваш производ на средини ваше скале или су га неки одобрили, а неки не одобрили?

Размотрите експеримент у којем се од испитаника тражи да оцијене производ на низу атрибута на скали од 5 поена. Средња вредност за групу од десет испитаника (означена са „А“ до „Ј“ испод) за „добру вредност за новац“ била је 3,2, а СД вредност 0,4, а средња вредност „поузданост производа“ 3,4 са СД од 2,1.

На први поглед (гледајући само на средства) чини се да је поузданост оцијењена вишом од вриједности. Али виши СД за поузданост може указати (као што је приказано у дистрибуцији испод) да су одговори веома поларизовани, где већина испитаника није имала проблема са поузданошћу (оценио је атрибут „5“), али је мањи, али важан сегмент испитаника проблем са поузданошћу и оценио је атрибут „1“. Ако посматрамо само средство говори само део приче, међутим, то се истраживачи чешће фокусирају. Расподјела одговора је важно узети у обзир и СД пружа вриједну описну мјеру овога.

Испитаник Добра вредност за новац Поузданост производа
А 3 1
Б 3 1
Ц 3 1
Д 3 1
Е 4 5
Ф 4 5
Г 3 5
Х 3 5
Ја 3 5
Ј 3 5
Значити 3.2 3.4
Стд Дев. 0,4 2.1

Прва анкета: Испитаници оцјењују производ на скали од 5 поена

Две врло различите поделе одговора на скали од 5 поена могу дати исту средину. Размотрите следећи пример који приказује вредности одзива за две различите оцене.

У првом примеру (оцена „А“) СД је нула јер су СВИ одговори били тачно средња вредност. Појединачни одговори уопће нису одступили од просјека.

У рејтингу „Б“, иако је средина групе иста (3.0) као и прва дистрибуција, стандардно одступање је веће. Стандардно одступање од 1,15 показује да су појединачни одговори у просеку * били нешто више од 1 бода од средњег просека.

Испитаник Оцена „А“ Оцена „Б“
А 3 1
Б 3 2
Ц 3 2
Д 3 3
Е 3 3
Ф 3 3
Г 3 3
Х 3 4
Ја 3 4
Ј 3 5
Значити 3.0 3.0
Стд Дев. 0,00 1.15

Друга анкета: Испитаници оцјењују производ на скали од 5 поена

Други начин посматрања СД-а је исцртавање дистрибуције као хистограм одговора. Дистрибуција са ниским СД-ом приказала би се као високи уски облик, док би велики СД била означена ширим обликом.

СД генерално не означава „тачно или погрешно“ или „боље или горе“ - нижи СД није нужно пожељнији. Користи се искључиво као описна статистика. Описује расподјелу у односу на средњу вриједност.

Ттехнички одрицање одговорности које се односи на СД

Размишљање о СД-у као „просечном одступању“ одличан је начин концептуалног разумевања његовог значења. Међутим, он се у ствари не израчунава као просек (да је тако, назвали бисмо га „просечним одступањем“). Уместо тога, „стандардизована“ је помало сложен метод рачунања вредности користећи зброј квадрата.

У практичне сврхе, рачунање није важно. Већина табулаторних програма, табела или других алата за управљање подацима израчунаће СД за вас. Важније је разумети шта статистика преноси.

Стандардна грешка

Стандардна грешка је инферентиал статистика која се користи при поређењу узорка значи (просек) за популацију. То је мера прецизност просечне вредности узорка. Средња вриједност узорка је статистика изведена из података који имају основну дистрибуцију. Не можемо га визуелизовати на исти начин као и податке, јер смо извели један експеримент и имамо само једну вредност. Статистичка теорија нам говори да се просечна вредност узорка (за велики „довољно“ узорак и под неколико услова регуларности) приближно нормално дистрибуира. Стандардно одступање ове нормалне дистрибуције је оно што називамо стандардном грешком.

Слика 2. Дистрибуција на дну репрешаље дистрибуцију података, док је дистрибуција на врху теоријска расподјела узорка. СД 20 је мера ширења података, док је СЕ 5 мера несигурности око узорка.

Када желимо да упоредимо средства резултата двоструког узорка експеримента лечења А и лечења Б, тада морамо да проценимо колико смо тачно одмерили средства.

Заправо нас занима како смо тачно одмерили разлику између два средства. Ову меру називамо стандардном грешком разлике. Можда се нећете изненадити кад сазнате да је стандардна грешка разлике у средствима узорка функција стандардних грешака средстава:

Сад кад сте схватили да су стандардна грешка средње вредности (СЕ) и стандардно одступање дистрибуције (СД) две различите звери, можда се питате како су се они збунили на првом месту. Иако се појмовно разликују, они имају математички једноставан однос:

,где је н број тачака података.

Примјетите да стандардна грешка зависи од двије компоненте: стандардног одступања узорка и величине узорка н. Ово има интуитивног смисла: што је већа стандардна девијација узорка, мање прецизни можемо да проценимо праву вредност.

Такође, што је већа величина узорка, што више података имамо о популацији и тачније можемо проценити праву средину.

СЕ је показатељ поузданости средње вредности. Мали СЕ је показатељ да је просечна вредност узорка тачнији одраз стварне средње популације. Већа величина узорка обично резултира мањим СЕ (док величина узорка директно не утиче на СД).

Већина истраживачких истраживања укључује узимање узорка из популације. Затим направимо закључке о популацији на основу резултата добијених из тог узорка. Ако је извучен други узорак, резултати вероватно неће тачно одговарати првом узорку. Ако је средња вриједност за атрибут оцјењивања била 3,2 за један узорак, то би могла бити 3,4 за други узорак исте величине. Ако бисмо извукли бесконачни број узорака (једнаке величине) из наше популације, могли бисмо приказати посматрано средство као дистрибуцију. Тада бисмо могли израчунати просек свих наших узорака. То би значило једнаку стварној вриједности становништва. Такође можемо израчунати и СД дистрибуције узорака. СД ове дистрибуције узорака значи СЕ сваке појединачне средње вредности узорка.

Тако имамо најзначајније запажање: СЕ је СД просечне вредности становништва.

Узорак Значити
1ст 3.2
2нд 3.4
3рд 3.3
Четврти 3.2
5. 3.1
… . … .
… . … .
… . … .
… . … .
… . … .
Значити 3.3
Стд Дев. 0,13

Табела која илуструје однос СД и СЕ

Сада је јасно да ако нам СД у овој дистрибуцији помогне да схватимо колико значи узорак од стварне средње популације, тада можемо то искористити да схватимо колико је тачан сваки појединачни узорак у односу на истинску средину. То је суштина СЕ.

У ствари, из наше популације смо извукли само један узорак, али овај резултат можемо да искористимо за процену поузданости проматраног просека узорка.

У ствари, СЕ нам говори да можемо бити 95% сигурни да је наша посматрана средња вредност узорка плус или минус отприлике 2 (заправо 1,96) Стандардне грешке из популације значе.

Доња табела приказује расподелу одговора из првог (и јединог) узорка коришћеног за наше истраживање. СЕ од 0,13, релативно мали, даје нам назнаку да је наша средња вредност релативно близу стварне средње вредности наше укупне популације. Граница грешке (са 95% поузданости) за нашу средњу вредност је (отприлике) двоструко већа од ове вредности (+/- 0,26), што нам говори да је највећа вредност између 2,94 и 3,46.

Испитаник Оцена
А 3
Б 3
Ц 3
Д 3
Е 4
Ф 4
Г 3
Х 3
Ја 3
Ј 3
Значити 3.2
Стд Ерр 0,13

Резиме

Многи истраживачи не разумеју разлику између стандардног одступања и стандардне грешке, иако су они обично укључени у анализу података. Иако стварни прорачуни за Стандард Девиатион и Стандард Еррор изгледају врло слично, они представљају две врло различите, али комплементарне мере. СД нам говори о облику наше дистрибуције, колико су појединачне вредности података блиске од средње вредности. СЕ говори о томе колико је средња вредност нашег узорка стварна средина укупне популације. Заједно, они помажу да пружимо комплетнију слику него што то само средство може да нам каже.