Централна тенденција вс дисперзија
У описној и инференцијалној статистици, неколико индекса се користи за описивање скупа података који одговарају његовој централној тенденцији, дисперзији и накривљености: три најважнија својства која одређују релативни облик дистрибуције скупа података.
Шта је централна тенденција?
Централна тенденција односи се и лоцира средиште дистрибуције вредности. Средња вредност, мод и средња вредност су најчешћи индекси за опис централне тенденције скупа података. Ако је скуп података симетричан, тада се и средња и средина скупа података подударају једна са другом.
С обзиром на скуп података, средња вриједност се израчунава тако што се узима зброј свих вриједности података, а затим се подијели с бројем података. На пример, масе 10 људи (у килограмима) мере се на 70, 62, 65, 72, 80, 70, 63, 72, 77 и 79. Тада средња тежина десет особа (у килограмима) може бити израчунава се на следећи начин. Збир тегова је 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79 = 710. Средња вредност = (збир) / (број података) = 710/10 = 71 (у килограмима). Подразумева се да одласци (тачке података који одступају од нормалног тренда) имају тенденцију да утичу на средњу вредност. Стога, у присуству оутлиерса, само средство неће дати тачну слику о центру скупа података.
Медијан је тачка података која се налази на тачној средини скупа података. Један од начина израчунавања медијана је да се тачке података распореде узлазним редоследом, а затим лоцирају тачку података у средини. На пример, ако је једном наручено, претходни скуп података изгледа као 62, 63, 65, 70, 70, 72, 72, 77, 79, 80. Према томе, (70 + 72) / 2 = 71 је у средини. Из овога се види да медијан не мора бити у скупу података. Присуство аутреије не утиче на медијан. Стога ће медијан служити као боље мерило централне тенденције у присуству одметника.
Режим је вредност која се најчешће јавља у скупу података. У претходном примеру, вредности 70 и 72 се јављају два пута, па су оба начина. То показује да, у неким дистрибуцијама, постоји више од једне модалне вредности. Ако постоји само један мод, за скуп података се наводи да је унимодални, у овом случају је скуп података бимодални.
Шта је дисперзија?
Дисперзија је количина ширења података о центру дистрибуције. Опсег и стандардна девијација су најчешће коришћене мере дисперзије.
Распон је једноставно највећа вредност минус најнижа вредност. У претходном примеру, највећа вредност је 80, а најнижа вредност 62, тако да је распон 80-62 = 18. Али распон не даје довољну слику о дисперзији.
Да би се израчунало стандардно одступање, прво се израчунавају одступања вредности података од средње вредности. Средња вредност одступања коријенског квадрата назива се стандардном девијацијом. У претходном примеру одговарајућа одступања од средње вредности су (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80 - 71) = 9, (70 - 71) = -1, (63 - 71) = -8, (72 - 71) = 1, (77 - 71) = 6 и (79 - 71) = 8. Збир квадрат одступања је (-1)2 + (-9)2 + (-6)2 + 12 + 92 + (-1)2 + (-8)2 + 12 + 62 + 82 = 366. Стандардно одступање је √ (366/10) = 6,05 (у килограмима). Ако се скуп података не искриви, из тога се може закључити да је већина података у интервалу 71 ± 6.05, а заиста је тако у овом конкретном примеру.
Која је разлика између централне тенденције и дисперзије? • Централна тенденција односи се и лоцира средиште расподјеле вриједности • Дисперзија је количина ширења података о средишту скупа података.
|