Статистикийн медианыг тооцоолох томъёо. Вариацын тархалтын цувралын бүтцийн шинж чанар

ТУРШИЛТ

Сэдэв: "Горим. Медиан. Тэдгээрийг тооцоолох арга"


Оршил

Дундаж утгууд ба түүнтэй холбоотой өөрчлөлтийн үзүүлэлтүүд нь статистикт маш чухал үүрэг гүйцэтгэдэг бөгөөд энэ нь судалгааны сэдэвтэй холбоотой юм. Тиймээс энэ сэдэв нь сургалтын гол сэдвүүдийн нэг юм.

Дундаж нь статистикийн маш түгээмэл хураангуй хэмжүүр юм. Үүнийг зөвхөн дундаж үзүүлэлтийн тусламжтайгаар хүн амыг тоон хэлбэлзэлтэй шинж чанараар тодорхойлж болно гэж тайлбарладаг. Статистикийн хувьд дундаж утга нь зарим нэг тоон хэлбэлзэлтэй шинж чанарт суурилсан ижил төстэй үзэгдлийн багцыг ерөнхийд нь илэрхийлэх шинж чанар юм. Дундаж нь хүн амын нэгжид ногдох энэ шинж чанарын түвшинг харуулж байна.

Нийгмийн үзэгдлийг судалж, тэдгээрийн онцлог, ердийн шинж чанарыг тухайн газар, цаг хугацааны тодорхой нөхцөлд тодорхойлохыг оролдохдоо статистикчид дундаж утгыг өргөн ашигладаг. Дундаж утгыг ашиглан янз бүрийн шинж чанаруудын дагуу янз бүрийн популяцийг бие биетэйгээ харьцуулж болно.

Статистикт ашигласан дундаж нь чадлын дундаж ангилалд хамаарна. Эрчим хүчний дундаж утгуудаас арифметик дундажийг ихэвчлэн ашигладаг, гармоник дундажийг бага ашигладаг; Гармоник дундажийг зөвхөн динамикийн дундаж хурдыг тооцоолоход ашигладаг бөгөөд дундаж квадратыг зөвхөн вариацын индексийг тооцоолоход ашигладаг.

Арифметик дундаж нь хувилбаруудын нийлбэрийг тэдгээрийн тоонд хуваах коэффициент юм. Энэ нь нийт популяцийн хувьд янз бүрийн шинж чанарын эзэлхүүн нь түүний бие даасан нэгжийн шинж чанарын утгын нийлбэр хэлбэрээр үүссэн тохиолдолд ашиглагддаг. Арифметик дундаж нь нийгмийн үзэгдлийн мөн чанарт тохирсон дундаж үзүүлэлтүүдийн хамгийн түгээмэл төрөл бөгөөд нийлбэр дэх янз бүрийн шинж чанаруудын хэмжээ нь хүн амын бие даасан нэгжийн шинж чанарын утгын нийлбэр хэлбэрээр ихэвчлэн тодорхойлогддог. .

Тодорхойлсон шинж чанарын дагуу шинж чанарын нийт эзэлхүүнийг хувилбарын урвуу утгын нийлбэр болгон бүрдүүлэх үед гармоник дундажийг ашиглах ёстой. Энэ нь материалаас хамааран жинг үржүүлэхгүй, харин хувилбарт хуваах эсвэл ижил утгатай бол тэдгээрийн харилцан үнэ цэнээр үржүүлэхэд ашиглагддаг. Эдгээр тохиолдолд гармоник дундаж нь шинж чанарын харилцан утгуудын арифметик дундажийн эсрэг утгатай байна.

Хүн амын нэгжийг - шинж чанарыг тээгч - жин болгон ашигладаггүй, харин эдгээр нэгжийн бүтээгдэхүүнийг шинж чанарын утгаараа ашигладаг тохиолдолд гармоник дундаж утгыг ашиглах ёстой.


1. Статистикийн горим ба медианы тодорхойлолт

Арифметик ба гармоник хэмжигдэхүүнүүд нь нэг буюу өөр өөр өөр шинж чанарын дагуу популяцийн ерөнхий шинж чанарууд юм. Янз бүрийн шинж чанарын тархалтын туслах дүрслэх шинж чанарууд нь горим ба медиан юм.

Статистикийн хувьд горим гэдэг нь тухайн популяцид ихэвчлэн олддог шинж чанарын (хувилбар) утга юм. Вариацын цувралд энэ нь хамгийн өндөр давтамжтай сонголт байх болно.

Статистикийн хувьд медиан нь вариацын цувралын дунд байдаг сонголт юм. Медиан нь цувралыг хагасаар хуваадаг бөгөөд түүний хоёр талд (дээш ба доош) ижил тооны популяцийн нэгж байдаг.

Хүч чадлын хэрэгслээс ялгаатай нь горим ба медиан нь тодорхой шинж чанарууд бөгөөд тэдгээрийн утгыг вариацын цувралын аль ч тодорхой хувилбарт хуваарилдаг.

Энэ горимыг шинж чанарын хамгийн их тохиолддог утгыг тодорхойлох шаардлагатай тохиолдолд ашигладаг. Жишээлбэл, аж ахуйн нэгжийн хамгийн түгээмэл цалингийн хэмжээ, зах зээл дээр хамгийн олон бараа зарагдсан үнэ, хэрэглэгчдийн дунд хамгийн их эрэлт хэрэгцээтэй байгаа гутлын хэмжээ гэх мэтийг олж мэдэх шаардлагатай бол. Эдгээр тохиолдлуудад тэд загварт ханддаг.

Медиан нь хүн амын тал хувь нь хүрсэн янз бүрийн шинж чанарын тоон хязгаарыг харуулдагаараа сонирхолтой юм. Банкны ажилчдын дундаж цалин 650,000 рубль байна. сар бүр. Хэрэв бид ажилчдын тал хувь нь 700,000 рублийн цалин авсан гэж хэлбэл энэ шинж чанарыг нэмж болно. ба түүнээс дээш, өөрөөр хэлбэл. Медианыг өгье. Мод ба медиан нь популяци нь нэг төрлийн, олон тооны хувьд ердийн шинж чанар юм.


2. Дискрет вариацын цувааны горим ба медианыг олох

Шинж чанарын утгыг тодорхой тоогоор өгсөн вариацын цувралын горим ба медианыг олох нь тийм ч хэцүү биш юм. Хүүхдийн тоогоор гэр бүлийн хуваарилалтыг хүснэгт 1-ээс харцгаая.

Хүснэгт 1. Хүүхдийн тоогоор гэр бүлийн хуваарилалт

Мэдээжийн хэрэг, энэ жишээн дээр загвар нь хоёр хүүхэдтэй гэр бүл байх болно, учир нь энэ сонголтын үнэ цэнэ нь хамгийн олон гэр бүлтэй тохирч байна. Бүх сонголтууд ижил давтамжтай тохиолддог хуваарилалтууд байж болох бөгөөд энэ тохиолдолд горим байхгүй, эсвэл өөрөөр хэлбэл бүх сонголтууд адилхан модаль гэж хэлж болно. Бусад тохиолдолд нэг биш, харин хоёр сонголт нь хамгийн өндөр давтамжтай байж болно. Дараа нь хоёр горим байх болно, тархалт нь хоёр модаль байх болно. Хоёр модаль тархалт нь судалж буй шинж чанарын дагуу популяцийн чанарын ялгаатай байдлыг илэрхийлж болно.

Дискрет вариацын цуваа дахь медианыг олохын тулд давтамжийн нийлбэрийг хагас болгон хувааж, үр дүнд нь ½ нэмэх хэрэгтэй. Тиймээс 185 гэр бүлийг хүүхдийн тоогоор хуваарилахад медиан нь: 185/2 + ½ = 93, өөрөөр хэлбэл. Захиалсан мөрийг хагасаар хуваадаг 93-р сонголт. 93 дахь хувилбарын утга учир юу вэ? Үүнийг мэдэхийн тулд та хамгийн жижиг сонголтуудаас эхлээд давтамжийг хуримтлуулах хэрэгтэй. 1 ба 2-р хувилбарын давтамжийн нийлбэр нь 40. Энд 93 сонголт байхгүй нь тодорхой байна. Хэрэв бид 3-р хувилбарын давтамжийг 40 дээр нэмбэл бид 40 + 75 = 115-тай тэнцэх нийлбэрийг авна. Тиймээс 93-р сонголт нь янз бүрийн шинж чанарын гурав дахь утгатай тохирч, дундаж нь хоёр хүүхэдтэй гэр бүл байх болно.

Энэ жишээн дээрх горим ба медиан нь давхцаж байна. Хэрэв бид давтамжуудын тэгш нийлбэртэй байсан бол (жишээлбэл, 184) дээрх томьёог ашиглан бид дундаж хувилбарын тоог авах болно, 184/2 + ½ =92.5. Бутархай сонголт байхгүй тул үр дүн нь медиан нь 92-93 хувилбарын дунд байгааг харуулж байна.

3. Интервалын вариацын цувааны горим ба медианыг тооцоолох

Мод ба медиануудын дүрслэх шинж чанар нь хувь хүний ​​хазайлтыг нөхдөггүйтэй холбоотой юм. Тэд үргэлж тодорхой сонголттой нийцдэг. Тиймээс горим ба медиан нь шинж чанарын бүх утгууд мэдэгдэж байгаа эсэхийг олохын тулд тооцоолол шаарддаггүй. Гэсэн хэдий ч интервалын вариацын цувралд тодорхой интервал дахь горим ба медиануудын ойролцоо утгыг олохын тулд тооцооллыг ашигладаг.

Интервалд агуулагдах шинж чанарын модаль утгын тодорхой утгыг тооцоолохын тулд дараах томъёог ашиглана уу.

M o = X Mo + i Mo *(f Mo – f Mo-1)/((f Mo – f Mo-1) + (f Mo – f Mo+1)),

Энд XMo нь модаль интервалын хамгийн бага хил юм;

i Mo – модаль интервалын утга;

f Mo – модаль интервалын давтамж;

f Mo-1 – модалын өмнөх интервалын давтамж;

f Mo+1 – модалын дараах интервалын давтамж.

Хүснэгт 2-т өгсөн жишээн дээр горимын тооцоог үзүүлье.


Хүснэгт 2. Аж ахуйн нэгжийн ажилчдын үйлдвэрлэлийн стандартын биелэлтээр хуваарилалт

Горимыг олохын тулд эхлээд энэ цувралын модаль интервалыг тодорхойлно. Жишээ нь хамгийн өндөр давтамж нь 100-аас 105 хүртэлх хувилбарт байрлах интервалтай тохирч байгааг харуулж байна. Энэ бол модаль интервал юм. Модаль интервалын утга нь 5 байна.

2-р хүснэгтийн тоон утгыг дээрх томъёонд орлуулснаар бид дараахь зүйлийг авна.

M o = 100 + 5 * (104 -12)/((104 – 12) + (104 – 98)) = 108.8

Энэ томъёоны утга нь дараах байдалтай байна: түүний хамгийн бага хил дээр нэмэх шаардлагатай модаль интервалын хэсгийн утгыг өмнөх болон дараагийн интервалуудын давтамжийн хэмжээнээс хамааран тодорхойлно. Энэ тохиолдолд бид 8.8-ыг 100-д ​​нэмнэ, өөрөөр хэлбэл. хагасаас илүү интервал, учир нь өмнөх интервалын давтамж нь дараагийн интервалын давтамжаас бага.

Одоо медианыг тооцоолъё. Интервалын хэлбэлзлийн цувааны медианыг олохын тулд эхлээд түүний байрлах интервалыг (медиан интервал) тодорхойлно. Ийм интервал нь хуримтлагдсан давтамж нь давтамжийн нийлбэртэй тэнцүү буюу хагасаас их байх интервал байх болно. Хуримтлагдсан давтамжууд нь атрибутын хамгийн бага утгатай интервалаас эхлэн давтамжуудыг аажмаар нэгтгэх замаар үүсдэг. Давтамжийн нийлбэрийн тал нь 250 (500:2) байна. Тиймээс 3-р хүснэгтийн дагуу дундаж интервал нь 350,000 рублийн цалингийн үнэ цэнэтэй интервал болно. 400,000 рубль хүртэл.

Хүснэгт 3. Интервалын вариацын цувааны медиануудын тооцоо

Энэ интервалаас өмнө хуримтлагдсан давтамжийн нийлбэр 160 байсан. Тиймээс дундаж утгыг авахын тулд дахин 90 нэгж (250 – 160) нэмэх шаардлагатай.

Медиан Битэд эрэмбэлсэн цувралын дунд байрлах атрибутын утгыг нэрлэж, нэгжийн тоогоор тэнцүү хоёр хэсэгт хуваадаг. Тиймээс тархалтын эрэмблэгдсэн эгнээнд мөрийн нэг тал нь медианаас давсан шинж чанарын утгууд, нөгөө тал нь медианаас бага байна.

Эрэмбэлэгдсэн цувралын туйлын сонголтууд (хамгийн бага ба хамгийн том) бусадтай харьцуулахад хэт том эсвэл хэт жижиг байх үед арифметик дундажийн оронд медианыг ашиглана.

IN салангидсондгой тооны нэгж агуулсан вариацын цувралд медиан нь дараах тоотой шинж чанарын хувилбартай тэнцүү байна.
,
Энд N нь хүн амын нэгжийн тоо.
Хүн амын тэгш тооны нэгжээс бүрдэх салангид цувралд медианыг дараах тоо бүхий сонголтуудын дундажаар тодорхойлно.
.
Ажилчдыг ажилласан хугацаагаар нь хуваарилахдаа медиан нь эрэмбэлсэн цувралын 10 дугаартай хувилбаруудын дундажтай тэнцүү байна: 2 = 5 ба 10: 2 + 1 = 6. Тав, зургаа дахь шинж чанаруудын сонголтууд тэнцүү байна. 4 жил хүртэл, иймээс
жилийн
Дундаж утгыг тооцоолохдоо интервалэгнээний эхний олдвор медиан интервал, (өөрөөр хэлбэл медианыг агуулсан), хуримтлагдсан давтамж эсвэл давтамжийг ашигладаг. Дундаж гэдэг нь хуримтлагдсан давтамж нь нийт хүн амын эзлэхүүний хагастай тэнцүү буюу түүнээс их интервал юм. Дараа нь дундаж утгыг дараах томъёогоор тооцоолно.
,
дундаж интервалын доод хязгаар хаана байна;
– дундаж интервалын өргөн;
– медианы өмнөх интервалын хуримтлагдсан давтамж;
– дундаж интервалын давтамж.
Ажилчдын цалингийн хуваарилалтын медианыг тооцоод үзье ("Статистикийн мэдээллийн хураангуй ба бүлэглэл" лекцийг үзнэ үү).
Дундаж нь 800-900 UAH цалингийн хүрээ юм, учир нь түүний хуримтлагдсан давтамж нь 17 бөгөөд энэ нь бүх давтамжийн нийлбэрээс хагасаас давсан байна (). Дараа нь
Би=800+100 грн.
Олж авсан үнэ цэнэ нь ажилчдын тал хувь нь 875 UAH-аас бага цалинтай байгааг харуулж байгаа боловч энэ нь дунджаас дээгүүр байна.
Медианыг тодорхойлохын тулд та хуримтлагдсан давтамжийн оронд хуримтлагдсан давтамжийг ашиглаж болно.
Медиан нь горимын нэгэн адил хувилбарын туйлын утгаас хамаардаггүй тул тодорхойгүй хил хязгаартай тархалтын цувралын төвийг тодорхойлоход ашигладаг.
Дундаж өмч : медианаас хазайсан үнэмлэхүй утгуудын нийлбэр нь бусад утгаас бага байна (арифметик дунджаас оруулаад):

Медианы энэ шинж чанарыг трамвай, троллейбусны зогсоол, шатахуун түгээх станц, угсрах цэг гэх мэт байршлыг төлөвлөхдөө тээврийн хэрэгсэлд ашигладаг.
Жишээ. 100 км урт хурдны зам дагуу 10 гарааштай. Шатахуун түгээх станцын барилгын зураг төслийг гаргахын тулд гараж тус бүрийн шатахуун түгээх станц руу явах хүлээгдэж буй аяллын тоог цуглуулсан.
Хүснэгт 2 - Гараж тус бүрийн шатахуун түгээх станц руу аялах тоон мэдээлэл.

Шатахуун цэнэглэх тээврийн хэрэгслийн нийт миль хамгийн бага байхын тулд шатахуун түгээх станц суурилуулах шаардлагатай.
Сонголт 1.Хэрэв шатахуун түгээх станцыг хурдны замын голд, өөрөөр хэлбэл 50-р километрт (шинж чанар дахь өөрчлөлтийн хүрээний төв) байрлуулсан бол аяллын тоог харгалзан миль нь:
а) нэг чиглэлд:
;
б) эсрэгээр:
;
в) хоёр чиглэлд нийт миль: .

Сонголт 2.Хэрэв шатахуун түгээх станцыг хурдны замын дунд хэсэгт байрлуулсан бол аяллын тоог харгалзан арифметик дундаж томъёогоор тодорхойлно.

Дундаж утгыг хуримтлалыг ашиглан графикаар тодорхойлж болно ("Статистикийн мэдээллийн хураангуй ба бүлэглэл" лекцийг үзнэ үү). Үүнийг хийхийн тулд бүх давтамж эсвэл давтамжийн нийлбэртэй тэнцүү сүүлчийн ординатыг хагасаар хуваана. Үүссэн цэгээс перпендикуляр нь хуримтлалтай огтлолцох хүртэл сэргээгддэг. Уулзвар цэгийн абсцисса нь медиан утгыг өгнө.

Excel-ийн MEDIAN функцийг тоон утгын мужид дүн шинжилгээ хийхэд ашигладаг бөгөөд шалгаж буй олонлогийн дунд (медиан) тоог буцаана. Өөрөөр хэлбэл, энэ функц нь тоонуудын багцыг хоёр дэд бүлэгт хуваадаг бөгөөд эхнийх нь дундажаас бага, хоёр дахь нь илүү их тоог агуулдаг. Медиан нь сонирхлын хүрээний төв хандлагыг тодорхойлох хэд хэдэн аргуудын нэг юм.

Excel дээр MEDIAN функцийг ашиглах жишээ

Оюутнуудын насны бүлгийг судлахдаа их сургуулийн санамсаргүй түүврийн аргаар сонгогдсон бүлгийн оюутнуудын өгөгдлийг ашигласан. Даалгавар бол сурагчдын дундаж насыг тодорхойлох явдал юм.

Анхны өгөгдөл:

Тооцоолох томъёо:


Аргументын тайлбар:

  • B3:B15 - судлагдсан насны ангилал.

Үр дүн:

Өөрөөр хэлбэл, бүлэгт 21 нас хүрээгүй, энэ үзүүлэлтээс дээш насны оюутнууд байдаг.



Дундаж утгыг тооцоолох MEDIAN болон AVERAGE функцийг харьцуулах

Эмнэлэгт оройн ээлжинд өвчтөн бүрийн биеийн температурыг хэмждэг. Олж авсан утгуудын хүрээг шалгахын тулд дундаж утгын оронд медиан параметрийг ашиглах нь ашигтай болохыг харуул.

Анхны өгөгдөл:

Дундажийг олох томъёо:

Медианыг олох томъёо:

Дундаж үзүүлэлтээс харахад өвчтөнүүдийн дундаж температур хэвийн хэмжээнээс өндөр байгаа боловч энэ нь үнэн биш юм. Медиан нь өвчтөнүүдийн дор хаяж тал хувь нь биеийн температур хэвийн, 36.6-аас хэтрэхгүй байгааг харуулж байна.

Анхаар! Төв чиг хандлагыг тодорхойлох өөр нэг арга бол горим (судалгаад байгаа мужид хамгийн их тохиолддог утга) юм. Excel-ийн төв хандлагыг тодорхойлохын тулд та MODE функцийг ашиглах хэрэгтэй. Энэ жишээнд медиан болон горимын утга ижил байгааг анхаарна уу.

Өөрөөр хэлбэл, нэг багцыг жижиг, том утгын дэд олонлогт хуваах дундаж утга нь олонлогт хамгийн их тохиолддог утга юм. Таны харж байгаагаар ихэнх өвчтөнүүд 36.6 температуртай байдаг.

Excel-ийн статистик шинжилгээнд медианыг тооцоолох жишээ

Жишээ 3. Дэлгүүрт 3 худалдагч ажилладаг. Сүүлийн 10 хоногийн үр дүнд үндэслэн урамшуулал олгох ажилтныг тодорхойлох шаардлагатай. Шилдэг ажилтныг сонгохдоо борлуулсан барааны тоог бус харин түүний ажлын үр ашгийн зэргийг харгалзан үздэг.

Жинхэнэ өгөгдлийн хүснэгт:


Үр ашгийг тодорхойлохын тулд бид нэг дор гурван үзүүлэлтийг ашиглана: дундаж утга, дундаж утга, горим. Тэдгээрийг ажилтан тус бүрээр AVERAGE, MEDIAN болон MODE томьёог ашиглан тодорхойлъё.


Өгөгдлийн тархалтын зэргийг тодорхойлохын тулд бид дундаж утга ба горим, дундаж утга ба медиан хоорондын зөрүүний модулийн нийт утга болох утгыг ашиглана. Өөрөөр хэлбэл, коэффициент x=|av-med|+|av-mod|, энд:

  • av - дундаж утга;
  • мед - дундаж;
  • мод - загвар.

Эхний худалдагчийн хувьд x коэффициентийн утгыг тооцоолъё.

Бид бусад борлуулагчдын хувьд ижил төстэй тооцоог хийх болно. Үр дүн:


Урамшуулал өгөх худалдагчийг тодорхойлъё.

Тайлбар: ЖИЖИГ функц нь x коэффициентийн утгуудын авч үзсэн мужаас эхний хамгийн бага утгыг буцаана.


X коэффициент нь дэлгүүрийн эдийн засагчийн танилцуулсан борлуулалтын ажилтны тогтвортой байдлын тодорхой тоон шинж чанар юм. Түүний тусламжтайгаар утгын хамгийн бага хазайлттай мужийг тодорхойлох боломжтой болсон. Энэ арга нь хамгийн найдвартай үр дүнд хүрэхийн тулд төв хандлагыг тодорхойлох гурван аргыг нэгэн зэрэг ашиглаж болохыг харуулж байна.

Excel-д MEDIAN функцийг ашиглах онцлог

Функц нь дараах синтакстай байна:

MEDIAN(тоо1; [тоо2];...)

Аргументуудын тайлбар:

  • тоо1 нь судалж буй мужид агуулагдах эхний тоон утгыг тодорхойлох шаардлагатай аргумент юм;
  • [2 дугаар] - нэмэлт хоёр дахь (болон дараагийн аргументууд, нийт 255 хүртэл аргумент), судалж буй мужын хоёр дахь болон дараагийн утгуудыг тодорхойлдог.

Тэмдэглэл 1:

  1. Тооцоолол хийхдээ аргументуудыг дараалан оруулахын оронд судалж буй утгын бүх хүрээг нэг дор шилжүүлэх нь илүү тохиромжтой.
  2. Зөвшөөрөгдсөн аргументууд нь тоон өгөгдөл, тоо агуулсан нэрс, лавлагааны төрлийн өгөгдөл, массив (жишээлбэл, =MEDIAN((1,2,3,5,7,10))).
  3. Медианыг тооцоолохдоо хоосон утгууд эсвэл логик ҮНЭН, ХУДАЛ агуулсан нүднүүдийг харгалзан үзэх бөгөөд энэ нь тус тус 1 ба 0 гэсэн тоон утгууд гэж ойлгогдоно. Жишээлбэл, аргумент дахь логик утгатай функцийг гүйцэтгэх үр дүн (ҮНЭН; ХУДАЛ) нь аргументууд (1; 0) ашиглан гүйцэтгэх үр дүнтэй тэнцүү бөгөөд 0.5-тай тэнцүү байна.
  4. Хэрэв нэг буюу хэд хэдэн функцийн аргумент нь тоон утга руу хөрвүүлэх боломжгүй текст утгыг хүлээн авах эсвэл алдааны код агуулсан бол функц нь #VALUE! алдааны кодыг буцаана.
  5. Түүврийн медианыг тодорхойлохын тулд Excel-ийн бусад функцуудыг ашиглаж болно: PERCENTILE.IN, QUARTILE.IN, MAX Хэрэглэх жишээ:
  • =ХУВЬ ХУВЬ (A1:A10,0.5), учир нь тодорхойлолтоор медиан нь 50 дахь хувь юм.
  • =QUARTILE.ON(A1:A10;2), учир нь медиан нь 2-р квартиль юм.
  • =ӨНДӨР(A1:A9,COUNT(A1:A9)/2), гэхдээ зөвхөн муж дахь тооны тоо сондгой тоо байвал.

Тэмдэглэл 2:

  1. Хэрэв судалж буй мужид бүх тоонууд дунджийн эргэн тойронд тэгш хэмтэй тархсан бол энэ мужийн арифметик дундаж ба медиан нь тэнцүү байх болно.
  2. Муж дахь өгөгдлийн их хэмжээний хазайлттай ("утгын тархалт") медиан нь арифметик дунджаас илүү утгын тархалтын хандлагыг илүү сайн тусгадаг. Албан тушаалтнууд жирийн иргэдээс илүү цалин авдаг муж улсын хүн амын дундаж цалингийн бодит түвшинг тодорхойлоход ашигладаг маш сайн жишээ юм.
  3. Судалж буй утгуудын хүрээ нь дараахь зүйлийг агуулж болно.
  • Сондгой тооны тоо. Энэ тохиолдолд медиан нь мужийг том ба жижиг утгын хоёр дэд бүлэгт хуваах нэг тоо байх болно;
  • Тэгш тооны тоо. Дараа нь медианыг дээр дурдсан хоёр дэд бүлэгт хуваах хоёр тоон утгын арифметик дундаж гэж тооцно.

Эдийн засгийн янз бүрийн салбарын цалин хөлс, ижил нутаг дэвсгэрт харьцуулж болохуйц хугацаанд температур, хур тунадасны түвшин, газарзүйн өөр өөр бүс нутагт тариалсан ургацын ургац гэх мэт. Гэсэн хэдий ч дундаж үзүүлэлт нь цорын ганц ерөнхий үзүүлэлт биш юм - зарим тохиолдолд Илүү нарийвчлалтай үнэлгээний хувьд тохиромжтой утга нь медиан юм. Статистикийн хувьд энэ нь тодорхой популяцид шинж чанарын тархалтыг тодорхойлох туслах шинж чанар болгон өргөн хэрэглэгддэг. Энэ нь дундажаас юугаараа ялгаатай болохыг, мөн яагаад үүнийг ашиглах шаардлагатай байгааг олж мэдье.

Статистикийн медиан: тодорхойлолт ба шинж чанар

Дараах нөхцөл байдлыг төсөөлөөд үз дээ: 10 хүн захиралтай хамт компанид ажилладаг. Энгийн ажилчид 1000 грн, харин эзэн нь байдаг менежер нь 10000 грн авдаг. Хэрэв бид арифметик дундажийг тооцоолох юм бол энэ аж ахуйн нэгжийн дундаж цалин 1900 UAH байна. Энэ мэдэгдэл үнэн байх болов уу? Эсвэл ийм жишээ авъя: нэг эмнэлгийн тасагт 36.6 хэмтэй есөн хүн, 41 хэмтэй нэг хүн байна. Энэ тохиолдолд арифметик дундаж нь тэнцүү байна: (36.6*9+41)/10 = 37.04 °C. Гэхдээ энэ нь тэнд байгаа бүх хүмүүс өвчтэй гэсэн үг биш юм. Энэ бүхнээс харахад дундаж нь дангаараа хангалтгүй байдаг тул медианыг нэмж ашигладаг. Статистикийн хувьд энэ үзүүлэлтийг захиалгат вариацын цувралын яг дунд хэсэгт байрлах сонголт гэж нэрлэдэг. Хэрэв бид үүнийг жишээндээ тооцвол 1000 UAH авна. ба 36.6 ° C. Өөрөөр хэлбэл, статистикийн медиан гэдэг нь цувааг хоёр талд нь (доош эсвэл дээш) өгөгдсөн популяцид ижил тооны нэгж байхаар хоёр хуваадаг утгыг хэлнэ. Энэ шинж чанараас шалтгаалан энэ үзүүлэлт нь өөр хэд хэдэн нэртэй байдаг: 50-р хувь буюу 0.5 квантил.

Статистикийн медианыг хэрхэн олох вэ

Энэ утгыг тооцоолох арга нь бид ямар төрлийн вариацын цувралаас хамаарна: дискрет эсвэл интервал. Эхний тохиолдолд медианыг статистикт маш энгийнээр олдог. Та хийх ёстой зүйл бол давтамжийн нийлбэрийг олж, 2-т хувааж, үр дүнд нь ½ нэмэх явдал юм. Тооцооллын зарчмыг дараах жишээн дээр тайлбарлах нь дээр. Бид үржил шимийн талаарх мэдээллийг бүлэглээд медиан нь юу болохыг олж мэдэхийг хүсч байна гэж бодъё.

Хүүхдийн тоогоор гэр бүлийн бүлгийн дугаар

Гэр бүлийн тоо

Хэд хэдэн энгийн тооцоолол хийсний дараа шаардлагатай үзүүлэлт нь: 195/2 + ½ = сонголт байна. Энэ нь юу гэсэн үг болохыг олж мэдэхийн тулд та хамгийн жижиг сонголтуудаас эхлээд давтамжийг дараалан хуримтлуулах хэрэгтэй. Тэгэхээр эхний хоёр мөрийн нийлбэр нь 30 болж байна. Энд 98 сонголт байхгүй нь ойлгомжтой. Харин үр дүнд нь гурав дахь хувилбарын давтамжийг (70) нэмбэл 100-тай тэнцэх нийлбэр гарна. Энэ нь яг 98 дахь хувилбарыг агуулж байгаа бөгөөд энэ нь голч нь хоёр хүүхэдтэй гэр бүл байх болно гэсэн үг юм.

Интервалын цувралын хувьд дараахь томъёог ихэвчлэн ашигладаг.

M e = X Me + i Me * (∑f/2 - S Me-1)/f Me, үүнд:

  • X Me - дундаж интервалын эхний утга;
  • ∑f - цувралын тоо (түүний давтамжийн нийлбэр);
  • i Ме - дундаж хүрээний утга;
  • f Me - дундаж хүрээний давтамж;
  • S Ме-1 нь медианы өмнөх муж дахь хуримтлагдсан давтамжийн нийлбэр юм.

Дахин хэлэхэд жишээгүйгээр ойлгоход хэцүү байдаг. Үнийн талаархи өгөгдөл байна гэж бодъё

Цалин, мянган рубль.

Хуримтлагдсан давтамжууд

Дээрх томъёог ашиглахын тулд бид эхлээд дундаж интервалыг тодорхойлох хэрэгтэй. Ийм муж болохын хувьд хуримтлагдсан давтамж нь нийт давтамжийн нийлбэрийн талаас илүү буюу түүнтэй тэнцүү давтамжийг сонгоно. Тиймээс 510-ыг 2-оор хуваахад энэ шалгуур нь 250,000 рубльтэй цалингийн интервалтай тохирч байгааг бид олж мэдэв. 300,000 рубль хүртэл. Одоо та бүх өгөгдлийг томъёонд орлуулж болно:

M e = X Me + i Me * (∑f/2 - S Me-1)/f Me = 250 + 50 * (510/2 - 170) / 115 = 286.96 мянган рубль.

Бидний нийтлэл хэрэгтэй байсан гэж найдаж байна, та одоо статистикт медиан гэж юу болох, түүнийг хэрхэн тооцоолох талаар тодорхой ойлголттой болсон гэж найдаж байна.

Түүврийг тодорхойлох тоо (жишээлбэл, тоонуудын багц). Хэрэв бүх түүврийн элементүүд өөр бол медиан нь түүврийн элементүүдийн яг тал нь түүнээс их, нөгөө тал нь түүнээс бага байхаар түүврийн тоо юм. Ерөнхийдөө дундажийг түүврийн элементүүдийг өсөх эсвэл буурах дарааллаар эрэмбэлж, дунд элементийг авах замаар олж болно. Жишээлбэл, түүвэр (11, 9, 3, 5, 5) эрэмбэлсний дараа (3, 5, 5, 9, 11) болж хувирах ба медиан нь 5 байна. Хэрэв түүвэр тэгш тооны элементтэй бол медианыг нэг бүрчлэн тодорхойлох боломжгүй: тоон мэдээллийн хувьд хоёр зэргэлдээх утгын хагасыг ихэвчлэн ашигладаг (өөрөөр хэлбэл олонлогийн медианыг (1, 3, 5, 7) 4-тэй тэнцүү авдаг), дэлгэрэнгүй мэдээллийг үзнэ үү.

Санамсаргүй хэмжигдэхүүнүүдийн хувьд медианыг мөн тодорхойлж болно: энэ тохиолдолд тархалтыг хагасаар хуваана. Ойролцоогоор санамсаргүй хэмжигдэхүүний медиан нь түүний баруун талд байгаа санамсаргүй хэмжигдэхүүний утгыг авах магадлал нь зүүн талд байгаа утгыг авах магадлалтай тэнцүү байх тоо юм (мөн эдгээр нь хоёулаа тэнцүү байна. 1/2); Илүү нарийвчлалтай тодорхойлолтыг үзнэ үү.

Медианыг мөн дээж эсвэл тархалтын 50-р хувь, 0.5 квантил эсвэл хоёрдугаар квартил гэж хэлж болно.

Санамсаргүй хэмжигдэхүүний медианы шинж чанарууд

F (x) = 0.5 (\displaystyle F(x)=0.5)

Хэрэв тархалт нь тасралтгүй өсөх функц байвал тэгшитгэлийн шийдэл нь өвөрмөц байна. Хэрэв тархалт нь тасалдалтай байвал медиан нь санамсаргүй хэмжигдэхүүний хамгийн бага эсвэл хамгийн их (хэт) боломжтой утгатай давхцаж болох бөгөөд энэ нь энэ нэр томъёоны "геометрийн" ойлголттой зөрчилддөг.

Медиан нь санамсаргүй хэмжигдэхүүний тархалтын чухал шинж чанар бөгөөд хүлээгдэж буй утгын нэгэн адил тархалтыг төвлөрүүлэхэд ашиглаж болно. Дундаж хэмжигдэхүүний тооцоо илүү баттай байдаг тул түүний тооцоолол нь тархалт гэж нэрлэгддэг хувьд илүү тохиромжтой байж болох юм. хүнд сүүл. Гэсэн хэдий ч, математикийн хүлээлттэй харьцуулахад медианыг тооцоолох давуу талыг зөвхөн тархалтын эдгээр шинж чанарууд, ялангуяа тэгш хэмтэй магадлалын нягтын функцүүдийн хувьд давхцаж байгаа тохиолдолд л авч үзэх боломжтой.

Медиан нь бүх тархалтын хувьд тодорхойлогддог бөгөөд тодорхойгүй тохиолдолд энэ нь байгалийн жамаар тодорхойлогддог бол математикийн хүлээлт тодорхойлогдоогүй байж болно (жишээлбэл, Коши тархалтын хувьд).

Хэрэглээний жишээ

Нэг өрөөнд 19 ядуу хүн, нэг саятан байсан гэж бодъё. Ядуу хүн бүр 5 доллар, саятан бүрт 1 сая доллар байдаг (10 6). Нийт 1,000,095 доллар.Мөнгөө 20 хүнд тэнцүү хуваавал 50,004,75 доллар болно. Энэ нь тухайн өрөөнд байсан 20 хүний ​​бүх мөнгөний арифметик дундаж болно.

Энэ тохиолдолд медиан нь 5 доллартай тэнцүү байх болно (арав, арваннэгдүгээр нийлбэрийн хагас, дундажэрэмбэлсэн цувралын утгууд). Үүнийг дараах байдлаар тайлбарлаж болно. Манай компанийг 10 хүнтэй тэнцүү хоёр бүлэгт хувааж үзвэл эхний бүлэгт хүн бүр 5 доллараас ихгүй, хоёрдугаарт 5 доллараас багагүй байна гэж хэлж болно. Ер нь дундаж гэдэг нь “дундаж” хүн ямар их мөнгө авчирсаныг бид хэлж чадна. Эсрэгээр, арифметик дундаж нь энгийн хүний ​​бэлэн мөнгөний хэмжээнээс хамаагүй давсан тул зохисгүй шинж чанар юм.