صيغة لحساب الوسيط في الإحصاء. الخصائص الهيكلية لسلسلة توزيع التباين

امتحان

حول الموضوع: "الوضع. الوسيط. طرق حسابها"


مقدمة

تلعب القيم المتوسطة ومؤشرات التباين المرتبطة بها دورًا مهمًا جدًا في الإحصاء، ويرجع ذلك إلى موضوع دراستها. ولذلك فإن هذا الموضوع هو أحد المواضيع المركزية في الدورة.

المتوسط ​​هو مقياس موجز شائع جدًا في الإحصائيات. ويفسر ذلك حقيقة أنه فقط بمساعدة المتوسط ​​يمكن وصف السكان بخاصية متباينة كميا. في الإحصاء، القيمة المتوسطة هي خاصية عامة لمجموعة من الظواهر المتشابهة بناءً على بعض الخصائص الكمية المتغيرة. ويظهر المتوسط ​​مستوى هذه الخاصية لكل وحدة من السكان.

عند دراسة الظواهر الاجتماعية ومحاولة تحديد سماتها المميزة والنموذجية في ظروف محددة من المكان والزمان، يستخدم الإحصائيون القيم المتوسطة على نطاق واسع. باستخدام المتوسطات، يمكنك مقارنة مجموعات سكانية مختلفة مع بعضها البعض وفقًا لخصائص مختلفة.

تنتمي المتوسطات المستخدمة في الإحصائيات إلى فئة متوسطات القوة. من بين متوسطات القدرة، يتم استخدام المتوسط ​​الحسابي في أغلب الأحيان، وفي كثير من الأحيان المتوسط ​​التوافقي؛ يتم استخدام المتوسط ​​التوافقي فقط عند حساب متوسط ​​معدلات الديناميكيات، ويستخدم مربع المتوسط ​​فقط عند حساب مؤشرات التباين.

الوسط الحسابي هو حاصل قسمة مجموع المتغيرات على عددها. يتم استخدامه في الحالات التي يتشكل فيها حجم الخاصية المتغيرة لجميع السكان كمجموع القيم المميزة لوحداتها الفردية. المتوسط ​​الحسابي هو النوع الأكثر شيوعا من المتوسط، لأنه يتوافق مع طبيعة الظواهر الاجتماعية، حيث غالبا ما يتم تشكيل حجم الخصائص المتغيرة في المجموع على وجه التحديد كمجموع القيم المميزة للوحدات الفردية من السكان .

وفقًا لخاصيته المحددة، يجب استخدام الوسط التوافقي عندما يتم تشكيل الحجم الإجمالي للسمة كمجموع القيم العكسية للمتغير. يتم استخدامه عندما لا يتم ضرب الأوزان، اعتمادًا على المادة، بل يتم تقسيمها إلى خيارات، أو، وهو نفس الشيء، مضروبة في قيمتها المتبادلة. والوسط التوافقي في هذه الحالات هو مقلوب الوسط الحسابي للقيم المتبادلة للخاصية.

وينبغي اللجوء إلى الوسط التوافقي في الحالات التي لا تستخدم فيها وحدات السكان - حاملات الخاصية - كأوزان، بل منتجات هذه الوحدات بقيمة الخاصية.


1. تعريف الوضع والوسيط في الإحصاء

تعمل الوسائل الحسابية والتوافقية على تعميم خصائص السكان وفقًا لخاصية أو أخرى مختلفة. الخصائص الوصفية المساعدة لتوزيع الخصائص المتغيرة هي الوضع والوسيط.

في الإحصائيات، الوضع هو قيمة الخاصية (المتغير) التي توجد غالبًا في مجموعة سكانية معينة. في سلسلة الاختلافات، سيكون هذا هو الخيار ذو التردد الأعلى.

في الإحصائيات، الوسيط هو الخيار الموجود في منتصف سلسلة التباين. يقسم الوسيط السلسلة إلى نصفين، وعلى جانبيها (أعلى وأسفل) يوجد نفس عدد الوحدات السكانية.

يعتبر الوضع والوسيط، على النقيض من وسائل القدرة، من الخصائص المحددة؛ ويتم تعيين معناها لأي خيار محدد في سلسلة الاختلافات.

يتم استخدام الوضع في الحالات التي يكون فيها من الضروري وصف القيمة الأكثر تكرارًا للخاصية. إذا كان من الضروري، على سبيل المثال، معرفة معدل الأجور الأكثر شيوعًا في مؤسسة ما، والسعر في السوق الذي تم فيه بيع أكبر عدد من السلع، وحجم الحذاء الأكثر طلبًا بين المستهلكين، وما إلى ذلك، في وفي هذه الحالات يلجأون إلى الموضة.

إن الوسيط مثير للاهتمام لأنه يوضح الحد الكمي لقيمة خاصية متفاوتة، والتي وصل إليها نصف أفراد السكان. دع متوسط ​​​​راتب موظفي البنك يبلغ 650 ألف روبل. كل شهر. ويمكن استكمال هذه الخاصية إذا قلنا أن نصف العمال حصلوا على راتب قدره 700000 روبل. والأعلى، أي. دعونا نعطي الوسيط. يعد الوضع والوسيط من الخصائص النموذجية في الحالات التي يكون فيها السكان متجانسين وكبيرين في العدد.


2. إيجاد المنوال والوسيط في سلسلة تباين منفصلة

إن العثور على المنوال والوسيط في سلسلة التباين، حيث يتم إعطاء قيم الخاصية بأرقام معينة، ليس بالأمر الصعب للغاية. دعونا نلقي نظرة على الجدول 1 مع توزيع الأسر حسب عدد الأطفال.

الجدول 1. توزيع الأسر حسب عدد الأطفال

من الواضح، في هذا المثال، أن الموضة ستكون عائلة لديها طفلان، نظرًا لأن قيمة الخيار هذه تتوافق مع أكبر عدد من العائلات. قد تكون هناك توزيعات حيث تحدث جميع الخيارات بشكل متساوٍ في كثير من الأحيان، وفي هذه الحالة لا يوجد وضع، أو بعبارة أخرى، يمكننا القول أن جميع الخيارات مشروطة بشكل متساوٍ. وفي حالات أخرى، قد لا يكون خيار واحد، بل خيارين، هو الأكثر تكرارًا. ثم سيكون هناك وضعين، وسيكون التوزيع ثنائي المنوال. قد تشير التوزيعات ثنائية النسق إلى عدم التجانس النوعي للسكان وفقًا للخاصية التي تتم دراستها.

للعثور على الوسيط في سلسلة تباين منفصلة، ​​تحتاج إلى تقسيم مجموع التكرارات إلى النصف وإضافة ½ إلى النتيجة. لذلك، في توزيع 185 أسرة على عدد الأطفال، سيكون الوسيط: 185/2 + ½ = 93، أي. الخيار رقم 93 الذي يقسم الصف المرتب إلى نصفين. ما هو معنى الخيار 93؟ من أجل معرفة ذلك، تحتاج إلى تجميع الترددات، بدءا من أصغر الخيارات. مجموع ترددات الخيارين الأول والثاني هو 40. ومن الواضح أنه لا يوجد 93 خيارًا هنا. إذا أضفنا تكرار الخيار الثالث إلى 40، نحصل على مجموع يساوي 40 + 75 = 115. وبالتالي، فإن الخيار 93 يتوافق مع القيمة الثالثة للخاصية المتغيرة، وسيكون الوسيط عائلة بها طفلان.

تزامن الوضع والوسيط في هذا المثال. إذا كان لدينا مجموع زوجي من التكرارات (على سبيل المثال، 184)، فعندئذ، باستخدام الصيغة المذكورة أعلاه، سنحصل على رقم الخيار المتوسط، 184/2 + ½ = 92.5. نظرًا لعدم وجود خيارات كسرية، تشير النتيجة إلى أن الوسيط يقع في منتصف المسافة بين 92 و93 خيارًا.

3. حساب الوضع والوسيط في سلسلة تباين الفاصل الزمني

ترجع الطبيعة الوصفية للمنوال والوسيط إلى حقيقة أنهما لا يعوضان الانحرافات الفردية. أنها تتوافق دائمًا مع خيار محدد. لذلك، لا يتطلب الوضع والوسيط إجراء حسابات لمعرفة ما إذا كانت جميع قيم السمة معروفة أم لا. ومع ذلك، في سلسلة تباين الفاصل الزمني، يتم استخدام الحسابات للعثور على القيمة التقريبية للمنوال والوسيط خلال فترة زمنية معينة.

لحساب قيمة معينة للقيمة المشروطة لخاصية موجودة في فترة زمنية، استخدم الصيغة:

M o = X Mo + i Mo *(f Mo – f Mo-1)/((f Mo – f Mo-1) + (f Mo – f Mo+1))),

حيث XMo هو الحد الأدنى للفاصل الزمني المشروط؛

i Mo – قيمة الفاصل الزمني المشروط؛

f Mo – تردد الفاصل الزمني المشروط؛

f Mo-1 - تردد الفاصل الزمني الذي يسبق الفاصل المشروط؛

f Mo+1 - تردد الفاصل الزمني الذي يلي الفاصل المشروط.

دعونا نعرض حساب الوضع باستخدام المثال الوارد في الجدول 2.


الجدول 2. توزيع العاملين في المؤسسة حسب استيفاء معايير الإنتاج

للعثور على المنوال، علينا أولًا تحديد الفترة المنوالية لهذه المتسلسلة. يوضح المثال أن أعلى تردد يتوافق مع الفاصل الزمني حيث تقع المتغيرات في النطاق من 100 إلى 105. وهذا هو الفاصل الزمني المشروط. قيمة الفاصل الزمني المشروط هي 5.

باستبدال القيم العددية من الجدول 2 في الصيغة أعلاه نحصل على:

م o = 100 + 5 * (104 -12)/((104 – 12) + (104 – 98)) = 108.8

معنى هذه الصيغة هو كما يلي: يتم تحديد قيمة ذلك الجزء من الفاصل الزمني المشروط الذي يجب إضافته إلى حده الأدنى اعتمادًا على حجم ترددات الفواصل الزمنية السابقة واللاحقة. في هذه الحالة نضيف 8.8 إلى 100، أي. أكثر من نصف الفترة لأن تكرار الفترة السابقة أقل من تكرار الفترة اللاحقة.

دعونا الآن نحسب الوسيط. للعثور على الوسيط في سلسلة تباين الفاصل الزمني، نحدد أولاً الفاصل الزمني الذي يقع فيه (الفاصل المتوسط). سيكون مثل هذا الفاصل الزمني الذي يكون تردده التراكمي مساويًا أو أكبر من نصف مجموع الترددات. يتم تشكيل التكرارات التراكمية عن طريق جمع التكرارات تدريجيًا، بدءًا من الفاصل الزمني بأقل قيمة للسمة. نصف مجموع الترددات هو 250 (500:2). لذلك، وفقًا للجدول 3، سيكون الفاصل الزمني المتوسط ​​هو الفاصل الزمني بقيمة راتب تبلغ 350.000 روبل. ما يصل إلى 400000 فرك.

الجدول 3. حساب الوسيط في سلسلة تباين الفاصل الزمني

قبل هذا الفاصل الزمني، كان مجموع الترددات المتراكمة 160. لذلك، للحصول على القيمة المتوسطة، من الضروري إضافة 90 وحدة أخرى (250 – 160).

متوسط ​​لييسمون قيمة السمة التي تقع في منتصف السلسلة المرتبة ويقسمونها إلى جزأين متساويين في عدد الوحدات. وبالتالي، في صف التوزيع المصنف، يحتوي نصف الصف على قيم سمات تتجاوز المتوسط، والنصف الآخر أقل من المتوسط.

يتم استخدام الوسيط بدلاً من الوسط الحسابي عندما يتبين أن الخيارات المتطرفة للسلسلة المرتبة (الأصغر والأكبر) مقارنة بالباقي كبيرة جدًا أو صغيرة جدًا.

في منفصلةفي سلسلة التباين التي تحتوي على عدد فردي من الوحدات، يكون الوسيط مساويًا لمتغير الخاصية التي لها الرقم:
,
حيث N هو عدد الوحدات السكانية.
في سلسلة منفصلة تتكون من عدد زوجي من الوحدات السكانية، يتم تعريف الوسيط على أنه متوسط ​​الخيارات التي تحتوي على أرقام و:
.
في توزيع العمال حسب مدة الخدمة، يساوي الوسيط متوسط ​​الخيارات ذات الأرقام 10 في السلسلة المرتبة: 2 = 5 و10: 2 + 1 = 6. الخيارات الخاصة بالخاصيتين الخامسة والسادسة متساوية إلى 4 سنوات، وبالتالي
من السنة
عند حساب الوسيط في فاصلةالصف الأول تجد الفاصل الزمني المتوسط، (أي تحتوي على الوسيط)، والتي تستخدم فيها الترددات أو الترددات المتراكمة. الوسيط هو الفاصل الزمني الذي يساوي تكراره المتراكم أو أكبر من نصف الحجم الإجمالي للسكان. ثم يتم حساب القيمة المتوسطة باستخدام الصيغة:
,
أين هو الحد الأدنى للفاصل الزمني المتوسط؛
- عرض الفاصل الزمني المتوسط؛
- التردد المتراكم للفاصل الزمني الذي يسبق الوسيط؛
- تردد الفاصل الزمني المتوسط.
لنحسب متوسط ​​توزيع العمال حسب الراتب (انظر المحاضرة "ملخص وتجميع البيانات الإحصائية").
المتوسط ​​هو نطاق الراتب 800-900 غريفنا، حيث أن تردده التراكمي هو 17، وهو ما يتجاوز نصف مجموع جميع الترددات (). ثم
أنا=800+100 غريفنا.
تشير القيمة التي تم الحصول عليها إلى أن نصف العمال لديهم أجور أقل من 875 غريفنا، ولكن هذا أعلى من المتوسط.
لتحديد الوسيط، يمكنك استخدام التكرارات التراكمية بدلاً من التكرارات التراكمية.
لا يعتمد الوسيط، مثل الوضع، على القيم المتطرفة للمتغير، لذلك يتم استخدامه أيضًا لوصف المركز في سلسلة التوزيع بحدود غير مؤكدة.
خاصية متوسطة : مجموع القيم المطلقة للانحرافات عن الوسيط أقل من أي قيمة أخرى (بما في ذلك الوسط الحسابي):

تُستخدم خاصية الوسيط هذه في النقل عند تصميم موقع محطات الترام والترولي باص ومحطات الوقود ونقاط التجمع وما إلى ذلك.
مثال.يوجد 10 مرائب على طول الطريق السريع الذي يبلغ طوله 100 كيلومتر. لتصميم إنشاء محطة وقود، تم جمع بيانات عن عدد الرحلات المتوقعة إلى محطة الوقود لكل مرآب.
جدول 2 - بيانات عدد الرحلات إلى محطة الوقود لكل جراج.

من الضروري تركيب محطة وقود بحيث يكون إجمالي عدد الكيلومترات من المركبات للتزود بالوقود في حده الأدنى.
الخيار 1.إذا تم وضع محطة وقود في منتصف الطريق السريع، أي عند الكيلومتر الخمسين (مركز نطاق التغييرات في السمة)، فإن المسافة المقطوعة، مع مراعاة عدد الرحلات، ستكون:
أ) في اتجاه واحد:
;
ب) في المقابل:
;
ج) إجمالي المسافة المقطوعة في الاتجاهين: .

الخيار 2.إذا تم وضع محطة وقود في القسم الأوسط من الطريق السريع، يتم تحديدها بواسطة معادلة المتوسط ​​الحسابي، مع مراعاة عدد الرحلات:

يمكن تحديد الوسيط بيانياً باستخدام التراكم (انظر المحاضرة "ملخص وتجميع البيانات الإحصائية"). للقيام بذلك، يتم تقسيم الإحداثي الأخير، الذي يساوي مجموع جميع الترددات أو الترددات، إلى النصف. من النقطة الناتجة، يتم استعادة عمودي حتى يتقاطع مع التراكم. يعطي الإحداثي عند نقطة التقاطع القيمة المتوسطة.

تُستخدم الدالة MEDIAN في Excel لتحليل نطاق من القيم الرقمية وإرجاع رقم يمثل منتصف المجموعة التي يتم فحصها (الوسيط). أي أن هذه الوظيفة تقسم مجموعة الأرقام بشكل مشروط إلى مجموعتين فرعيتين، تحتوي الأولى على أرقام أقل من الوسيط، والثانية - أكثر. الوسيط هو إحدى الطرق العديدة لتحديد الاتجاه المركزي لمجموعة من الاهتمامات.

أمثلة على استخدام الدالة MEDIAN في Excel

عند دراسة الفئات العمرية للطلاب، تم استخدام بيانات من مجموعة مختارة عشوائياً من الطلاب في إحدى الجامعات. المهمة هي تحديد متوسط ​​​​عمر الطلاب.

البيانات الأولية:

صيغة الحساب:


وصف الوسيطة:

  • B3:B15 - نطاق الأعمار المدروسة.

نتيجة:

أي أن هناك طلاب في المجموعة أعمارهم أقل من 21 سنة وأكثر من هذه القيمة.



مقارنة الدالتين MEDIAN وAVERAGE لحساب القيمة المتوسطة

خلال الجولات المسائية في المستشفى، تم قياس درجة حرارة جسم كل مريض. توضيح فائدة استخدام المعلمة المتوسطة بدلاً من القيمة المتوسطة لفحص نطاق من القيم التي تم الحصول عليها.

البيانات الأولية:

صيغة لإيجاد المتوسط:

صيغة لإيجاد الوسيط:

وكما يتبين من القيمة المتوسطة، تكون درجة حرارة المرضى في المتوسط ​​أعلى من المعتاد، ولكن هذا ليس صحيحا. ويظهر المتوسط ​​أن ما لا يقل عن نصف المرضى لديهم درجة حرارة الجسم الطبيعية، ولا تتجاوز 36.6.

انتباه! هناك طريقة أخرى لتحديد الاتجاه المركزي وهي الوضع (القيمة الأكثر حدوثًا في النطاق قيد الدراسة). لتحديد الاتجاه المركزي في Excel، يجب عليك استخدام الدالة MODE. يرجى ملاحظة أن قيم الوسيط والوضع في هذا المثال هي نفسها:

أي أن القيمة المتوسطة التي تقسم مجموعة واحدة إلى مجموعات فرعية ذات قيم أصغر وأكبر هي أيضًا القيمة الأكثر تكرارًا في المجموعة. كما ترون، فإن درجة حرارة معظم المرضى تبلغ 36.6.

مثال لحساب الوسيط في التحليل الإحصائي في برنامج Excel

مثال 3. هناك 3 مندوبي مبيعات يعملون في متجر. بناءً على نتائج آخر 10 أيام، من الضروري تحديد الموظف الذي سيحصل على المكافأة. عند اختيار أفضل موظف تؤخذ بعين الاعتبار درجة كفاءة عمله، وليس عدد البضائع المباعة.

جدول البيانات الأصلي:


لوصف الكفاءة، سوف نستخدم ثلاثة مؤشرات في وقت واحد: القيمة المتوسطة، والوسيط، والمنوال. دعونا نحددها لكل موظف باستخدام الصيغ AVERAGE و MEDIAN و MODE على التوالي:


لتحديد درجة تشتت البيانات، نستخدم قيمة تمثل القيمة الإجمالية لمعامل الفرق بين القيمة المتوسطة والوضع، والقيمة المتوسطة والوسيط، على التوالي. أي أن المعامل x=|av-med|+|av-mod|، حيث:

  • أف - متوسط ​​القيمة؛
  • ميد - متوسط؛
  • وزارة الدفاع - الموضة.

لنحسب قيمة معامل x للبائع الأول:

سنقوم بإجراء الحسابات بالمثل للبائعين الآخرين. نتائج:


دعونا نحدد البائع الذي سيتم منح المكافأة له:

ملاحظة: ترجع الدالة SMALL أول قيمة دنيا من النطاق المدروس لقيم معامل x.


معامل x هو خاصية كمية معينة لاستقرار عمل مندوبي المبيعات، والتي قدمها خبير الاقتصاد في المتجر. وبمساعدتها، كان من الممكن تحديد النطاق بأصغر الانحرافات في القيم. توضح هذه الطريقة كيف يمكن استخدام ثلاث طرق لتحديد النزعة المركزية في وقت واحد للحصول على النتائج الأكثر موثوقية.

ميزات استخدام الدالة MEDIAN في Excel

تحتوي الوظيفة على بناء الجملة التالي:

الوسيط (رقم 1؛ [رقم 2]؛...)

وصف الحجج:

  • number1 هو وسيطة مطلوبة تميز القيمة الرقمية الأولى الموجودة في النطاق قيد الدراسة؛
  • [الرقم 2] - الثانية الاختيارية (والوسيطات اللاحقة، حتى 255 وسيطة في المجموع)، والتي تميز القيم الثانية والقيم اللاحقة للنطاق قيد الدراسة.

ملاحظات 1:

  1. عند إجراء الحسابات، يكون من الملائم أكثر نقل النطاق الكامل للقيم التي تتم دراستها مرة واحدة بدلاً من إدخال الوسائط بشكل تسلسلي.
  2. الوسيطات المقبولة هي البيانات الرقمية، والأسماء التي تحتوي على أرقام، وبيانات النوع المرجعي، والمصفوفات (على سبيل المثال، =MEDIAN((1,2,3,5,7,10))).
  3. عند حساب الوسيط، يتم أخذ الخلايا التي تحتوي على قيم فارغة أو القيم المنطقية TRUE وFALSE في الاعتبار، والتي سيتم تفسيرها على أنها القيم الرقمية 1 و0 على التوالي. على سبيل المثال، نتيجة تنفيذ دالة ذات قيم منطقية في الوسيطات (TRUE; FALSE) تعادل نتيجة تنفيذها مع الوسيطات (1;0) وتساوي 0.5.
  4. إذا كانت وسيطة دالة واحدة أو أكثر تقبل قيمًا نصية لا يمكن تحويلها إلى قيم رقمية، أو تحتوي على رموز خطأ، فستُرجع الدالة رمز الخطأ #VALUE!.
  5. يمكن استخدام وظائف Excel الأخرى لتحديد متوسط ​​العينة: PERCENTILE.IN، QUARTILE.IN، MAX أمثلة للاستخدام:
  • =PERCENTILE.IN(A1:A10,0.5)، نظرًا لأن الوسيط حسب التعريف هو المئين الخمسين.
  • =QUARTILE.ON(A1:A10;2)، حيث أن الوسيط هو الربع الثاني.
  • =HIGH(A1:A9,COUNT(A1:A9)/2)، ولكن فقط إذا كان عدد الأرقام في النطاق رقمًا فرديًا.

ملاحظات 2:

  1. إذا تم توزيع جميع الأرقام في النطاق قيد الدراسة بشكل متماثل حول المتوسط، فإن المتوسط ​​الحسابي والوسيط لهذا النطاق سيكونان متساويين.
  2. مع الانحرافات الكبيرة للبيانات في النطاق ("مبعثر" القيم)، يعكس الوسيط الاتجاه في توزيع القيم بشكل أفضل من المتوسط ​​الحسابي. ومن الأمثلة الممتازة على ذلك استخدام الوسيط لتحديد المستوى الحقيقي للرواتب بين سكان الدولة التي يكسب فيها المسؤولون أكثر من المواطنين العاديين.
  3. قد يحتوي نطاق القيم قيد الدراسة على:
  • عدد فردي من الأرقام. في هذه الحالة، سيكون الوسيط رقمًا واحدًا يقسم النطاق إلى مجموعتين فرعيتين من القيم الأكبر والأصغر، على التوالي؛
  • حتى عدد الأرقام. ثم يتم حساب الوسيط باعتباره الوسط الحسابي لقيمتين عدديتين تقسم المجموعة إلى المجموعتين الفرعيتين المشار إليهما أعلاه.

الرواتب في مختلف قطاعات الاقتصاد، ومستويات درجات الحرارة وهطول الأمطار في نفس المنطقة لفترات زمنية مماثلة، وإنتاجية المحاصيل المزروعة في مناطق جغرافية مختلفة، وما إلى ذلك. ومع ذلك، فإن المتوسط ​​​​ليس بأي حال من الأحوال المؤشر العام الوحيد - في بعض الحالات للحصول على تقييم أكثر دقة، القيمة المناسبة هي الوسيط. في الإحصاء، يتم استخدامه على نطاق واسع كخاصية وصفية مساعدة لتوزيع الخاصية في مجتمع معين. دعونا نتعرف على كيفية اختلافه عن المتوسط، وكذلك سبب ضرورة استخدامه.

الوسيط في الإحصاء: التعريف والخصائص

تخيل الموقف التالي: 10 أشخاص يعملون في شركة مع المدير. يتلقى العمال العاديون 1000 غريفنا، ويتلقى مديرهم، وهو المالك أيضًا، 10000 غريفنا. إذا قمت بحساب المتوسط ​​الحسابي، اتضح أن متوسط ​​\u200b\u200bالراتب في هذه المؤسسة هو 1900 غريفنا. هل سيكون هذا البيان صحيحا؟ أو لنأخذ هذا المثال: في نفس جناح المستشفى يوجد تسعة أشخاص درجة حرارتهم 36.6 درجة مئوية، وشخص واحد درجة حرارته 41 درجة مئوية. والوسط الحسابي في هذه الحالة يساوي: (36.6*9+41)/10 = 37.04 درجة مئوية. لكن هذا لا يعني أن كل الحاضرين مريض. كل هذا يشير إلى أن المتوسط ​​وحده لا يكفي في كثير من الأحيان، ولهذا السبب يتم استخدام المتوسط ​​بالإضافة إليه. في الإحصائيات، يُطلق على هذا المؤشر اسم الخيار الموجود بالضبط في منتصف سلسلة التباين المطلوبة. إذا قمنا بحسابها لأمثلتنا، فسنحصل على 1000 غريفنا، على التوالي. و 36.6 درجة مئوية. بمعنى آخر، الوسيط في الإحصاء هو القيمة التي تقسم سلسلة إلى نصفين بحيث يوجد على جانبيها (لأسفل أو لأعلى) نفس عدد الوحدات في مجتمع معين. وبسبب هذه الخاصية، فإن هذا المؤشر له عدة أسماء أخرى: المئين الخمسين أو الكمية 0.5.

كيفية العثور على الوسيط في الإحصاء

تعتمد طريقة حساب هذه القيمة إلى حد كبير على نوع سلسلة التباين لدينا: منفصلة أو فاصلة. في الحالة الأولى، يتم العثور على الوسيط بكل بساطة في الإحصائيات. كل ما عليك فعله هو إيجاد مجموع التكرارات وتقسيمه على 2 ثم إضافة ½ إلى النتيجة. سيكون من الأفضل شرح مبدأ الحساب باستخدام المثال التالي. لنفترض أننا قمنا بتجميع بيانات حول الخصوبة ونريد معرفة الوسيط.

رقم المجموعة العائلية حسب عدد الأطفال

عدد العائلات

وبعد بعض الحسابات البسيطة نجد أن المؤشر المطلوب هو: 195/2 + ½ = option. من أجل معرفة ما يعنيه هذا، يجب عليك تجميع الترددات بالتتابع، بدءا من أصغر الخيارات. إذن، مجموع أول سطرين يعطينا 30. ومن الواضح أنه لا يوجد 98 خيارًا هنا. لكن إذا أضفت تكرار الخيار الثالث (70) إلى النتيجة، فستحصل على مجموع يساوي 100. وهو يحتوي بالضبط على الخيار 98، مما يعني أن الوسيط سيكون عائلة لديها طفلان.

أما بالنسبة للسلسلة الفاصلة، عادة ما تستخدم الصيغة التالية:

M e = X Me + i Me * (∑f/2 - S Me-1)/f Me، حيث:

  • X Me - القيمة الأولى للفاصل الزمني المتوسط؛
  • ∑f - عدد السلاسل (مجموع تردداتها)؛
  • i ME - قيمة النطاق المتوسط؛
  • f Me - تردد النطاق المتوسط؛
  • S ME-1 هو مجموع الترددات التراكمية في النطاقات التي تسبق الوسيط.

مرة أخرى، من الصعب جدًا أن نفهم بدون مثال. لنفترض أن هناك بيانات عن القيمة

الراتب ألف روبل.

الترددات المتراكمة

لاستخدام الصيغة أعلاه، نحتاج أولاً إلى تحديد الفاصل الزمني المتوسط. على هذا النحو، اختر النطاق الذي يتجاوز تردده المتراكم نصف مجموع الترددات أو يساويه. لذلك، بتقسيم 510 على 2، نجد أن هذا المعيار يتوافق مع الفاصل الزمني بقيمة الراتب 250000 روبل. ما يصل إلى 300000 فرك. يمكنك الآن استبدال كافة البيانات في الصيغة:

M e = X Me + i Me * (∑f/2 - S Me-1)/f Me = 250 + 50 * (510/2 - 170) / 115 = 286.96 ألف روبل.

نأمل أن تكون مقالتنا مفيدة وأن يكون لديك الآن فهم واضح لماهية الوسيط في الإحصائيات وكيفية حسابه.

رقم يميز العينة (على سبيل المثال، مجموعة من الأرقام). إذا كانت جميع عناصر العينة مختلفة، فإن الوسيط هو رقم العينة بحيث يكون نصف عناصر العينة بالضبط أكبر منه والنصف الآخر أقل منه. وبشكل أكثر عمومية، يمكن العثور على الوسيط من خلال ترتيب عناصر العينة بترتيب تصاعدي أو تنازلي وأخذ العنصر الأوسط. على سبيل المثال تتحول العينة (11، 9، 3، 5، 5) بعد الترتيب إلى (3، 5، 5، 9، 11) ووسيطها هو الرقم 5. وإذا كانت العينة تحتوي على عدد زوجي من العناصر، فإن لا يمكن تحديد الوسيط بشكل فريد: بالنسبة للبيانات الرقمية، يتم استخدام نصف مجموع القيمتين المتجاورتين في أغلب الأحيان (أي أن متوسط ​​المجموعة (1، 3، 5، 7) يساوي 4)، لمزيد من التفاصيل انظر.

يمكن أيضًا تعريف الوسيط للمتغيرات العشوائية: في هذه الحالة، يقسم التوزيع إلى النصف. بشكل تقريبي، متوسط ​​المتغير العشوائي هو رقم بحيث يكون احتمال الحصول على قيمة المتغير العشوائي على يمينه مساويًا لاحتمال الحصول على القيمة على يساره (وكلاهما يساوي 1/2)؛ للحصول على تعريف أكثر دقة، راجع .

يمكن القول أيضًا أن الوسيط هو المئين الخمسين أو الكمية 0.5 أو الربع الثاني للعينة أو التوزيع.

خصائص الوسيط للمتغيرات العشوائية

F (x) = 0.5 (\displaystyle F(x)=0.5)

إذا كان التوزيع دالة مستمرة ومتزايدة بشكل صارم، فإن حل المعادلة يكون فريدًا. إذا كان للتوزيع انقطاعات، فقد يتطابق الوسيط مع القيمة الدنيا أو القصوى (المتطرفة) الممكنة للمتغير العشوائي، وهو ما يتعارض مع الفهم "الهندسي" لهذا المصطلح.

يعد الوسيط خاصية مهمة لتوزيع المتغير العشوائي، ويمكن استخدامه، مثل القيمة المتوقعة، لتوسيط التوزيع. وبما أن تقديرات الوسيط أكثر قوة، فقد يكون تقديره أكثر تفضيلاً للتوزيعات بما يسمى. ذيول ثقيلة. ومع ذلك، لا يمكن مناقشة مزايا تقدير الوسيط مقارنة بالتوقع الرياضي إلا إذا تزامنت خصائص التوزيع هذه، على وجه الخصوص، مع وظائف الكثافة الاحتمالية المتماثلة.

يتم تحديد الوسيط لجميع التوزيعات، وفي حالة الغموض يتم تحديده بشكل طبيعي بشكل أكبر، في حين قد لا يتم تحديد التوقع الرياضي (على سبيل المثال، لتوزيع كوشي).

مثال الاستخدام

لنفترض أن هناك 19 شخصًا فقيرًا ومليونيرًا واحدًا في غرفة واحدة. كل فقير لديه 5 دولارات، وكل مليونير لديه مليون دولار (10 6). المجموع هو 1,000,095 دولارًا أمريكيًا، وإذا قسمنا المال بالتساوي بين 20 شخصًا، نحصل على 50,004.75 دولارًا أمريكيًا. سيكون هذا هو المتوسط ​​الحسابي لمبلغ المال الذي كان يمتلكه جميع الأشخاص العشرين الموجودين في تلك الغرفة.

الوسيط في هذه الحالة سيكون مساوياً لـ 5 دولارات (نصف مجموع العاشر والحادي عشر، الوسيطقيم السلسلة المرتبة). هذا يمكن تفسيره على النحو التالي. بعد تقسيم شركتنا إلى مجموعتين متساويتين كل منهما 10 أشخاص، يمكننا القول أنه في المجموعة الأولى لا يملك كل فرد أكثر من 5 دولارات، وفي الثانية ما لا يقل عن 5 دولارات. بشكل عام، يمكننا القول أن الوسيط هو مقدار ما جلبه الشخص "العادي" معه. وعلى العكس من ذلك، فإن المتوسط ​​الحسابي هو صفة غير مناسبة، لأنه يتجاوز بشكل كبير المبلغ النقدي المتاح للشخص العادي.