آمار توصیفی وارائه داده ها

تهیه کننده : عبدالامیر کربلایی
منبع : سایت راسخون، http://rasekhoon.net

همانطور که می دانید فصل چهارم پایان نامه های علوم انسانی و نیز بخش مهمی از مقالات و طرحهای پژوهشی مربوط به بخش آمار و تجزیه و تحلیل داده است. آمار توصیفی یک از دو بخش مهم ارزیابی و تحلیل داده ها به ویژه در مورد سوالات دموگرافیک یا جمعیت شناسی ابزارهای جمع اوری اطلاعات در این طرح هاست. در این مطلب آشنایی کاملی باآمار توصیفی و آماره های آن برای دانشجویان عزیز و کاربران محترم آورده شده است. این مطلب از سایت راسخون به امانت گرفته شده است.

مقدمه:

کلمه آمار ابتدا به معنی مجموعه اطلاعاتی از جمعیت واقتصاد بود، اینک، آمار از آن شروع ابتدایی ، به یک روش علمی تجزیه و تحلیل که در تمام رشته های علوم اجتماعی ومهندسی و… به کار برده میشود،ترقی کرده است.
آمار شاخهای از علوم است که به نقش:
۱-سازماندهی وخلاصه کردن
۲-استنباط ونتیجه گیری در باره مجموعه ای از داده هاست ،وقتی که تنها بخشی از آن ها مشاهده شده اند.
درحقیقت آمار یک روش است که هدفش توصیف کردن است وعلاوه بر این ، یک روش کمی است که از عدد به عنوان وسیله ای برای بیان و توصیف استفاده میشود.
با نگرش به این توصیف ، از نقطه نظر آموزشی ، سه مرحله زیر را میتوان در آمار در نظر گرفت:
۱-آمار توصیفی
۲-احتمالات
۳-آمار ریاضی
آمار توصیفی وارائه داده ها

هدف آموزشی
علم آمار با روشهای مورد استفاده از جمع آوری، ارائه، تجزیه و تحلیل و تفسیرداده ها سروکار دارد. هر نوع عمل کردن روی داده ها که پیش بینی ها یا استنباط هایی درباره گروه بزرگتری از داده ها منجر شود. آمار استنباطی و مجموعه روشها و قوانینی که نتایج را ساده تر کند آمار توصیفی شمرده می شود.
جامعه و نمونه ها

اگر یک مجموعه داده همه مشاهدات ممکن یک پدیده خاص را شامل شود ، آن را یک جامعه می نامیم . اگر یک مجموعه داده فقط یک بخش از مشاهدات را شامل شود ، آن را نمونه می نامیم .
به عنوان مثال برآمدهای ۱۲ پرتاب یک سکه (شیر و خط) را در یک نمونه از همه پرتاب های ممکن سکه در جامعه بررسی میکنیم .
مفاهیم کلی در رابطه با جامعه

جامعه (آماری) ، عبارت است از مجموعه کامل اندازه‌های ممکن یا اطلاعات ثبت شده از یک صفت کیفی ، در مورد گرد آورده کامل واحدها ، که می‌خواهیم استنباطهایی راجع به آن انجام دهیم. جامعه آماج تحقیق است، و منظور از عمل گردآوردن داده‌ها ، استخراج نتایج درباره جامعه می‌باشد. یا به بیان ساده‌تر ، در هر بررسی آماری ، مجموعه عناصر مورد نظر را جامعه می‌نامند. یعنی جامعه ، مجموعه تمام مشاهدات ممکن است که می توانند با تکرار یک آزمایش حاصل شوند.
مفاهیم کلی در رابطه نمونه

نمونه‌ای از جامعه آماری ، مجموعه اندازه‌هایی است که عملا در جریان یک تحقیق گردآوری می‌شود. نمونه بخشی از جامعه تحت بررسی است که با روشی که از پیش تعیین شده است انتخاب می‌شود. به قسمی که می‌توان از این بخش ، استنباطهایی درباره کل جامعه بدست آورد. هر گونه درباره جامعه را می‌توان کم و بیش از طریق نمونه برآورد کرد. فرآیند انتخاب نمونه و استخراج نتایج و استنباطهای حاصل را بررسی نمونه‌ای می‌نامند.
میانگین حسابی

فرض کنید جامعه مورد بررسی دارای N عضو x1,x2,…,xn باشد. میانگین جامعه از رابطه زیر بدست می آید:

مثال : در یک روز خاص ،۹ دانشآموز به ترتیب : ۱،۲،۳،۰،۱،۵،۲،۱ و ۳ نامه دریافت کردهاند ، میانگین را پیدا کنید .
حل : تعداد کل نامههایی که ۹ دانشآموز دریافت کردهاند برابر با ۱۸
است . بنابراین ۱۸/۹=۲ و میانگین تعداد نامه برای هر دانشآموز ۲ است .
مثال: فرص کنید کانون مهندسین نرم افزار کامپیوتر دارای ۷ عضو است که حقوق سالانه آن ها عبارتند از:
۱۵۰۰ ۱۷۰۰ ۱۹۰۰ ۲۰۰۰ ۱۳۰۰ ۱۴۰۰ ۱۷۵۰
میانگین جامعه را حساب کنید.
حل:

میانگین هندسی

میانگین هارمونیک

میانگین پیراسته

میانگین پیراسته حالت خاصی از میانگین حسابی است به طوری که تعداد ار مشاهدات به علت نا هماهنگ بودن، از داده ها حذف می شود و میانگین حسابی برای داده ها باقی مانده محاسبه می شود. اگرk تا از مشاهدات حذف شده باشند میانگین پیراسته از رابطه زیر بدست می آید(k<n).

میانه و دیگر چندک

به منظورجلوگیری از خطای ایجاد شده توسط مقادیر خیلی بزرگ یا کوچک ، گاهی اوقات بهتر است ”وسط“ یا ”مرکز” یک مجموعه از داده را بوسیله اندازههای آماری دیگر به جز میانگین توصیف کنیم .
تعریف : یکی از این مقیاس ها یعنی میانه n مقدار ما را ملزم میسازد که دادهها را بر حسب اندازه نمونه مرتب کنیم .
وقتی که n فرداست ، میانه برابر با وسط داده هاست .
وقتی که n زوج است ، میانه برابر با میانگین دو عددی است که نزدیک وسط دادهها هستند.
در آمار چارک و صدک ها مهم هستند اما صدک ها به طور کلی در مورد مجموعههای بزرگ به کار میروند . بنابراین اکنون سه چارک به صورت زیر معرفی می کنیم .
Q1:چارک اول میانه تمام مقادیر سمت چپ موقعیت میانه تمام داده های مجموعه است .
Q2:چارک دوم ، میانه است .
Q3 :چارک سوم ، میانه تمام مقادیر سمت راست میانه تمام داده های مجموعه است .
مثال : اعداد زیر تعداد دقایقی است که فردی در طول ۱۴ روز باید برای رفتن به محل کارش منتظر اتوبوس شود ۱۰،۲،۱۷،۱،۱۶،۸،۳،۱۰،۲،۹،۵،۹،۱۳،۱۰و ۱۰ ، میانه ، Q1 و Q2 بیابید .
حل : برایn=14 موقعیت میانه برابر است با (۱۴+۱)/۵=۷٫۵ ، بنابراین موقعیت (۷+۱)/۲=۴
Q1 و Q2 چهارمین مقدار از آخر میباشد . هنگامی که دادهها را براساس اندازه شان مرتب کنیم، داریم : ۱۷،۱۳،۱۰،۱۰،۱۰،۹،۹،۸،۶،۵،۳،۲،۲و ۱ .
ملاحظه میکنید که میانه برابر با (۸+۹)/۲=۸٫۵ وQ1=3 و Q3=10 میباشد .
دامنه

« دامنه عبارتست از تفاوت کوچکترین مقدار و بزرگترین مقدار. »
توزیع های فراوانی

یک جدول مانند جدول زیررا جدول توزیع فراوانی و یا به طور ساده تری ، توزیع عددی می نامند . این جدول چگونگی توزیع سن ۱۰ میلیون فرد دستگیر شده را نشان میدهد . این مقادیر دادهها بر طبق یک مقدار عدد (سن) طبقهبندی شدهاند ، در بعضی از مثال ها اطلاعات را براساس مقیاس های غیر عددی مانند :رنگ،ناحیه جغرافیایی، تشخیص پزشکی دسته بندی میکنیم

نمایش نموداری

برای خلاصه کردن مجموعههای بزرگی از دادهها در یک شکل ساده ، آنها را اغلب به صورت نموداری نمایش میدهیم . معمولترین شکل نمایش به صورت نموداری توزیع فراوانی ، بافت نگار است.

قاعده مستطیل های نمایش داده شده روی فاصله‌های مساوی و ارتفاعشان مطابق با فراوانی هاست .

نمودار میله ای برای توزیع تعداد دفعاتی که ۸۰ دانشجو در فعالیتهای فوق برنامه کاندید شده اند.

چند ضلعی فراوانی توزیع تعداد ساعاتی که ۸۰ دانشجو در فعالیتهای فوق برنامه کاندید شده اند

نمودار دایره ای

نمودار وضعیت خانوارهای ارتشی سفید پوست کشوری در سال ۱۹۸۲
اندازه نمونه ، معمولاً بوسیله حرف تعریف شده است . مقدار را در یک نمونه به صورت x1,x2,…,xn نشان می دهیم و می نویسیم :

مثال : در ماه اخیر ، سازمان ماهیگیری اعلام کرد که ۵۳،۳۱،۶۷،۵۳ و ۳۶ تخلف در صید ماهی در ۵ ناحیه متفاوت
اتفاق افتاده است . میانه تعداد تخلفات برای ماه‌های اخیر را پیدا کنید:
حل : ابتدا اعداد را به ترتیب صعودی مرتب می‌کنیم .
۶۷،۵۳،۵۳،۳۶،۳۱
بنابراین میانه برابر با ۵۳ است
مُد

مُد یکی دیگر از مقیاس های مکان است که در بعضی مواقع برای توصیف وسط یک مجموعه از دادهها مقیاس های مکان دیگری در کنار میانگین ، میانه و مد وجود دارند و سوالی که کدام متوسط در یک موقعیت بهخصوص باید انتخاب شود همواره به راحتی پاسخ داده نمیشود . واقعیت این است که جادوی آمار میتواند هر چیزی را ثابت کند .
مثال : نمونهای از گزارش گرفته شده در سال جاری یک شرکت وسایل نقلیه موتوری حاکی ازآن است که شانزده راننده در گروههای سنی مشخص:
۲،۳،۳،۱،۰،۲،۱،۰،۳،۴،۰،۳،۲،۳و۰وجود دارد ، مد را پیداکنید.
حل :۰ پنج بار، ۱دو بار، ۲سه بار، ۳پنج بار، ۴یک بار و ۰و۳ هرکدام با بیشترین فراوانی پنج بار تکرار شدهاند ، بنابراین ۲ مد وجود دارد .
میتوانیم نتیجه بگیریم که هم تعداد رانندگان خوب و هم رانندگان ضعیف زیاد است . و تعداد رانندگانی بین این دو دسته وجود دارند کم است .
مقیاس پراکندگی : انحراف معیار

برای معرفی انحراف معیار یکی از پرکارترین مقیاس پراکندگی بیان می کنیم که اگر مقادیر در اطراف میانگین متراکم باشند انحراف معیار کوچک و اگر از میانگینشان دور باشند مقدارش بزرگ است . بنابراین بهنظر قابلقبول میرسد که برای

هر جایی که دادهها یک نمونه یا یک جامعه تشکیل میدهند ، از فرمول صفحه قبل می توان استفاده کرد . در این قسمت بیان می کند که متغیرها چند ، انحراف معیار استاندارد بالاتر یا پایین تر از میانگین مجموعه دادهها قرار میگیرد . واحد استاندارد در قسمت بعدی به کار برده میشود .
مثال : در طول چند ماه گذشته یک دونده با میانگین ۱۲ مایل درهفته با انحراف معیار استاندارد ۲ مایل در حالی که یک دونده دیگر با میانگین ۲۵ مایل در هفته با انحراف معیار استاندارد ۳ مایل دویده است . کدامیک از این دو دونده سازگاری ارتباطی بیشتری با برنامه هفتگی دویدن دارد ؟
حل : دو ضریب تعیین به ترتیب :
(۳/۲۵)*۱۰۰%=۱۲% (۲/۱۲)*۱۰۰%=۱۶٫۷%
پس دونده دوم سازگاری ارتباط بیشتری با برنامه هفتگی دویدن دارد .
منابع
۱-کتاب آمار و احتمال مهندسی جان فروند

۲-http://daneshnameh.roshd.ir
۳–http://bekrizadeh.blogfa.com
۴- http://statisticslu.blogfa.com



افزودن نظر: