امروزه مدیران، برنامه‌ریزان و تصمیم‌گیران برای تصمیم‌گیری بهتر به دنبال اطلاعات می‌باشند. این اطلاعات باید از کیفیت مطلوبی برخوردار باشند. برای رسیدن به این هدف باید خطاها را شناسایی و ویرایش کرد. خطاهای مورد بررسی در این پایان‌نامه دورافتادگی و بی‌پاسخی می‌باشند.‎‎ در یک مجموعه داده‌ها بزرگ، دورافتاده‌ها به وسیله‌ی روش غیررسمی، رسم نمودار‏، ممکن است به سختی شناسایی شوند. به منظور رفع این مشکل یک روش نیم‌خودکار برای شناسایی دورافتاده‌ها برای داده‌های چند متغیره‌ی پیوسته معرفی می‌شود. داده‌های خام با دورافتاده‌ها به وسیله توزیع نرمال چند متغیره‌ی آلوده توصیف می‌شوند. با روش داده‌افزایی، آلگوریتم ‎ EMو آلگوریتم ‎ EM ‎ اصلاحی برای داده‌های گم‌شده، داده‌ها را ویرایش کرده و براوردی استوار برای میانگین و واریانس با وجود مقدارهای گم‌شده به‌دست می‌آوریم. در نهایت در یک مطالعه‌ی شبیه‌سازی بر روی داده‌های هزینه و درامد خانوار روستایی سال ‎1389‎ مرکز آمار ایران، کارایی دو روش ویرایش داده‌افزایی و آلگوریتم‎ ‌‎EM ‎ را با هم مقایسه می‌کنیم.

 متن کامل در سایت تخصصی دانلود پایان نامه های کارشناسی ارشد  :www.arshadha.ir