การเปรียบเทียบประสิทธิภาพของสถิติทดสอบทีและสถิติทดสอบแมนน์-วิตนีย์ กรณีมีค่านอกกลุ่ม
Main Article Content
Abstract
งานวิจัยนี้มีวัตถุประสงค์เพื่อเปรียบเทียบประสิทธิภาพของสถิติทดสอบทีและสถิติทดสอบแมนน์-วิตนีย์ สำหรับทดสอบความแตกต่างของค่ากลางของประชากร 2 กลุ่ม ในกรณีที่ความแปรปรวนของประชากร 2 กลุ่มไม่แตกต่างกัน ภายใต้การแจกแจงของประชากร 2 กลุ่มเป็นแบบสมมาตร ได้แก่ การแจกแจงแบบปกติ การแจกแจงแบบยูนิฟอร์ม และการแจกแจงแบบโลจิสติก ที่ขนาดตัวอย่าง 2 กลุ่มเท่ากัน คือ 20 40 60 และ 100 โดยทำการศึกษาในกรณีที่ตัวอย่างทั้ง 2 กลุ่มไม่มีค่านอกกลุ่ม และกรณีที่มีค่านอกกลุ่มปะปนอยู่ทั้งในตัวอย่างกลุ่มที่ 1 และปะปนอยู่ในตัวอย่างทั้งสองกลุ่ม ด้วยสัดส่วน 0.05 ในแต่ละกลุ่ม สำหรับข้อมูลที่ใช้ในการวิจัยได้จากการจำลองด้วยเทคนิคมอนติคาร์โล โดยโปรแกรม R และกระทำซ้ำจำนวน 10,000 ครั้งในแต่ละสถานการณ์ เกณฑ์ที่ใช้เปรียบเทียบประสิทธิภาพของสถิติทดสอบพิจารณาจากความสามารถในการควบคุมการเกิดความผิดพลาดแบบที่ 1 โดยใช้เกณฑ์ของ Bradley และกำลังของการทดสอบ ที่ระดับนัยสำคัญ 0.05 ถ้าสถิติทดสอบใดมีค่าความน่าจะเป็นของการเกิดความผิดพลาดแบบที่ 1 อยู่ระหว่าง 0.025 – 0.075 ถือว่าสถิติทดสอบนั้นสามารถควบคุมการเกิดความผิดพลาดแบบที่ 1 ได้
ผลการวิจัย สรุปได้ดังนี้
กรณีไม่มีค่านอกกลุ่ม สถิติทดสอบทีและสถิติทดสอบแมนน์-วิตนีย์มีความสามารถในการควบคุมการเกิดความผิดพลาดแบบที่ 1 ได้ใกล้เคียงกันในทุกขนาดตัวอย่าง และทุกการแจกแจง แต่เมื่อขนาดตัวอย่างทั้งสองกลุ่มเพิ่มขึ้น จะพบว่า กำลังการทดสอบของสถิติทดสอบแมนน์-วิตนีย์จะสูงกว่าสำหรับทุกการแจกแจง ในกรณีที่มีค่านอกกลุ่มปะปนอยู่ในตัวอย่างกลุ่มที่ 1 หรืออยู่ในทั้ง 2 กลุ่ม จะพบว่า สถิติทดสอบแมนน์-วิตนีย์จะมีประสิทธิภาพสูงกว่าสถิติทดสอบทีในทุกกรณี และเมื่อขนาดตัวอย่างทั้งสองกลุ่มมากกว่า 60 สถิติทดสอบที จะมีความสามารถในการควบคุมการเกิดความผิดพลาดแบบที่ 1 ได้ดีขึ้น รวมถึงกำลังการทดสอบที่สูงขึ้น
The purpose of this research is to compare the efficiency among the t and Mann-Whitney test statistics which are used for testing hypothesis about the difference of the two population location parameters. The three symmetric distributions : Normal, Uniform and Logistic distributions with equal variances and sample sizes of 20 40 60 and 100 are considered. In this research, we studied in the case of no outlier and the outliers contaminated in the first sample and all of two samples with proportion 0.05 in each sample. The data in this research are generated through the Monte Carlo simulation technique with 10,000 replications for each situation by the R program. The criterion employed for comparing the efficiency of the two tests are controlling of the probability of type I error according to Bradley criterion and power of the test. The nominal significant level (a) used is 0.05. The test statistic which the estimated probability of type I error value lies between 0.025 and 0.075, it can control the probability of type I error.
The results of this research can be summarized as follows:
For no outlier included in all of two samples, the t test statistic can control the probability of type I error slightly better than the Mann-Whitney test statistic for all sample sizes and distributions. Moreover, when the sample sizes are increased, the power of the test of the Mann-Whitney is higher than of the t test statistic.
For either outliers contaminated in the first sample or in all of two samples, the Mann-Whitney test statistic provides more efficient than the t test statistic. However, the t test statistic has the more performances in controlling the probability of type I error and power of the test when the each sample size of two groups is greater than 60.