ความเบี่ยงเบน

ในชีวิตประจำวันเราใช้สถิติโดยที่เราไม่รู้ตัวอยู่มากมาย เช่น สงกรานต์ปีนี้มีคนขึ้นไปเที่ยวเชียงใหม่กันมาก ส่วนใหญ่มาจากกรุงเทพมหานคร ความหมายในที่นี้คือ กลุ่มคนที่มาเที่ยวเชียงใหม่มีกระจัดกระจายจากที่ต่าง ๆ แต่กลุ่มคนที่มามากที่สุดคือ มาจากกรุงเทพมหานคร 
คราวนี้ถ้าดูกันในแง่ของสถิติ เราต้องการดูความแปรปรวนของข้อมูล เช่น เรามีข้อมูลอยู่สองชุด คือ  


ข้อมูลชุดที่ 1    10, 12, 14
ข้อมูลชุดที่ 2    30, 5, 1 



ข้อมูลทั้งสองชุดนี้ให้ค่าเฉลี่ยเท่ากันคือ 12 แต่หากพิจารณาที่พิสัย (range) จะพบว่า ขอบเขตของข้อมูลชุดที่สองมีการกระจายตัวกว้างกว่า คือ จาก 1 ถึง 30 เราจะเห็นว่า ชุดที่ 1 มีการรวมกลุ่มกัน กระจายตัวน้อยกว่า ทางสถิติเราคำนวณค่าความเบี่ยงเบนนี้ และเรียกว่า วาเรียนซ์ (varience) 


ใช้สัญลักษณ์ 
(อ่านว่าซิกมา ยกกำลังสอง)
ใช้สัญลักษณ์ s2 ใช้สัญลักษณ์  และ s
แทนวาเรียนซ์ของประชากร แทนวาเรียนซ์ของประชากร แทนส่วนเบี่ยงเบนมาตรฐานของประชากร แทนส่วนเบี่ยงเบนมาตรฐานของตัวแทน

วาเรียนซ์ คือ ผลบวกของกำลังสองของความแตกต่างระหว่างแต่ละค่า กับค่าเฉลี่ย หารด้วยจำนวนซึ่งน้อยกว่าจำนวนค่าทั้งหมดหนึ่ง
ดังนั้น ถ้าประชากรมี x1, x2, . . ., xn และมี เป็นค่าเฉลี่ย วาเรียนซ์ที่ได้ 
=
=
 สำหรับวาเรียนซ์ของตัวแทน หาได้จาก  s =  

การหาค่าเฉลี่ยและวาเรียนซ์ทำให้เข้าใจลักษณะของข้อมูลการกระจายตัวของข้อมูล เช่น



ชุดข้อมูล A มีข้อมูล 0 48 49 51 52 100
ชุดข้อมูล B มีข้อมูล 47 48 49 51 52 53

ทั้งสองข้อมูลมีค่าเฉลี่ย เท่ากับ 50 เท่ากัน แต่พิสัยต่างกัน ความแปรปรวนของข้อมูลพิจารณาได้จากวาเรียนซ์


ข้อมูลชุด A ข้อมูลชุด B
ข้อมูล
0 -50 2500
48 -2 4
49 -1 1
51 1 1
52 2 4
100 50 2500
ผลรวม 5010

ข้อมูล
47 -3 9
48 -2 4
49 -1 1
51 1 1
52 2 4
53 3 9
ผลรวม 28

เมื่อนำมาหารด้วย s = 1002
วาเรียนซ์ของข้อมูลชุด A มีค่าเท่ากับ 1002
วาเรียนซ์ ของข้อมูลชุด A มีค่าเท่ากับ 28/5 ได้ 5.6

 



เห็นได้ชัดว่าข้อมูลสองชุดมีจำนวนข้อมูลเท่ากัน มีค่าเฉลี่ยเท่ากัน แต่การเปรียบเทียบข้อมูลยังมีความแตกต่างกัน ในเรื่องความปรวนแปร ข้อมูลชุด A มีความปรวนแปร หรือ มีวาเรียนซ์สูงกว่า ข้อมูลชุด B
การใช้งานในชีวิตประจำวันอาจพบเห็นได้ เช่น เมื่อต้องการลงทุนในการซื้อหุ้นกิจการบริษัทในตลาดหลักทรัพย์ โดยพิจารณาจากบริษัทสามบริษัท คือ บริษัทรุ่งเรือง บริษัทค้าดี และบริษัทกิจการดี ข้อมูลที่เก็บย้อนหลังสิบปี โดยข้อมูลทั้งสิบปีประกอบด้วยข้อมูล การปันผล เมื่อนำเอาข้อมูลปันผลทั้งสิบปีมาคิดหาค่าสำคัญทางสถิติ ได้ผล ดังนี้

 

บริษัท ค่าเฉลี่ยการปันผล % ความเบี่ยงเบนมาตรฐาน %
บริษัทรุ่งเจริญ
บริษัทค้าดี
บริษัทกิจการดี

8
5
5

5
2
1

คำถามมีอยู่ว่า เราจะเลือกลงทุนในกิจการบริษัทใดดี เพราะถ้าได้ปันผลเฉลี่ยสูง แต่มีความแปรปรวนสูง บางปีอาจได้ต่ำ บางปีอาจได้สูง หรือมีความเสี่ยงมาก
เพื่อให้มีเงื่อนไขการตัดสินใจได้ง่ายขึ้น เรามีการวัด ค่าด้วยสัมประสิทธิ์ของความผันแปร (Coefficient of variation) ซึ่งค่านี้เป็นค่าส่วนความเบี่ยงเบนมาตรฐานคิดเป็นเปอร์เซนต์ของค่าเฉลี่ย
cv = * 100
ดังนั้น จากข้อมูลที่ได้มาจะเห็นว่าทั้งสามบริษัทมีค่า cv แตกต่างกัน
cv ของบริษัทรุ่งเจริญ (5/8) * 100 = 62.5 %
cv ของบริษัทค้าดี (2/5) * 100 = 40 %
cv ของบริษัทกิจการดี (1/5) * 100 = 20 %



ข้อมูลนี้เป็นข้อมูลช่วยในการตัดสินใจ ถ้าเราต้องการความเสี่ยง โดยอาจได้ปันผลสูงในบางปี ก็ต้องเลือกบริษัทรุ่งเจริญ แต่ถ้าต้องการความแน่นอนก็ต้องเลือกบริษัทกิจการดี


ความคิดเห็น

โพสต์ยอดนิยมจากบล็อกนี้

การประยุกต์สถิติในชีวิตประจำวัน

ตัวแทนสุ่ม (random sample)

การวัดแนวโน้มเข้าสู่ศูนย์กลาง (Central Tendency)