เทคนิคการเก็บไอเท็มเซ็ตที่เกิดขึ้นบ่อย โดยพิจารณาค่าความเชื่อมั่นขั้นต่ำ เพื่อรองรับการเพิ่มของข้อมูล

Main Article Content

กฤษฎากร ก๋งอุบล
ธนาวินท์ รักธรรมานนท์
กฤษณะ ไวยมัย

Abstract

กฎความสัมพันธ์ (Association rule) ที่มีความสำคัญ คือกฎที่ผ่านค่าสนับสนุนขั้นต่ำ (Minimum support) และค่าความเชื่อมั่นขั้นต่ำ (Minimum confidence) งานวิจัยในอดีตจึงมีการเสนอเทคนิคที่มีประสิทธิภาพสำหรับค้นหากฎที่มีความสำคัญในฐานข้อมูลขนาดใหญ่ แต่ยังคงมีปัญหาของการปรับปรุงกฎเมื่อมีการเพิ่มของข้อมูล เนื่องจากการเพิ่มของข้อมูลไม่เพียงแต่ทำให้ไอเท็มเซ็ตที่ผ่านค่าสนับสนุนขั้นต่ำเปลี่ยนเป็นไม่ผ่านค่าสนับสนุนขั้นต่ำ แต่กลับทำให้ไอเท็มเซ็ตที่ไม่ผ่านค่าสนับสนุนขั้นต่ำเปลี่ยนเป็นผ่านค่าสนับสนุนขั้นต่ำ งานวิจัยชิ้นนี้จึงมีการเสนอเทคนิคการเก็บไอเท็มเซ็ตที่เกิดขึ้นบ่อย เพื่อรองรับการเพิ่มของข้อมูล (Fast Update of Frequent Item sets, FUFI) เทคนิค FUFI จะพิจารณาค่าความ เชื่อมั่นขั้นต่ำและค่าขอบเขตล่าง (Lower bound) เป็นเกณฑ์ในการเลือกไอเท็มเซ็ตที่มีโอกาสมากที่คาดว่าจะผ่านค่าสนับสนุนขั้นต่ำในรอบถัดไป ไอเท็มเซ็ตที่มีโอกาสมากที่คาดว่าจะผ่านค่าสนับสนุนขั้นต่ำในรอบถัดไปคือไอเท็มเซ็ตที่เป็นตัวแทนของไอเท็มเซ็ตทั้งหมดที่คาดว่าจะผ่านค่าสนับสนุนขั้นต่ำในรอบถัดไป ดังนั้นเทคนิคการคำนวณของ FUFI จึงลดขั้นตอนการค้นหาในฐานข้อมูลขนาดใหญ่เมื่อมีการเพิ่มของข้อมูล และยังคงสามารถปรับปรุง เพิ่มเติมไอเท็มเซ็ตที่ผ่านค่าสนับสนุนขั้นต่ำเมื่อมีข้อมูลเพิ่มเข้ามาจากผลการทดลองกับชุดข้อมูลที่เกาะกลุ่ม (Dense datasets) แสดงให้เห็นว่าเทคนิค FUFI มีประสิทธิภาพด้านเวลาประมวลผลและการลดจำนวนไอเท็มเซ็ตทั้งหมดที่คาดว่าจะผ่านค่าสนับสนุนขั้นต่ำในรอบถัดไป เมื่อเทียบกับเทคนิค FUP และ NUWEP

Article Details

Section
บทความวิจัย