การทำเหมืองข้อมูลที่มีประสิทธิภาพของรูปแบบลำดับเหตุการณ์เชิงกลุ่ม
Abstract
บทคัดย่อ
งานสืบค้นหารูปแบบลำดับเหตุการณ์ย่อยในฐานข้อมูลลำดับเหตุการณ์ขนาดใหญ่มีความสำคัญมาก งานวิจัย นี้ได้พัฒนากระบวนการสืบค้นรูปแบบลำดับเหตุการณ์เชิงกลุ่มชื่อไบเดก โดยดัดแปลงจากวิธีการของไบด์ที่มี ประสิทธิภาพมากสำหรับลำดับเหตุการณ์เชิงเดี่ยว อัลกอริทึมไบเดกสามารถค้นหารูปแบบลำดับเหตุการณ์ที่เกิดขึ้นใน เวลาที่ต่างกันหรือพร้อม ๆ กันได้จากการทดสอบเปรียบเทียบการทำงานระหว่างอัลกอริทึมไบเดกกับอัลกอริทึมโคล์ สะแพน พบว่าผลลัพธ์มีความถูกต้องตรงกันและอัลกอริทึมไบเดกใช้เวลาน้อยกว่า ด้วยระดับนัยสำคัญ 0.05 ผู้วิจัยได้นำ อัลกอริทึมไบเดกไปประยุกต์ใช้กับงานด้านการพยากรณ์อากาศ โดยการใช้ข้อมูลสภาพอากาศที่มีความสัมพันธ์กัน ย้อนหลัง 3 วัน ทำให้สามารถพยากรณ์อุณหภูมิในวันถัดไปได้ด้วยค่าความถูกต้อง 82% และ79% ในชุดข้อมูลฝึกฝน และชุดทดสอบ ตามลำดับ
คำสำคัญ : รูปแบบลำดับเหตุการณ์, อัลกอริทึมโคล์สะแพน, อัลกอริทึมไบด์, การพยากรณ์
Abstract
Discovering frequent subsequences in large sequence database is a very important task. This work develops an algorithm for mining group sequential patterns named BIDEG; BI-Direction Extension algorithm on Grouping sequences. The proposed algorithm is based on the BIDE algorithm which is very efficient algorithm for single-item sequences. BIDEG algorithm can be applied for subsequences that may occur at different time intervals or appear at the same time. The proposed method was then applied to same datasets as a verifying result to the CloSpan algorithm. Our algorithm performs correct results as well as significantly less processing time (α= 0.05). BIDEG was applied for weather forecasting. By using related attributes measured on 3 previous days, the temperature value of the next day can be forecasted with 82% and 79% accuracies on training and testing data sets, respectively.
Keywords : Sequential pattern, CloSpan algorithm, BIDE algorithm, Forecasting