ขั้นตอนวิธีการสำหรับการให้ค่าเรตติ้งและการวิเคราะห์เว็บไซต์อนาจาร

Main Article Content

เกรียงกมล คำมา
จักรกฤษณ์ เสน่ห์ นมะหุต

บทคัดย่อ

บทคัดย่อ

ปัจจุบันอินเตอร์เน็ตมีบทบาทสำคัญในการอำนวยความสะดวกต่างๆ ไม่ว่าจะเป็นทางด้านการศึกษา การค้นคว้าหาความรู้ต่างๆ การทำธุรกรรมพาณิชอิเล็กทรอนิกส์เป็นต้น ซึ่งการใช้อินเตอร์เน็ตนั้นมีทั้งข้อดีและข้อเสีย โดยเฉพาะการเข้าถึงเว็บไซต์ที่ไม่เหมาะสมหรือเว็บไซต์อนาจารสำหรับเยาวชนนั้น ควรมีการเฝ้าระวังหรือป้องกันเพื่อไม่ให้ก่อเกิดปัญหาทางสังคมโดยเฉพาะปัญหาการกระทำชำเราทางเพศ แต่ด้วยจำนวนเว็บไซต์อนาจารที่เพิ่มอย่างทวีคูณในปัจจุบันทำให้เป็นเรื่องยากและซับซ้อนที่จะทำการกรองข้อมูลหรือวิเคราะห์ความเป็นอนาจารของเว็บไซต์ เนื่องจากตัวเว็บไซต์อนาจารเมื่อถูกตรวจพบจะมีการเปลี่ยนแปลงรูปแบบไป ในงานวิจัยนี้จึงได้พัฒนาวิธีการวิเคราะห์เว็บไซต์อนาจารด้วยเทคนิคที่ไม่ซับซ้อน ด้วยข่ายงานความหมาย (Semantic Network)คำอนาจารและการให้ค่าระดับความอนาจาร (Rating)ของคำอนาจารนั้นๆ เทียบกับคำที่พบในเว็บไซต์อนาจารและวิเคราะห์หาค่าความเป็นอนาจารของเว็บไซต์ โดยใช้การวิเคราะห์จากโครงสร้างของเว็บไซต์ HTMLTags จากนั้นจะใช้ค่า Rating ของ Semantic Networkคำอนาจารที่ได้สร้างไว้แล้วมาทำการคำนวณในแต่ละส่วนของโครงสร้างเพื่อนำมาวิเคราะห์ค่าความเป็นอนาจารของเว็บไซต์ จากการทดสอบระบบด้วยหลักการF-measure กับเว็บไซต์ 150 เว็บไซต์ ประกอบไปด้วยเว็บไซต์ที่มีความเป็นอนาจาร เว็บไซต์ที่สื่อถึงความเป็นอนาจารแต่ไม่ได้เป็นเว็บไซต์อนาจาร และเว็บไซต์ที่ไม่มีความเป็นอนาจารเลย ตัวอย่างละ 50 เว็บไซต์พบว่าประสิทธิภาพในการวิเคราะห์มีความถูกต้องสูงถึง97 เปอร์เซ็นต์

คำสำคัญ: การจำแนกประเภทเว็บไซต์ การกรองเว็บไซต์ การวิเคราะห์เว็บไซต์ ข่ายงานความหมาย การสนับสนุนการตัดสินใจ

Abstract

The internet plays an important role in such areasas education, knowledge distribution, and e-commerceservices, which has both advantages and disadvantages.In particular, access to pornographic sites or sites thatare not appropriate for children should be monitored.With the ever increasing number of pornographic Websites, analyzing as well as filtering and blocking themis a complex and difficult task. Various inappropriatesites have been found to hide their contents, e.g. byadvertising of other sites that are not pornographic orusing words or jargon expression that do not appear tobe pornographic. In this research, we have developed asimple method that can analyze pornographic websitesby using a semantic list (or database) of inappropriatewords for the rating of a Web site containing pornographiccontent. For the analysis of an inappropriateWeb site we use the structural analysis of HTML tags.After that, the rating of the inappropriate words is usedto perform the computation in each part of the sitestructure for pornography identification. The systemtests were performed on 150 Web sites, from which 50sites contain pornographic material, 50 sites containindecent but not obscene material, and 50 sites containappropriate material. It was found that the system canrate 97 percent of the Web sites correctly.

Keywords: Web Category, Web Filtering, WebClassification, Semantic Network,Decision Support

Article Details

บท
บทความวิจัย