Optimizing Document Retrieval by Measurement Resemblance Between Semantic Word Methods
Main Article Content
Abstract
The aims of article to present the method for measuring semantic similarity between words. Data test are documents in the computer domain from ThaiLIS : Thai Library Integration System 50 documents and prepare a Dublin Core metadata for documentation such as Title, Keyword / Subject, Description / Abstract and Source. Create ontology on Web Ontology Language (OWL) by the word form https://technology.in.th/thesaurus about 402 words that is thesaurus website by National Science and Technology Development Agency. This research use Dijkstra algorithm for shorted part between node to node relate by Edge and Node such as skos:prefLabel , skos:broader, skos:narrower, skos:related and skos:altLabel. The results showed that method of measuring semantic similarity between words by shortest path method proposed by the researcher shows efficiency more than cosine similarity, accuracy of retrieval with F-measure and MRR. Cosine Similarity measurement and the results of the retrieval meet users' needs.
Downloads
Article Details
References
พิลาวัณย์ พลับรู้การ และกฤษณะ ไวยมัย. (2544). รายงานการวิจัยเรื่องการวัดความคล้ายคลึงระหว่าง เอกสารโดยใช้แนวทางด้านความหมาย. รายงานวิจัยระบบคอมพิวเตอร์และเครื่อข่ายสื่อสาร คณะ วิศวกรรมศาสตร์ มหาวิทยาลัยเกษตรศาสตร์.
ศุภกฤษฏิ์ นิวัฒนากูล. (2556). การเข้าถึงความรู้ ทางการเกษตรด้วยเทคโนโลยีเว็บเชิงความหมาย. รายงานการวิจัย สาขาวิชาเทคโนโลยี สารสนเทศ มหาวิทยาลัยเทคโนโลยีสุรนารี.
Craswell, N. and Hawking, D.(2002). Overview of the TREC-2002 Web Track. Technical report In Text Retrieval Conference. Gaithersburg, Maryland.
Dijkstra, E. W. (1959). "A Note on Two Problems in Connexion with Graphs". Numerische Mathematik, 1: 269–271
Lee, J. H. (1995). Combining Multiple Evidence from Different Properties of Weighting Schemes, In Proceedings of the 18th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval (pp.180-188).
McConnell, Jeffrey J. (2001). Analysis of Algorithms: An Active Learning Approach. Canada: Jones and Bartlett, pp. 163-168.
Sahami,M. ,Yusufali, S. And Baldonado,M.Q.W. (1998). SONIA: A Service for Organizing Networked Information Autonomously. In Proceedings of The Digital Libraries.
Salton, G. (1989). Automatic Text Processing: the Transformation, Analysis and Retrieval of Information by Computer. Addison-Wesley Publishing.
Shatkay,H. and Wibur, W.J. (2000). Finding Themes in Medline Documents Probabilistic Similarity Search, In IEEE, Advances in Digital Libraries.
Strasberg, H.R., Manning, C.D., Rindfleisch, T.C. and Melmon, K.L. (2000). What’s Related? Generalizing Approaches to Related Articles in Medicine. In Proceedings AMIA Symp.