بررسی مقایسه‌ای جامعیت و دقت موتورهای جستجوی عمومی براساس شاخص ربط سیستمی و منطق جستجو

نوع مقاله : مقاله پژوهشی

نویسندگان

1 استاد علم اطلاعات و دانش شناسی دانشگاه خوارزمی، تهران.

2 دانشجوی دکتری علم اطلاعات و دانش شناسی دانشگاه خوارزمی، تهران، ایران.

3 دانشجوی دکتری علم اطلاعات و دانش شناسی دانشگاه خوارزمی، تهران

چکیده

هدف: یکی از راههای بازیابی اطلاعات استفاده از موتورهای جستجو است. هدف پژوهش حاضر بررسی مقایسه ای جامعیت و دقت موتورهای جستجوی عمومی براساس شاخص ربط سیستمی و بر اساس منطق جستجو می باشد.
روش: این مطالعه به روش تطبیقی با استفاده از سه کلید واژه علم سنجی- تولیدات علمی و تحلیل استنادی که بر اساس جستجو در پایگاه اطلاعاتی ایرانداک پرتکرار ترین کلیدواژه ها در سالهای 1389-1393 در حوزه علم اطلاعات بوده اند انتخاب و در پنج موتور جستجوی Google- Yahoo- Bing- Ask- AOI و با استفاده از منطق های جستجوی بولی، برداری و منطق فازی (روش کوتاه سازی) و به دو زبان جستجو شدند. 10 نتیجه اول هر موتور، بازیابی و میزان جامعیت و دقت آن محاسبه شد .
یافته ها و نتیجه گیری: در هر سه منطق جستجو، Google بیشترین سطح دقت و جامعیت (دقت: 20/0±833/0 و جامعیت: 03/0±125/0) و Bing کمترین سطح دقت و جامعیت در موتور‌های کاوش (دقت: 12/0±277/0 و جامعیت: 02/0±041/0) به خود اختصاص دادند. موتور ASK در هر سه منطق رتبه دوم را در دقت و بازیافت به خود اختصاص داده و AOL در منطق برداری و Bing در روش کوتاه سازی ضعیفترین دقت را داشته اند.
موتور Google با منطق بولی بهترین و با روش کوتاه سازی کمترین و موتورASK در سه منطق جستجو به یک میزان و موتور کاوش Yahoo، با منطق بولی کمترین و با منطق برداری بیشترین و موتور Bing با روش کوتاه سازی کمترین و در نهایت موتور AOL با منطق برداری کمترین مدرک مرتبط را بازیابی کردند.

کلیدواژه‌ها


عنوان مقاله [English]

Evaluation the accuracy and recall in general search engines, based on the system relevance and search logic

نویسنده [English]

  • Leili Allahbakhshian 2
2 Librarian
چکیده [English]

Purpose: using search engines is a way to retrieve information. The aim of this study was to evaluate and compare the recall and accuracy of general search engines, based on the system relevance and search logic.
Methodology: This comparative study was done using three key words” scientometry”, “scientific production” and “citation analysis” which based on searched keywords in IranDoc are the most frequent during 1389-1393 in the field of information sciences. These keywords were searched in Google- Yahoo- Bing- Ask- AOI using Boolean search logic operation (AND), fuzzy logic (the short way) and vector model in English. According to search logic first 10 results per search engine were saved then the recall and accuracy were calculated.
Findings and Conclusion: In all three logic search Google had the highest level of accuracy and recall (accuracy: 0.833 ± 0. 20 and recall: 0.125 ±0.03) and Bing had the lowest levels (Accuracy: 0.277± 0.12 and recall: 0.41 ± 0.02), ASK was at the second level in all three methods and AOL and Bing had the weakest function in vector model and truncation respectively. Google with Boolean logic had the most and with truncation had the least relevant documents. ASK in the three search logic had a same level of relevancy, Yahoo with Boolean logic search had the lowest and with vector model had the highest number of relevant documents. Bing had the lowest relevant documents with truncation and eventually AOL was at the lowest operating level with vector model.

کلیدواژه‌ها [English]

  • Recall
  • Accuracy
  • General Search Engines
  • System relevance
  • Search logic