سنجش میزان تکرار اطلاعات در بازیابی اطلاعات فارسی از وب با مقایسۀ موتورهای کاوش عمومی

نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشجوی کارشناسی ارشد علم اطلاعات و دانش‌شناسی، دانشگاه خوارزمی

2 استادیار علم اطلاعات و دانش‌شناسی، دانشگاه خوارزمی

چکیده

هدف: پژوهش حاضر با هدف سنجش میزان تکرار اطلاعات بازیابی‌شدۀ فارسی در وب و مقایسۀ موتورهای کاوش از لحاظ میزان توانمندی در بازیابی کمترین تکرار در محتوای نتایج انجام گرفت.
   روش: این پژوهش، از دستۀ مطالعات توصیفی است که از روش‌های کمّی و آمار توصیفی بهره می‌گیرد و با توجه به مقایسه و ارزیابی موتورهای کاوش، در زمرۀ تحقیقات ارزیابی نظام‌های بازیابی اطلاعات نیز محسوب می‌شود.
    یافته‌ها: یافته‌ها نشان داد که موضوعاتی همچون حقوق، جغرافیا و ادبیات با بیش از 70 درصد تکرار در هر موتور کاوش، بیشترین میزان را در بازیابی نتایج دارای محتوای تکراری دارند. موتور کاوش گوگل با بازیابی تنها 8/42 درصد کمترین میزان و موتور کاوش بینگ با بازیابی 33/58 درصد، بیشترین میزان را در بازیابی نتایج دارای محتوای تکراری داشتند.

کلیدواژه‌ها


عنوان مقاله [English]

Duplicated Items in Persian Information Retrieved from the Web

نویسندگان [English]

  • Samira Gohari 1
  • Leila MakabiFard 2
  • Hamid Reza Jamali 2
چکیده [English]

Objective: This research was aimed to measure the number of duplicated items in Persian information retrieval from the Web, and to compare search engines' abilities in removing duplicated items from the results.
Methodology: Quantitative methods And Descriptive Statistics And Evaluation of information retrieval systems.
Findings: The findings showed that in subjects such as law, geography, literature there were more than 70% duplicated items in search results. Google retrieved the lowest number of duplicated items (42.8%) and Bing retrieved the highest number of duplicated items (58.3%).

کلیدواژه‌ها [English]

  • Information duplication
  • information retrieval
  • Persian Web
  • Search engines
  • Internet
1. آزادی، قاسم (1384). میزان دقت موتورهای کاوش وب در بازیابی اطلاعات کتابداری و اطلاع‌رسانی. فصلنامۀ کتاب. 15 (3)، 111 - 122.
2. بهمن‌آبادی، علیرضا (1386). ذخیره و بازیابی اطلاعات. دایرةالمعارف کتابداری و اطلاع‌رسانی. ج 1، 853.
3. رودکی، مهدی (1384). وب2: موجی زودگذر یا آیندۀ وب. دنیای کامپیوتر و ارتباطات. 41.
4. رودکی، مهدی (1384). وب 2 چیست؟. دنیای کامپیوتر و ارتباطات. 42.
5. شاکری، صدیقه (1387). بررسی نسبت جامعیت و مانعیت ابزارهای کاوش اینترنت در بازیابی اطلاعات در حوزۀ کتابداری و اطلاع‌رسانی. مجلۀ مطالعات ملی کتابداری و سازماندهی اطلاعات. 19 (1)، 177 - 200.
6. فتاحی، رحمت‌الله (1378). بلبشوی اینترنت: گفتاری پیرامون مشکلات سازماندهی، جست‌وجو، و بازیابی اطلاعات در وب جهان‌گستر. فصلنامۀ کتابداری و اطلاع‌رسانی. 2 (2)، 1 - 22.
7. کوشا، کیوان (1381). ابزارهای کاوش اینترنت: اصول، مهارت‌ها و امکانات جست‌وجو در وب. تهران: نشر کتابدار.
8. منصوریان، یزدان (1382). مروری بر پژوهش‌های کاربرمدار در مطالعات بازیابی اطلاعات مبتنی بر وب. نشریۀ کتابداری و اطلاع‌رسانی. 6 (3).
9. منصوریان، یزدان (1386). عوامل مؤثر بر جست‌وجو بازیابی اطلاعات از شبکۀ جهان‌گستر وب. مجلۀ الکترونیکی نشر کتابدار.
10. Bar-Ilan, J. (2005). Comparing ranking of search result on the web search. Information Processing & Management, 41(6), 1511-1519.
11. Chu, H., & Rosenthal, M. (1996). Search engines for the World Wide Web: a comparative study and evaluation methodology.Retrieved Feb, 13, 2013, from http://www.asis.org/annual-96/ElectronicProceedings/chu.htm
12.Courtois, M., & Baer, W., & Stark, M. (1995). Cool tools for searching the Web: A performance evaluation. Online, 19(6), 14-32. Retrieved February  12, 2012, fromhttp://www.eric.ed.gov/ERICWebPortal/search/detailmini.jsp?_nfpb=true&_&ERICExtSearch_SearchValue_0=EJ515004&ERICExtSearch_SearchType_0=no&accno=EJ515004
13. Goodwin, D. (2013). Google Grabs More Search Market Share, Now at 67.5%. Search Engine Watch. Online, Retrieved June 6, 2013, from                                          http://searchenginewatch.com/article/2255183/Google-Grabs-More-Search-Market-Share-Now-at-67.5
14.Leighton, H., &  Srivastavay, J. (1997). Precision among world wide web search
              services/search engines: Altavista, Excite, HotBot, Infoseek, Lycos. Retrieved June 11, 2013, from http://www.winona.edu/library/webind2.htm.
15. Lewandowski, D. (2011). The retrieval effectiveness of search engines on navigational. Retrieved June 15, 2013, from                                               http://eprints.rclis.org/17233/1/ASLIB2011_preprint.pdf
16.Véronis, J. (2006). A comparative study of six search engines. Retrieved June 11, 2012, from http://www.up.univmrs.fr/veronis/pdf/2006-comparative-study.pdf.