مروری بر رویکردهای نمایه سازی خودکار وب : محتوا محوری، استناد محوری و معنا محوری

نویسنده

چکیده

وب به واسطه ویژگی چند رسانه‌ای، کاربران فراوانی در اینترنت دارد. شمار وب سایت‌ها روز به روز افزایش می‌یابد و انبوهی از اطلاعات در وب منتشر می‌شود. در چنین وضعیتی مهم ترین مسئله، سازماندهی و مدیریت اطلاعات منتشر شده است: زیرا کیفیت بازیابی در گرو سازماندهی و ذخیره سازی مناسب است. موتورهای کاوش، با نمایه سازی و ذخیره اطلاعات نمایه شده در پایگاه‌های خود امکان جست و جو، بازیابی، رتبه بندی، و نمایش اطلاعات وب را فراهم می‌آورند. در این مقاله سعی بر آن است تا ضمن معرفی مختصر برخی ابزارهای کاوش، به تشریح رویکردهای موجود محتوا محوری، استناد محوری، و معنا محوری، در زمینه نمایه سازی خودکار وب در موتورهای کاوش پرداخته شود. در نهایت حرکت به سمت داده‌های ساختار یافته و وب معنایی با تکنولوژی‌های XML و RDF مورد بررسی قرار می‌گیرد.

کلیدواژه‌ها


عنوان مقاله [English]

-

چکیده [English]

Tehran University LIS Master Student Due to multimedia features of the world wide web, rapidly growth of websites and large amount of information which is published and available through web, the number of web users are increasingly growing. So, in such a situation, the main issues are information organization and administration To crawl, indexing and storing the information in search engines’ databases provide searching, retrieving, ranking and displaying the query answers. In this article some search tools and a comprehensive introduction cm current automatic indexing approaches by search engines- content-base indexing, link analysis and semantic indexing - are briefly discussed. At the end, it is pointed that the movement is toward structured data and semantic web through XML and RDF technologies.

کلیدواژه‌ها [English]

  • Automatic Indexing
  • Content - base indexing
  • Link analysis
  • Semantic indexing
  • Web indexing