فی فوو

مرجع دانلود فایل ,تحقیق , پروژه , پایان نامه , فایل فلش گوشی

فی فوو

مرجع دانلود فایل ,تحقیق , پروژه , پایان نامه , فایل فلش گوشی

دانلود تحقیق ذخیره و بازیابی اطلاعات

اختصاصی از فی فوو دانلود تحقیق ذخیره و بازیابی اطلاعات دانلود با لینک مستقیم و پر سرعت .

دانلود تحقیق ذخیره و بازیابی اطلاعات


دانلود تحقیق ذخیره و بازیابی اطلاعات

ذخیره و بازیابی اطلاعات:
مقدمه با افزایش حجم اطلاعات ذخیره شده در منابع مختلف قابل دسترس، بحث بازیابی این اطلاعات اهمیت ویژه ای پافته است. بازیابی اطلاعات به فرایند استخراج مجموعه اطلاعات مورد نظر فرد اطلاق می شود. اطلاعات بازیابی شده ممکن است شامل هر نوع منبعی باشد. مانند متن، تصویر، صوت، ویدئو، و ...
بازیابی اطلاعات در حوزه ی متن مورد توجه بسیاری از محققان است. شاید شما هم با سیستم های بازیابی اطلاعات از اینترنت کار کرده باشید. سیستم های Google ، MSN ، Yahoo سه نمونه از محبوب ترین این سیستم ها هستند.
مدل کردن کل اطلاعات برای بازیابی اطلاعات اولین کاری که هر سیستم باید انجام دهد این است که مدلی برای توصیف و تعیین شباهت میان اطلاعاتی که در اختیار دارد با نیاز اطلاعاتی کاربر تعریف کند. سه مدل مهم در حوزه ی بازیابی اطلاعات مدل دودویی (یا دوگانی)، مدل برداری، و مدل احتمالاتی هستند.
در مدل دودویی (یا دوگانی) هر سند (document)، به صورت کیفی پر از کلمات در نظر گرفته می شود (Bag of words). در مدل برداری، هر مستند را به صورت برداری از کلمات در نظر می گیریم و فضایی چند بعدی که ابعاد آنرا کلمات تشکیل می دهند ایجاد می کنیم. سپس هر سند در این فضا به صورت یک بردار نمایش داده می شود. مولفه های این بردار سند، در واقع وزن هایی هستند که نشان می دهند هر یک از کلمات چقدر در متمایز کردن آن سند دخیل هستند. در مدل احتمالاتی ، به هر سند احتمالی اختصاص داده می شود که مربوط بودن آن مستند را به نیاز کاربر به صورت احتمال بین صفر و یک بیان می کند.
تعیین میزان ربط هر سند به نیاز اطلاعاتی کاربر بعد از تعریف این مدل، سیستم اکنون آماده است که نیاز اطلاعاتی کاربر را دریافت کند. معمولا کاربران نیاز اطلاعاتی خود را در قالب چندین کلمه یا عبارات معمولی به سیستم بیان می کنند. سیستم سپس بر اساس مدلی که اطلاعات را در آن مدل کرده است، میزان ربط هر سند را با نیاز اطلاعاتی کاربر محاسبه می کند و آن سندهایی را که از همه باربط تر تشخیص داده شده اند به عنوان خروجی باز می گرداند.
در مدل دودویی، نیاز اطلاعاتی کاربر به صورت عبارتی منطقی با عملگر های AND , OR, NOT بیان می شود و هر سندی که این عبارت در مورد آن صحیح باشد بازیابی می شود. مثلا اگر نیاز اطلاعاتی به صورت Iran AND Oil بیان شود، تمامی اسنادی که کلمه ی Iran و Oil را با هم دارند به کاربر نمایش داده می شوند. متاسفانه در مدل دودویی سند یا باربط است یا نیست, و هیچ معیاری برای سنجش میزان ربط وجود ندارد. مثلا دو سندی که یکی تماما در باره ایران و نفت بحث می کند, و دیگری در مورد اقتصاد جهانی صحبت می کند و فقط از نام ایران و نفت به عنوان مثالی در یک جمله استفاده کرده است، از نظر سیستم تفاوتی نیست. در صورتیکه در واقع سند اول بیشتر به نیاز کاربر مربوط است.
در مدل برداری، برای سنجش میزان ربط اسناد و نیاز اطلاعاتی کاربر، سیستم دقیقا به مانند قبل نیاز اطلاعاتی کاربر را هم به فضای چند بعدی از کلمات می برد و در نتیجه برای سنجش میزان شباهت میان این دو بردار می توان از زاویه ای که این دو بردار با هم می سازند استفاده کرد. اسنادی که با نیاز اطلاعاتی کاربر دقیقا هم جهت هستند مسلما نسبت کلماتشان به همان نسبت کلمات نیاز اطلاعاتی است و در نتیجه مرتبط تر خواهند بود. برتری این مدل این است که به ما درجه ای از ربط را می دهد.
در مدل احتمالاتی هم به ازای هر نیاز اطلاعاتی، تمامی اسناد بر اساس احتمال این که این سند با نیاز اطلاعاتی مرتبط باشد مرتب می شوند و لیست اسناد در نهایت به صورت درجه بندی شده (مانند مدل برداری) به کاربر نمایش داده می شود به نحوی که اولین سندی که کاربر می بیند از همه بیشتر احتمال دارد که به نیاز او ربط داشته باشد.
تفاوت بازیابی داده و بازیابی اطلاعات بین بازیابی اطلاعات و بازیابی داده تفاوت های زیادی وجود دارد. داده ها ابهام ندارند. اما اطلاعات نیاز به تفسیر دارد و در نتیجه مبهم می شوند. سیستم بازیابی داده نیاز به رفع این ابهام ها را ندارد اما در سیستم بازیابی اطلاعات باید هر چه بهتر اطلاعات را مدل کنیم تا ابهام ها در درک اطلاعات توسط سیستم کمتر شوند. برای همین است که بر خلاف سیستم های بازیابی داده که کارایی سیستم از نظر سرعت و فضا به عنوان معیار ارزیابی در نظر گرفته می شود، در سیستم های بازیابی اطلاعات، معیار دقت (precision) و بازخوانی (recall) و معیارهایی شبیه به آنها بیشتر به عنوان معیار ارزیابی سیستم به کار می روند.
معیار های ارزیابی معیار دقت به حاصل تقسیم تعداد مستندات بازیابی شده ی واقعا باربط ، بر تعداد کل مستندات بازیابی شده گفته می شود. و معیار بازخوانی هم به حاصل تقسیم تعداد مستندات بازیابی شده ی باربط، بر تعداد کل مستندات باربطی که در مجموعه ی اطلاعاتی موجود بوده است.

 

 

شامل 24 صفحه word


دانلود با لینک مستقیم


دانلود تحقیق ذخیره و بازیابی اطلاعات
نظرات 0 + ارسال نظر
امکان ثبت نظر جدید برای این مطلب وجود ندارد.