تحقیق درباره ذخیره سازی اطلاعات

↓↓ لینک دانلود و خرید پایین توضیحات ↓↓

فرمت فایل: word 

 (قابل ویرایش و آماده پرینت)

تعداد صفحات:10

 

 

قسمتی از متن فایل دانلودی:

مقدمه:

 با افزایش حجم اطلاعات ذخیره شده در منابع مختلف قابل دسترس، بحث بازیابی این اطلاعات اهمیت ویژه ای یافته است. بازیابی اطلاعات دقیقا به فرایند استخراج مجموعه اطلاعات مورد نظر فرد اطلاق می شود. اطلاعات بازیابی شده می توانند تمامی منابع ممکن باشند. مانند متن، تصویر، صوت، ویدئو، و …

هم اکنون بازیابی اطلاعات در حوزه ی متن توجه بیشتری از محققان را به خود جلب کرده است. مسلما همه ی شما هم با سیستم های بازیابی اطلاعات از اینترنت کار کرده اید. سیستم های Google ، MSN ، Yahoo سه نمونه از محبوب ترین این سیستم ها هستند.

مدل کردن کل اطلاعات برای بازیابی اطلاعات اولین کاری که هر سیستم باید انجام دهد این است که مدلی برای توصیف و تعیین شباهت میان اطلاعاتی که در اختیار دارد تعریف کند. سه مدل مهم در حوزه ی بازیابی اطلاعات مدل دودویی، مدل برداری، و مدل احتمالی هستند.

در مدل دودویی هر مستند یا document ، بصورت کیفی پر از تعدادی کلمه در نظر گرفته می شود. (Bag or word) در مدل برداری، هر مستند را به صورت برداری از کلمات در نظر می گیریم و در واقع، در این مدل، فضایی چند بعدی که ابعاد آنرا کلمات تشکیل می دهند ایجاد می کنیم. و سپس هر مستند در این فضا بصورت یک بردار نمایش داده می شود. موئلفه های این بردار مستند، در واقع وزن هایی هستند که نشان می دهند هر یک از کلمات چقدر در متمایز کردن مستند دخیل هستند. در مدل احتمالی ، به هر مستند احتمالی اختصاص داده می شود که مربوط بودن آن مستند را به نیاز کاربر به صورت احتمالی بین صفر و یک بیان می کند.

تعیین میزان مرتبط بودن هر مستند به نیاز اطلاعاتی کاربر:

 بعد از تعریف این مدل، سیستم اکنون آماده است که نیاز اطلاعاتی کاربر را دریافت کند. معمولا کاربران نیاز اطلاعاتی خود را در قالب چندین کلمه و یا عبارات معمولی به سیستم بیان می کنند. سیستم سپس بر اساس مدلی که اطلاعات را در آن مدل کرده است، میزان مرتبط بودن هر مستند را با نیاز اطلاعاتی کاربر محاسبه می کند و آن مستنداتی که از همه مربتط تر تشخیص داده شده اند را به عنوان خروجی باز می گرداند.

در مدل دودویی، نیاز اطلاعاتی کاربر بصورت عبارتی منطقی با عملگر های AND , OR, NOT بیان می شود و هر مستندی که این عبارت در مورد آن صحیح باشد بازیابی می شود. مثلا اگر نیاز اطلاعاتی بصورت Iran AND Oil بیان شود، تمامی مستنداتی که کلمه ی Iran و Oil را با هم دارند به کاربر نمایش داده می شوند. متاسفانه در مدل دودویی مستند یا مرتبط است و یا نیست. هیچ معیاری برای سنجش میزان مرتبط بودن وجود ندارد. مثلا دو مستندی که یکی تماما در مورد ایران و نفت بحث می کند و دیگری در مورد اقتصاد جهانی صحبت می کند و فقط از نام ایران و نفت به عنوان مثالی در یک جمله استفاده کرده است، از نظر سیستم تفاوتی نیست. در صورتیکه در واقع مستند اول بیشتر به نیاز کاربر مربوط است.

و….


 دانلود جدیدترین فایل های لایه باز در پی اس دی نگار

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *