دانشجو یار

مقاله بررسی روشهای برآورد میسان تشابه فیلدها در پایگاه داده های

95/8/5:: 5:3 صبح علی م دیدگاه

مقاله بررسی روشهای برآورد میسان تشابه فیلدها در پایگاه داده های بسرگ pdf دارای 8 صفحه می باشد و دارای تنظیمات در microsoft word می باشد و آماده پرینت یا چاپ است

فایل ورد مقاله بررسی روشهای برآورد میسان تشابه فیلدها در پایگاه داده های بسرگ pdf کاملا فرمت بندی و تنظیم شده در استاندارد دانشگاه و مراکز دولتی می باشد.

این پروژه توسط مرکز مرکز پروژه های دانشجویی آماده و تنظیم شده است

توجه : در صورت مشاهده بهم ریختگی احتمالی در متون زیر ،دلیل ان کپی کردن این مطالب از داخل فایل ورد می باشد و در فایل اصلی مقاله بررسی روشهای برآورد میسان تشابه فیلدها در پایگاه داده های بسرگ pdf ،به هیچ وجه بهم ریختگی وجود ندارد

بخشی از متن مقاله بررسی روشهای برآورد میسان تشابه فیلدها در پایگاه داده های بسرگ pdf :

سال انتشار: 1391

محل انتشار: همایش ملی علوم و مهندسی کامپیوتر

تعداد صفحات: 8

چکیده:

تشخیص رکورد تکراری، فرآیند شناسایی رکوردهای چندگانه و مختلف است که به یک شی یا نهاد منحصر به فرد از جهان واقعی اشاره می کند. تشخیص رکوردهای تکراری یکی از گام های اساسی در افزایش صحت و درستی داده هاست. اولین گام از فرآیند تشخیص تکرار، برآورد میزان شباهت فیلدهاست. الگوریتم های تطابق فیلد به روش های مبتنی بر کاراکتر، توکن و آوایی طبقه بندی شده است. در این مقاله الگوریتم هایی مانند TF-IDF, Q-grams, Jaro, Edit Distance و SotfTF-IDF برای برآورد میزان شباهت فیلدها معرفی شده است. سپس معیارهای ارزیابی که شامل Recall< Precision و F-measure می باشد بر روی الگوریتم ها انجام شده است. هر چه مقادیر معیارهای ارزیابی بالاتر باشد کارایی الگوریتم بهتر است. پس از مقایسه الگوریتم ها این نتیجه حاصل شده است که مقدار F-measure الگوریتم SoftTf-IDF بالاتر است. به این ترتیب بهترین کارایی را در بین الگوریتم ها داراست.

کلمات کلیدی:

دانشجو یار