پروژه نگاشت اسامی داخل متن به پایگاه داده افراد شناخته شده NLP پردازش زبان های طبیعی

پروژه نگاشت اسامی داخل متن به پایگاه داده افراد شناخته شده NLP پردازش زبان های طبیعی

در این پروژه جهت یافتن اسم ها، از یک دیتابیس اختصاصی استفاده می کند، این دیتابیس از نوع XML می باشد که نیاز است کنار فایل اصلی پروژه وجود داشته باشد.

جهت به دست آوردن دیتابیسی جامع از اسم های افراد معروف، لیست بازیگران، ورزشکاران، سیاستمداران، روحانیون، دانشمندان، هنرمندان، نقاشان، نویسندگان و… از ویکی پدیا جستجو شد و در یک فایل Excel اضافه شد، سپس با استفاده از توابع Excel نام و نام خانوادگی افراد از هم جدا شد. سپس دیتاهای  تکراری حذف شد.

بعد از کانورت اطلاعات به صورت مناسب و در قالب فایل XML  دیتابیس آماده است.

نرم افزار NLP_Project جهت نگاشت اسامی داخل متن به افراد شناخته شده، در محیط ویژوال استودیو ۲۰۱۳ با .net 4.5 ایجاد گردید. 

روش کار نرم افزار:

متن مورد نظر را در کادر بالا وارد کرده  و دکمه “جستجو با Wikipedia API ” را کلیک می کنیم، برنامه همه کلمه های جمله را بررسی کرده و با نام های دیتابیس XML  مقایسه می کند، در صورتی که کلمه مورد نظر در فایل XML وجود داشته باشد، برنامه به وب سرویس Wikipedia API متصل شده و نتایج مربوطه به کلمه را استخراج می کند، این نتایج عبارتند از عنوان، توضیح مختصری در مورد نام و لینک مطلب موجود در ویکی پدیا.

برای نمونه کلمه “هاشمی” در متن ذیل وجود دارد:

“رئیس جمهور های ایران به ترتیب ابوالحسن بنی صدر ، محمد علی رجایی ، سید علی خامنه ای ، اکبر هاشمی رفسنجانی ، سید محمد خاتمی ، محمود احمدی نژاد و حسن روحانی می باشند. ”

متن فوق را به صورت ذیل به برنامه داده و نتیجه را مشاهده می کنیم (کامپیوتر باید به اینترنت متصل باشد)

 برنامه، همه اسم های متن را در یک کنترل TreeView اضافه کرده و پیغام “انجام شد” را به کاربر نمایش می دهد، 

برنامه افراد معروفی که در ویکی پدیا وجود دارند و به کلمه “هاشمی” مربوط هستند را لیست می کند، لینک ارائه می دهد و توضیحی مختصر در مورد کلمه ارائه می دهد، برای نمایش جزئیات کامل می توانیم روی هر کدام از رکوردها کلیک کنیم:

برنامه به صورت اتوماتیک متن را انتخاب کرده و آماده کپی می کند، در صورتی که روی لینک کلیک کنیم به صورت زیر می توانیم، URL را کپی کنیم


دریافت فایل


پروژه نگاشت اسامی داخل متن به پایگاه داده افراد شناخته شده NLP پردازش زبان های طبیعی

پردازش زبان طبیعی , NLP , پردازش متن

برنامه نویسی ، سورس ، پروژه

فایل های جدید

یکی از تب ها رو انتخاب بکنید