Professional Documents
Culture Documents
Poroposal Saifullah
Poroposal Saifullah
ماستری لیسانس
-1مشخصات دانشجو:
حداكثرسنوات مقطع تحصیلي دانشكده گرایش رشته شماره دانشجویي نام وتخلص دانشجو
لیسانس کمپیوتر ساینس سافت ویر کمپیوتر ساینس 98278255 سیف هللا منصوری
0729781713 شماره تماس Saifullahmansoori88@gmail.com ایمیل
هوش 1
لیسانس رسمی دانشگاه کاتب کامپیوتر ساینس محمد ناظم جعفری
مصنوعی
1
1
-6مشخصات مونوگراف :
الف-عنوان مونوگراف:
ب-نوع تحقیق:
ج-کلید واژهها:
python -1
2
-7شرح و بیان مساله پژوهشی:
با رشد روز افزون اطالعات و منابع آنالین و افزایش سایتهای اینترنتی ،کتوبها و تعداد اطالعات و متنی در دنیای امروزی که حجم بسیار
زیادی از این نوع اطالعات در دسترس است که این امر عث به وجود آمدن مشکالت بسیاری به منظور استفاده دروست و خواندن مفید از این
منابع در وقت کم بصورت موثر به وجود آورده است
با توجه به حجم عظیم اطالعات موجود در دنیای امروز ،نیازمندی به خالصهسازی متن برای استخراج اطالعات مفید و مؤثر از متون بزرگ و
پیچیده ،بیشتر شده است به همین دلیل درچند سال اخیر سیستم هایی برای خالصه سازی متن پیشنهاد شدند خالصه سازی متنها از اهمیت
بسیاری برخوردار است.
خالصهسازی متن یک فرآیند مهم در حوزه پردازش زبان طبیعی ( )NLPاست که به صورت خالصه و مختصر ،اطالعات کلیدی موجود در یک
متن را استخراج میکند.
هدف اصلی خالصهسازی متن ،تسهیل درک سریع و انتقال دقیق اطالعات موجود در متن به خواننده است .با استفاده ازتکنیکهای خالصهسازی
متن ،میتوان اطالعات کلیدی موجود در یک متن را به یک حجم کوچکتر و به طور خالصه بیان کرد .این امر به کاربران اجازه میدهد تا با
سرعت بیشتری به نتایج و جزئیات مهم متن دسترسی پیدا کنند و در عین حال زمان و انرژی خود را صرف مطالعه کلیه جزئیات غیرضروری
نکنند.
برای خالصهسازی متن ،از روشها و الگوریتمهای متنوعی استفاده میشود .این روشها شامل خالصهسازی استنتاجی (با استفاده از قوانین
قضاوت و درک) و خالصهسازی استنتاجی مبتنی بر مبانی آماری و محاسباتی میشوند .با پیشرفت تکنولوژی و استفاده از شبکههای عصبی
عمیق ،الگوریتمهای مبتنی بر یادگیری عمیق نیز برای خالصهسازی متن مورد استفاده قرار میگیرند.
در حوزه پردازش زبان طبیعی و خالصهسازی متن ،الگوریتم Luhnیکی از روشهای محبوب و موثر است که به استخراج خالصهای مفید از یک
متن میپردازد .الگوریتم Luhnبر پایه مفهوم وزندهی لغات کلیدی متن عمل میکند و به صورت خالصه اطالعات مهم را بیان میکند.
3
-9اهمیت و ارزش تحقیق:
خالصهسازی متن نقش حیاتی در بازیابی اطالعات دارد و به کاربران امکان میدهد تا به سرعت ایدههای اصلی و جزئیات مهم یک سند را بدون
خواندن محتوای کلی آن درک کنند .با این حال ،خالصهسازی متن خودکار همچنان یک وظیفه چالشبرانگیز به دلیل پیچیدگی پردازش زبان
طبیعی و نیاز به الگوریتمهای مؤثر است .مسئله تحقیق در توسعه یک سیستم خالصهسازی متن است که از الگوریتم Luhnدر پایتون برای
استخراج جمالت مهم و تولید خالصههای سازنده استفاده کند.
خالصه سازی متون با استفاده از تیکنیکهای ،NLPامروزه در بسیاری از صنایع و حوزههای کاربردی مورد استفاده قرار میگیرد .به عنوان مثال،
در حوزه تحلیل دادهها ،این تکنیک برای استخراج اطالعات مهم و مفید از متون بسیار مفید است .همچنین ،در حوزه خدمات مشتریان و تحلیل
ارتباطات اجتماعی نیز میتوان از این تکنیک استفاده کرد.
در این زمینه ،پیاده سازی الگوریتم Luhnبرای خالصه سازی متن با استفاده از تیکنیکهای NLPدر پایتون ،به عنوان یک راهکار موثر برای
استخراج اطالعات مهم و مفید از متون مطرح است .با استفاده از این الگوریتم ،میتوان به سادگی اطالعات مهم و مفید را از متن استخراج کرد و
به عنوان یک خالصه از آن استفاده کرد.
تحقیق برای پیادهسازی الگوریتم Luhnبرای خالصه سازی متن با استفاده از تیکنیکهای NLPدر پایتون از اهمیت بسیار باالیی برخوردار
است.
استفاده از روشهای خالصه سازی متون با استفاده از تیکنیکهای NLPمیتواند بسیار مفید واقع شود .این روشها در صنعت ،دانشگاهها،
شرکتهای بزرگ ،وبسایتها ،رسانهها ،و بسیاری از سایر حوزهها استفاده میشوند .با استفاده از این روشها ،میتوان اطالعات مهم و مفید در
مدت زمان کمتری استخراج کرد و بهبود قابل توجهی در کیفیت کار و پردازش اطالعات داشت.
همچنین ،پیاده سازی الگوریتم Luhnبرای خالصه سازی متن با استفاده از تیکنیکهای ،NLPمیتواند بهبود قابل توجهی در عملکرد
سامانههای پردازش زبان طبیعی و تحلیل متن داشته باشد .با توجه به پیچیدگی باالی بسیاری از متون و حجم بزرگ آنها ،این الگوریتم میتواند
بهبود قابل توجهی در سرعت و دقت پردازش داشته باشد.
با توجه به اهمیت و گستردگی استفاده از خالصه سازی متن و تیکنیکهای ،NLPپیاده سازی الگوریتم Luhnبرای خالصه سازی متن با
استفاده از این تیکنیکها در پایتون ،میتواند به عنوان یک راهحل مؤثر و مفید واقع میشود که میتواند به توسعه روشهای موثرتر در این زمینه
کمک کند و در نتیجه به بهبود کارایی و دقت روشهای خالصه سازی متن کمک کند .در این زمینه مطرح شود پیاده سازی الگوریتم Luhnبا
استفاده از تیکنیکهای NLPدر پایتون ،به عنوان یک پروژه پژوهشی مهم و ارزشمند به نظر میرسد که میتواند به توسعه روشهای موثرتر در
زمینه خالصه سازی متن کمک کرده و به بهبود کارایی و دقت روشهای خالصه سازی متن در صنایع مختلف کمک کند.
– 10اهداف تحقیق:
هدف اصلی:
معرفی و بررسی مفهوم و عملکرد الگوریتم luhnو توضیح نحوه کارکرد آن در خالصه سازی متن.
اهداف فرعی:
.1بررسی تیکنیکهای NLPمورد استفاده در پیاده سازی الگوریتم Luhnبرای خالصه سازی متن.
.2پیاده سازی الگوریتم Luhnبرای خالصه سازی متن با استفاده از تیکنیکهای NLPدر پایتون.
.3ارزیابی دقت و کارایی الگوریتم Luhnبرای خالصه سازی متن با استفاده از تیکنیکهای NLPدر پایتون
-11سوالهاي تحقیق:
سوال اصلی
.1چه مراحلی برای پیاده سازی الگوریتم Luhnبا استفاده از تیکنیکهای NLPدر پایتون باید انجام شود؟
سواالت فرعی:
4
.1چگونگی پیاده سازی الگوریتم Luhnدر پایتون؟
.2آیا الگوریتم Luhnقابلیت استخراج اطالعات مهم و کلیدی در متن را دارد؟
.3چه مزایایی دارد که از تیکنیکهای NLPدر پیاده سازی الگوریتم Luhnبرای خالصه سازی متن استفاده شود؟
.4چه کاربردهایی برای خالصه سازی متن با استفاده از الگوریتم Luhnو تیکنیکهای NLPوجود دارد؟
.5چه مزایایی دارد که پایتون به عنوان زبان برنامهنویسی انتخاب شده است؟
-11روش تحقیق:
جمعآوری دادههای متنی :در این مرحله باید دادههای متنی مورد نیاز برای آموزش و تست الگوریتم جمعآوری شود .این دادهها •
میتوانند از منابع مختلف مانند پایگاهدادهها ،صفحات وب و فایلهای متنی دریافت شوند.
پیشپردازش دادهها :در این مرحله ،دادههای جمعآوری شده برای استفاده در الگوریتم ،Luhnپیشپردازش میشوند .این شامل تمیز •
کردن دادهها از عالئم نگارشی غیرضروری ،تجزیه و تحلیل متن برای استخراج اطالعات مفید ،تبدیل کردن متن به فرمت قابل بررسی
برای پردازشهای بعدی است.
پیادهسازی الگوریتم :Luhnپس از پیشپردازش دادهها ،الگوریتم Luhnبرای خالصه سازی متن پیادهسازی میشود .این شامل •
تعریف توابع مورد نیاز برای پردازش متن با استفاده از الگوریتم Luhnو نیز تعیین پارامترهای مورد نیاز برای اجرای الگوریتم است.
استفاده از تیکنیکهای :NLPدر این مرحله ،با استفاده از تیکنیکهای ،NLPاطالعات مفید مانند فرکانس کلمات ،دستهبندی •
کلمات و جمالت ،تشخیص انواع متن و ...استخراج میشوند .این اطالعات به کاربران کمک میکنند تا بهترین روش خالصه سازی برای
متن خود انتخاب کنند.
5
ماه چهارم ماه سوم ماه دوم ماه اول اهداف
جمع آوری و
پردازش داده
ها
برنامه نویسی
جمع آوری
نتایج
ارزیابی
نوشتن
مونوگراف
6
تاریخ و امضا ......................................... : دانشجو :
........................در شوراي دیپارتمنت در تاریخ ......................مورد بررسی قرار گرفت و به تصویب رسید.
استاد ................................:
آمریت دیپارتمنت .............................:
7
وزارت تحصیالت عالی
دانشگاه کاتب
با استعانت از خداي سبحان و با اعتقاد راسخ به اينكه عالم محضر خداست و او همواره ناظر بر اعمال ماست
و به منظور انجام شايستهي پژوهشهاي اصیل ،تولید دانش جديد و بهسازي زندگانی بشر،
ما دانشجويان و اعضاي کدر علمی دانشگاهها و پژوهشگاههاي کشور:
تمام تالش خود را براي كشف حقيقت و فقط حقيقت به كار خواهيم بست و از هر گونه جعل و تحريف در فعاليتهاي علمي پرهيز ميكنيم.
حقوق پژوهشگران ،پژوهيدگان (انسان ،حيوان ،گياه و اشياء) ،سازمانها و ساير صاحبان حقوق را به رسميت ميشناسيم و در حفظ آن ميكوشيم.
به مالكيت مادي و معنوي آثار پژوهشي ارج مينهيم ،براي انجام پژوهشي اصيل اهتمام ورزيده از سرقت علمي و ارجاع نامناسب اجتناب ميكنيم.
ضمن پايبندي به انصاف و اجتناب از هر گونه تبعيض و تعصب ،در كليه فعاليتهاي پژوهشي رهيافتي نقادانه اتخاذ خواهيم كرد.
ضمن امانت داري ،از منابع و امكانات اقتصادي ،انساني و فني موجود استفاده بهرهورانه خواهيم كرد.
از انتشار غيراخالقي نتايج پژوهش نظير انتشار موازي همپوشان و چندگانه (تكهاي) پرهيز ميكنيم.
اصل محرمانه بودن و رازداري را محور تمام فعاليتهاي پژوهشي خود قرار ميدهيم.
در همه فعاليتهاي پژوهشي به منافع ملي توجه كرده و براي تحقق آن ميكوشيم.
خويش را ملزم به رعايت كليه هنجارهاي علمي رشته خود ،قوانين و مقررات ،سياستهاي حرفهاي ،سازماني ،دولتي و راهبردهاي ملي
رعايت اصول اخالق در پژوهش را اقدامي فرهنگي ميدانيم و به منظور بالندگي اين فرهنگ ،به ترويج و اشاعهي آن
8