Download as pdf or txt
Download as pdf or txt
You are on page 1of 8

‫باسمه تعالی‬

‫دانشگاه کامپیوتر ساینس و انجنیری‬


‫درخواست تصویب طرح پروپوزال مونوگراف‬

‫ماستری‬ ‫لیسانس‬

‫‪-1‬مشخصات دانشجو‪:‬‬

‫حداكثرسنوات‬ ‫مقطع تحصیلي‬ ‫دانشكده‬ ‫گرایش‬ ‫رشته‬ ‫شماره دانشجویي‬ ‫نام وتخلص دانشجو‬

‫لیسانس‬ ‫کمپیوتر ساینس‬ ‫سافت ویر‬ ‫کمپیوتر ساینس‬ ‫‪98278255‬‬ ‫سیف هللا منصوری‬
‫‪0729781713‬‬ ‫شماره تماس‬ ‫‪Saifullahmansoori88@gmail.com‬‬ ‫ایمیل‬

‫‪-2‬مشخصات استاد‪ /‬استادان راهنما ‪:‬‬

‫پایان نامههای تحت‬


‫راهنمایي‬ ‫نوع استخدام‬
‫(رسمي‪/‬مدعو)‬
‫تخصص‬ ‫محل مرتبه‬ ‫دانشگاه‬
‫خدمت‬ ‫دانشکده‬ ‫نام و نام خانوادگی‬ ‫ردیف‬
‫مقطع‬ ‫تعداد‬

‫هوش‬ ‫‪1‬‬
‫لیسانس‬ ‫رسمی‬ ‫دانشگاه کاتب‬ ‫کامپیوتر ساینس‬ ‫محمد ناظم جعفری‬
‫مصنوعی‬

‫‪-3‬مشخصات استاد‪ /‬استادان مشاور ‪:‬‬

‫مالحظات‬ ‫تخصص‬ ‫محل مرتبه‬ ‫دانشگاه‬


‫خدمت‬ ‫دانشکده‬ ‫نام و نام خانوادگی‬ ‫ردیف‬

‫‪1‬‬

‫‪-4‬ثبت پیشنهادیه پایاننامه در دانشکده‪:‬‬


‫تذكر‪ :‬مطابق قوانین پروپوزال در دانشکده بررسی و در صورت تصویب توسط اعضای کدر علمی ثبت میگردد‪.‬‬

‫تاریخ ثبت‬ ‫شماره ثبت‬ ‫عنوان دانشکده‬

‫‪1‬‬
‫‪-6‬مشخصات مونوگراف ‪:‬‬

‫الف‪-‬عنوان مونوگراف‪:‬‬

‫‪-1‬فارسی‪ :‬پیاده سازی الگوریتم ‪ Luhn‬برای خالصه سازی متن‬

‫‪-2‬انگلیسی‪Implementation of the Luhn algorithm for text summarization :‬‬

‫ب‪-‬نوع تحقیق‪:‬‬

‫‪-3‬توسعه ای‬ ‫‪-2‬بنیادی‬ ‫‪-1‬کاربردی‬

‫ج‪-‬کلید واژهها‪:‬‬

‫‪python -1‬‬

‫‪NLP/ Natural Language Processing -2‬‬

‫‪Extractive techniques -3‬‬

‫‪2‬‬
‫‪-7‬شرح و بیان مساله پژوهشی‪:‬‬
‫با رشد روز افزون اطالعات و منابع آنالین و افزایش سایتهای اینترنتی‪ ،‬کتوبها و تعداد اطالعات و متنی در دنیای امروزی که حجم بسیار‬
‫زیادی از این نوع اطالعات در دسترس است که این امر عث به وجود آمدن مشکالت بسیاری به منظور استفاده دروست و خواندن مفید از این‬
‫منابع در وقت کم بصورت موثر به وجود آورده است‬
‫با توجه به حجم عظیم اطالعات موجود در دنیای امروز‪ ،‬نیازمندی به خالصهسازی متن برای استخراج اطالعات مفید و مؤثر از متون بزرگ و‬
‫پیچیده‪ ،‬بیشتر شده است به همین دلیل درچند سال اخیر سیستم هایی برای خالصه سازی متن پیشنهاد شدند خالصه سازی متنها از اهمیت‬
‫بسیاری برخوردار است‪.‬‬
‫خالصهسازی متن یک فرآیند مهم در حوزه پردازش زبان طبیعی (‪ )NLP‬است که به صورت خالصه و مختصر‪ ،‬اطالعات کلیدی موجود در یک‬
‫متن را استخراج میکند‪.‬‬
‫هدف اصلی خالصهسازی متن‪ ،‬تسهیل درک سریع و انتقال دقیق اطالعات موجود در متن به خواننده است‪ .‬با استفاده ازتکنیکهای خالصهسازی‬
‫متن‪ ،‬میتوان اطالعات کلیدی موجود در یک متن را به یک حجم کوچکتر و به طور خالصه بیان کرد‪ .‬این امر به کاربران اجازه میدهد تا با‬
‫سرعت بیشتری به نتایج و جزئیات مهم متن دسترسی پیدا کنند و در عین حال زمان و انرژی خود را صرف مطالعه کلیه جزئیات غیرضروری‬
‫نکنند‪.‬‬
‫برای خالصهسازی متن‪ ،‬از روشها و الگوریتمهای متنوعی استفاده میشود‪ .‬این روشها شامل خالصهسازی استنتاجی (با استفاده از قوانین‬
‫قضاوت و درک) و خالصهسازی استنتاجی مبتنی بر مبانی آماری و محاسباتی میشوند‪ .‬با پیشرفت تکنولوژی و استفاده از شبکههای عصبی‬
‫عمیق‪ ،‬الگوریتمهای مبتنی بر یادگیری عمیق نیز برای خالصهسازی متن مورد استفاده قرار میگیرند‪.‬‬
‫در حوزه پردازش زبان طبیعی و خالصهسازی متن‪ ،‬الگوریتم ‪ Luhn‬یکی از روشهای محبوب و موثر است که به استخراج خالصهای مفید از یک‬
‫متن میپردازد‪ .‬الگوریتم ‪ Luhn‬بر پایه مفهوم وزندهی لغات کلیدی متن عمل میکند و به صورت خالصه اطالعات مهم را بیان میکند‪.‬‬

‫‪-8‬پیشینه و تاریخچه موضوع تحقیق‪:‬‬


‫در گذشته‪ ،‬برای خالصه سازی متون از روشهای سنتی مانند حذف عبارات تکراری و عبارات کم اهمیت استفاده میشد با پیشرفت تکنولوژی در‬
‫دهههای اخیر‪ ،‬با پیشرفت رویکردهای پردازش زبان طبیعی(‪ ،)NLP‬روشهایی برای خالصه سازی متون با استفاده از تیکنیک های ‪ NLP‬ارائه‬
‫شده است‪ .‬این روشها با استفاده از تحلیل و استخراج اطالعات مهم و مفید از متن‪ ،‬خالصهای از متن را تولید میکنند و الگوریتمهای متنوعی‬
‫برای خالصه سازی متون ابداع شد است الگوریتم ‪ Luhn‬نیز یکی از الگوریتم ها مشهور یا روشهای موثر در این زمینه است که با استفاده از‬
‫تکنیکهای ‪ NLP‬قابل پیادهسازی است‪.‬‬
‫امروزه‪ ،‬با گسترش استفاده از رباتهای گفتگو و تحلیل متون به صورت خودکار‪ ،‬نیاز به خالصه سازی متن و استخراج اطالعات مفید از آن بیشتر‬
‫شده است‪ .‬بنابراین‪ ،‬پیادهسازی الگوریتم ‪ Luhn‬با استفاده از تیکنیکهای ‪ NLP‬در پایتون میتواند به عنوان یک راه حل موثر در این زمینه‬
‫مطرح شود‪.‬‬
‫الگوریتم ‪ Luhn‬برای اولین بار در سال ‪ ۱۹۵۳‬توسط هربرت لوهن ارائه شد‪ .‬در آن زمان‪ ،‬این الگوریتم برای تشخیص اعتبار کارتهای اعتباری‬
‫استفاده میشد‪ .‬با گذر زمان‪ ،‬به دلیل سادگی و کارایی آن این الگوریتم به عنوان یک روش موثر در خالصه سازی متون شناخته شد و به صورت‬
‫گسترده در این حوزه استفاده میشود‬
‫استفاده از تیکنیکهای پردازش زبان طبیعی در پیاده سازی الگوریتم ‪ Luhn‬برای خالصه سازی متون‪ ،‬به دلیل دقت و کیفیت بهتر خالصه سازی‬
‫و همچنین افزایش سرعت و کارایی در پردازش متون مورد توجه قرار گرفته است‪ .‬در پیاده سازی الگوریتم ‪ Luhn‬برای خالصه سازی متن با‬
‫استفاده از تیکنیکهای ‪ NLP‬در پایتون‪ ،‬با توجه به قابلیتهای پردازش زبان طبیعی و قدرت باالی زبان برنامه نویسی پایتون‪ ،‬این الگوریتم با‬
‫دقت و کارایی باال قابل پیادهسازی است‬

‫‪3‬‬
‫‪ -9‬اهمیت و ارزش تحقیق‪:‬‬
‫خالصهسازی متن نقش حیاتی در بازیابی اطالعات دارد و به کاربران امکان میدهد تا به سرعت ایدههای اصلی و جزئیات مهم یک سند را بدون‬
‫خواندن محتوای کلی آن درک کنند‪ .‬با این حال‪ ،‬خالصهسازی متن خودکار همچنان یک وظیفه چالشبرانگیز به دلیل پیچیدگی پردازش زبان‬
‫طبیعی و نیاز به الگوریتمهای مؤثر است‪ .‬مسئله تحقیق در توسعه یک سیستم خالصهسازی متن است که از الگوریتم ‪ Luhn‬در پایتون برای‬
‫استخراج جمالت مهم و تولید خالصههای سازنده استفاده کند‪.‬‬
‫خالصه سازی متون با استفاده از تیکنیکهای ‪ ،NLP‬امروزه در بسیاری از صنایع و حوزههای کاربردی مورد استفاده قرار میگیرد‪ .‬به عنوان مثال‪،‬‬
‫در حوزه تحلیل دادهها‪ ،‬این تکنیک برای استخراج اطالعات مهم و مفید از متون بسیار مفید است‪ .‬همچنین‪ ،‬در حوزه خدمات مشتریان و تحلیل‬
‫ارتباطات اجتماعی نیز میتوان از این تکنیک استفاده کرد‪.‬‬
‫در این زمینه‪ ،‬پیاده سازی الگوریتم ‪ Luhn‬برای خالصه سازی متن با استفاده از تیکنیکهای ‪ NLP‬در پایتون‪ ،‬به عنوان یک راهکار موثر برای‬
‫استخراج اطالعات مهم و مفید از متون مطرح است‪ .‬با استفاده از این الگوریتم‪ ،‬میتوان به سادگی اطالعات مهم و مفید را از متن استخراج کرد و‬
‫به عنوان یک خالصه از آن استفاده کرد‪.‬‬
‫تحقیق برای پیادهسازی الگوریتم ‪ Luhn‬برای خالصه سازی متن با استفاده از تیکنیکهای ‪ NLP‬در پایتون از اهمیت بسیار باالیی برخوردار‬
‫است‪.‬‬
‫استفاده از روشهای خالصه سازی متون با استفاده از تیکنیکهای ‪ NLP‬میتواند بسیار مفید واقع شود‪ .‬این روشها در صنعت‪ ،‬دانشگاهها‪،‬‬
‫شرکتهای بزرگ‪ ،‬وبسایتها‪ ،‬رسانهها‪ ،‬و بسیاری از سایر حوزهها استفاده میشوند‪ .‬با استفاده از این روشها‪ ،‬میتوان اطالعات مهم و مفید در‬
‫مدت زمان کمتری استخراج کرد و بهبود قابل توجهی در کیفیت کار و پردازش اطالعات داشت‪.‬‬
‫همچنین‪ ،‬پیاده سازی الگوریتم ‪ Luhn‬برای خالصه سازی متن با استفاده از تیکنیکهای ‪ ،NLP‬میتواند بهبود قابل توجهی در عملکرد‬
‫سامانههای پردازش زبان طبیعی و تحلیل متن داشته باشد‪ .‬با توجه به پیچیدگی باالی بسیاری از متون و حجم بزرگ آنها‪ ،‬این الگوریتم میتواند‬
‫بهبود قابل توجهی در سرعت و دقت پردازش داشته باشد‪.‬‬
‫با توجه به اهمیت و گستردگی استفاده از خالصه سازی متن و تیکنیکهای ‪ ،NLP‬پیاده سازی الگوریتم ‪ Luhn‬برای خالصه سازی متن با‬
‫استفاده از این تیکنیکها در پایتون‪ ،‬میتواند به عنوان یک راهحل مؤثر و مفید واقع میشود که میتواند به توسعه روشهای موثرتر در این زمینه‬
‫کمک کند و در نتیجه به بهبود کارایی و دقت روشهای خالصه سازی متن کمک کند‪ .‬در این زمینه مطرح شود پیاده سازی الگوریتم ‪ Luhn‬با‬
‫استفاده از تیکنیکهای ‪ NLP‬در پایتون‪ ،‬به عنوان یک پروژه پژوهشی مهم و ارزشمند به نظر میرسد که میتواند به توسعه روشهای موثرتر در‬
‫زمینه خالصه سازی متن کمک کرده و به بهبود کارایی و دقت روشهای خالصه سازی متن در صنایع مختلف کمک کند‪.‬‬

‫‪ – 10‬اهداف تحقیق‪:‬‬
‫هدف اصلی‪:‬‬
‫معرفی و بررسی مفهوم و عملکرد الگوریتم ‪ luhn‬و توضیح نحوه کارکرد آن در خالصه سازی متن‪.‬‬
‫اهداف فرعی‪:‬‬
‫‪ .1‬بررسی تیکنیکهای ‪ NLP‬مورد استفاده در پیاده سازی الگوریتم ‪ Luhn‬برای خالصه سازی متن‪.‬‬
‫‪ .2‬پیاده سازی الگوریتم ‪ Luhn‬برای خالصه سازی متن با استفاده از تیکنیکهای ‪ NLP‬در پایتون‪.‬‬
‫‪ .3‬ارزیابی دقت و کارایی الگوریتم ‪ Luhn‬برای خالصه سازی متن با استفاده از تیکنیکهای ‪ NLP‬در پایتون‬

‫‪ -11‬سوالهاي تحقیق‪:‬‬
‫سوال اصلی‬
‫‪ .1‬چه مراحلی برای پیاده سازی الگوریتم ‪ Luhn‬با استفاده از تیکنیکهای ‪ NLP‬در پایتون باید انجام شود؟‬
‫سواالت فرعی‪:‬‬

‫‪4‬‬
‫‪ .1‬چگونگی پیاده سازی الگوریتم ‪ Luhn‬در پایتون؟‬
‫‪ .2‬آیا الگوریتم ‪ Luhn‬قابلیت استخراج اطالعات مهم و کلیدی در متن را دارد؟‬
‫‪ .3‬چه مزایایی دارد که از تیکنیکهای ‪ NLP‬در پیاده سازی الگوریتم ‪ Luhn‬برای خالصه سازی متن استفاده شود؟‬
‫‪ .4‬چه کاربردهایی برای خالصه سازی متن با استفاده از الگوریتم ‪ Luhn‬و تیکنیکهای ‪ NLP‬وجود دارد؟‬
‫‪ .5‬چه مزایایی دارد که پایتون به عنوان زبان برنامهنویسی انتخاب شده است؟‬

‫‪ -11‬روش تحقیق‪:‬‬
‫جمعآوری دادههای متنی‪ :‬در این مرحله باید دادههای متنی مورد نیاز برای آموزش و تست الگوریتم جمعآوری شود‪ .‬این دادهها‬ ‫•‬
‫میتوانند از منابع مختلف مانند پایگاهدادهها‪ ،‬صفحات وب و فایلهای متنی دریافت شوند‪.‬‬
‫پیشپردازش دادهها‪ :‬در این مرحله‪ ،‬دادههای جمعآوری شده برای استفاده در الگوریتم ‪ ،Luhn‬پیشپردازش میشوند‪ .‬این شامل تمیز‬ ‫•‬
‫کردن دادهها از عالئم نگارشی غیرضروری‪ ،‬تجزیه و تحلیل متن برای استخراج اطالعات مفید‪ ،‬تبدیل کردن متن به فرمت قابل بررسی‬
‫برای پردازشهای بعدی است‪.‬‬
‫پیادهسازی الگوریتم ‪ :Luhn‬پس از پیشپردازش دادهها‪ ،‬الگوریتم ‪ Luhn‬برای خالصه سازی متن پیادهسازی میشود‪ .‬این شامل‬ ‫•‬
‫تعریف توابع مورد نیاز برای پردازش متن با استفاده از الگوریتم ‪ Luhn‬و نیز تعیین پارامترهای مورد نیاز برای اجرای الگوریتم است‪.‬‬
‫استفاده از تیکنیکهای ‪ :NLP‬در این مرحله‪ ،‬با استفاده از تیکنیکهای ‪ ،NLP‬اطالعات مفید مانند فرکانس کلمات‪ ،‬دستهبندی‬ ‫•‬
‫کلمات و جمالت‪ ،‬تشخیص انواع متن و ‪ ...‬استخراج میشوند‪ .‬این اطالعات به کاربران کمک میکنند تا بهترین روش خالصه سازی برای‬
‫متن خود انتخاب کنند‪.‬‬

‫‪ -12‬کاربرد نتایج تحقیق‬


‫نتایج این تحقیق میتوانند بهبود و توسعه روشهای خالصه سازی متن در حوزه ‪ NLP‬و استفاده از الگوریتم ‪ Luhn‬در پایتون را ممکن‬
‫سازندنتایج تحقیق و سیستم خالصهسازی متن پیادهسازی شده‪ ،‬کاربردهای عملی در حوزههای مختلفی از جمله موارد زیر دارند‪.‬‬
‫‪ .1‬تجزیه و تحلیل خبر‪ :‬تولید خالصههای خودکار از مقاالت خبری برای ارائه اطالعات مختصر به کاربران‪.‬‬
‫‪ .2‬خالصهسازی اسناد‪ :‬فشردهسازی گزارشهای بلند‪ ،‬مقاالت تحقیقاتی یا اسناد حقوقی به خالصههای کوتاهتر برای خواندن و درک آسان‪.‬‬
‫‪ .3‬بازیابی اطالعات‪ :‬بهبود ر‪ levance‬و کارایی موتورهای جستجو با ارائه خالصههای مختصر از اسناد بازیابی شده‪.‬‬
‫‪ .4‬مصرف محتوا‪ :‬سهولت در مصرف حجم زیادی از دادههای متنی با ارائه خالصههای مختصر به کاربران‪ ،‬که زمان و زحمت را صرفهجویی‬
‫میکند‪.‬‬
‫‪ .5‬با استفاده از نتایج تحقیق در این حوزهها‪ ،‬سیستم خالصهسازی متن پیشنهادی میتواند به پیشرفت بازیابی اطالعات‪ ،‬تجزیه و تحلیل‬
‫اسناد و تجربه کلی کاربران در ارتباط با دادههای متنی کمک کند‪.‬‬
‫‪ .6‬بهبود و گسترش تکنیکهای استخراجی برای خالصه سازی متن‬

‫‪ -13‬جدول زماني ومراحل اجراء‪:‬‬


‫به شکل نمودار گانت نمایش داده شود‪.‬‬

‫‪5‬‬
‫ماه چهارم‬ ‫ماه سوم‬ ‫ماه دوم‬ ‫ماه اول‬ ‫اهداف‬

‫جمع آوری و‬
‫پردازش داده‬
‫ها‬
‫برنامه نویسی‬
‫جمع آوری‬
‫نتایج‬
‫ارزیابی‬
‫نوشتن‬
‫مونوگراف‬

‫تاریخ و امضا ‪.......................................... :‬‬ ‫استاد‪/‬استادان راهنما‪:‬‬

‫تاریخ و امضا ‪......................................... :‬‬ ‫استاد‪ /‬استادان مشاور‪:‬‬

‫‪6‬‬
‫تاریخ و امضا ‪......................................... :‬‬ ‫دانشجو ‪:‬‬

‫الف‪ -‬موضوع پایان نامه آقاي ‪ /‬خانم‬

‫‪ ........................‬در شوراي دیپارتمنت در تاریخ ‪ ......................‬مورد بررسی قرار گرفت و به تصویب رسید‪.‬‬

‫استاد ‪................................:‬‬
‫آمریت دیپارتمنت ‪.............................:‬‬

‫‪7‬‬
‫وزارت تحصیالت عالی‬
‫دانشگاه کاتب‬

‫به نام خدا‬

‫منشور اخالق پژوهش‬

‫با استعانت از خداي سبحان و با اعتقاد راسخ به اينكه عالم محضر خداست و او همواره ناظر بر اعمال ماست‬
‫و به منظور انجام شايستهي پژوهشهاي اصیل‪ ،‬تولید دانش جديد و بهسازي زندگانی بشر‪،‬‬
‫ما دانشجويان و اعضاي کدر علمی دانشگاهها و پژوهشگاههاي کشور‪:‬‬

‫تمام تالش خود را براي كشف حقيقت و فقط حقيقت به كار خواهيم بست و از هر گونه جعل و تحريف در فعاليتهاي علمي پرهيز ميكنيم‪.‬‬

‫حقوق پژوهشگران‪ ،‬پژوهيدگان (انسان‪ ،‬حيوان‪ ،‬گياه و اشياء)‪ ،‬سازمانها و ساير صاحبان حقوق را به رسميت ميشناسيم و در حفظ آن ميكوشيم‪.‬‬

‫به مالكيت مادي و معنوي آثار پژوهشي ارج مينهيم‪ ،‬براي انجام پژوهشي اصيل اهتمام ورزيده از سرقت علمي و ارجاع نامناسب اجتناب ميكنيم‪.‬‬

‫ضمن پايبندي به انصاف و اجتناب از هر گونه تبعيض و تعصب‪ ،‬در كليه فعاليتهاي پژوهشي رهيافتي نقادانه اتخاذ خواهيم كرد‪.‬‬

‫ضمن امانت داري‪ ،‬از منابع و امكانات اقتصادي‪ ،‬انساني و فني موجود استفاده بهرهورانه خواهيم كرد‪.‬‬

‫از انتشار غيراخالقي نتايج پژوهش نظير انتشار موازي همپوشان و چندگانه (تكهاي) پرهيز ميكنيم‪.‬‬

‫اصل محرمانه بودن و رازداري را محور تمام فعاليتهاي پژوهشي خود قرار ميدهيم‪.‬‬

‫در همه فعاليتهاي پژوهشي به منافع ملي توجه كرده و براي تحقق آن ميكوشيم‪.‬‬

‫خويش را ملزم به رعايت كليه هنجارهاي علمي رشته خود‪ ،‬قوانين و مقررات‪ ،‬سياستهاي حرفهاي‪ ،‬سازماني‪ ،‬دولتي و راهبردهاي ملي‬

‫در همه مراحل پژوهش ميدانيم‪.‬‬

‫رعايت اصول اخالق در پژوهش را اقدامي فرهنگي ميدانيم و به منظور بالندگي اين فرهنگ‪ ،‬به ترويج و اشاعهي آن‬

‫درجامعه اهتمام ميورزيم‪.‬‬

‫امضاء استاد راهنما‬ ‫امضاء دانشجو‬

‫‪8‬‬

You might also like