چارچوبی جديد برای تشخيصِ مرجعِ‏ مشترک و اسمِ اشاره در متون پارسی : پایان نامه کارشناسی ارشد مهندسی فناوریِ اطلاعات ، گرايشِ تجارتِ الکترونيک

چارچوبی جديد برای تشخيصِ مرجعِ‏ مشترک و اسمِ اشاره در متون پارسی : پایان نامه کارشناسی ارشد مهندسی فناوریِ اطلاعات ، گرايشِ تجارتِ الکترونيک

یکی از رشته های زیر مجموعه فنی مهندسی که علاقمندان بسیاری در کشور ما  دارد رشته کامپیوتر و فناوری اطلاعات هستش که اتفاقا سایت مسترداک در حال تکمیل سری جدیدی از پایان نامه های ارشد این رشته تحصیلی برای کاربران گرانقدر خود میباشد. مسترداک در ادامه پایان نامه ” چارچوبی جديد برای تشخيصِ مرجعِ‏ مشترک و اسمِ اشاره در متون پارسی ”  با  گرايشِ تجارتِ الکترونيک  با فرمت Word (قابل ویرایش) در ۱۴۶ صفحه را معرفی مینماید.

چکیده پایان نامه چارچوبی جديد برای تشخيصِ مرجعِ‏ مشترک و اسمِ اشاره در متون پارسی:

پردازش زبان طبیعی شامل وظایفی همچون استخراج اطلاعات، خلاصه‏سازی متن، پرسش و پاسخ می باشد که همگی نیاز دارند تا تمام اطلاعاتی که در مورد یک موجودیت در متن وجود دارد شناسایی شوند. بنابراین وجود سیستمی که بتواند مسئله هم ‏مرجع را بررسی نماید، کمک شایانی به انجامِ موفقیت ‏آمیز این وظایف خواهد نمود. روش‏های تشخیص مرجع ‏مشترک را می‏توان به دو دسته‏ی روش‏های زبان‏شناسی و روش‏های یادگیری ماشین تقسیم نمود.

روش‏های زبان‏ شناسی بیشتر به اطلاعات زبان‏ شناسی نیاز دارند، البته مشکل این روش‏ها این است که پر خطا و طولانی می‏باشند. از طرف دیگر روش‏های یادگیری ماشین کمتر به اطلاعات زبان‏ شناسی نیاز دارند و نتایج حاصل از آنها قابل اعتماد‏تر است. در این پایان‏ نامه  تلاش می‏کنیم تا فرآیند تشخیص مرجع ‏مشترک را مورد مطالعه قرار دهیم و چارچوبی ارائه دهیم تا بتواند علاوه بر شناسایی اشاره ‏ها، عبارت‏های هم‏ مرجع را نیز تشخیص دهد. به همین منظور باید سه رکن اساسی کار را که پیکره نشانه ‏گذاری شده، سیستم شناساییِ اشاره و محدوده آن، و الگوریتم پیشنهادی پیش‏بینی عبارت‏های اسمی هم ‏‏مرجع را مبنای کار قرار دهیم. درهمین راستا، در قدم اول، پیکره‏ای با نشانه‏ هایی شامل محدوده‏ی اشاره، نوع اشاره، هسته‏ ی اشاره، نوع موجودیت، نوع زیر گروه موجودیت، کلاس موجودیت تهیه می‏کنیم، این پیکره می‏تواند به عنوان اولین پیکره دارای نشانه ‏های اشاره و هم ‏مرجعی، مبنای کار بسیاری از پژوهش‏های مربوط به شناسایی و کشف اشاره و تحلیل هم ‏مرجعی قرار گیرد.

همچنین با استفاده از این پیکره و بررسی قوانین و اولویت‏های میان اشاره‏ ها، سیستمی ارائه می‏کنیم که اشاره‏ های موجود در متن را شناسایی کرده و سپس نمونه ‏های مثبت و منفی را از پیکره لوتوس استخراج می‏کند. در نهایت نیز با استفاده از الگوریتم‏های یادگیری پایه درخت تصمیم، شبکه عصبی و ماشین بردار پشتیبان، نمونه ‏های حاصله را مورد ارزیابی و مقایسه قرار دادیم. نتایج حاصل نشان می‏دهد که یادگیر شبکه عصبی، نسبت به سایرین عملکرد بهتری دارد.

 

 

فهرست مطالب

عنوان صفحه
  • فصل ۱: آشنایی با تشخیص مرجع مشترک…………………۱
  • ۱-۱. مقدمه و بیان مسئله………………. ۱
  • ۱-۲٫ بررسی ارتباطات هم ‏مرجعی……………… ۶
  •    ۱-۲-۱٫ هم ‏مرجع در مقابل پیشایند…………….. ۹
  •       ۱-۲-۱-۱. ارتباط هم مرجع……………….. ۱۰
  •   ۱-۲-۱-۲٫ ارتباط پیشایندی………………….. ۱۱
  •    ۱-۲-۲. تحلیل پیشایند………………… ۱۶
  •    ۱-۲-۳. تحلیل مرجع مشترک…………… ۱۶
  •    ۱-۲-۴. تقابل تحلیل مرجع مشترک و تحلیل پیشایندی……… ۱۷
  • ۱-۳٫جمع ‏بندی…………………. ۲۰
  • فصل ۲ : بخش اول…………… ۲۱
  • ۲-۱-۱. پیشینه تشخیص مرجع مشترک………… ۲۱
  • ۲-۱-۲. روش‏های زبان‏شناسی………….. ۲۲
  •      ۲-۱-۲-۱٫ فاکتورهای حذف کننده………….. ۲۳
  •             ۲-۱-۳-۲-۱. تطبیق جنس و عدد……… ۲۳
  •             ۲-۱-۳-۲-۱. تطبیق معنایی……… ۲۴
  •      ۲-۱-۲-۲. فاکتورهای امتیاز دهنده ……….. ۲۴
  •             ۲-۱-۳-۲-۱. مشابهت نحوی………… ۲۴
  •             ۲-۱-۳-۲-۱. مشابهت معنایی………….. ۲۵
  •             ۲-۱-۳-۲-۱. بارز بودن……………… ۲۵
  • ۲-۱-۳. روش‏های یادگیری ماشین………….. ۲۷
  •      ۲-۱-۳-۱. ویژگی‏ها……….. ۲۸
  •      ۲-۱-۳-۲. مدل‏های جفت اشاره……………. ۲۸
  •            ۲-۱-۳-۲-۱. رده بندی جفت عبارت‏های اسمی………… ۳۲
  •                ۲-۱-۳-۲-۱-۱٫ درخت تصمیم……….. ۳۳
  •         ۲-۱-۳-۲-۲.افراز…………. ۳۵
  •             ۲-۱-۳-۲-۲-۱.درختِ بل………… ۳۶
  •             ۲-۱-۳-۲-۲-۲. افراز گراف…………. ۳۸
  •      ۲-۱-۳-۳. روش‏های مبتنی بر پیکره……….. ۴۰
  •   ۲-۱-۳-۴. روش‏های جایگزین………….. ۴۴
  •       ۲-۱-۳-۴-۱. روش هم ‏آموزی…………. ۴۴
  •       ۲-۱-۳-۴-۲. مدل احتمالاتی مرتبه اول……………. ۴۶
  •          ۲-۱-۳-۴-۳. رتبه‏ بندی……………. ۴۷
  •       ۲-۱-۳-۴-۴. فیلدهای تصادفی شرطی………… ۴۹
  •        ۲-۱-۳-۴-۵. خوشه بندی………. ۵۱
  • ۲-۱-۴. جمع‏بندی….. ……… ۵۶
  • فصل ۲: بخش دوم….. …….. ۵۷
  • ۲-۲-۱. پیکره نشانه گذاری شده توسط اطلاعات هم‏مرجع……. ……. ۵۸
  • ۲-۲-۲. پیکره بیژن‏خان……. ……. ۵۹
  • ۲-۲-۳. پیکره لوتوس…….. …….. ۶۰
  • ۲-۲-۴.شیوه‏های نشانه‏گذاری پیکره لوتوس…… … ۶۲
  •    ۲-۲-۴-۱. نشانه‏گذاری انواع موجودیت‏ها…… ………. ۶۲
  •       ۲-۲-۴-۱-۱. موجودیت شخص…. …………… ۶۴
  •       ۲-۲-۴-۱-۲. موجودیت سازمان….. ….. ۶۴
  •       ۲-۲-۴-۱-۳. موجودیت مکان…. ………. ۶۶
  •       ۲-۲-۴-۱-۴. موجودیت سیاسی…… ….. ۶۶
  •    ۲-۲-۴-۲.کلاس هر موجودیت…. ……….. ۶۸
  •        ۲-۲-۴-۲-۱.غیر ارجاعی ………….. ۶۹
  •        ۲-۲-۴-۲-۲.ارجاعی……. ………… ۶۹
  •           ۲-۲-۴-۲-۲-۱.ارزیابی به شکل منفی…… ……… ۶۹
  •           ۲-۲-۴-۲-۲-۲.ارجاعی خاص……. ……. ۷۰
  •           ۲-۲-۴-۲-۲-۳.ارجاعی عمومی…… …………. ۷۰
  •           ۲-۲-۴-۲-۲-۴.ارجاعی زیر مشخص شده…. ………. ۷۰
  •    ۲-۲-۴-۳.انواع اشاره/سطوح اشاره.. ……. ۷۱
  •       ۲-۲-۴-۳-۱.اشاره ساده…….. ………. ۷۲
  •           ۲-۲-۴-۳-۱-۱.محدوده اشاره…… ……… ۷۲
  •           ۲-۲-۴-۳-۱-۲. هسته اشاره… .. ۷۲
  •           ۲-۲-۴-۳-۱-۳.انواع اشاره ساده…… …….. ۷۲
  •     ۲-۲-۴-۳-۲.ساختارهای پیچیده.. ………. ۷۴
  •           ۲-۲-۴-۴-۲-۱.ساختارهای عطف بیان یا بدل…. ……. ۷۵
  • ۲-۲-۵.جمع‏بندی… …………….. ۷۵
  • فصل ۳: الگوریتم­های پیشنهادی……. …. ۷۶
  • ۳-۱. رده بندی دودویی…. …………… ۷۶
  •    ۳-۱-۱٫جدا کننده‏های خطی…. ……… ۷۷
  •       ۳-۱-۱-۱ پرسپترون……… ………. ۷۸
  •       ۳-۱-۱-۲ ماشین بردار پشتیبان….. …. ۸۰
  •       ۳-۱-۱-۳ درخت تصمیم……… …….. ۸۵
  • ۳-۲.خوشه‏بندی………….. ………….. ۸۸
  •     ۳-۲-۱ .الگوریتم‏های افراز بسته‏ای……….. …….. ۸۹
  •        ۳-۲-۱-۱ .خوشه‏بندی سلسله مراتبی پایین به بالا…. …….. ۹۰
  •        ۳-۲-۱-۲ .آموزش الگوریتم خوشه‏بندی سلسله مراتبی…….. .. ۹۳
  • ۳-۳٫جمع‏بندی…….. ……… ۹۶
  • فصل ۴: سیستم ارزیابی…… ……… ۹۷
  • ۴-۱.مقدمه….. ……… ۹۷
  • ۴-۲.سیستم شناسایی اشاره لوتوس……. …….. ۹۸
  •     ۴-۲-۱ .بانک اطلاعاتی…. ……………. ۹۸
  •     ۴-۲-۲٫سیستم شناسایی اشاره…… ………….. ۱۰۲
  • ۴-۳٫تشخیص اشاره‏های هم مرجع…. ……………. ۱۰۳
  •     ۴-۳-۱ ویژگی‏ها…. …… ۱۰۴
  •     ۴-۳-۲٫الگوریتم یادگیری… ………….. ۱۰۵
  •     ۴-۳-۳٫معیار ارزیابی……… ……… ۱۰۷
  •     ۴-۳-۴٫نتیجه ارزیابی…….. ……………. ۱۱۰
  •        ۴-۳-۴-۱٫نتایج بدست آمده ………. ۱۱۰
  •        ۴-۳-۴-.۲چالش‏ها و تحلیل خطا…… … ۱۱۲
  • ۴-۴٫جمع‏بندی…… ………… ۱۱۵
  • فصل ۵ :نتیجه گیری و پیشنهادها.. …….. ۱۱۶
  • ۵-۱.نتیجه‏گیری… …………. ۱۱۶
  • ۵-۲٫پیشنهادها…….. ………… ۱۱۸
  • فصل .۶ منابع….. ……… ۱۲۱

فهرست جدول‏ها

عنوان صفحه
  • جدول ۱-۱: مقایسه ویژگی‏های دو ارتباط هم‏مرجع وپیشایند………………………….. ۱۱
  • جدول ۲-۱: فاکتورهای متداول برای تشخیص مرجع مشترک……………………………………………. ۲۳
  • جدول ۲-۲: برخی از ویژگی‏های ارائه شده در تحلیل مرجع مشترک………………….. ۳۰
  • جدول ۲-۳: معرفی برخی از پژوهش‏هایی که از خوشه‏بندی استفاده کرده‏اند………………….. ۵۵
  • جدول ۲-۴: مشخصات مربوط به انواع موجودیت‏ها………………. ………. ۶۲
  • جدول۲-۵: زیر گروه‏های موجودیت مشخص…… ………………….. ۶۴
  • جدول۲-۶: زیر گروه‏های موجودیت سازمان…. …………………… ۶۵
  • جدول ۲-۷: زیر گروه‏های موجودیت مکان ……. …………………… ۶۶
  • جدول ۲-۸: زیر گروه‏های موجودیت سیاسی………. …………………….. ۶۷
  • جدول ۲-۹: حالت‏های خاص موجودیت‏های سیاسی………….. ………………. ۶۸
  • جدول ۲-۱۰: انواع طبقه‏بندی اشاره…….. ……………………. ۷۱
  • جدول ۴-۱: بانک اطلاعاتی سیستم کشف اشاره: جدول واژگان………… ……….. ۱۰۰
  • جدول ۴-۲: بانک اطلاعاتی سیستم کشف اشاره: جدول اشاره‏ها….. ………………… ۱۰۱
  • جدول ۴-۳: فهرست ویژگی‏های به کار رفته در تشخیص مرجع مشترک……. ………. ۱۰۶
  • جدول ۴-۴: حالت‏های ممکن نتایج یک ماشین یادگیر…. ……………….. ۱۰۸
  • جدول ۴-۵: نتایج ارزیابی الگوریتم‏های پایه مورد بررسی… …………….. ۱۱۰
  • جدول ۴-۶: نتایج ارزیابی الگوریتم SVM با هسته‏های متفاوت…. ………………… ۱۱۱
  • جدول ۴-۷: نتایج ارزیابی الگوریتم شبکه عصبی با مدل‏های متفاوت……………………………… ۱۱۲

فهرست شکل‏ها

عنوان صفحه
  • شکل۱-۱. انواع روابط ممکن میان دو عبارت اسمی ………………. ۱۲
  • شکل۱-۲. میزان ارتباط میان حوزه‏ها با انواع دانش‏های زبان‏شناسی و واژگانی…………………. ۱۶
  • شکل۲-۱. نمونه‏ای از نمونه‏های مثبت و منفی که توسط ۴.۵C تولید شده است……………. ۳۱
  • شکل۲-۲. درختِ بل به ازای سه عبارت اسمی ………………………. ۳۷
  • شکل۲-۳٫ شمایی از نشانه‏گذاری پیکره بیژن‏خان…………………… ۶۰
  • شکل۲-۴٫ شمایی از نشانه‏گذاری اشاره‏های هم مرجع در پیکره لوتوس………………… ۶۲
  • شکل۳-۱. شمایی از داده‏های خطی و غیر خطی جدایی‏پذیر…………………….. ۷۷
  • شکل۳-۲. الگوریتم پرسپترون میانگین‏دار…………………. ۸۰
  • شکل۳-۳٫ نمونه‏ای از یک درخت تصمیم‏گیری………………… ۸۶
  • شکل۳-۴٫الگوریتم C5 ………………………. 88
  • شکل۳-۵٫ مثالی از نمودار دندوگرام در تشخیص عبارت‏های اسمی هم‏مرجع…………………… ۹۲
  • شکل۳-۶٫ الگوریتم خوشه‏بندی سلسله مراتبی پایین به بالا                                       ۹۳
  • شکل۳-۷٫الگوریتم آموزش خوشه‏بندی حریصانه   ……………. ۹۴
  • شکل۳-۸٫الگوریتم بروزرسانی ……………………   ۹۶
  • شکل۴-۱ :شمای کلی از جداول این بانک اطلاعاتی لوتوس……………………… ۹۹
  • شکل۴-۲ :شمای کلی سیستم شناسایی اشاره……………… ۱۰۲
  • شکل۴-۳ :شمایی از نمایش خروجی سیستم نمایش اشاره……………. ۱۰۲
  • شکل۴-۴: شمایی از نمایش خروجی سیستم نمایش واژگان……………… ۱۰۳
  • شکل۴-۵: شمایی از نمایش خروجی تعیین نمونه‏های مثبت و منفی…………… ۱۰۷
  • شکل۴-۶: نمودار مقایسه الگوریتم‏های پایه مورد بررسی……………. ۱۱۱

 

فهرست علائم و اختصارات

ACE Automatic Content Extraction
ADR Address  Sub Entity
AI Artificial Intelligence
ANA Anaphor
ANT Antecedent
APP Apposition Construction mention type
AR Anaphora Resolution
BAR Bare Sub Entity
BND Boundary Sub Entity
CLS Celestial Sub Entity
CLUS Cluster Sub Entity
COM Commercial Sub Entity
CONT Continent Sub Entity
CR Coreference Resolution
DIS District Sub Entity
EDU Educational Sub Entity
EM Expectation Maximization
ENT Entertainment Sub Entity
GEN General Entity class
GOV Government Sub Entity
GR Group Sub Entity
HLS Headless nominal mention type
IE Information Extraction
IND Individual Sub Entity
IR Information Retrieval
JPE Geo political Entity
LOC Location Entity
MD Mention Detection
MED Media Sub Entity
ML Machine Learning
MT Machine Translation
MUC Message Understanding
NAM Name mention
NAMMH Name which is head of mention
NAMPOS Post modifier mention of name head
NAT Nation Sub Entity
NEG Negative Quantified Entity class
NER Named Entity Recognition
NGOV Non-government Sub Entity
NOMH Nominal which is head of mention
NOMH Nominal mention
NOMPOS Post modifier mention of nominal head
NP Noun phrase
ORG Organization Entity
PER Persons Sub Entity
POP Population Sub Entity
PRO Pronominal mention
PTV Portative Construction mention type
RBFN Radial Basis Function Network
REF Refential  Entity class
REG Region Sub Entity
REL Religious Sub Entity
SPC Specific Entity class
SPE Special Sub Entity
SPO Sport Sub Entity
STAT state Sub Entity
SVM Support Vector Machine
TLT Title Sub Entity
USP Underspecified referential Entity class
WAT Water body Sub Entity
WHO WH_Question Words and specific  mention type

 

مراحل خرید فایل دانلودی
اگر محصول را می پسندید لطفا آنرا به اشتراک بگذارید.

دیدگاهی بنویسید

0