پروپوزال مهندسی کامپیوتر خوشه بندی اسناد با استفاده از روشهای فرا ابتکاری

مشاوره در انجام پایان نامه و پروپوزال ارشد و دکتری، انجام پایان نامه ارشد و دکتری ادیب مشاور، انجام پایان نامه، انجام پایان نامه ارشد، انجام پایان نامه کارشناسی ارشد، انجام رساله دکتری، انجام پایان نامه دکتری

در نمونه پروپوزال ارشد مهندسی کامپیوتر به دنبال ارائه طرحی جهت یادگیری دانشجویان ارشد با ساختار کلی پروپوزال هستیم که دانشجو بتواند با مطالعه پروپوزال در روند انجام پایان نامه ارشد آشنایی پیدا کند و توان تدوین پروپوزال و پایان نامه را داشته باشد.از آنجایی که دانشجویان در مقطع ارشد آشنایی اولیه ای با روند انجام پروپوزال و انجام پایان نامه ندارند و در این مسیر نیازمند مشاوره در انجام پایان نامه هستند بنابراین سعی شده است که با ارائه موضوعات پایان نامه،نمونه پروپوزال ارشد و نمونه پایان نامه ارشد دانشجویان را در این مسیر یاری رسانده و آشنایی لازم را در این مسیر کسب نمایند.لازم است که دانشجویان عزیر با دقت نمونه موضوعات پایان نامه و نمونه پروپوزال ها و پایان نام های ارائه شده را با دقت مطالعه نموده و با نمونه برداری از هر قسمت به تدوین پروپوزال و پایان نامه خود اقدام نمایند.امید است که در این راه بتوانیم همواره مشاور و همراه شما باشیم .

در قسمت دفاعیه پایان نامه نیز نمونه پاورپوینت ارشد قرار داده هست که دانشجویان بتوانند جهت اماده سازی پاورپوینت دفاع پایان نامه استفاده نمایند.یک دفاع موفق منوط به مطالعه با دقت پایان نامه و رفع اشکال پایان نامه و سپس ارائه پاورپوینت با قسمت های پایان نامه همراه با آرامش در زمان دفاع می باشد.موسسه ادیب مشاور همواره در تمامی این مراحل در کنار شما عزیزان خواهد بود.

بیان مساله(تشریح ابعاد٬ حدود مساله٬ معرفی دقیق مساله٬ بیان جنبه های مجهول و مبهم و متغیرهای مربوط به پرسش های تحقیق٬ منظور تحقیق)

یکی از مهمترین وظیفه های داده کاوی خوشه بندی است، خوشه بندی نوعی یادگیری بدون ناظر است که وظیفه دارد داده های مشابه را در یک خوشه قرار دهد به صورتی که داده های موجود در یک خوشه مشابه هم باشند و داده های درون خوشه های مختلف کاملا متفاوت باشند. به بیانی دیگر فاصله درونی بین داده های یک خوشه باید کم باشد و فاصله بین خوشه ها باید زیاد باشد.

یکی از ابتدای ترین و بهترین روش های خوشه بندی الگوریتم کا-میانه است(Hartigan & Wong, 1979; Jain, 2010). اين روش علي‌رغم سادگي آن يک روش پايه براي بسياري از روش‌هاي خوشه‌بندي ديگر (مانند خوشه‌بندي فازي) محسوب مي‌شود. اين روش روشي انحصاري و مسطح محسوب مي‌شود(Alpaydin, 2014). براي اين الگوريتم شکلهاي مختلفي بيان شده است. ولي همة آنها داراي روالي تکراري هستند که براي تعدادي ثابت از خوشه‌ها سعي در تخمين موارد زير دارند:

  • بدست آوردن نقاطي به عنوان مراکز خوشه‌ها اين نقاط در واقع همان ميانگين نقاط متعلق به هر خوشه هستند.
  • نسبت دادن هر نمونه داده به يک خوشه که آن داده کمترين فاصله تا مرکز آن خوشه را دارا باشد.

در نوع ساده‌اي از اين روش ابتدا به تعداد خوشه‌‌هاي مورد نياز نقاطي به صورت تصادفي انتخاب مي‌شود. سپس در داده‌ها با توجه با ميزان نزديکي (شباهت) به يکي از اين خوشه‌ها نسبت داده‌ مي‌شوند و بدين ترتيب خوشه‌هاي جديدي حاصل مي‌شود. با تکرار همين روال مي‌توان در هر تکرار با ميانگين‌گيري از داده‌ها مراکز جديدي براي آنها محاسبه کرد و مجدادأ داده‌ها را به خوشه‌هاي جديد نسبت داد. اين روند تا زماني ادامه پيدا مي‌کند که ديگر تغييري در داده‌ها حاصل نشود. تابع زير به عنوان تابع هدف مطرح است.

 

که ║║ معيار فاصلة بين نقاط و cj مرکز خوشة j ام است.

الگوريتم زير الگوريتم پايه براي اين روش محسوب مي‌شود:

  1. در ابتدا K نقطه به عنوان به نقاط مراکز خوشه‌ها انتخاب مي‌شوند.
  2. هر نمونه داده به خوشه‌اي که مرکز آن خوشه کمترين فاصله تا آن داده را داراست، نسبت داده‌ مي‌شود.
  3. پس تعلق تمام داده‌ها به يکي از خوشه‌ها براي هر خوشه يک نقطه جديد به عنوان مرکز محاسبه مي‌شود. (ميانگين نقاط متعلق به هر خوشه)
  4. مراحل 2 و 3 تکرار مي‌شوند تا زماني که ديگر هيچ تغييري در مراکز خوشه‌ها حاصل نشود.

علي‌رغم اينکه خاتمه‌پذيري الگوريتم بالا تضمين شده است ولي جواب نهايي آن واحد نبوده و همواره جوابي بهينه نمي‌باشد. به طور کلي روش ساده بالا داراي مشکلات زير است.

  • جواب نهايي به انتخاب خوشه‌هاي اوليه وابستگي دارد.
  • روالي مشخص براي محاسبة اولية مراکز خوشه‌ها وجود ندارد.
  • اگر در تکراري از الگوريتم تعداد داده‌هاي متعلق به خوشه‌اي صفر شد راهي براي تغيير و بهبود ادامة روش وجود ندارد.
  • در اين روش فرض شده است که تعداد خوشه‌ها از ابتدا مشخص است. اما معمولا در کاربردهاي زيادي تعداد خوشه‌ها مشخص نمي‌باشد.

در سالهای اخیر برای کاربردهای متفاوت با استفاده از روشهای آماری جهت مدل کردن موضوعات[1] استفاده شده است. در این تحلیل می توان هر سند را به صورت ترکیبی از چند موضوع در نظر گرفت و از این نظر اسناد را به خوشه های با بیشترین شباهت موضوعی تقسیم کرد. یکی از روشهای که اخیرا ارائه شده است تخصیص پنهان دیریکله[2] است که با استفاده از چند تابع توزیع (تابع توزیع دیریکله) موضوعات اسناد را مدل می نماید(Blei, Ng, & Jordan, 2012).

در این پایان نامه قصد داریم که با استفاده از روشهای فراابتکاری نظیر کلونی زنبور (Forsati, Keikha, & Shamsfard, 2015) بخش مربوط به خوشه بندی را بهبود دهیم. و نقایص مربوط به خوشه بندی های رایج نظیر کا-میانه را برطرف نماییم.

 

 

6- سوابق مربوط(بیان مختصر سابقة تحقیقات انجام شده دربارة موضوع ونتایج به دست آمده در داخل و خارج از کشور، نظرهای علمی موجود دربارة موضوع تحقیق)

همانطور که بیان شد این پیشنهادیه یک پیشنهادیه جهت بهبود خوشه بندی با استفاده از ترکیب روشهای مدل کردن موضوعات با روشهای فرا ابتکاری است. در این قسمت مروری بر روشهای خوشه بندی به خصوص در حوزه خوشه بندی اسناد خواهیم داشت. همچنین با توجه به اینکه کارهای بسیار زیادی در این حوزه انجام شده است در این قسمت تعداد محدودی از کارهای اصلی و بسیار مرتبط ارائه خواهد شد.

در رابطه با الگوریتم کا-میانه با توجه به قدمت این الگوریتم و مشکلاتی که دارد راه حل های فراوانی برای رفع مشکلات ارائه شده است. در (Erisoglu, Calis, & Sakallioglu, 2011) روش برای پیدا کردن مرکز خوشه های اولیه ارائه می دهد که بر اساس بیشترین فاصله داده ها در دو بعد اصلی فضای ورودی[3] کار می کند. که یکی از مهمترین نقدهایی که می توان به این روش گرفت حساسیت این روش به داده های نویز دار[4] و داده های پرت[5] است.

و در (Eiben & Smith, 2003) نشان داده شده که می توان از الگوریتم های تکاملی برای بهبود اکثر مسائل با استفاده از بهینه سازی آنها استفاده کرد و نتایج بدست آمده در مقابل روش های بهینه سازی دیگر نشان دهنده قدرت و سرعت این دسته از بهینه سازها است.

در (Goswami & Agrawal, n.d.) روشی جهت بهبود سرعت  کا-میانه ارائه داده است که از الگوریتم خوشه بندی رهبری[6] استفاده می کند و آن را در جهت بهبود سرعت کا-میانه استفاده می کند. یعنی به جای محاسبه مرکز خوشه با استفاده از تمام داده ها، سعی می کند مرکز خوشه را بر اساس مقادیر بدست آمده از خوشه بندی رهبری بدست آورد.

در (Huang, Acero, Hon, & Foreword By-Reddy, 2001) الگوريتم خوشه‌بندي LBG را ارائه می دهد در اين روش ابتدا الگوريتم تمام داده‌ها را به صورت يک خوشه‌ در نظر مي‌گيرد و سپس براي اين خوشه يک بردار مرکز محاسبه مي‌کند.(اجراي الگوريتم کا-میانه با تعداد خوشةK=1). سپس اين بردار را به 2 بردار مي‌شکند و داده‌ها را با توجه به اين دو بردار خوشه‌بندي مي‌کند (اجراي الگوريتم کا-میانه با تعداد خوشة K=2 که مراکز اوليه خوشه‌ها همان دو بردار هستند). در مرحلة بعد اين دو نقطه به چهار نقطه شکسته مي‌شوند و الگوريتم ادامه پيدا مي‌کند تا تعداد خوشة مورد نظر توليد شوند.

و برای ارزیابی روش پیشنهادی با روش های دیگر از معیار های مطرح شده در (Kovács, Legány, & Babos, 2005) استفاده می کنیم. که دو معیار اصلی آن تراکم[7] و جدايي[8] است. همچنین معیار های دیگری نظیر خطا در هنگامی که از قبل داده های درون خوشه ها را می دانیم.

بعد از معرفی بهبود ها و نکات مختلف روش کا-میانه حال از دیگر روشهای خوشه بنداشاره‌ای می کنیم.

در (Li, Ma, & Ogihara, 2004) با یک روش تکرارشونده  زیر فضای هر خوشه از داده ها را به صورت صریح مدل می کند، برای این کار از یک پروسه بهینه‌سازی متناوب جهت کاهش بعد و مشخص کردن زیر فضا به صورت همزمان بهره می‌گیرد.

ودر (Xu, Liu, & Gong, 2003) که یکی از اولین کارها در استفاده از فاکتورگیری ماتریس غیرمنفی برای خوشه بندی است، از این روش برای استفاده می کند. و همچنین نشان می دهد روش مورد استفاده از تمامی روشهای خوشه بندی طیفی  که تا آن زمان معرفی شده اند بهتر عمل می کند.

و یکی از کارهایی که در (Cui, Potok, & Palathingal, 2005) بیان شده است نشان می دهد که از روشهای بهینه سازی متاهیورستیک نیز می‌توان برای خوشه بندی استفاده کرد. در این کار از روش بهینه سازی ازدحام ذرات برای خوشه بندی اسناد استفاده شده است.

در (Blei et al., 2012) از روشهای آماری بر پایه مدل های بیز جهت خوشه بندی و دسته‌بندی استفاده می شود، برای این کار از یک سلسه‌مراتب سه سطحی استفاده می‌شود.

و همچنین بر اساس مقاله  (Bakus, Hussin, & Kamel, 2002) که از شبکه عصبی خود سازمانده جهت خوشه بندی اسناد استفاده شده است و روشی پایه ای در نحوه ساخت مجموعه داده بر اساس جمله، که ترتیب کلمات در آن به هم نریزد ارائه داده است.

 

7- فرضیه ها ( هر فرضیه به صورت یک جمله ی خبری نوشته شود.) دقیقاً به پرسش مربوط باشندو کلی و بدیهی نباشند.

روشهای فرابتکاری قابلیت خوبی در یافتن پاسخ بهینه سراسری را دارند.

از روشهای فراابتکاری می توان برای خوشه بندی استفاده کرد.

یکی از راه های مناسب جهت کاهش ابعداد در مسائل متنی استفاده از مدل کردن موضوعات است.

روش تخصیص پنهان دیریکله یکی از بهترین روشهای مدل کردن اسناد است.

 

8- اهداف تحقیق (شامل اهداف علمی، کاربردی وضرورت های خاص انجام تحقیق)

 

1. اهداف علمی:( با شناسایی، تعیین، تبیین و غیره همراه است ) :

ارائه یک روش کارامد جهت خوشه بندی اسناد.

افزایش سرعت خوشه بندی اسناد.

تعیین روشهای فراابتکاری به همراه مدلسازی موضوعی به عنوان یکی از راه حلهای خوشه بندی اسناد

 

2.اهداف کاربردی :(اهدافی هستند که منجر به ارائه راه کار ،ساخت نمونه و... میشوند):

ارائه یک خوشه بند اسناد جهت استفاده در سازمانها به خصوص خبرگزاری ها و موتورهای جستجو.

3.ضرورت خاص انجام تحقیق(ضرورت خاص یعنی اهمیت ویژه ای که این تحقیق در این دوره از زمان در کشور دارد، یک تحقیق ممکن است ضرورت داشته باشد یا نداشته باشد، یا ضرورت ویژه ای داشته باشد،در حالت سوم توضیح داده شود).

خوشه بندی اسناد با توجه به کاربرد اساسی آن در حجم عظیم اطلاعاتی که روزانه در اطراف ما تولید می شود یکی از مهمترین کارهای استخراج دانش از داده ها است. که این پایان نامه قصد دارد با بهبود دقت خوشه بندی این امر را کامل‌تر نماید.

 

10- جنبة نوآوری وجدید بودن تحقیق درچیست؟(این قسمت توسط استاد راهنما تکمیل و تایپ شود.)

صرفاً نوآوری تحقیق ذکر شود وبایست با ( اهمیت وضرورت تحقیق) متفاوت باشد.

 

استفاده از روشهای فراابتکاری در خوشه بندی.

استفاده از روشهای مدلسازی موضوع در خوشه بندی.

ترکیب روشهای مدلسازی موضوع و الگوریتم های فرا ابتکاری در خوشه بندی اسناد.

11-  .روش کار :

الف.نوع روش تحقیق(توصیفی،توصیفی پیمایشی،تحلیل محتوا و....) :

در این پژوهش باید مجموعه‌داده مناسبی گردآوری شود. بدین منظور یک کنفرانس معتبر را هدف گذاری کرده(مانند کنفرانسAAAI) و مقاله های آن کنفرانس استخراج و قسمت های اصلی هر مقاله را از آن استخراج می شود. مهمترین قسمت های مقاله عبارتند از عنوان، نویسندگان، چکیده و کلمات کلیدی و همچنین اطلاعات جانبی مقاله نظیر بخش پذیرفته شده را به دست می آوریم.

در مرحله بعد لغت نامه ای از تمام کلمات که در تمام مقاله ها استفاده شده است را تشکیل می دهیم سپس آن را فیلتر کرده، این فیلتر در سطوح مختلفی استفاده می شود ، برای مثال می توان کلمات توقف  را از آن حذف کرد. پس از با توجه به لغت نامه تشکیل شده مجموعه داده را می سازیم که در هر چکیده مقاله رخداد هر یک از کلمات لعت نامه را نشان می دهیم و با بقیه خصوصیات مقاله تجمیع شده و مجموعه داده ای را تشکیل می دهیم. برای تشکیل مجموعه داده از زبان های شی گرایی نظیر C# و یا Java استفاده خواهد شد.

پس از تشکیل مجموعه داده روش های مطرح شده را بر روی مجموعه داده اعمال کرده و با انجام آزمایش های استاندارد و معیارهای مناسب روش ها را با هم مقایسه خواهیم کرد. برای این کار از نرم افزار Matlab استفاده خواهد شد.

 

ب.روش گردآوری اطلاعات (میدانی، کتابخانه ای وغیره):

از مجموعه داده ای مناسب در اینترنت نظیر مجموعه مقالات ارائه شده در کنفرانس AAAI در سالهای 2013 و 2014 جهت خوشه بندی استفاده می شود.

و اطلاعات اساسی تحقیق نیز از مقالات معتبر مجله های علمی پژوهشی استخراج می گردد.

پ.ابزار گرد آوری اطلاعات (پرسشنامه، مصاحبه، مشاهده، آزمون، فیش، جدول، نمونه برداری، تجهیزات آزمایشگاهی وبانک های اطلاعاتی و شبکه های کامپیوتری و ماهواره ای و غیره):

شبکه های کامپیوتری و بانکهای اطلاعاتی

ت.روش تجزیه و تحلیل اطلاعات :

یکی از اهداف این پایان نامه تجزیه و تحلیل خودکار اطلاعات است و به این ترتیب داده های خام با ساختار مناسب تولید و از آن دانش استخراج گردد.

 

[1] Topic modeling

[2] Latent Dirichlet Allocation (LDA)

[3] Input Space

[4] Noisy Data

[5] Outliers

[6] Leader Cluster

[7] Compactness

[8] Separation

 

پروپوزال مهندسی کامپیوتر تلفیق الگوریتم ژنتیک و منطق فازی برای خوشه بندی نابرابر در شبکه های حسگر بیسیم

آموزش تخصصی انجام پایان نامه مهندسی کامپیوتر، شبکه حسگر بیسیم

پروپوزال مهندسی کامپیوتر ردیابی هدف متحرک در شبکه حسگر بی‌سیم با استفاده از الگوریتم بهینه‌سازی کوکو

پروپوزال مهندسی کامپیوتر ارائه چارچوب و مدلی برای امنیت داده های حجیم

پروپوزال مهندسی کامپیوتر ارائه‌ی یک روش تخصیص منابع جهت انتخاب طیف در شبكه­‌هاي  بي‌سيم راديوشناختی در محیطهای پویاچ

 

خدمات ادیب مشاور در زمینه رشته مهندسی کامپیوتر

ارائه موضوع پایان نامه مهندسی کامپیوتر

تدوین مقاله در رشته مهندسی کامپیوتر

مشاوره در تدوین پروپوزال مهندسی کامپیوتر

مشاوره و آموزش در پایان نامه مهندسی کامپیوتر

انجام شبیه سازی در رشته مهندسی کامپیوتر

استخراج مقاله در  رشته مهندسی کامپیوتر

استفاده از نرم افزارهای تخصصی همچون نرم افزار R، نرم افزار STATA، نرم افزار MATLAB، نرم افزار Vensim، نرم افزار LINGO، نرم افزار NS2

 

مشاوره تخصصی انجام پایان نامه ارشد

یکی از مهمترین وظایف دانشجویان در مقاطع تحصیلات تکمیلی (کارشناسی ارشد و دکتری) انجام پایان نامه می باشد. فقر اساتید خبره در زمینه های مختلف علمی تحقیقاتی در برخی دانشگاه های داخلی و خارجی موجب سردرگمی دانشجویان عزیز گردیده است، موسسه ادیب مشاور مفتخر است که در پاسخ به این نیاز طی ده سال فعالیت به تعداد بیشماری از دانشجویان ارشد و دکتری خدمات مشاوره تخصصی ارايه داده است.

به طور کلی انجام پایان نامه کاری زمان بر است که دانش و تجربه زیادی نیازمند است. موسسه ادیب مشاور با چندین سال تجربه در عرصه مشاوره و با در اختیار داشتن متخصصین و اساتیدی با تجربه آماده مشاوره و آموزش پایان نامه در کلیه رشته های دانشگاهی می باشد.

علاوه بر این موسسه ادیب مشاور، در زمینه شبیه سازی مقالات، پایان نامه ها و انجام پروژه ها با برنامه نویسی نیز به دانشجویان کشور عزیزمان خدمات لازم را ارائه می کند. این خدمات شامل تحلیل آماری، پیاده سازی با انواع نرم افزارهای مهندسی، برنامه نویسی با انواع زبان های برنامه نویسی و تهیه پرسش نامه می شود.

به طور کلی سر فصل های خدمات موسسه ادیب مشاور عبارتند از:

مشاوره پروپوزال در رشته مدیریت، حسابداری، مهندسی برق قدرت، مهندسی برق الکترونیک، مهندسی کامپیوتر و روانشناسی و دیگر رشته ها

مشاوره پایان نامه در رشته مدیریت، حسابداری، مهندسی برق قدرت، مهندسی برق الکترونیک، مهندسی کامپیوتر و روانشناسی و دیگر رشته ها

استخراج مقاله از پایان نامه در رشته مدیریت، حسابداری، مهندسی برق قدرت، مهندسی برق الکترونیک، مهندسی کامپیوتر و روانشناسی و دیگر رشته ها

انجام پایان نامه کامپیوتر، پروپوزال مهندسی کامپیوتر

اگر برای هریک از موارد فوق نیاز به مشاوره رایگان دارید، همین الان با ما تماس بگیرید.