خلاصه سازی روشی است برای فشرده سازی منتهای بسیاربزرگ که به دلیل روش بیشترین درمرتبط نرین اطلاعات موجود درمتن استخراج می شودآنچه که مارادراین محدود می نماید استخراج مرتبط ترین اطلاعات وعامل مهم دیگرخواندنی بودن وقابل فهم بودن متن است.
باتوجه به افزایش روزافزون اطلاعات موجود دراینترنت که به صورت الکترونیکی ارائه می شود، تحقیقات وسیعی برروی این زمینه درحال انجام است تابتوان هرچه سریع تر به مرتبط ترین اطلاعات است یافت مثلاٌ :اگر شما دراینترنت به دنبال موضوعی باشید حجم وسیعی ازصفحات اینترنتی دراختیار شما قرار نی گیرد حال باید تک تک این صفحات رابه طور کامل مطالعه ؟؟؟؟؟ به اطلاعات موردنیاز دست پیداکنیم . ولی به کمک روشهای خلاصه سازی می توان به راحتی خلاصه یک صفحه اینترنتی رادرچند جمله مشاهده کنید وسپس به به طور خلاصه سازی کلی صورت می پذیرد:
- خلاصه سازی مبتنی برفهم مطلب
- خلاصه سازی مبتنی براستخراج مطالب مهم
روش اول که نام دیگرآن (پرورش طبیعی زبانی) (NLP) می باشد یعنی سعی وآموزش سیستم درفهمیدن متن وباتوجه که قواعد وساختار های زبانی درباره وبایک ساختار جدید تری متن راخلاصه کند دراین روش مانیاز مند گرامر ونحوه جمله نویسی یک زبان خاص هستیم.
قدرت واهمیت این روش دراین است که ازدقت بالاتری برخوردار است ولی به دلیل سرعت پائین وپیچیدگی بسیار زیاد کمتراستفاده می شود.
روش دوم که به روش های آماری معروف هستند ابتدا متن رابه تعداد جملات خود افراد کرده وهر جمله رابایک بردار نگاشت می کنیم که این بردار ها مثال یک سری ویژگی های خاص نظیر تعداد کلمات بعد ویاتعداد اتفاقیی افتادن کلمات کلیدی درآن و... می باشد ازاین روش نیازمند یهای زیادی هستیم تابه یک کلیت ارتمام تنها بوسیله ازاین روش براساس یک سری ویژگی که بردار هرجمله تشکیل می دهند یادمیگیریم که چ=گونه جملات مزتبط بامفهوم متن راپیدا کنیم.
خلاصه سازی با شبکه عصبی و کاربرد آن در متن کاوی