اختصاصی از
فی لوو 4 مقاله جدید فارسی و 2مقاله انگلیسی درباره big data دانلود با لینک مستقیم و پر سرعت .
1-الگوریتم های طبقه بندی کلان داده های نامتعادل (دومین کنفرانس بین المللی و سومین همایش ملی کاربرد فناوری های نوین در علوم مهندسی)
چکیده:
با افزایش رو به رشد نمایی دادهها و حجم بزرگی از آنها که به وجود آمده است، روز به روز نیاز به پررداز و تحلیل این دادههای کالن بیشتر میشود. طبقهبندی دادهها، شرللی از تحلیرل داده هرا تلقری مری شرود، کره در آن مدلهایی جهت توصیف کالسهای مهمی از دادهها استخراج میشود. طبقهبنردی مجموعره دادههرای نامتارادل ، چالشی را برای اکثر تلنیکهای یادگیری استاندارد به وجود آورده است و الگوریتمها، تحت تاثیر منفی توزیر کالس نامتاادل قرار گرفته است. در این کار، به بررسی رو های مختلف طبقهبندی کالن دادههای نامتارادل برا الگوریتمهای مختلفی از جمله تادیل نمونه، الگوریتمهای تلاملی و غیره پرداخته شده است. نتایج در مقاالت برا استفاده از رو های ارزیابی مختلف مورد مقایسه قرار گرفتهاند
واژگان کلیدی: کالن دادهها، نگاشت کاهش، مجموعه دادههای نامتاادل، یادگیری ماشین، طبقهبندی دادهها
2-طبقه بندی کلان دادههای نامتعادل با استفاده از الگوریتم جنگل تصادفی (دومین کنفرانس بین المللی و سومین همایش ملی کاربرد فناوری های نوین در علوم مهندسی)
چکیده:
با افزایش رو به رشد نمایی دادهها و حجم بزرگی از آنها که به وجود آمده است، روز به روز نیاز به پررداز و تحلیل این دادههای کالن بیشتر میشود. طبقهبندی دادهها، شرللی از تحلیرل داده هرا تلقری مری شرود، کره در آن مدلهایی جهت توصیف کالسهای مهمی از دادهها استخراج مری شرود . یلری از اهرداا اصرلی در طبقره بنردی دادهها رسیدن به صحت باالست و یلی از متدها برای رسیدن به این هردا اسرتداده از یرادگیری تلدیقری اسرت . جنگل تصادفی به عنوان درخت تصمیم تلدیقی شناخته میشود و کارایی خوبی هم در طبقهبندی دادههای کرالن دارد. طبقهبندی مجموعه دادههای نامتعادل چالشی را برای اکثر تلنیکهای یادگیری استاندارد به وجرود آورده است و الگوریتم جنگل تصادفی هم تحت تاثیر مندی توزیع کالس نامتعادل قررار گرفتره اسرت . در ایرن کرار، از متد SplitBal که روشی جدید در ایجاد تعادل دادههای نامتعادل میباشد، برای متعادلسرازی داده هرای کرالن نامتعادل استداده گردیده است و در نهایت کار طبقهبندی این نوع دادهها را با کمک الگروریتم جنگرل تصرادفی انجام دادهایم. نتایج این کار در مقابل کارهای انجام شده از جمله نمونهزدایی تصادفی و نمونهافزایی تصرادفی و رو حساس به هزینه نتایجی بهتر در زمان اجرا و کارایی طبقهبندی را در بعضی از نگاشتکنندههرا نشران مری - دهد که مزیت این رو در مقابل دیگر رو ها نداشتن سربار و از دست دادن دادههای مدید است. در این کرار از رو ارزیابی میانگین هندسی برای مقایسه رو پیشنهادی نسبت به رو های دیگر استداده شده است .
واژگان کلیدی: کلان دادهها، نگاشت کاهش، مجموعه دادههای نامتعادل، یادگیری تلدیقی، جنگل تصادفی
3- امنیت و حریم خصوصی در کلان داده (کنفرانس بین المللی پژوهش های کاربردی در فناوری اطلاعات، کامپیوتر و مخابرات)
چکیده:
کالن داده به مقدار بیش از حد داده های تولید شده در جامعه امروز اشاره دارد. در مقایسه با پایگاه داده های معمولی، ، تنوع 2 کالن داده، دارای ویژگی های جدید از نظر حجم 4 است و سرعت 3 (li and Yang, 2112). کالن داده و تجزیه و تحلیل آن در مرکز علم مدرن و تجارت قرار دارد. این داده ها از معامالت آنالین، ایمیل ها، ویدئو ها، فایل های صوتی، تصاویر، جریان کلیک ها، سیاهه ها، پست ها، سوال های جستجو، رکورد های سالمت، تعامالت شبکه های اجتماعی، علم داده، حسگر ها و تلفن های موبایل و برنامه های کاربردی شان تولید می شوند. آنها در پایگاه داده هایی که به صورت انبوه رشد می کنند ذخیره می شوند و در این پایگاه داده ها ثبت کردن، شکل دادن، ذخیره، مدیریت، اشتراک، تجزیه و تحلیل و بصری سازی با استفاده از ابزارهای نرم افزاری معمولی پایگاه داده ها سخت می باشد. 2 اگزابایت داده تا سال 2113 توسط انسان ها ایجاد شده است. امروزه این مقدار از اطالعات در طی دو روز ایجاد می شود. فیسبوک 2 ماهانه 522 میلیون حساب فعال با استفاده از 01 زبان و 141 میلیارد عکس آپلود شده، 122 میلیارد ارتباطات دوستی، هر روز 31 میلیارد قطعه محتوا و 0.2 میلیارد ابراز عالقمندی و نظر ارسال شده دارد. هر دقیقه 44 اجرا می شود. گوگل سرویس های زیادی 6 ساعت ویدئو آپلود می شود و هر روز 4 میلیارد نمایش ویدئو روی یوتیوب را پشتیبانی می کند. 2.0 میلیارد صفحه را در هر روز نظارت می کند و همچنین 21 پتابایت داده را روزانه به 66 زبان 0 ترجمه می کند. یک میلیارد توییت در هر 02 ساعت از بیش از 141 میلیون کاربر فعال روی توییتر فرستاده می شود. 201 وب سایت جدید هر دقیقه از روز ایجاد می شوند. تا دهه آینده تعداد اطالعات تا 21 برابر افزایش خواهد یافت.
4-مدیریت دادههای حجیم با استفاده از سیستمهای NoSQL (کنفرانس بین المللی پژوهش های کاربردی در فناوری اطلاعات، کامپیوتر و مخابرات)
چکیده:
با ظهور پدیده Data Big در دهه گذشته، یک کلاس از سیستمهای مدیریت دادهها به نام NoSQL پدید آمده و در حال حاضر به شدت گسترش پیدا کرده است. از ویژگیهای اصلی آنها این است که این سیستمها مدل داده رابطهای و زبان SQL را رها کرده، از خواص ACID تراکنشها بهصورت کامل پشتیبانی نکرده و اغلب از معماری توزیعشده استفاده میکنند. در نتیجه این سیستمها در بعضی کاربردها عملکرد بهتری نسبت به پایگاههای داده وابسته به زبان SQL دارند. عالوه بر این، این سیستمها قابلیت مقیاسپذیری باالیی در شرایط افزایش بار کاری و حجم باالی دادههادارند که این موضوع مخصوصاً برای برنامههایتحت وب اهمیت زیادیدارد. در بخش اول این مقاله سعی داریم به شناخت بیشتر محدودیتهای پایگاههای داده رابطهای سنتی در مواجه با دادههای حجیم، بپردازیم. سپس با مفاهیم و ویژگیهای اصلی سیستمهای NoSQL آشنا شده و انواع این سیستمهاو زمینههای کاربرد آنها را مشخص خواهیم کرد. در انتها به جمعبندی مطالب و پیشنهادهایی برای استفاده بهینه از این سیستمها در کاربردهای پیش رو میپردازیم.
Big Data ،Not Relational Database ،NoSQL Database
5-Performance Eevaluation of SpatialHadoop for Big Web Mapping Data
6-Enhancing Open Collaborative Applications Using Document-oriented Databases
دانلود با لینک مستقیم
4 مقاله جدید فارسی و 2مقاله انگلیسی درباره big data