پاورپوینت پیادهسازی موازی الگوریتم زنبور عسل بر روی GPU
موضوع فارسی :تمایز الگوریتم الحاقی GPU شتاب
موضوع انگلیسی :<!--StartFragment -->
GPU-accelerated adjoint algorithmic differentiation✩
تعداد صفحه :12
فرمت فایل :PDF
سال انتشار :2015
زبان مقاله : انگلیسی
بسیاری از مسائل علمی مانند آموزش طبقه بندی و یا بازسازی تصاویر پزشکی می تواند به عنوان حداقل رساندن مشتقپذیر توابع هزینه واقعی ارزش بیان و حل با روش های مبتنی بر گرادیان تکرار شونده. تمایز الگوریتم الحاقی (AAD) را قادر می سازد محاسبه شیب از جمله توابع هزینه اجرا به عنوان برنامه های کامپیوتری خودکار می باشد. به backpropagate الحاقی مشتقات، حافظه بیش از حد است به طور بالقوه مورد نیاز برای ذخیره مشتقات جزئی میانی در یک ساختار داده اختصاص داده شده، به عنوان '' نوار '' با اشاره به. موازی مشکل است زیرا موضوعات نیاز به همگام سازی دسترسی خود را در طول مداخله و پس انتشار خطا. این وضعیت برای معماری های چند هسته ای، مانند گرافیک واحد پردازش (GPU ها) تشدید، به دلیل تعداد زیادی از موضوعات سبک وزن و اندازه حافظه محدود به طور کلی و همچنین هر موضوع. ما نشان دهد که چگونه این محدودیت ها می توان به واسطه اگر تابع هزینه با استفاده از عملیات بردار و ماتریس GPU شتاب که به عنوان توابع ذاتی توسط نرم افزار AAD ما به رسمیت شناخته بیان شده است. ما این رویکرد با پیاده سازی ساده و بی تکلف و برداری برای پردازنده مقایسه کنید. ما با استفاده از چهار توابع هزینه به طور فزاینده پیچیده به منظور ارزیابی عملکرد با توجه به مصرف حافظه و زمان انجام محاسبات شیب. با استفاده از vectorization، CPU و مصرف حافظه GPU می تواند به طور قابل توجهی در مقایسه با مرجع پیاده سازی ساده و بی تکلف حتی منظور از پیچیدگی کاهش می یابد، در برخی موارد. vectorization استفاده از اجازه از کتابخانه های موازی، بهینه در طول جلو و عقب پاس که در مقایسه با مرجع پیاده سازی ساده و بی تکلف در تند بالا برای نسخه CPU برداری. نسخه GPU به دست آورد تسریع اضافی از
7.5 ± 4.4، نشان دادن که قدرت پردازش GPU های را می توان برای AAD استفاده از این مفهوم استفاده شده است.
علاوه بر این، ما نشان می دهد که چگونه این نرم افزار می توان به طور سیستماتیک برای مشکلات پیچیده تر مانند بازسازی جذب غیرخطی توموگرافی-فلورسانس واسطه افزایش یافته است.
پیاده سازی الگوریتم موازی درgpu
در سال های اخیر، افزایش روز افزون عملکرد کارت های گرافیکی، محققین را به فکر بهره گیری از توان پردازشی آنها در کاربردهای غیر گرافیکی انداخته است. درهمین راستا شاخه جدیدی در علوم کامپیوتر به نام محاسبات با اهداف همه منظوره روی واحد GPU ایجاد شده است ، هدف فعالان این عرصه بهره گیری از کارت گرافیک به عنوان یک کمک پردازنده محاسباتی در برنامه های غیرگرافیکی و برنامه های عمومی است.ازاین رو از صنعت محاسباتی گرفته تا محاسبات موازی دچار تغییرات گسترده ای شده وعملیات انتقال تقریبا تمام کامپیوترهای مصرف کننده سال 2010 همراه با پردازنده های چند هسته ای صورت گرفته است صنعت رایانه ای در سراشیبى تند انقلاب محاسباتی موازی قرار دارد ،نتیجه اینکه در پی آن، تقریبا هر برنامه نویس مشتاق در آن نیاز به آموزش برنامه نویسی موازی دارد تا بتواند در علوم کامپیوتری به طور کامل موثر واقع شود. و در نتیجه CUDA C NVIDIA تا کنون به عنوان یکی از موفق ترین زبانهای عمل کرده است که تا به حال برای محاسبات موازی طراحی شده است. در این پایان نامه، ضمن بیان مقدمه ای از CUDA، تعدادی از دستورات زبان NVIDIA CUDA C معرفی خواهد شد.