یادگیری عمیق (Deep Learning) زیرشاخهای از یادگیری ماشین است که بر یادگیری لایههای متوالی از نمایشهای معنادار و فزاینده از دادهها متمرکز است. اصطلاح “عمیق” به عمق مدل اشاره دارد که توسط تعداد لایههای مورد استفاده برای تبدیل دادههای ورودی به نمایشهای مفید تعیین میشود. این لایهها بر روی یکدیگر قرار میگیرند و هر لایه ویژگیهای انتزاعیتری را از دادهها استخراج میکند.
مفاهیم کلیدی
۱. لایههای متوالی نمایشها
در یادگیری عمیق، دادهها از طریق چندین لایه پردازش میشوند که هر کدام ورودی را به نمایشی انتزاعیتر و معنادارتر تبدیل میکنند. به عنوان مثال، در تشخیص تصویر:
- لایه اول ممکن است ویژگیهای سادهای مانند لبهها را تشخیص دهد.
- لایه دوم ممکن است شکلهای پیچیدهتری مانند دایرهها یا خطوط را تشخیص دهد.
- لایه سوم ممکن است بخشهایی از اشیاء (مانند چشمها یا چرخها) را تشخیص دهد.
- لایه نهایی ممکن است کل شیء (مانند یک صورت یا ماشین) را شناسایی کند.
۲. عمق مدل
عمق یک مدل یادگیری عمیق به تعداد لایههای آن اشاره دارد. مدلهای یادگیری عمیق مدرن میتوانند دهها یا حتی صدها لایه داشته باشند. هر لایه به توانایی مدل در استخراج و نمایش ویژگیهای پیچیدهتر از دادهها کمک میکند.
۳. یادگیری سلسلهمراتبی
مدلهای یادگیری عمیق نمایشهای سلسلهمراتبی از دادهها را یاد میگیرند. این بدان معناست که هر لایه بر اساس نمایشهای یادگرفتهشده توسط لایه قبلی ساخته میشود و منجر به درک دقیقتری از ورودی میشود. این رویکرد سلسلهمراتبی به مدلهای یادگیری عمیق اجازه میدهد تا وظایف پیچیدهای مانند تشخیص تصویر، تشخیص گفتار و پردازش زبان طبیعی را مدیریت کنند.
۴. شبکههای عصبی
مدلهای یادگیری عمیق معمولاً با استفاده از شبکههای عصبی پیادهسازی میشوند که به صورت لایهای ساختار یافتهاند. هر لایه شامل نورونهایی است که محاسبات سادهای را روی دادههای ورودی انجام میدهند. خروجی یک لایه به عنوان ورودی لایه بعدی استفاده میشود. اصطلاح “شبکه عصبی” از نوروبیولوژی الهام گرفته شده است، اما مدلهای یادگیری عمیق مدلهایی از مغز نیستند. آنها چارچوبهای ریاضی برای یادگیری نمایشها از دادهها هستند.
۵. استخراج خودکار ویژگیها
یکی از مزایای کلیدی یادگیری عمیق، توانایی آن در یادگیری خودکار ویژگیها از دادههای خام، بدون نیاز به مهندسی دستی ویژگیها است. در یادگیری ماشین سنتی، ویژگیها (مانند لبهها در یک تصویر) اغلب توسط انسانها طراحی میشوند. در یادگیری عمیق، مدل این ویژگیها را به طور خودکار از طریق مواجهه با دادههای آموزشی یاد میگیرد.
۶. یادگیری سطحی در مقابل یادگیری عمیق
مدلهای یادگیری ماشین سنتی اغلب بر یادگیری یک یا دو لایه از نمایشها متمرکز هستند (مانند گرفتن هیستوگرام پیکسلها و اعمال یک قانون طبقهبندی). این مدلها گاهی اوقات مدلهای یادگیری سطحی (Shallow Learning) نامیده میشوند. از سوی دیگر، یادگیری عمیق شامل یادگیری بسیاری از لایههای نمایشها است که آن را برای وظایف پیچیده قدرتمندتر میکند.
جمعبندی
یادگیری عمیق با استفاده از لایههای متوالی نمایشها، توانایی استخراج ویژگیهای پیچیده و معنادار از دادهها را فراهم میکند. این لایهها به صورت سلسلهمراتبی عمل میکنند و هر لایه بر اساس لایه قبلی، درک عمیقتری از دادهها ایجاد میکند. این رویکرد باعث میشود که یادگیری عمیق برای وظایف پیچیدهای مانند تشخیص تصویر، تشخیص گفتار و پردازش زبان طبیعی بسیار مؤثر باشد. در مقابل، یادگیری سطحی که تنها بر یک یا دو لایه نمایشها متمرکز است، برای چنین وظایفی محدودیتهایی دارد.
یادگیری عمیق با استفاده از شبکههای عصبی و توانایی آن در استخراج خودکار ویژگیها، انقلابی در حوزه یادگیری ماشین ایجاد کرده است و به یکی از قدرتمندترین ابزارها برای حل مسائل پیچیده در دنیای واقعی تبدیل شده است.