فناوری

عملکرد بهتر مدل هوش مصنوعی DeBERTa در مقایسه با انسان

اخیرا کمپانی مایکروسافت، مدل هوش مصنوعی DeBERTa را بروز رسانی کرده است. این هوش مصنوعی از طریق تعلیم نسخه‌ی عظیم‌تر آن با 48 لایه‌ی ترنسفورمر، با 1.5 میلیارد پارامتر به‌روزرسانی شده است.

تقویت چشمگیر عملکرد DeBERTa سبب شده این مدل برای نخستین بار، در پردازش و فهم زبان SuperGLUE از نظر نمره‌ی متوسط کلان، از انسان پیشی بگیرد. در این آزمایش مدل DeBERTa امتیاز 89.9 کسب کرده و انسان موفق‌ به کسب امتیاز 89.8 شده است. این تفاوت امتیازها با درنظرگرفتن معیارهای پایه‌ بیشتر می‌شود (90.3 در برابر 89.8).

SuperGLUE شامل وظایف گوناگون مبتنی‌ بر پردازش زبان طبیعی (NLP) می‌باشد؛ از جمله از آن‌ها می‌توان به پاسخ‌دهی به سؤال و استنتاج زبان طبیعی اشاره کرد. مدل DeBERTa مایکروسافت با کسب نمره‌ی متوسط کلان 90.8، در رتبه‌ی نخست بنچمارک SuperGLUE قرار گرفته است.

این مطلب هم شاید برای شما جالب باشه
آموزش سیری برای تشخیص صدای افراد دارای لکنت زبان

مدل DeBERTa قادر است PLM-های پیشین نظیر BERT،اRoBERTa و UniLM را با استفاده از سه تکنیک نوین، بهبود ببخشد. یکی از این تکنیک‌ها، مکانیسم دقت منظم‌شده (Disentangled Attention) نام دارد و تکنیک دوم در واقع نسخه‌ی بهبودیافته‌ی ابزار Mask Decoder محسوب می‌شود. مایکروسافت علاوه بر آن به نوعی تعلیمِ رقابتی‌ مجازی برای بهینه‌سازی مدل DeBERTa اشاره می‌کند.

مدل 1.5 میلیارد پارامتری DeBERTa در مقایسه ‌با T5 گوگل که شامل 11 میلیارد پارامتر می‌باشد، از مصرف انرژی بسیار کمتری برخوردار است و به ‌شکلی ساده‌تر امکان فشرده‌سازی اپلیکیشن‌ها با تنظیمات مختلف را فراهم می‌کند.

این عملکرد بهتر در مقایسه با انسان در بنچمارک SuperGLUE دستاورد بسیار مهمی در حوزه‌ی هوش مصنوعی عمومی محسوب می‌شود. با اینکه DeBERTa عملکر بسیار خوبی در این مقایسه داشته اما مدل مایکروسافت با هیچ متر و معیاری به سطح هوش انسان در زمینه‌ی درک زبان طبیعی (NLU) دست پیدا نمی‌کند. ذهن انسان در زمینه‌ی یادگیری دانش از وظایف مختلف برای حل کردن وظیفه‌ای جدید، عملکردی بسیار هوشمندانه دارد.

این مطلب هم شاید برای شما جالب باشه
تربیت سگ‌ها با استفاده از هوش مصنوعی

این ابر غول فناوری تصمیم دارد این فناوری را با نسخه‌ی جدید مدل بازنمایی زبان طبیعی Microsoft Turing ادغام کند. شرکت ردموندی از این مدل در Bing،اOffice،اDynamics و Azure Cognitive Services برای ممکن ‌شدن انواع کارها نظیر تعاملات انسان-انسان و تعاملات انسان-دستگاه استفاده می‌کند. مایکروسافت تصمیم دارد مدل 1.5 میلیارد پارامتری DeBERTa و کد منبع آن را در دسترس عموم قرار دهد.

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا