صقل (تعلم الآلة)
الصقل أو الضبط الدقيق[1] في التعلم الآلي طريقة لنقل التعلم حيث يجري تدريب نموذج مدرب مسبقًا على بيانات جديدة.[2] يمكن إجراء الصقل على الشبكة العصبية بأكملها، أو على مجموعة فرعية فقط من طبقاتها، وفي هذه الحالة "تُجمّد" الطبقات التي لم تُصقَل (لم تُحدّث أثناء خطوة الانتشار العكسي).[3] من الشائع الاحتفاظ بالطبقات السابقة (تلك الأقرب إلى طبقة الإدخال) مجمدة في بعض المعماريات، مثل الشبكات العصبية الالتفافية، لأنها تلتقط ميزات ذات مستوى أدنى، في حين أن الطبقات اللاحقة غالبًا ما تتميز بميزات عالية المستوى يمكن أن تكون أكثر ارتباطًا بـ المهمة التي دُرّب النموذج عليها.[4][5] يجري الصقل عادةً من خلال التعلم المراقب، ولكن ثمة تقنيات لضبط النموذج باستخدام تعلم مراقب ضعيف أيضًا.[6] يستخدم التعلم بالتعزيز أيضًا لضبط نماذج اللغة مثل دردشة ج.ب.ت (نسخة دقيقة من GPT-3) وSparrow عن طريق التعليم المعزز من ردود الفعل البشرية.[7][8]
التكيف المنخفض الرتبة
يعد التكيف منخفض الرتبة (LoRA) تقنية لضبط النماذج بكفاءة. الفكرة الأساسية هي تصميم مصفوفة ذات رتبة منخفضة تضاف بعد ذلك إلى المصفوفة الأصلية.[9]
مراجع
- ↑ معجم البيانات والذكاء الاصطناعي (PDF) (بالعربية وEnglish)، الهيئة السعودية للبيانات والذكاء الاصطناعي، 2025، ص. 68، QID:Q111421033
- ↑ Quinn، Joanne (2020). Dive into deep learning: tools for engagement. Thousand Oaks, California. ص. 551. ISBN:978-1-5443-6137-6. مؤرشف من الأصل في January 10, 2023. اطلع عليه بتاريخ January 10, 2023.
{{استشهاد بكتاب}}
: تحقق من التاريخ في:|تاريخ الوصول=
(مساعدة)صيانة الاستشهاد: مكان بدون ناشر (link) - ↑ "CS231n Convolutional Neural Networks for Visual Recognition". cs231n.github.io. مؤرشف من الأصل في 2023-03-23. اطلع عليه بتاريخ 9 March 2023.
{{استشهاد ويب}}
: تحقق من التاريخ في:|تاريخ الوصول=
(مساعدة) - ↑ "CS231n Convolutional Neural Networks for Visual Recognition". cs231n.github.io. مؤرشف من الأصل في 2023-03-23. اطلع عليه بتاريخ 9 March 2023.
{{استشهاد ويب}}
: تحقق من التاريخ في:|تاريخ الوصول=
(مساعدة) - ↑ Zeiler، Matthew D؛ Fergus، Rob (2013). "Visualizing and Understanding Convolutional Networks". arXiv:1311.2901.
{{استشهاد بدورية محكمة}}
: الاستشهاد بدورية محكمة يطلب|دورية محكمة=
(مساعدة) - ↑ Yu، Yue؛ Zuo، Simiao؛ Jiang، Haoming؛ Ren، Wendi؛ Zhao، Tuo؛ Zhang، Chao (2020). "Fine-Tuning Pre-trained Language Model with Weak Supervision: A Contrastive-Regularized Self-Training Approach". arXiv:2010.07835.
{{استشهاد بدورية محكمة}}
: الاستشهاد بدورية محكمة يطلب|دورية محكمة=
(مساعدة) - ↑ "Introducing ChatGPT". openai.com. مؤرشف من الأصل في 2023-04-10. اطلع عليه بتاريخ 9 March 2023.
{{استشهاد ويب}}
: تحقق من التاريخ في:|تاريخ الوصول=
(مساعدة) - ↑ Glaese، Amelia؛ McAleese، Nat؛ Trębacz، Maja؛ Aslanides، John؛ Firoiu، Vlad؛ Ewalds، Timo؛ Rauh، Maribeth؛ Weidinger، Laura؛ Chadwick، Martin (2022). "Improving alignment of dialogue agents via targeted human judgements". arXiv:2209.14375.
{{استشهاد بدورية محكمة}}
: الاستشهاد بدورية محكمة يطلب|دورية محكمة=
(مساعدة) - ↑ Hu, Edward J.; Shen, Yelong; Wallis, Phillip; Allen-Zhu, Zeyuan; Li, Yuanzhi; Wang, Shean; Wang, Lu; Chen, Weizhu (28 Jan 2022). "LoRA: Low-Rank Adaptation of Large Language Models" (بEnglish). Archived from the original on 2023-03-15.
{{استشهاد بدورية محكمة}}
: الاستشهاد بدورية محكمة يطلب|دورية محكمة=
(help)