نظرة فاحصة على ‘زواج’ نماذج الذكاء الاصطناعي

في عالم “الذكاء الاصطناعي”، لم تعد “النماذج” مجرد أدوات مستقلة، بل أصبحت تشبه العلاقات البشرية، حيث تتلاقى وتتفاعل لتنشئ كيانات أكثر ذكاءً ومرونة. مثل الزواج الذي يجمع شخصين مختلفين في رحلة تكاملية، تعمل تقنيات “دمج النماذج” على جمع عدة “نماذج” “تعلم آلي” للاستفادة من نقاط القوة الفردية لكل نموذج، وتعزيز الأداء، وزيادة القدرة على التكيف مع تحديات غير متوقعة.
هذه العملية التفاعلية تسمح لـ”الذكاء الاصطناعي” بأن يكون أكثر استدامة وفعالية، من خلال استغلال تنوع التخصصات والخبرات كما يحدث في التحالفات البشرية.
أسس “ديفيد ها” وزميله السابق في “غوفل” شركة “ساكانا إيه آي” في اليابان عام 2023، كخطوة مبتكرة بعيدًا عن تكرار بناء “نماذج” ضخمة وموفرة للطاقة مثل “تشات جي بي تي”.
ومنذ إطلاقها، تجاوزت قيمة الشركة مليار دولار، لتصبح أسرع شركة ناشئة يابانية تصل إلى حالة “اليونيكورن”.
ذكاء جماعي
وقال “ها” ان فريقه ركز على تشكيل “ذكاء جماعي قادر على الاستمرار حتى لو توقف أحد “النماذج عن العمل.
يشمل نهج “Sakana AI” الجمع بين مزايا النماذج المختلفة لتحقيق مرونة واستدامة أكبر، وقد جذب هذا النهج دعم شركة نفيديا الأميركية العملاقة، بالإضافة إلى البنوك اليابانية وشركات أخرى تتطلع لتبني حلول الذكاء الاصطناعي التوليدي المتقدمة بسرعة. وتسعى الشركة إلى استلهام الطبيعة، حيث تتعاون الكائنات من النمل إلى البشر لحل المشكلات، وهو ما انعكس في اسمها “Sakana”، الذي يعني “سمك” باليابانية.
ويعكس نهج “ساكانا إيه آي” فلسفة “دمج النماذج” التي تهدف إلى تحسين الدقة، تعزيز المتانة، تحسين استخدام الموارد، وتعزيز التعميم. فالدمج لا يعني مجرد الجمع العشوائي لـ”النماذج”، بل يتعلق بإنشاء كيان متكامل يستفيد من نقاط القوة الفردية لكل نموذج، تمامًا كما تتعلم الشخصيتان المختلفتان في الزواج من بعضهما البعض لتحقيق تكامل أفضل.
ما هو “دمج النماذج”؟
يشير “دمج النماذج” إلى عملية جمع عدة “نماذج” “تعلم آلي”، سواء كانت “نماذج لغوية كبيرة” (“إل إل إم”) أو متخصصة، لتقديم أداء أفضل في مختلف التطبيقات. تتضمن هذه التقنية ما يُعرف أحيانًا بـ “تجميع النماذج” (“مودل إنسمبلينغ”) أو “تجميع الأوزان” (“مودل أغريغايشن”). الهدف الرئيسي هو تعزيز قدرات كل نموذج من خلال معالجة التعقيدات الفردية واستغلالها عند الحاجة، وبالتالي تحسين النتائج النهائية عبر مجالات متعددة.
فوائد “دمج النماذج”
تحسين الدقة:
يستفيد الدمج من نقاط القوة لكل نموذج، مما يعزز الدقة في المهام المختلفة. على سبيل المثال، في الترجمة اللغوية، يمكن دمج نموذج مدرب مسبقًا على الترجمة من الإنجليزية إلى الصينية مع نموذج آخر للترجمة من الصينية إلى اليابانية، ما يقلل الأخطاء ويعزز جودة الترجمة متعددة اللغات. أما في تلخيص النصوص، فإن دمج “نماذج” متخصصة في مجالات مختلفة مثل الأخبار ووسائل التواصل الاجتماعي و”المجلات” يوفر ملخصات دقيقة وشاملة، تلتقط التفاصيل الدقيقة لكل نوع من المحتوى.
زيادة المتانة:
يمكن للدمج أن يحسن متانة “النماذج” عند التعامل مع بيانات متنوعة. في تحليل المشاعر، يؤدي الجمع بين “نماذج” مدربة على مقالات ومنشورات على وسائل التواصل الاجتماعي ومراجعات المنتجات إلى توقعات أكثر موثوقية. أما “روبوتات” الدردشة (“تشاتبوتس”)، فيمكنها تقديم استجابات دقيقة ومتسقة بغض النظر عن نوع الاستفسار، إذا تم دمج “نماذج” متخصصة في الدعم الفني وإدارة الشكاوى ومعلومات المنتجات.
تحسين استخدام الموارد:
يتيح “دمج النماذج” استخدامًا أكثر كفاءة للموارد الحاسوبية، حيث يمكن دمج “نماذج” متخصصة في لغات مختلفة ضمن نموذج واحد، مثل دمج “نماذج” مدربة على الإنجليزية واليابانية والإسبانية والفرنسية، لتقليل الحاجة إلى “نماذج” منفصلة، وبالتالي تقليل استهلاك الطاقة وزيادة الاستدامة.
تقنيات “دمج النماذج”
تتعدد الأساليب لتجميع “النماذج”:
“الدمج الخطي” (“لينير ميرج”): يستخدم المتوسط المرجح للتحكم في مساهمة كل نموذج في النموذج النهائي.
“إس إل إي آر بي” (“سفيركال لينير إنترپوليشن”): يحافظ على الخصائص الهندسية للمتجهات، ويجمع نموذجين في المرة الواحدة مع إمكانية إنشاء تركيبات هرمية متعددة.
“خوارزميات المتجهات المهمة” (“تاسك فكتور ألگوريثمز”): تحدد اتجاهات في فضاء الأوزان لتحسين أداء المهام، ويمكن تعديلها ودمجها لتحسين الأداء في عدة مهام. تتضمن تقنيات مثل “تاسك أريثمتيكس”، “تايز” (“تريم، إلكت ساين & ميرج”)، و”دار” (“دروب أند ريسكيل”).
“فرانكنميرج”: دمج أوزان عدة “نماذج” متخصصة لإنشاء نموذج واحد قابل للضبط والتحسين على مجموعات بيانات محددة.
تطبيقات “دمج النماذج”
تشمل التطبيقات معالجة “اللغة الطبيعية” مثل الترجمة، تلخيص النصوص، وتحليل المشاعر، بالإضافة إلى دعم المركبات الذاتية القيادة و”الروبوتات”، وتحسين دقة “الرؤية الحاسوبية” في التعرف على الصور والكشف عن الأشياء والتطبيقات الطبية.
يتيح دمج النماذج تعزيز الدقة عبر الاستفادة من نقاط القوة لكل نموذج، مثل تحسين الترجمات متعددة اللغات أو تلخيص المحتوى من مصادر متنوعة بدقة عالية. كما يعزز الدمج المتانة عبر مجموعات بيانات مختلفة، مثل دمج نماذج تحليل المشاعر أو روبوتات الدردشة المدربة على مجموعات بيانات متعددة لتقديم أداء موثوق ومتسق. ويحقق استخدامًا أكثر كفاءة للموارد من خلال دمج نماذج متخصصة في لغات متعددة ضمن نموذج واحد، ما يقلل الحاجة إلى نماذج منفصلة ويخفض استهلاك الطاقة.
تشمل التطبيقات معالجة “اللغة الطبيعية” مثل الترجمة، تلخيص النصوص، وتحليل المشاعر، بالإضافة إلى المركبات الذاتية القيادة والروبوتات، حيث يمكن للنماذج المدمجة اتخاذ قرارات أفضل من خلال الجمع بين عدة خبرات، والرؤية الحاسوبية التي تحسن دقة التعرف على الصور والكشف عن الأشياء والتعرف على الوجوه، بما في ذلك التطبيقات الطبية المتقدمة.
التحديات المستقبلية
رغم المزايا، تواجه هذه التقنية تحديات مثل توافق البنية، تفاوت الأداء بين “النماذج”، مخاطر الإفراط أو نقص التخصيص، وتعقيد “النماذج” المدمجة وصعوبة تفسيرها، ما يستدعي اختبارات دقيقة لضمان الأداء.
في مايو الماضي، أعلنت “ساكانا إيه آي” عن شراكة طويلة الأمد مع بنك “إم يو إف جي” الياباني لتطوير أنظمة “ذكاء اصطناعي” مخصصة للبنوك، بينما يركز “ها” على الحفاظ على فريق البحث صغيرًا ومتخصصًا، مع توسيع الفرع الذي يدعم نشر حلول “الذكاء الاصطناعي” في القطاع العام و”الشركات” الخاصة.
مع تزايد الطلب على “نماذج” متخصصة، يبدو أن “دمج النماذج” يشكل مستقبل تطوير “الذكاء الاصطناعي”، موفرًا أدوات أكثر ذكاءً ومرونة، تشبه العلاقات البشرية في قدرتها على التعلم والتكيف والتكامل.
ميدل إيست أون لاين