اللغة العربية ومشاكلها المتشابكة تحول دون صنع برامج رقمية لها
منذ فترة طويلة، تسعى وزارات ومؤسسات بحثية تربوية إلى إيجاد موارد تعليمية في اللغة العربية، لكن أياً منها لم يتوصل إلى موارد قابلة للاعتماد والتعميم على نطاق واسع. ولم تأتِ المعلوماتية بحلول عميقة لتلك الإشكالية. وعلى رغم ظهور بعض البرامج الحاسوبية لتعليم العربية في السنوات الماضية، فإنها لم تصمد طويلاً، بل سُحبت من التداول التربوي، بمعنى أنها لم تقدم الحلول المنشودة. وإذ تعجز المؤسسات العربية عن توفير موارد لغوية رقمية تحوز من الكفاءة ما يكفي لإدراجها في مناهجها التعليمية للعربية، تظهر صورة معاكسة في كثير من اللغات الأخرى التي أدى تفاعلها مع التقنية المعلوماتية إلى فورة في مواردها التعليمية رقمياً. وتعبر تلك الصورة عن نفسها بجلاء في واقع إقبال الطلبة العرب على دراسة لغات أجنبية بواسطة تقنيات رقمية تجعل التمكن منها أمراً سهلاً، فيما يستمر غياب الموارد الرقمية العربية الكفوءة لحد الآن، ما يوسع الهوة بين أجيال الشباب العرب ولغتهم.
الحوسبة واللغة
في علوم المعلوماتية والحوسبة، تتألف الموارد اللغوية في مساحتين. ويتمثل أولهما في الموارد المعجمية التي تشمل الأفعال والأسماء والحروف والتكوين الشكلي- الصوتي (مورفوفونولوجي) للكلمات، وتكوين المفردات والمتغيرات الإملائية. ويتجسد الثاني في الموارد النحوية، أي بناء الجمل وتكوينها.
ثمة مثال مألوف عن الموارد الرقمية للعربية، يتمثله المدقق الإملائي في «مايكروسوفت أوفيس» الذي طالما أثار أسئلة عن مدى كونه مورداً لغوياً فعلياً.
ففي العام 1997، ضمنت شركة «مايكروسوفت» برامج «أوفيس»، مدققاً إملائياً عربياً من صنع شركة «كولتك.كوم» Coltec.com المصرية التي يأتي اسمها من الحروف الأولى لعبارة Computer & Language Technology، وتعني حرفياً «الكومبيوتر وتكنولوجيا اللغة». وتكون انطباع واسع لدى الجمهور الإلكتروني العربي بأن ذلك المُدقق لم يكن بالدقة اللازمة. لذا، عمدت مايكروسوفت إلى استبدال مدقق صنعه فريق من خبرائها به، يستند في جزء من عمله إلى مكنز أساسي يتمتع بمرونة تمكنه من قبول تغذيته بمفردات يقدمها الجمهور، ما يساهم في تجديده بطريقة مستمرة.
وهناك آلية مشابهة معتمدة في الهواتف الذكية. وعند كتابة كلمة ما وتكرارها تدخل تلقائياً في مكنز الهاتف، فيصبح لدى المستخدم «قاموس» للكلمات التي يستعملها في كتابة الرسائل النصية على الهاتف. وفي المقابل، يتطلب تعميم تلك الطريقة توافر آلية عمل معقدة، وفريق تدقيق ومراقبة وتحديث للمداخل المعجمية، إضافة إلى ضرورة التنبه إلى دخول مفردات عامية وأخطاء شائعة إلى ذلك المكنز. وكذلك تغيب القدرة على توليد المفردات عن ذلك المكنز، بمعنى أن الكلمة التي تدخل بصيغة المذكر مثلاً، لا يصنع المكنز لها مؤنثها أو صيغ جمعها، وكذلك الحال بالنسبة إلى مسألة إدخال سوابق ولواحق على الكلمات المفردة، ما يوجب إدخال تلك الصيغة بصورة مستقلة. وتالياً، عندما تسير الأمور على ذلك النحو، يتضخم المكنز ويصبح مثقلاً بملايين المفردات، وهو أمر يشكل عائقاً ضخماً أمام سهولة استعماله.
وبالنتيجة، يؤدي مزيج التضخم وانخفاض الدقة وضآلة المصادر اللغوية الموثوقة وغيرها، إلى عدم صلاحية استخدام ذلك المدقق الإملائي مورداً لغوياً فعلياً للعربية.
لجأت مراكز بحثية وجامعية عربية، من بينها «الجامعة العربية» ومنظمة الـ»ألسكو» («المنظمة العربية للثقافة والفنون») إلى دعم إنتاج موارد لغوية رقمية بهدف تحسين جودة التعليم عبر استخدام التقنية. وتقاطع ذلك مع تراجع مستوى تعليم اللغة العربية في بلدان كثيرة كان بعضها يبحث أيضاً عن حوافز لتعزيز الموارد اللغوية الرقمية. وعلى رغم النوايا الطيبة، لم تتوصل تلك المراكز البحثية حتى الآن، إلى إصدار مورد معجمي وتصريفي يمكن الوثوق به في إنتاج برامج رقمية تعليمية للغة العربية.
في منظور التقنية الرقمية، تتمثل الإشكالية الكبرى في معالجة اللغة العربية في إيجاد حلول لمجموعة كبيرة من قواعد الصرف والإملاء والمورفونولوجيا، تتضمن صياغة ملفاتها وجداولها الرقمية، كي تعمل بسرعة وكفاءة. ويسعى المبرمجون إلى حل تشابكات تلك الأمور وتضارباتها وتقاطعاتها.
تميز «يوني تيكس»
بعد سنوات من العمل، لم يظهر منتج قابل للتوظيف في التعليم والتدقيق الإملائي، والتشكيل (المعجمي والإعرابي)، وتوليد الكلمات (على غرار تصريف كل فعل في حالاته كلها، أو تأنيث المفردة ومثناها وجمعها انطلاقاً من المفردة نفسها) والتحليل بمعنى تفكيك المفردة وتجريدها من السوابق واللواحق، وربطها بمدخلها المعجمي وجذرها وغيرها. ومن أسباب المشاكل، إعطاء الأولوية للمقاربة التقنية ونُظُم البرامج، على حساب المقاربات والحلول الصرفية والنحوية، ذلك أن المبرمجين ليسوا خبراء لغة، لكنهم هم من يوجهون الدفة. لا تنتهي مشكلة الموارد التعلمية للغة العربية عند ما ورد ذكره، بل تشمل عدم استيفاء البرامج الحاسوبية الشروط الدنيا لتوليد المداخل المعجمية وتحليلها، على رغم وجود محاولات جدية كثيرة في ذلك المجال.
وتتضمن قائمة المشاكل أيضاً خضوع البرامج الرقمية لنُظم البرمجيات الغربية، التي لا تبدو متلائمة مع اللغة العربية عموماً، على رغم وجود استثناء يمثله نظام «يوني تكس» UNITEX الذي أدخل تعديلات على نُظُم برمجته كي يصبح متلائماً مع العربية. ويبقى السؤال مستمراً عن جهود العالم العربي في إيجاد حل لجوهر المشكلة المتمثل في صناعة موارد رقمية حقيقية للصالح العام، وعدم الاكتفاء بتلزيمات واستثمارات تنفق عليها أموال كثيرة، من دون الوصول إلى حلول فعلية.
صحيفة الحياة اللندنية