هل يُستثنى العرب من معجزة الذكاء الصناعي بسبب لغتهم؟

بقلم أمل المكي

ترجمة وتحرير مريم الحمد

عندما قرأت كتاب المؤرخ الإسرائيلي، يوفال نوح هراري، “الإنسان الإله: موجز لتاريخ الغد”، الذي بنى فيه على نبوءة مفادها أن الخوارزميات والبيانات سوف تصبح يوماً “الأعلى سلطة”، توقفت قليلاً لاعدل العبارة من وجهة نظري وأقول “البيانات صحيح ولكن بلغات معينة”، ففي معركة الإنسانية ضد تدخل الذكاء الاصطناعي، كنت أخشى أن بعض اللغات قد تبقى خارج الحسابات!

عندما بدأت باستخدام “شات جي بي تي“، أدركت أن مخاوفي كانت في محلها بالفعل، فلا وجود للغة العربية في هذه المعركة التكنولوجية الجديدة حتى الآن!

“إذا استطاعت البشرية إرسال رجل إلى القمر، ألن تستطيع تعليم قواعد اللغة العربية لآلة ذكية؟!”

 من رحم تخصصي كصحفية ومدربة مهتمة في مجال الذكاء الصناعي، لا يسعني إلا ملاحظة ما أحدثت أدوات الذكاء الصناعي اليوم من ثورة في صناعة المحتوى والبحث وقنوات الاتصال، وفي المقابل، ألاحظ أيضاً كيف تكشف أدوات التغيير ذاتها عن فجوة لغوية عميقة، لا تنصف المتحدثين باللغة العربية بنفس الدرجة مع نظرائهم من الناطقين باللغة الإنجليزية.

خلال فترة معينة، قضيت وقتاً في تجريب أدوات “شات جي تي بي” بين اللغتين، لرصد ارتفاع الجودة وانخفاضها مع تغيير اللغة، فوجدت أن الأمر لا يقتصر على الصياغة والتركيب اللغوي ولكن في المعلومات نفسها، ففي بحثي بالانجليزية عن “الحرباء” أو “مرض الفصام”، أظهر لي “شات جي بي تي” المعلومات وكأنها صيغت على يدي باحث مجتهد دقيق ومرتب، أما في العربية، فقد ظهرت أشبه بعمل موظف أرشيف كسول لا يريد أن يتعب نفسه وكأنه يقول “هذا كل ما لدي، غادر الآن”!

ما زالت أداة مثل “شات جي بي تي” بحاجة إلى التدرب على كمية هائلة من البيانات المكتوبة باللغة العربية عالية الجودة، فعدم توفر البيانات يجعل نتائج الاداة باللغة العربية أضعف بالضرورة، وغير قادرة على تمييز الفروق الدقيقة والعمل بدقة وعمق لإنشاء محتوى عالي الجودة.

قد يهاجم البعض اللغة العربية بوصفها بأنها “لغة معقدة ومن الصعب فهم قواعدها اللغوية والنحوية ومفرداتها”، ولكني أقول “إذا استطاعت البشرية إرسال رجل إلى القمر، ألن تستطيع تعليم قواعد اللغة العربية لآلة ذكية؟!”.

التأثير على المستخدمين العرب

إضافة إلى الإحباط، يواجه المستخدمون الناطقون باللغة العربية لأدوات الذكاء الصناعي عواقب وخيمة بسبب هذا التهميش اللغوي، فقائمة البيانات والمراجع الضخمة التي تفحصها هذه الأدوات لتوليد نتائجها متاحة باللغة الإنجليزية بشكل أساسي.

ويعيق هذا التناقض قدرة المستخدمين الناطقين باللغة العربية على الاستفادة من الذكاء الاصناعي للنمو المهني والشخصي ويجعل للأمر تداعيات طويلة المدى، فيما يقتصر الحل مرحلياً على استخدام أدوات الذكاء الاصناعي بإعطاء الأوامر أو التعليمات والحصول على النتائج بالانجليزية، ثم ترجمة النتيجة.

 ورغم ذلك، يفتح هذا الحل الباب على مشكلة أخرى وهي الترجمة، فجودة أدوات الترجمة عبر الانترنت، مثل جوجل وغيرها، منخفضة الجودة حتى اليوم، قد تسبب ركاكة في الصياغة وعيوباً كبيرة في الترجمة لمن لا يتقن اللغة المصدر!

مشكلة أخرى قد تواجه المستخدم الناطق بالعربية، وتتمثل بضياع الفرص، ففي الوقت الذي يمتلك فيه الكثير من الصحفيين ومنشئي المحتوى الذين يعملون باللغة العربية مهارات عالية الجودة في إنتاج ذلك المحتوى، إلا أنهم يصطدمون بعدم كفاية المعلومات خلال البحث من خلال أدوات الذكاء الصناعي،  فبعض أدوات إنتاج الفيديو، على سبيل المثال، غير قادرة على تنظيم اتجاه الكتابة باللغة العربية، وهو أمر يدعو للإحباط عند الصحفي أو صانع المحتوى إذا أراد بدء عنوان مقاله مثلاً برقم وليس كلمة، فيجد الكلمات قد تداخلت وصار العنوان غير مفهوم.

وهنا تكون الفرصة الضائعة، أي القدرة الأقل على استخدام تلك الأدوات لإنشاء محتوى عالي الجودة، وقدرة أقل على تحقيق وصول أكبر، وقدرة أقل على المساهمة في نمو وتطوير النظام الإيكولوجي لصناعة المحتوى العربي، وهي فرص تهم الأفراد والمؤسسات على حد سواء، فالجودة الردئية بالنسخة العربية تعني أنه سيتعين على المحترفين ورجال الأعمال مواصلة كفاحهم في سياق المنافسة غير العادلة مع السوق العالمي.

نحن المتحدثون بالعربية لا نصوغ تلك التكنولوجيا، فهل نحظى فعلاً في يوم ما بتكافؤ الفرص في الاستفادة من أدوات الذكاء الصناعي؟!

ويعد سوء الفهم الثقافي جانباً آخر من أوجه قصور أدوات الذكاء الصناعي في النسخة العربية، فهناك مشكلة في فهم الخصوصيات والحساسيات الثقافية المرتبطة باللغة، حيث تميل تلك الروبوتات المدربة على كمية محدودة من البيانات مقارنة بنظيراتها بلغات أخرى، إلى إنشاء محتوى غير لائق ثقافياً أو عدوانياً، أمر يزيد شعور المستخدم العربي بالغربة ويقلل ثقته بتلك الأدوات.

سد الفجوة

هل يمكن سد الفجوة اللغوية الموجودة في أدوات الذكاء الصناعي؟ وكيف ذلك؟ يتطلب ذلك إرادة حقيقية للاستثمار في تدريب تلك الأدوات على بيانات عربية ضخمة ومتنوعة، فالبيانات الكثيرة وعالية الجودة وحدها فقط يمكن أن تحسن أداء الذكاء الصناعي بشكل فعال.

يتطلب سد الفجوة أيضاً تطوير أدوات بحث مدعومة بالذكاء الصناعي، وقادرة على فهم اكبر وأكثر دقة للغة العربية، كما يمكن سد الفجوة كذلك من خلال الجهود المشتركة بين مطوري الذكاء الصناعي واللغويين والخبراء في هذا المجال، فالجهود المتضافرة بين الأوساط الأكاديمية وصناع التكنولوجيا وأصحاب المصلحة في المجتمعات، هي الضمان لوصول المستخدمين الناطقين باللغة العربية إلى محتوى عالي الجودة يعادل ما يتم إنتاجه في اللغات الأخرى.

الآن، سأضع نفسي مكان مطوري ادوات الذكاء الصناعي مثل “شات جي بي ت” وأطرح أسئلة مهمة ، “لماذا علي تدريب أداتي على بيانات أكبر وأفضل باللغة العربية؟ ما الفائدة من ذلك؟”، ربما تكون الإجابة الجاهزة أن عدد الناطقين باللغة العربية حوالي 400 مليون شخص، الأمر الذي يجعل من العربية سوقاً جيداً للاستثمار فيه، لكني على يقين أن تلك الإجابة غير كافية لإرضاء مطوري الذكاء الصناعي.

تقول المسؤولة في شركة OpenAI التي طورت “شات جي بي تي”، ميرا موراتي، أن “التكنولوجيا تُشكلنا، ونقوم بدورنا نشكلها”، ولكني أشعر بالقلق من أن المجتمع الذي سوف تشكله “شات جي بي تي”، لن يكون فقط غير قادر على دخول مجتمع ما بعد المعلومات، ولكن أيضاً غير قادر على الوصول إلى المعلومات ببساطة، خاصة وأننا المتحدثون بالعربية لا نصوغ تلك التكنولوجيا، فهل نحظى فعلاً في يوم ما بتكافؤ الفرص في الاستفادة من أدوات الذكاء الصناعي؟!

للاطلاع على النص الأصلي من (هنا)

مقالات ذات صلة