صورة اللغة العربية وتطبيقات الذكاء الاصطناعي بين الواقع والمأمول

صورة اللغة العربية وتطبيقات الذكاء الاصطناعي بين الواقع والمأمول

صورة اللغة العربية وتطبيقات الذكاء الاصطناعي بين الواقع والمأمول


28/02/2023

علي بن تميم

يلخّص خبراء الذكاء الاصطناعي الهدف من تطوير روبوتات المحادثة في "تعزيز القدرات البشرية، وإطلاق العنان للبشر ليصبحوا أكثر إبداعاً وابتكاراً"، ويتوقعون أن يصل الأمر بالبشر إلى "قضاء مزيد من أوقاتهم في الأنشطة الاستراتيجية، وليس الأنشطة التكتيكية".

وفي مقابل هذه الصورة ثمة تخوفات من الإمكانيات المذهلة التي باتت بأيدي روبوتات المحادثة التي تزداد قدرة على محاكاة أنماط عمل الذهن البشري في القدرة على التعلم، والاستنتاج، وصياغة ردود الفعل.

وتدور معظم التخوفات في أطر اجتماعية، مثل تغيير أنماط التواصل بين البشر، أو اقتصادية مثل الاستحواذ على وظائف نحو مليار شخص وانقراض ما يقارب 400 ألف وظيفة في بضع سنوات، أو أمنية مثل اختراق الخصوصيات وتسهيل وقوع الجرائم. 

ويمثل روبوت المحادثة "تشات جي بي تي" (ChatGPT) أحدث تطبيقات الذكاء الاصطناعي التي طورتها شركة "أوبن أيه آي" (OpenAI) الأمريكية، وأطلقتها في نهاية نوفمبر (تشرين الثاني) الماضي. ويستخدم الروبوت تقنيات متطورة تحاكي عمل الدماغ البشري لتحليل البيانات، وتقديم الإجابات في وقت قياسي في أثناء المحادثة.

وقد انطلق التطبيق بأربع لغات أساسية -حتى اليوم- هي الإنجليزية، والفرنسية، والألمانية، والعربية، ويعمل وفق تقنية خاصة تمكنه من تحقيق أكبر تدفق للمعلومات المتاحة على الإنترنت؛ ما يعني أن مخرجات هذا الروبوت تعيد استخدام المتوافر من معلومات في الفضاء الرقمي، وصياغته، وعرضه، وهو أمر يدعونا للانتباه إلى خصائص المحتوى العربي على الإنترنت كمًّا ونوعًا وانضباطًا. 

وتشير التقارير إلى أن اللغة العربية تأتي في مرتبة متأخرة من حيث إسهامها في المحتوى الرقمي على الإنترنت، إذ يشير موقع (Technology Survey Subscriptions - W3Techs) إلى حلولها في المرتبة الخامسة عشرة من أصل 39 لغة، بعد اللغات: الإنجليزية والروسية والإسبانية والفرنسية والألمانية واليابانية والتركية والبرتغالية والفارسية والإيطالية والصينية والهولندية والفيتنامية والبولندية، بنسبة مشاركة في المحتوى لا تزيد على 0.8 في المئة.
ويمكننا النظر بتفاؤل إلى هذه المرتبة إذا وضعنا في الحسبان وجود أكثر من سبعة آلاف لغة حية في العالم -بحسب منظمة الأمم المتحدة للتربية والعلم والثقافة (اليونسكو)- لا يشارك منها في محتوى الإنترنت سوى 39 لغة منها العربية، إلا أن حضارة بحجم اللغة العربية تستحق حضورًا يليق بها. 
والواقع أن اللغة الإنجليزية وحدها تستأثر بنسبة 56.6 % من حجم المحتوى الرقمي، وتتوزع النسبة الباقية على سائر اللغات الـ38، ومن بينها العربية. 

ولأننا لسنا بصدد مناقشة أسباب تصدُّر الإنجليزية نتائج هذه الإحصائية، فإن الموضوعية تتطلب عقد مقارنة بين نسب حضور كل لغة من اللغات التي يتعامل بها تطبيق "تشات جي بي تي" بخلاف الإنجليزية، إلى أعداد الناطقين بها في العالم.

فبينما كانت نسبة مشاركة اللغة العربية 0.8 %، كانت نسبتا اللغتين الفرنسية والألمانية هي 4.2 %، و4.1 % على التوالي بحسب التقرير نفسه. وإذا ذكرنا أن عدد الناطقين باللغة العربية -بصفتها لغتهم الأم- يزيد على 467 مليون نسمة، في وقت لا يزيد فيه عدد المتحدثين باللغة الفرنسية -بصفتها لغة أمًّا- على 80 مليونًا، ولا يزيد عدد المتحدثين بالألمانية -بصفتها لغة أمًّا- على 130 مليوناً، فإن المقياس يكشف عن فجوة كمية واضحة على مستوى الحضور الرقمي نسبة إلى الحضور الفعلي للغة العربية. 

وإذا كانت دراسة أسباب هذه الفجوة ليست محل حديثنا الآن، فإنها في معرض مناقشتنا لعلاقة تطبيقات المحادثة الذكية باللغة العربية، تُضيّق -بلا شك- أفق نتائج كل حوار متوقع، وتحد من إمكانيات تطوير هذا الحوار على نحو يعكس حقيقة ثراء اللغة العربية، وعُمق ثقافتها، وأصالة حضارتها.

ولو عدَدْنا روبوت المحادثة "تشات جي بي تي" عقلًا بديلًا للذهن البشري في تمثيل الحضارة والثقافة العربية من واقع محتواها في الفضاء الرقمي، فسيكون هذا العقل محصورًا ومحكومًا في عمله، ومن ثَمَّ نتائجه داخل حدود هذه النسبة الضئيلة من المحتوى المتوافر رقميًّا باللغة العربية. وما الحال إذا كان هذا المحتوى -المتواضع من حيث الكم- عشوائياً من حيث المضمون، ينقصه الانتظام، والمرجعية، والتوازن والدقة والمصداقية؟ 

ثمَّة صعوبة شديدة في الوصول إلى حكم بشأن طبيعة المحتوى العربي على الإنترنت، إذ ليس الأمر في سهولة الإحصاء الكمي، إلا أن استقراء بعض المؤشرات قد يساعد في هذا الشأن؛ ومنها أن محتويات "فيس بوك" وغيرها من وسائل التواصل الاجتماعي، والمدونات والمنتديات والمواقع الشخصية، والنسخة العربية من ويكيبيديا... تمثل جانبًا كبيرًا من المحتوى العربي المحتسب في مؤشرات القياس الدولية. وليس خافيًا على المتابعين افتقار هذه المحتويات إلى ما تحتاج إليه المصادر لتكتسب الموثوقية اللازمة للتعامل معها بصفتها مرجعية منضبطة.

كما أن المحتوى العربي المحتسب يضم نسبة كبيرة مترجمة من لغات أخرى، وبصرف النظر عن أهمية هذه المحتويات، وأهمية الترجمة وضرورتها، فإنه لا يجوز تضمينها ضمن المحتوى الأصيل الممثل للغة والثقافة العربية.

ولعلَّ المنطق يستدعي استبعاد كثير من المواقع الرسمية الممثلة لمؤسسات وشركات مختلفة التوجهات والتخصصات، من نسبة مشاركة المحتوى العربي، لأنها ليست سوى انعكاس لكيانات ذات أهداف تجارية أو اقتصادية أو غير ذلك مما لا يتعلق بالصورة المطلوب عرضها عن الثقافة العربية. 

أضِفْ إلى ذلك خطورة شيوع محتوى يخدم توجهات معينة من الفقه، أو الفهم التاريخي للتراث، وهو ما يحتاج إلى جهود منتظمة ومنضبطة لموازنته بذخائر الفقه، والفهم العقلي المنضبط، إلى جوار غياب كثير من دُرر الفكر والفن والفلسفة وفقه اللغة والعلوم والشعر والأدب والمعاجم والمصنفات التي قدمتها اللغة العربية وحضارتها إلى العالم. 

وما يدعو إلى التفاؤل وجود كثير من المشروعات الجادة والمبادرات المثابرة المعنية بإثراء المحتوى العربي في الفضاء الرقمي على الصعيدَين الأهلي والحكومي. ولعل ما تديره وترعاه دولة الإمارات العربية المتحدة في هذا الصدد يُعد نموذجاً كفيلًا ببث الأمل في النفوس، جنبًا إلى جنب مع مشروعات المملكة العربية السعودية وجمهورية مصر العربية وغيرهما من الدول التي لمست أهمية وضرورة العمل السريع والنوعي في ضبط المحتوى العربي بالفضاء الرقمي، إلا أننا ما زلنا في حاجة إلى مزيد من الجهود والمبادرات لتجسير هذه الفجوة المذهلة بين صورة اللغة العربية وثقافتها على خط مسيرتها الفعلية من التاريخ حتى عصرنا الراهن، وصورتها التي تعكسها نسبة مشاركة رقمية لا تتجاوز 0.8 بالمئة في الفضاء الرقمي.

عن "مفكرو الإمارات"




انشر مقالك

لإرسال مقال للنشر في حفريات اضغط هنا سياسة استقبال المساهمات
الصفحة الرئيسية