عبد القادر الكاملي.. يكتب / هل يوحد الذكاء الاصطناعي المصطلحات العربية؟
عبد القادر الكاملي – مستشار تكنولوجيا المعلومات والاتصالات
على الرغم من التحسن المستمر للترجمات الآلية من اللغة الإنجليزية إلى العربية خاصة بعد دعمها بالذكاء الاصطناعي، إلا أنها لا تزال تعاني من التشوش ذاته الذي تعاني منه الترجمات البشرية وخاصة فيما يتعلق بالمصطلحات. النتيجة السابقة نابعة من دراسة أولية أجريتها على برمجيات ترجمة غوغل ومايكروسوفت بينغ وشات-جي بي تي (ChatGPT)، والويكيبيديا العربية.
سأبدأ بمثال بسيط: يترجم غوغل ومايكروسوفت بينغ وشات-جي بي تي كلمة computer إلى حاسوب عند إدخالها منفردة، لكن عندما تأتي مع كلمة أخرى أو أكثر تصبح ترجمة غوغل ومايكروسوفت بينغ وشات-جي بي تي غير متسقة، فالبرمجيات الثلاثة المذكورة تترجم Computer Gaming إلى “ألعاب الكمبيوتر”، فيما تترجم Computer Engineering إلى “هندسة الحاسوب”، لكن عند وجود العبارة الأخيرة ضمن فقرة كاملة يترجمها غوغل ومايكروسوفت بينغ إلى “هندسة الكمبيوتر”، فيما يترجمها شات-جي بي تي إلى “هندسة الحاسوب”. توجد أربع ترجمات مختلفة على شبكة الإنترنت لكلمة computer، ترتيبها وفق درجة انتشارها، هو كمبيوتر، حاسوب، حاسب آلي، كومبيوتر. ويبدو أن برامج الترجمة الشهيرة تستخدم الترجمتين الأكثر انتشاراً منهمها دون اعتماد أحدهما.
طلبت من البرامج الثلاثة ترجمة computer chip ثم جمعها computer chips، فجاءت الترجمات كما يلي: ترجمها غوغل إلى رقائق الكمبيوتر وجمعها شرائح الكمبيوتر، وترجمها مايكروسوفت بينغ إلى رقاقة الكمبيوتر وجمعها رقائق الكمبيوتر، وترجمها شات-جي بي تي إلى رقاقة الحاسوب وجمعها رقائق الحاسوب.
تعاني ترجمة المصطلحات الإنجليزية إلى اللغة العربية من ثلاث مشاكل رئيسية، هي:
1- تعدد الترجمات العربية للمصطلح الإنجليزي الواحد. مثال: تتنوع ترجمات مصطلح “think tank” المنتشرة على الإنترنت بشكل كبير، نذكر منها، معهد البحوث، مركز أبحاث، مركز فكري، المركز التفكيري، خلية التفكير، صناع القرار، جهاز التفكير، مستودعات الفكر، دبابة الفكر، المصفحات المفكرة، بيت خبرة فكري، بنوك الفكر، مراكز ومؤسسات صنع القرار، مراكز البحوث الاستراتيجية، الحوزات الفكرية. ماذا تترجم برامج الترجمة هذا المصطلح؟ إذا أدخلنا المصطلح بمفردة، يترجمه غوغل إلى “مركز فكري”، ويترجمه مايكروسوفت بينغ إلى “مركز أبحاث”، ويترجمه شات-جي بي تي إلى “معهد البحوث” أو “المركز التفكيري”. لكن عند وروده ضمن جملة أو فقرة يترجمه غوغل إلى صيغ عربية عديدة ضمن النصوص المختلفة، منها “مركز أبحاث” و”مجمع أبحاث” و”خزان التفكير” و”مؤسسة فكرية”. ويترجمه شات-جي بي تي إلى “معهد بحوث”، ونجد أن ترجمة مايكروسوفت بينغ الأكثر اتساقاً لهذا المصطلح، إذ تحافظ على “معهد البحوث” سواءً في الجمل أو الفقرات. بالمناسبة الويكيبيديا العربية تترجمه إلى “مجمع تفكير”، لكنها تعرض لثلاثة إمكانيات أخرى لترجمته، هي: مجمع التفكير وخلية التفكير وبيت الخبرة، ما يزيد من تشوش المترجمين.
2- استخدام كلمة واحدة للدلالة على أكثر من مصطلح إنجليزي. مثال: مصفوفة للدلالة على matrix وarray، خاصة وأنه من الشائع أن تستخدم كلا الكلمتين ضمن جملة واحدة، مما يشكل انتهاكاً لقانون الهوية، وهو القانون الأول من قوانين الفكر التي وضعها أرسطو قبل أكثر من 2300 عام، والذي جعل من الاتساق (استخدام الكلمة أو العبارة الواحدة بالمعنى ذاته أينما وردت في النص) شرطاً أساسياً لتجنب سوء الفهم والفوضى الفكرية. طلبت من برامج الترجمة الثلاثة ترجمة هاتين الكلمتين فجاءت النتائج كما يلي: اتفقت البرامج الثلاثة على ترجمة كلمة matrix إلى مصفوفة، أما كلمة array فعندما تأتي مفردة يرجمها غوغل وشات-جي بي تي إلى مصفوفة أيضاً، لكن عندما تكون ضمن جملة أو فقرة يتخبط غوغل فيترجمها أحياناً مصفوفة وأحياناً صفيف وأحياناً مجموعة كما ويتجاهل وجودها في بعض الأحيان. وكذلك يفعل شات- جي بي تي. أما مايكروسوفت بينغ فهو متسق في ترجمته لهاتين الكلمتين، فهو يترجم matrix إلى مصفوفة، وarray إلى صفيف سواءً وردت الواحدة منهما دون الأخرى ضمن جملة أو فقرة أو جاءت كلاهما معاً ضمن جملة أو فقرة واحدة.
3- اعتماد الترجمة الشعبية وغياب المرجعيات. مثال: يترجم الناشرون على الإنترنت مصطلح server المستخدم في مجال تقنية المعلومات إلى خادم، مخدم، ملقم، خادوم). وبإجراء دراسة سريعة عبر محركات البحث، نجد أن كلمة “خادم” هي الأكثر انتشاراً. برمجيات الترجمة الثلاث المذكورة سابقاً تستخدم أيضاً كلمة “خادم” لترجمة server، ويبدو أنها تعتمد قاعدة الانتشار (الشعبية). تحاجج الويكيبيديا العربية بأن أفضل ترجمة لكلمة server، هي خادوم، فهي على وزن حاسوب، وأكثر مرونة فيما يتعلق بالاشتقاق والتصريف: يمكن جمعها على خواديم (مثل حواسيب)، كما أنه يمكن الاشتقاق منها والنسبة إليها إذا ما احتجنا دون الحاجة إلى “أشباه جمل”، وهو محدد مهم في التعريب.
الترجمة الآلية المثالية
متى ستصبح الترجمة الآلية المدعومة بالذكاء الاصطناعي أفضل من أفضل الترجمات البشرية؟
أشارت الدراسة التي أجرتها شركة “ترانسليتد” الإيطالية (translated.com) المتخصصة في الترجمة إلى أن المترجم المحترف كان يحتاج عام 2015 إلى 3.5 ثانية لتصحيح الكلمة المترجمة آلياُ في المتوسط. تقلص هذا الزمن إلى ثانيتين عام 2022، ويتوقع أن يسجل ثانية واحدة عام 2027. أما الوصول إلى الوضع المثالي (صفر ثانية تقريباً) فمن المتوقع أن يحدث قبل نهاية عام 2030.
تدعي الشركة الإيطالية التي أجرت الدراسة إلى أنها ارتكزت على بيانات مترجمة آلياً لملياري جملة تم تصحيحها من قبل 136 ألف مترجم محترف.
المصطلحات الجديدة
لكن حتى لو وصل مستوى الترجمة الألية إلى مستوى الترجمة البشرية الاحترافية، تبقى مشكلة ترجمة المصطلحات قائمة خاصة مع تكاسل المرجعيات اللغوية واختلافاتها. وما يفاقم هذه المشكلة هو العدد الكبير من المصطلحات الجديدة التي تدخل اللغة الإنجليزية سنوياً.
يقدر مرصد اللغة العالمي عدد المتحدثين باللغة الإنجليزية بنحو 3.85 مليار شخص وفق احصائيات شهر يناير/كانون الثاني 2023. ويقدر عدد كلمات اللغة الإنجليزية بنحو 1,074,372 كلمة لغاية 11 نوفمبر/تشرين الثاني 2022. ووفق المرصد، استمرت اللغة الإنجليزية في إنتاج حوالي 14.7 كلمة جديدة في اليوم -حوالي 5,366 كلمة في السنة، لكن لا تعتبر جميع الكلمات الجديدة جديرة بالإضافة إلى قواميس اللغة الإنجليزية الأكثر موثوقية. طبعاً، ليس المطلوب ترجمة كل هذه الكلمات، لكن يبقى ضرورياً ترجمة مئات المصطلحات الجديدة سنوياً.
دور الذكاء الاصطناعي
بما أن الذكاء الاصطناعي بدأ يقوم بالعديد من الأعمال الفكرية التي كانت مقتصرة على الإنسان، بل وينجز بعضها بأفضل مما يفعله الإنسان، فلماذا لا نمد الذكاء الاصطناعي بالقواعد اللازمة لتعريب المصطلحات وندربه على ترجمتها واختيار الأفضل منها، ثم ندعه يدرب ويطور نفسه بنفسه (deep learning). إذا نجح الذكاء الاصطناعي في ذلك فسوف تتحقق ثلاثة إنجازات مهمة جداً دفعة واحدة، 1) سرعة ترجمة المصطلحات الجديدة، 2) توحيد المصطلحات الجديدة والقديمة، 3) رفع مستوى الترجمة الآلية إلى مستوى يفوق الترجمة البشرية (مع بعض الاستثناءات).
هل يستحيل تحقيق ذلك؟
يقول ألبيرت آينشتاين: “فقط أولئك الذين يجربون ما يبدو غير مألوف وغير منطقي يمكنهم تحقيق المستحيل”. فهل نجرب؟