أمثلة من غوغل.. هل تطور الترجمة الآلية للغة العربية سيلغي مهنة الترجمة؟

طلبت الوكالة الأميركية لمشاريع البحوث المتقدمة التابعة لوزارة الدفاع (DARPA)، من المعهد الوطني للمعايير والتقنية (NIST) المتخصص في تشجيع الابتكارات، في عام 2005، اختبار عدة برامج للترجمة من العربية إلى الإنجليزية وبيان الأفضل بينها.

وكانت المفاجأة أن احتل برنامج غوغل (Google) التجريبي المرتبة الأولى، بتفوقه على برامج شركات عريقة مثل "آي بي إم" (IBM) و"صخر" التي كانت قد بدأت أبحاثها في هذا المجال في منتصف التسعينيات. ونال برنامج غوغل علامة قدرها 0.5137 من 1، في حين نال برنامج صخر علامة قدرها 0.3403 من 1، في اختبار أطلق عليه اسم "مسار البيانات غير المحدودة".

وأطلقت غوغل في أبريل/نيسان 2006 خدمة الترجمة من وإلى اللغة العربية رسميا، باستخدام المنهج الإحصائي بعد أن تمكن محرك غوغل للبحث في الإنترنت من فهرسة عدد هائل من النصوص الإنجليزية/العربية المتطابقة، التي كانت وراء نجاح هذا المنهج في الترجمة.

وفي نوفمبر/تشرين الثاني 2016 أعلنت غوغل أنها بصدد استبدال نظام الترجمة الإحصائي القائم على تقطيع كل جملة مدخلة إلى كلمات وعبارات يتم ترجمة كل منها بشكل مستقل (PBMT)، بنظام الترجمة الآلية العصبية (NMT)، الذي يستخدم تقنيات التعلم العميق لترجمة جمل كاملة دفعة واحدة من دون تجزئتها.

لكن هذه الطريقة لم تطبق على اللغة العربية حتى الرابع من أبريل/نيسان 2017، حين أعلنت مدونة غوغل الرسمية في الشرق الأوسط وشمال أفريقيا‎ عن بدء استخدام الترجمة الآلية العصبية في الترجمة من وإلى اللغة العربية.

وفيما يلي مثالاً يظهر التحسن الملموس الذي طرأ على ترجمة غوغل بعد تطبيق الترجمة الآلية العصبية.

التحسن في الترجمة للعربية بين 2016 و2017
النص الإنجليزي:

"Question is, what to do. It’s been determined now pretty clearly that calcium uptake is better when vitamin D is present."

جاءت الترجمة في ديسمبر/كانون الأول 2016 (قبل تطبيق الترجمة الآلية العصبية) على الشكل التالي: "السؤال هو، ما يجب القيام به. تم تحديده الآن يدع مجالا للشك امتصاص الكالسيوم هو أفضل عندما فيتامين D موجود."

أما الترجمة في مايو/أيار 2017 (بعد تطبيق الترجمة الآلية العصبية بأيام)، فكانت "السؤال هو، ماذا تفعل. وقد تم تحديده الآن بشكل واضح جدا أن امتصاص الكالسيوم هو أفضل عندما يكون فيتامين (د) موجود."

التحسن في الترجمة للعربية بين 2017 و2021
ولرصد التقدم الذي حدث بعد ذلك ترجمنا في مايو/أيار 2017 مقطعا يتحدث عن فيلم، ثم أعدنا ترجمته في يوليو/تموز 2021.

النص الإنجليزي:

"Eternal Sunshine of the Spotless Mind

When their relationship turns sour, a couple undergoes a procedure to have each other erased from their memories. But it is only through the process of loss that they discover what they had to begin with."

جاءت الترجمة في مايو/أيار 2017 على الشكل التالي "أشعة الشمس الأبدية للعقل النظيف.
عندما تتحول علاقتهم الحامض، زوجان يخضع لإجراء أن تمحى بعضها البعض من ذكرياتهم. ولكن فقط من خلال عملية الخسارة التي يكتشفون ما كان عليهم أن تبدأ."

أما الترجمة في يوليو/تموز 2021 فكانت "أشعة الشمس الأبدية للعقل النظيف.

عندما تفسد علاقتهما، يخضع الزوجان لإجراء يُمحى كل منهما الآخر من ذاكرتهما. لكن فقط من خلال عملية الخسارة يكتشفون ما كان عليهم أن يبدأوا به."

نلاحظ تحسنا كبيرا في الترجمة على الرغم من عدم وجود فارق في ترجمة العنوان، الذي هو إشكالي بطبيعته؛ إذ تجنب معظم من كتب عن الفيلم بالعربية ترجمة العنوان وتركوه باللغة الإنجليزية.

أما الكتّاب الذين ترجموا العنوان فقد تعددت ترجماتهم ما بين "إشراقة أبدية لعقل نظيف" و"إشراقة أبدية لعقل طاهر" و"الإشراقة الأبدية للعقل الطاهر" و"الإشراقة الأبدية لعقل لا تشوبه شائبة".

من الملاحظ أيضا أن برنامج الترجمة تمكّن من التعرف على المثنى في القسم الأول، وفشل في القسم الثاني فأعطى "يكتشفون ما كان عليهم أن يبدأوا به" بدلا من "يكتشفان ما كان عليهما أن يبدآ به".

كم مرة يجب أن يتدخل العنصر البشرى؟
ولاختبار دقة ترجمة غوغل الآلية من الإنجليزية إلى العربية، ومدى اقترابها من مستوى الترجمة البشرية اتبعنا منهجية ترتكز على قياس عدد التعديلات التي يجب على المحرر البشري إجراؤها على الترجمة الآلية حتى تصل إلى مستوى الترجمة البشرية.

وجربنا ذلك على نص إخباري عام من صحيفة الجارديان البريطانية، حيث ترجمنا النص الذي بلغ طوله نحو 740 كلمة بعد الترجمة الآلية، ثم أجرينا عليه تعديلات بحيث يصبح قابلاً للنشر. بلغ عدد التعديلات 50 تعديلاً أي نحو 6.75 بالمئة من إجمالي الكلمات. وبلغت بذلك جودة الترجمة 93.25 بالمئة من مستوى الترجمة البشرية. وهذا المستوى من الجودة لا ينطبق على جميع النصوص، خاصة وأن جودة ترجمة غوغل الآلية تختلف من قطاع اقتصادي أو معرفي لآخر ويتطلب قياسها إجراء اختبارات عديدة لكل قطاع.

أشارت نتائج الاستبيان الذي أجراه معهد مستقبل الإنسانية في جامعة أوكسفورد البريطانية وجامعة ييل الأميركية، الذي شمل 352 باحثا في مجال التعلم الآلي، إلى أن الذكاء الاصطناعي سيتفوق على الإنسان في مجال الترجمة بين اللغات بحلول عام 2024.

يشكك العديد من خبراء اللغة في نتائج الاستبيان السابق ويرون أن أمام الترجمة الآلية طريقا طويلا تقطعه قبل أن تصل إلى مستوى الترجمة البشرية، على الرغم من أن الاختبارات التي أجرتها شركة "ليونبريدج تكنولوجيز" (Lionbridge Technologies, Inc) الأميركية لحلول الترجمة، أظهرت أن الترجمة الآلية العصبية تتحسن بنسبة تتراوح بين 3 و7 بالمئة سنويا. أما بالنسبة للاختبارات الخاصة باللغة العربية، فمن الضروري إجراؤها سنويا ورصد مستوى جودة الترجمة ونقاط الضعف فيها بهدف تحسينها.

الترجمة ذات الجودة العالية من وإلى العربية، مهمة جدا لبناء مجتمع المعرفة، فهي بالتعاون مع تقنيات أخرى مثل تحويل الكلام المنطوق إلى نص، وتحويل النص إلى كلام منطوق بصوت مناسب، ستعزز العديد من الصناعات الناشئة عبر الإنترنت والتلفزيونات الذكية، مثل الترجمة الآلية الفورية/الدبلجة للمؤتمرات والبرامج التعليمية والأخبار والأفلام والمسلسلات والألعاب وتطبيقات الهاتف المحمول، من وإلى اللغة العربية.

هل ستوثر الترجمة الآلية على وظائف عشرات الآلاف من المترجمين العرب؟
بالتأكيد، فمن المتوقع أن تنخفض أجور الترجمة من جهة، ويتقلص عدد المترجمين التقليديين من جهة أخرى، لكن من غير المتوقع أن تنقرض هذه المهنة قريبا، خاصة في المجالات الأدبية. إن الحاجة إلى الترجمة البشرية ستستمر لأسباب عديدة منها، دخول مئات وأحيانا آلاف الكلمات الجديدة إلى اللغة العربية كل عام، خاصة في المجالات العلمية والتقنية، لكن من المتوقع وبسبب تقنيات التعلم الذاتي للآلة، أن تظهر منافسة بين الإنسان والآلة في مجال ترجمة المصطلحات والكلمات الجديدة، وهذا يتطلب من المترجمين الراغبين في الحفاظ على أعمالهم، تطوير مهاراتهم والارتقاء إلى مستوى التحرير الإبداعي.

المصدر : الجزيرة

الجزيرة نت