الفصـــل 25 من دستور المملكة : حرية الفكر والرأي والتعبير مكفولة بكل أشكالها. حرية الإبداع والنشر والعرض في المجالات الأدبية والفنية والبحت العلمي, والتقني مضمونة.


الثلاثاء، مايو 30، 2023

ضحالة ترجمة جوجل ترجمة عبده حقي

 


في أحد جلسات السالسا الأسبوعية ، أحضر صديقي فرانك ضيفًا دنماركيًا. كنت أعرف أن فرانك يتحدث الدنماركية جيدًا ، لأن والدته كانت دنماركية ، وكان قد عاش في الدنمارك عندما كان طفلاً. أما بالنسبة لصديقه ، فقد كانت لغته الإنجليزية طليقة ، كما هو معتاد في الدول الاسكندنافية. ومع ذلك ، ولدهشتي ، ظهر أثناء الدردشة المسائية أن الصديقين يتبادلان الرسائل الإلكترونية بشكل اعتيادي باستخدام ترجمة غوغل. كان فرانك يكتب رسالة باللغة الإنجليزية ، ثم يقوم بتشغيلها من خلال الترجمة من غوغل لإنتاج نص جديد باللغة الدنماركية ؛ على العكس من ذلك ، كانت تكتب رسالة باللغة الدنماركية ، ثم يسمح لتطبيق "ترجمة غوغل " بإنزالها. يا للغرابة ! لماذا يقوم شخصان أذكياء ، كل منهما يتحدث لغة الآخر بشكل جيد ، بفعل ذلك؟ لطالما دفعتني تجاربي الخاصة مع برامج الترجمة الآلية إلى التشكك الشديد في ذلك. لكن من الواضح أن هذين الشخصين لم يشاركا في شكوكي. في الواقع ، كثير من الأشخاص المفكرين مغرمون جدًا ببرامج الترجمة ، ولا يجدون سوى القليل لينتقدوا فيها. هذا ما يحيرني.

بصفتي محبًا للغة ومترجمًا شغوفًا ، وكعالم معرفي ومعجب مدى الحياة ببراعة العقل البشري ، فقد تابعت المحاولات لميكنة الترجمة لعقود. عندما اهتممت بالموضوع لأول مرة ، في منتصف السبعينيات من القرن الماضي ، صادفت رسالة كتبها عالم الرياضيات وارن ويفر عام 1947 ، وهو من أوائل المدافعين عن الترجمة الآلية ، إلى نوربرت وينر ، وهو شخصية رئيسية في علم التحكم الآلي ، قدم فيها ويفر هذا الادعاء الغريب ، اليوم مشهور جدًا:

عندما ألقي نظرة على مقال باللغة الروسية ، أقول ، "هذا حقًا مكتوب باللغة الإنجليزية ، لكن تم ترميزه ببعض الرموز الغريبة. سأشرع الآن في فك التشفير ".

بعد عدة سنوات قدم وجهة نظر مختلفة: "لا يوجد شخص عاقل يعتقد أن الترجمة الآلية يمكنها أن تحقق الأناقة. بوشكين لا يحتاج إلى الارتعاش ". يا للعجب! بعد أن كرست عامًا مكثفًا بشكل لا يُنسى من حياتي لترجمة رواية ألكسندر بوشكين البراقة في الشعر ، يوجين أونيجين ، إلى لغتي الأم (أي بعد إعادة صياغة هذا العمل الروسي العظيم بشكل جذري إلى رواية باللغة الإنجليزية في الشعر) ، أجد هذه الملاحظة أكثر ملاءمة بكثير من ملاحظته السابقة ، والتي تكشف عن نظرة تبسيطية غريبة للغة. ومع ذلك ، فإن رؤيته في عام 1947 للترجمة باعتبارها فك تشفير أصبحت عقيدة قادت مجال الترجمة الآلية لفترة طويلة.

منذ تلك الأيام ، تحسنت "محركات الترجمة" تدريجيًا ، ومؤخراً اقترح استخدام ما يسمى بالشبكات العصبية العميقة لبعض المراقبين (انظر "صحوة الذكاء الاصطناعي الكبرى" بقلم جيديون لويس كراوس في مجلة نيويورك تايمز ، و "الترجمة الآلية: ما وراء بابل" بقلم لين جرين في ذي إيكونوميست) أن المترجمين البشر قد يكونون من الأنواع المهددة بالانقراض. في هذا السيناريو ، سيصبح المترجمون البشر ، في غضون سنوات قليلة ، مجرد مراقبي الجودة ومصححي الأخطاء بدلاً من منتجي النصوص الجديدة.

مثل هذا التطور من شأنه أن يتسبب في اضطراب روحي في حياتي العقلية. على الرغم من أنني أفهم تمامًا سحر محاولة جعل الآلات تترجم جيدًا ، إلا أنني لست حريصًا على الأقل على استبدال المترجمين البشر بآلات جامدة. في الواقع ، إن الفكرة تخيفني وتثيرني. في رأيي ، تعتبر الترجمة فنًا دقيقًا بشكل لا يصدق يعتمد باستمرار على سنوات عديدة من الخبرة الحياتية ، وعلى الخيال الإبداعي للفرد. إذا أصبح المترجمون البشريون ، في يوم ما "رائع" ، من بقايا الماضي ، فإن احترامي للعقل البشري سيهتز بشدة ، وستتركني الصدمة أعاني من ارتباك رهيب وحزن هائل ودائم.

في كل مرة أقرأ فيها مقالًا يزعم أن مجموعة المترجمين البشر ستضطر قريبًا إلى الانحناء أمام السيف السريع الرهيب لبعض التقنيات الجديدة ، أشعر بالحاجة إلى التحقق من هذه الادعاءات بنفسي ، جزئيًا من إحساس بالرعب قد يكون هذا الكابوس قاب قوسين أو أدنى ، ونأمل أن يكون ذلك بدافع الرغبة في طمأنة نفسي أنه ليس قاب قوسين أو أدنى ، وأخيراً ، من منطلق إيماني طويل الأمد أنه من المهم مكافحة الادعاءات المبالغ فيها حول الذكاء الاصطناعي. وهكذا بعد أن قرأت كيف أن الفكرة القديمة للشبكات العصبية الاصطناعية ، التي تم تبنيها مؤخرًا من قبل فرع جوجل يسمى Google Brain والتي تم تعزيزها الآن من خلال "التعلم العميق" ، أدت إلى نوع جديد من البرامج التي يُزعم أنها أحدثت ثورة في الترجمة الآلية ، اضطررت إلى التحقق من أحدث تجسيد لترجمة جوجل. هل كان الأمر بمثابة تغيير في قواعد اللعبة ، حيث كان ديب بلو وألفاجو من أجل لعبتي الشطرنج والجو الجليلتين؟

تعلمت أنه على الرغم من أن الإصدار الأقدم من ترجمة جوجل يمكنه التعامل مع ذخيرة كبيرة جدًا من اللغات ، إلا أن تجسيد التعلم العميق الجديد في ذلك الوقت كان يعمل لتسع لغات فقط. (تم توسيعها الآن إلى 96.) * وبناءً على ذلك ، قصرت استكشافاتي على الإنجليزية والفرنسية والألمانية والصينية.

قبل عرض النتائج التي توصلت إليها ، يجب أن أشير إلى أن الغموض في عمق الصفة يتم استغلاله هنا. عندما يسمع المرء أن جوجل اشترت شركة تسمى DeepMind التي تحتوي منتجاتها على "شبكات عصبية عميقة" معززة بـ "التعلم العميق" ، لا يمكن للمرء أن يساعد في أخذ الكلمة عميقاً لتعني "عميق" ، وبالتالي "قوي" ، "ثاقب" ، "حكيم" . " ومع ذلك ، فإن معنى العمق في هذا السياق يأتي ببساطة من حقيقة أن هذه الشبكات العصبية بها طبقات أكثر (12 ، على سبيل المثال) من الشبكات القديمة ، والتي قد تحتوي على طبقتين أو ثلاث فقط. لكن هل هذا النوع من العمق يعني أن كل ما تفعله هذه الشبكة يجب أن يكون عميقًا؟ بالكاد. هذا هو الشغل اللفظي.

أنا حذر جدًا من ترجمة جوجل ، خاصةً بالنظر إلى كل الضجيج المحيط بها. لكن على الرغم من استيائي ، إلا أنني أدركت بعض الحقائق المذهلة حول هذا الكرم الأسود الخاص بي. يمكن الوصول إليه مجانًا لأي شخص على الأرض ، وسوف يحول النص بأي لغة من حوالي 100 لغة إلى نص في أي لغة أخرى. هذا أمر مذل. إذا كنت فخورًا بأن أطلق على نفسي "pi-lingual" (بمعنى أن مجموع كل اللغات الجزئية الخاصة بي يزيد قليلاً عن 3 ، وهي طريقتي المرحة للإجابة على السؤال "كم عدد اللغات التي تتحدثها؟") ، فكيف يجب أن تكون ترجمة جوجل أكثر فخراً ، حيث يمكن أن تطلق على نفسها اسم "bai-lingual" (تعني كلمة bai الماندرين لكلمة "100"). بالنسبة إلى مجرد لغة ثنائية ، فإن لغة الباى هي الأكثر إثارة للإعجاب. علاوة على ذلك ، إذا قمت بنسخ ولصق صفحة من النص في اللغة أ في الترجمة من جوجل ، فسوف تنقضي لحظات فقط قبل أن أعود إلى صفحة مليئة بالكلمات في اللغة ب. وهذا يحدث طوال الوقت على الشاشات في جميع أنحاء الكوكب ، في عشرات اللغات.

لا يمكن إنكار الفائدة العملية ل ترجمة جوجل والتقنيات المماثلة ، وربما يكون شيئًا جيدًا بشكل عام ، ولكن لا يزال هناك شيء ينقصه بشدة في النهج ، والذي يتم نقله بكلمة واحدة: الفهم. لم تركز الترجمة الآلية أبدًا على فهم اللغة. بدلاً من ذلك ، حاول المجال دائمًا "فك الشفرة" - للابتعاد عن القلق بشأن ماهية الفهم والمعنى. هل يمكن في الواقع أن يكون الفهم غير ضروري للترجمة بشكل جيد؟ هل يمكن لكيان ما ، بشريًا كان أم آلة ، القيام بترجمة عالية الجودة دون الالتفات إلى اللغة التي تدور حولها؟ لإلقاء بعض الضوء على هذا السؤال ، أنتقل الآن إلى التجارب التي قمت بها.

بدأت استكشافاتي بتواضع شديد ، باستخدام الملاحظة القصيرة التالية ، والتي تثير في ذهن الإنسان سيناريو واضحًا:

في منزلهم ، كل شيء يأتي في أزواج. هناك سيارته وسيارتها ومناشفه ومناشفها ومكتبته ومكتبتها.

يبدو تحدي الترجمة بسيطًا ، ولكن في الفرنسية (واللغات الرومانسية الأخرى) ، لا تتفق كلمات "له" و "هي" في الجنس مع المالك ، ولكن مع العنصر الذي يمتلكه. إذن ، هذا ما أعطاني إياه مترجم جوجل:

في منزلهم ، كل شيء يأتي في أزواج. هناك سيارته وسيارته ومناشفه ومناشفه ومكتبته ومكتبته.

وقع البرنامج في فخي ، ولم يدرك ، كما يفعل أي قارئ بشري ، أنني كنت أصف زوجين ، مشددًا على أنه لكل عنصر لديه ، كان لديه عنصر مشابه. على سبيل المثال ، استخدم محرك التعلم العميق كلمة sa لكل من "سيارته" و "سيارتها" ، لذلك لا يمكنك إخبار أي شيء عن جنس مالك السيارة. وبالمثل ، فقد استخدمت صيغة الجمع غير الجنسية لكلٍّ من "مناشفه" و "مناشفها" ، وفي الحالة الأخيرة للمكتبتين ، مكتبتيه ومكتبتها ، تم طرحها من قبل الأخيرة في "لها" وقررت بطريقة ما أن تمثل s صيغة الجمع ("les siennes"). غابت الجملة الفرنسية في ترجمة جوجل عن بيت القصيد.

بعد ذلك قمت بترجمة عبارة التحدي إلى اللغة الفرنسية بنفسي ، بطريقة حافظت على المعنى المقصود. ها هي نسختي الفرنسية:

في المنزل ، لديهم كل شيء في نسختين. هناك سيارتها وسيارته ومناشفها ومناشفه ومكتبتها ومكتبته.

توضح عبارة "sa voiture à elle" فكرة "سيارتها" ، وبالمثل ، لا يمكن سماع "sa voiture à lui" إلا بمعنى "سيارته". في هذه المرحلة ، اعتقدت أنه سيكون من التافه أن تقوم خدمة الترجمة من جوجل بإعادة ترجمتي الفرنسية إلى الإنجليزية والحصول على اللغة الإنجليزية بشكل صحيح من المال ، لكنني كنت مخطئًا تمامًا. هذا ما أعطاني إياه:

في المنزل ، لديهم كل شيء مزدوج. هناك سيارته الخاصة وسيارته الخاصة ومناشفه ومناشفه الخاصة ومكتبته الخاصة ومكتبته الخاصة.

ماذا؟! حتى مع صراخ جملة الإدخال لأجناس المالكين بأعلى صوت ممكن ، تجاهلت آلة الترجمة الصرخات وجعلت كل شيء ذكوريًا. لماذا تخلصت من أهم معلومات الجملة؟

نحن البشر نعرف كل أنواع الأشياء عن الأزواج ، والمنازل ، والممتلكات الشخصية ، والفخر ، والتنافس ، والغيرة ، والخصوصية ، والعديد من الأشياء غير الملموسة الأخرى التي تؤدي إلى مثل هذه المراوغات مثل الزوجين الذين قاما بتطريز مناشفهما . ترجمة جوجل ليست على دراية بمثل هذه المواقف. ترجمة جوجل ليست على دراية بالمواقف. إنه مألوف فقط مع السلاسل المكونة من كلمات تتكون من أحرف. الأمر كله يتعلق بالمعالجة الفائقة السرعة لأجزاء النص ، وليس التفكير أو التخيل أو التذكر أو الفهم. إنه لا يعرف حتى أن الكلمات تمثل الأشياء. اسمحوا لي أن أسرع للقول إن برنامج الكمبيوتر يمكنه بالتأكيد ، من حيث المبدأ ، أن يعرف ما هي اللغة ، ويمكن أن يكون لديه أفكار وذكريات وتجارب ، ويمكن أن يستخدمها ، ولكن هذا ليس ما تم تصميم الترجمة من جوجل من أجله. مثل هذا الطموح لم يكن حتى على شاشات رادار مصمميها.

حسنًا ، لقد ضحكت في هذه العروض السيئة ، وشعرت بالارتياح لرؤية أننا لسنا قريبين جدًا من استبدال المترجمين البشريين بآليات. لكنني ما زلت أشعر أنه يجب علي فحص المحرك عن كثب. بعد كل شيء ، ابتلاع واحد لا يروي العطش.

في الواقع ، ماذا عن هذه العبارة التي تمت صياغتها حديثًا ، "ابتلاع واحد لا يروي العطش" (في إشارة ، بالطبع ، إلى "ابتلاع واحد لا يصنع الصيف")؟ لم أستطع مقاومة تجربته ؛ هذا ما قلبته ترجمة جوجل في وجهي: " السنونو لا يمتص العطش." هذه جملة فرنسية نحوية ، لكن من الصعب فهمها. أولاً ، تسمي طائرًا معينًا une hirondelle - "طائر السنونو") ، ثم تقول أن هذا الطائر "لا يستنشق" أو "لا يمتص" ("n'aspire pas") ، وأخيرًا يكشف أن لا يستنشق- العنصر الذي لا يُمتص هو العطش (

"la soif").  من الواضح أن ترجمة جوجل لم تفهم معناها ؛ لقد خرجت فقط مع كومة من الثور. "Il Sortait simplement avec un tas de taureau." " لقد خرج للتو ومعه كومة من الثيران." "Il vient de sortir avec un tas de taureaux."  الرجاء العفو عن لغتي الفرنسية - أو بالأحرى الفرنسية الزائفة في ترجمة جوجل.

من المقلاة الفرنسية ، دعنا نقفز إلى نار الألمان. لقد انخرطت مؤخرًا في كتاب

 Sie nannten sich der Wiener Kreis ("أطلقوا عليهم اسم دائرة فيينا") لعالم الرياضيات النمساوي كارل سيغموند. يصف مجموعة من المثقفين الفيينيين المثاليين في عشرينيات وثلاثينيات القرن الماضي الذين كان لهم تأثير كبير على الفلسفة والعلوم خلال بقية القرن. اخترت مقطعًا قصيرًا من كتاب سيغموند وأعطيته لترجمة جوجل. ها هو ، أولاً باللغة الألمانية ، متبوعًا بترجمتي الخاصة ، ثم نسخة الترجمة من Google. (بالمناسبة ، راجعت ترجمتي مع اثنين من المتحدثين الأصليين للألمانية ، بما في ذلك كارل سيغموند ، لذلك أعتقد أنه يمكنك افتراض أنها دقيقة.

هوفستاتر:

بعد الهزيمة ، اعتبر العديد من الأساتذة ذوي الميول الجرمانية ، والذين شكلوا في ذلك الوقت غالبية أعضاء هيئة التدريس ، أنه من واجبهم حماية مؤسسات التعليم العالي من "غير المرغوب فيهم". والأكثر احتمالاً للفصل هم العلماء الشباب الذين لم يحصلوا بعد على الحق في تدريس الفصول الجامعية. أما العالمات فليس لهن مكان في النظام على الإطلاق. لم يكن هناك شيء أوضح من ذلك.

جوجل المترجم:

بعد الحرب الخاسرة ، اعتبر العديد من الأساتذة الألمان ، وهم الأغلبية في الكلية ، أن من واجبهم حماية الجامعات من "الغريب" ؛ كان العلماء الشباب أكثر عرضة للخطر قبل تأهيلهم. ولم يشكك العلماء بأي حال من الأحوال. كان هناك القليل منهم.

الكلمات في مخرجات الترجمة من جوجل كلها كلمات إنجليزية (حتى لو ، لأسباب غير واضحة ، تم استخدام الأحرف الكبيرة بشكل غير لائق في الزوجين). حتى الان جيدة جدا! ولكن سرعان ما ينمو بشكل متذبذب ، وكلما تقدمت إلى أسفل ، أصبح متذبذبًا.

سأركز أولاً على "الغريب". هذا يتوافق مع الكلمة الألمانية "Ungeraden" ، والتي تعني هنا "الأشخاص غير المرغوب فيهم سياسيًا". ومع ذلك ، كان لترجمة جوجل سبب - سبب إحصائي بسيط للغاية - لاختيار كلمة فردية. على وجه التحديد ، في قاعدة البيانات الضخمة ثنائية اللغة ، تمت ترجمة كلمة ungerade دائمًا على أنها "فردية". على الرغم من أن المحرك لم يدرك سبب حدوث ذلك ، إلا أنني أستطيع أن أخبرك عن السبب. ذلك لأن ungerade - التي تعني حرفياً "غير مستقيمة" أو "غير متساوية" - تُعرَّف دائمًا على أنها "غير قابلة للقسمة على اثنين". على النقيض من ذلك ، فإن اختياري لـ "غير المرغوب فيهم" لتقديم Ungeraden ليس له علاقة بإحصائيات الكلمات ، ولكنه جاء من فهمي للموقف - من تركيزي على فكرة غير مذكورة صراحة في النص وبالتأكيد ليست مدرجة على أنها ترجمة ungerade في أي من قواميس الألمانية.

دعنا ننتقل إلى التأهيل الألماني ، مما يدل على وضع جامعي يشبه الحيازة. توجد كلمة تأهيل باللغة الإنجليزية المتعارف عليها ولكنها نادرة للغاية ، وبالتأكيد لا تعيد إلى الذهن مدة الخدمة أو أي شيء من هذا القبيل. لهذا السبب شرحت الفكرة بإيجاز بدلاً من مجرد الاقتباس من الكلمة الغامضة ، لأن هذه الإيماءة الميكانيكية لن تنقل أي شيء إلى القراء الناطقين بالإنجليزية. بالطبع لن تفعل ترجمة جوجل أي شيء من هذا القبيل ، لأنه ليس لديها نموذج لمعرفة قرائها.

توضح الجملتان الأخيرتان مدى أهمية الفهم في الترجمة. الاسم الألماني Wissenschaftler المكون من 15 حرفًا يعني إما "عالم" أو "عالم". (اخترت الخيار الأخير ، لأنه في هذا السياق كان يشير إلى المثقفين بشكل عام. لم تحصل ترجمة جوجل على هذه الدقة). الاسم المرتبط بـ 17 حرفًا Wissenschaftlerin ، الموجود في الجملة الختامية بصيغة الجمع Wissenschaftlerinnen ، هو نتيجة لنوع الجنس في الأسماء الألمانية. في حين أن الاسم "القصير" هو مذكر نحويًا وبالتالي يشير إلى عالِم ذكر ، فإن الاسم الأطول يكون مؤنثًا وينطبق على الإناث فقط.

لقد كتبت "باحثة" لتوصيل الفكرة. ومع ذلك ، لم يفهم ترجمة جوجل أن اللاحقة المؤنثة "-in" كانت محور الاهتمام الرئيسي في الجملة الأخيرة. ولأنه لم يدرك أنه تم اختيار الإناث ، فقد أعاد المحرك استخدام كلمة عالم فقط ، وبالتالي فقد المغزى من الجملة بالكامل. كما في الحالة الفرنسية السابقة ، لم يكن لدى ترجمة جوجل الفكرة الأكثر ضبابية بأن الغرض الوحيد من الجملة الألمانية هو تسليط الضوء على التباين بين الذكور والإناث.

بصرف النظر عن هذا الخطأ الفادح ، فإن بقية الجملة الأخيرة هي كارثية. خذ النصف الأول. هل عبارة "لم يشكك العلماء على أي حال" هي بالفعل ترجمة لـ "Wissenschaftlerinnen kamen sowieso nicht in frage"؟ لا يعني ذلك ما يعنيه النص الأصلي — إنه ليس حتى في نفس الملعب. إنه يتكون فقط من كلمات إنجليزية يتم تشغيلها عشوائياً بواسطة الكلمات الألمانية. هل هذا هو كل ما يتطلبه جزء من الإخراج حتى يستحق ترجمة التسمية؟

إن النصف الثاني من الجملة خاطئ بنفس القدر. تعني الكلمات الألمانية الست الأخيرة ، حرفيًا ، "أكثر من القليل كان واحدًا أكثر اتحادًا" ، أو بشكل أكثر تدفقًا ، "لم يكن هناك الكثير حول الأشخاص الذين يتفقون أكثر" ، ومع ذلك تمكنت خدمة الترجمة من جوجل من تحويل هذه الفكرة الواضحة تمامًا إلى "كان هناك قليل منهم." لقد حيرنا من أن البشر قد نسأل "القليل من ماذا؟" لكن بالنسبة للمستمع الميكانيكي ، فإن مثل هذا السؤال سيكون بلا معنى. ليس لدى ترجمة جوجل أفكار وراء الكواليس ، لذلك لا يمكنها حتى البدء في الإجابة على طلب البحث الذي يبدو بسيطًا. لم يكن محرك الترجمة يتخيل كميات كبيرة أو صغيرة أو عددًا من الأشياء. لقد كان مجرد رمي الرموز ، دون أي فكرة عن أنها قد ترمز إلى شيء ما.

من الصعب على الإنسان ، الذي يتمتع بخبرة وفهم مدى الحياة واستخدام الكلمات بطريقة ذات مغزى ، أن يدرك مدى خلو جميع الكلمات التي تم إلقاؤها على الشاشة بواسطة ترجمة جوجل من المحتوى. يكاد لا يقاوم الناس أن يفترضوا أن قطعة من البرامج التي تتعامل مع الكلمات بطلاقة يجب أن تعرف بالتأكيد ما تعنيه. يُطلق على هذا الوهم الكلاسيكي المرتبط ببرامج الذكاء الاصطناعي تأثير ELIZA ، لأن أحد البرامج الأولى التي شدّت الصوف على أعين الناس بفهمها الظاهري للغة الإنجليزية ، في الستينيات ، كان عبارة عن مناور فارغ يسمى ELIZA ، والذي تظاهر بأنه معالج نفسي ، وعلى هذا النحو ، أعطى العديد من الأشخاص الذين تفاعلوا معه إحساسًا غريبًا بأنه فهم بعمق مشاعرهم العميقة.

لعقود من الزمان ، وقع الأشخاص المتمرسون - حتى بعض باحثي الذكاء الاصطناعي - في حب تأثير اليزا. للتأكد من أن قرائي يبتعدون عن هذا الفخ ، اسمحوا لي أن أقتبس بعض العبارات من بضع فقرات إلى الأعلى - على وجه التحديد ، "ترجمة جوجل لم تفهم" و "لم تدرك" و "ترجمة جوجل لم تكن أكثر ضبابية فكرة." من المفارقات ، أن هذه العبارات ، على الرغم من تعزفها على عدم الفهم ، تشير تقريبًا إلى أن الترجمة من جوجل قد تكون أحيانًا على الأقل قادرة على فهم معنى كلمة أو جملة أو جملة ، أو ما هي حوله. لكن هذا ليس هو الحال. تدور ترجمة جوجل حول تجاوز فعل فهم اللغة أو التحايل عليه.

بالنسبة لي ، فإن ترجمة الكلمة تنضح بهالة غامضة ومثيرة للذكريات. إنه يشير إلى شكل فني بشري عميق يحمل بلطف أفكارًا واضحة في اللغة أ إلى أفكار واضحة في اللغة ب ، ويجب ألا يحافظ فعل التجسير على الوضوح فحسب ، بل يجب أيضًا أن يعطي إحساسًا بالنكهة والمراوغات وخصوصيات أسلوب الكتابة. المؤلف الأصلي. كلما أترجم ، أقرأ النص الأصلي بعناية أولاً وأستوعب الأفكار بأكبر قدر ممكن من الوضوح ، مما أتركها تتأرجح ذهابًا وإيابًا في ذهني. ليس الأمر أن كلمات النص الأصلي تتأرجح ذهابًا وإيابًا ؛ الأفكار هي التي تثير جميع أنواع الأفكار ذات الصلة ، مما يخلق هالة غنية من السيناريوهات ذات الصلة في ذهني. وغني عن القول أن معظم هذه الهالة فاقد للوعي. فقط عندما يتم استحضار الهالة بشكل كافٍ في ذهني ، أبدأ بمحاولة التعبير عنها - "للضغط عليها" - باللغة الثانية. أحاول أن أقول في اللغة (ب) ما يذهلني باعتباره طريقة طبيعية للحديث عن أنواع المواقف التي تشكل هالة المعنى في السؤال.

 

باختصار ، أنا لا أنتقل مباشرة من الكلمات والعبارات في اللغة أ إلى الكلمات والعبارات في اللغة ب. بدلاً من ذلك ، فأنا أستحضر دون وعي الصور والمشاهد والأفكار ، واستخرج التجارب التي مررت بها بنفسي (أو قرأت عنها). ، أو مشاهدتها في الأفلام ، أو سماعها من الأصدقاء ، وفقط عندما تتحقق هذه "الهالة" الذهنية غير اللفظية والخيالية والتجريبية - فقط عندما تطفو فقاعة المعنى المراوغة في ذهني - أبدأ عملية صياغة الكلمات والعبارات في اللغة الهدف ، ثم المراجعة والمراجعة والمراجعة. قد تبدو هذه العملية ، التي يتم التوسط فيها من خلال المعنى ، بطيئة ، وفي الواقع ، بالمقارنة مع ثانيتين أو ثلاث ثوانٍ للصفحة في ترجمة جوجل ، فهي كذلك بالتأكيد — ولكن هذا ما يفعله أي مترجم بشري جاد. هذا هو نوع الشيء الذي أتخيله عندما أسمع عبارة مثيرة للذكريات مثل العقل العميق.

بعد هذا ، أنتقل الآن إلى اللغة الصينية ، وهي اللغة التي أعطت برنامج التعلم العميق تجربة أصعب بكثير من اللغتين الأوروبيتين. بالنسبة لمواد الاختبار الخاصة بي ، استخلصت من المذكرات المؤثرة (“نحن الثلاثة”) ، التي كتبها الكاتب المسرحي والمترجم الصيني يانغ جيانغ ، الذي توفي مؤخرًا عن عمر يناهز 104 عامًا. يروي كتابه الحياة المتشابكة. زوجته ، تشيان تشونغشو (روائي ومترجم أيضًا) وابنتهما. لم يتم كتابتها بطريقة غامضة بشكل خاص ، لكنها تستخدم لغة صينية متعلمة وحيوية. اخترت مقطعًا قصيرًا وتركت ترجمة جوجل فضفاضة عليه. فيما يلي النتائج ، جنبًا إلى جنب مع ترجمتي الخاصة (تم فحصها مرة أخرى بواسطة متحدثين أصليين للغة الصينية):

Yang:

锺书到清华工作一年后,调任毛选翻译委员会的工作,住在城里,周末回校。 他仍兼管研究生。

选翻译委员会的领导是徐永煐同志。介绍锺书做这份工作的是清华同学乔冠华同志。

事定之日,晚饭后,有一位旧友特雇黄包车从城里赶来祝贺。客去后锺书惶恐地对我说

他以为我要做书房行走了。这件事不是好做的不求有功但求无过。

هوفستاتر:

بعد أن عمل تشونغشو في جامعة تسينغهوا لمدة عام ، تم نقله إلى اللجنة التي كانت تترجم الأعمال المختارة للرئيس ماو. كان يعيش في المدينة ، لكنه كان يعود إلى المدرسة في نهاية كل أسبوع. كما كان لا يزال يشرف على طلاب الدراسات العليا.

كان رئيس لجنة ترجمة أعمال ماو هو الرفيق شو يونغ ينغ ، وكان الشخص الذي رتب لـتشونغشو للقيام بهذا العمل هو زميله القديم في تسينغهوا ، الرفيق تشياو جوانهوا.

في اليوم الذي تم فيه تحديد هذا الموعد ، بعد العشاء ، استأجر صديق قديم عربة ريكاشة خصيصًا وجاء على طول الطريق من المدينة فقط لتهنئة تشونغشو. بعد أن غادر ضيفنا ، التفت تشونغشوإلي بشكل مضطرب وقال:

"كان يعتقد أنني سأصبح" مساعدًا خاصًا للدراسة الجنوبية ". هذا النوع من العمل ليس بالأمر السهل. لا يمكنك أن تأمل في المجد. كل ما تتمناه هو أن تفعل ذلك بدون أخطاء ".

جوجل المترجم:

بعد عام من العمل في تسينغهوا ، تم نقله إلى لجنة ماو للترجمة للعيش في المدينة والعودة إلى المدرسة في عطلات نهاية الأسبوع. لا يزال طالب دراسات عليا.

يقود لجنة الترجمة ماو تسي الرفيق شو يونغجيان. مقدمة الكتاب للقيام بهذا العمل هو طلاب تسينغهوا تشياو جوانهوا الرفاق.

في يوم الحدث ، بعد العشاء ، استأجر صديق قديم عربة يد من المدينة للتهنئة. قال لي كتاب الخوف في الكتاب:

كان يعتقد أنني يجب أن أقوم بـ "دراسة المشي في الجنوب". هذا ليس بالأمر الجيد ، ليس من أجل الخدمة الجديرة بالتقدير ، ولكن من أجل لا شيء.

سأشير بإيجاز إلى بعض الشذوذ. بادئ ذي بدء ، لا تشير ترجمة جوجل مطلقًا إلى تشونغشو بالاسم ، على الرغم من أن اسمه (" ") ورد ثلاث مرات في الأصل. في المرة الأولى ، يستخدم المحرك الضمير هو ؛ في المرة الثانية يقول "الكتاب" ؛ والمرة الثالثة يقول "كتاب الخوف في الكتاب". إذهب واستنتج!

الغريب الثاني هو أن الفقرة الأولى تقول بوضوح أن تشونغشو يشرف على طلاب الدراسات العليا ، في حين أن ترجمة جوجل تحوله إلى طالب دراسات عليا.

الغرابة الثالثة هي أنه في عبارة لجنة الترجمة ماو تسي ، سقط ثلث اسم الرئيس ماو تسي تونغ من القطار.

الغرابة الرابعة هي أن اسم "يونغينغ" تم استبداله بـ "يونغجيان".

الشذوذ الخامس هو أنه "بعد مغادرة ضيفنا" تم تحويله إلى "ضيف يذهب".

الشذوذ السادس هو أن الجملة الأخيرة لا معنى لها على الإطلاق.

حسنًا ، هذه الشذوذ الست هي بالفعل فطيرة متواضعة حتى تبتلعها خدمة الترجمة من جوجل ، لكن دعنا نغفر وننسى. بدلاً من ذلك ، سأركز على عبارة محيرة واحدة فقط صادفتها - عبارة من خمسة أحرف بين علامات اقتباس في الفقرة الأخيرة (" 书房 行走"). الطابع الخاص بالشخصية ، قد يتم تقديمه كـ "غرفة الكتاب الجنوبية تذهب سيرا على الأقدام" ، ولكن من الواضح أن هذا الخليط غير مقبول ، خاصةً لأن السياق يتطلب أن يكون اسمًا. اخترع ترجمة جوجل "المشي في الدراسة الجنوبية" ، وهو أمر غير مفيد.

الآن ، أعترف أن العبارة الصينية كانت غامضة تمامًا بالنسبة لي. على الرغم من أنه يبدو حرفياً أنه يعني شيئًا ما يتعلق بالتحرك سيرًا على الأقدام في دراسة على الجانب الجنوبي من بعض المباني ، كنت أعرف أن هذا لا يمكن أن يكون صحيحًا ؛ لا معنى له في السياق. لترجمتها ، كان علي أن أكتشف شيئًا في الثقافة الصينية كنت أجهله. إذن ، إلى أين اتجهت للحصول على المساعدة؟ إلى جوجل! ولكن ليس للترجمة من جوجل.) لقد كتبت الأحرف الصينية ، وأحاطتها بعلامات اقتباس ، ثم قمت بالبحث في جوجل عن تلك السلسلة الحرفية بالضبط. ليكيتي سبليت ، ظهرت مجموعة من صفحات الويب باللغة الصينية ، ثم شققت طريقي بشكل مؤلم عبر الفقرات الافتتاحية للموقعين الأولين ، محاولًا معرفة ما كانت تدور حوله هذه العبارة.

اكتشفت أن المصطلح يعود إلى عهد أسرة تشينغ (1644-1911) ويشير إلى مساعد فكري للإمبراطور ، كان من واجبه مساعدة الإمبراطور (في الدراسة الجنوبية للقصر الإمبراطوري) في صياغة البيانات الرسمية بأناقة. الحرفان اللذان يبدو أنهما يعنيان "المشي" يشكلان في الواقع قطعة تشير إلى أحد المساعدين. وهكذا ، وبالنظر إلى تلك المعلومات التي يوفرها بحث جوجل ، فقد توصلت إلى عبارة "مساعد خاص للدراسة الجنوبية".

إنه لأمر سيء للغاية أن ترجمة جوجل لا يمكنها الاستفادة من خدمات بحث جوجل كما فعلت أنا ، أليس كذلك؟ ولكن بعد ذلك مرة أخرى ، لا تستطيع خدمة "ترجمة جوجل " فهم صفحات الويب ، على الرغم من أنها يمكن أن تترجمها في غمضة عين. أم يمكن ذلك؟ أدناه ، أعرض الجزء المذهل من نص الإخراج الذي تناثرت فيه خدمة الترجمة من جوجل بسرعة فائقة عبر شاشتي بعد تغذيي بفتح موقع الويب الذي حصلت على معلوماتي منه:

"المشي في دراسة الجنوب" ليس موقفًا رسميًا ، قبل عصر تشينغ ، كان هذا مجرد "رسول" ، بشكل عام من قبل المثقفين الإمبراطوريين آنذاك هانلين. دراسة الجنوب في المسؤولين هانلين في "اختيار سلع تشينكاي فقط وممتازة" في القيمة ، ودعا "جنوب دراسة المشي". بسبب قربه من الإمبراطور ، كان لقرار الإمبراطور تأثير معين. لقد أنشأ يونغ تشنغ في وقت لاحق "الطائرات العسكرية" ، وزير الجهاز العسكري ، بدوام كامل ، على الرغم من أن الدراسة لا تزال هانلة في القيمة ، ولكن ليس لها مشاركة في الشؤون الحكومية. العلماء في عهد أسرة تشينغ في دراسة قيمة الجنوب فخورون. العديد من العلماء والعلماء في أوائل عهد أسرة تشينغ إلى الجنوب من خلال الدراسة.

هل هذا في الواقع باللغة الإنجليزية؟ بالطبع نحن نتفق جميعًا على أنها مصنوعة من كلمات إنجليزية (في الغالب ، على أي حال) ، لكن هل هذا يعني أنها فقرة باللغة الإنجليزية؟ في رأيي ، لأن الفقرة أعلاه لا تحتوي على أي معنى ، فهي ليست باللغة الإنجليزية ؛ إنه مجرد خليط من المكونات الإنجليزية - سلطة عشوائية الكلمات ، خليط غير متماسك.

إذا كنت مهتمًا بالفضول ، فإليك نسختي من نفس المقطع (استغرق الأمر مني ساعات):

لم يكن إن شوفانغ شينغزو ("المساعد الخاص للدراسة الجنوبية") منصبًا رسميًا ، ولكن في أوائل عهد أسرة تشينغ كان له دورً خاصً يشغله بشكل عام كل من كان الأكاديمي الفكري الحالي للإمبراطور. ستختار مجموعة الأكاديميين الذين عملوا في الدراسة الجنوبية للقصر الإمبراطوري ، فيما بينهم ، شخصًا يتمتع بموهبة كبيرة وشخصية جيدة ليكون بمثابة كاتب أشباح للإمبراطور ، ويكون دائمًا تحت إشراف الإمبراطور. هذا هو السبب في أن هذا الدور كان يسمى "المساعد الخاص للدراسة الجنوبية". من الواضح أن مساعد الدراسة الجنوبية ، لكونه قريبًا جدًا من الإمبراطور ، كان في وضع يسمح له بالتأثير على قرارات سياسة الأخير. ومع ذلك ، بعد أن أنشأ الإمبراطور يونغ تشنغ وزارة عسكرية رسمية مع وزير ومختلف المناصب الدنيا ، فإن مساعد دراسة الجنوب ، على الرغم من كونه لا يزال في خدمة الإمبراطور ، لم يعد يلعب دورًا رئيسيًا في صنع القرار الحكومي. ومع ذلك ، كان علماء أسرة تشينغ حريصين على مجد العمل في دراسة الإمبراطور الجنوبية ، وخلال الجزء الأول من تلك السلالة ، خدم عدد غير قليل من العلماء المشهورين الإمبراطور كمساعدين خاصين للدراسة الجنوبية.

قد يشك بعض القراء في أنني ، من أجل تقويض ترجمة جوجل ، قمت باختيار المقاطع التي تعثرت فيها بشكل رهيب ، وأنها في الواقع تعمل بشكل أفضل بكثير في الغالبية العظمى من المقاطع. على الرغم من أن هذا يبدو معقولًا ، إلا أن الأمر ليس كذلك. أدت كل فقرة اخترتها من الكتب التي أقرأها حاليًا إلى حدوث أخطاء في الترجمة من جميع الأشكال والأحجام ، بما في ذلك العبارات التي لا معنى لها وغير المفهومة ، على النحو الوارد أعلاه.

 

بالطبع أوافق على أن ترجمة جوجل تأتي أحيانًا بسلسلة من جمل الإخراج التي تبدو جيدة (على الرغم من أنها قد تكون مضللة أو خاطئة تمامًا). قد تظهر فقرة كاملة أو فقرتان بشكل رائع ، مما يعطي الوهم بأن ترجمة جوجل تعرف ما تفعله ، وتفهم ما هي "القراءة". في مثل هذه الحالات ، تبدو رائعة حقًا — تكاد تكون بشرية! من المؤكد أن الثناء يرجع إلى المبدعين وعملهم الجماعي الشاق. ولكن في الوقت نفسه ، لا تنسَ ما فعلته خدمة "ترجمة جوجل " بهاتين المقطعين الصينيين ، وبالمقاطع الفرنسية والألمانية السابقة. لفهم مثل هذه الإخفاقات ، يجب على المرء أن يضع تأثير اليزا في الاعتبار. لا يقرأ محرك bai-lingual أي شيء - ليس بالمعنى البشري العادي للفعل "قراءة". إنها معالجة النص. الرموز التي تتم معالجتها منفصلة عن التجارب في العالم. ليس لديها ذكريات يمكن أن ترسم عليها ، ولا صور ، ولا فهم ، ولا معنى يقبع خلف الكلمات التي تدور حولها بسرعة كبيرة.

سألني أحد الأصدقاء عما إذا كان مستوى مهارة الترجمة من جوجل ليس مجرد وظيفة في قاعدة بيانات البرنامج. لقد توصل إلى أنك إذا قمت بضرب قاعدة البيانات بأي عامل ، على سبيل المثال ، مليون أو مليار ، فستتمكن في النهاية من ترجمة أي شيء يتم إلقاؤه عليها ، وبشكل مثالي بشكل أساسي. أنا لا أعتقد ذلك. إن الحصول على المزيد من "البيانات الضخمة" لن يجعلك أقرب إلى الفهم ، لأن الفهم ينطوي على امتلاك الأفكار ، ونقص الأفكار هو أصل جميع مشاكل الترجمة الآلية اليوم. لذلك أود المغامرة بأن قواعد البيانات الأكبر - حتى أكبر منها بكثير - لن تفلح.

سؤال طبيعي آخر هو ما إذا كان استخدام الترجمة من جوجل للشبكات العصبية - وهي إشارة نحو تقليد الأدمغة - يقربنا من الفهم الحقيقي للغة بواسطة الآلات. يبدو هذا معقولاً في البداية ، ولكن لا توجد حتى الآن أية محاولة لتجاوز المستوى السطحي للكلمات والعبارات. تتجسد جميع أنواع الحقائق الإحصائية حول قواعد البيانات الضخمة في الشبكات العصبية ، لكن هذه الإحصائيات تربط الكلمات بكلمات أخرى فقط ، وليس بالأفكار. لا توجد محاولة لإنشاء هياكل داخلية يمكن اعتبارها أفكارًا أو صورًا أو ذكريات أو تجارب. لا تزال مثل هذه الأثيرية الذهنية بعيدة المنال بحيث لا يمكن التعامل معها حسابيًا ، وبالتالي ، يتم استخدام خوارزميات تجميع الكلمات الإحصائية السريعة والمعقدة كبديل. لكن نتائج مثل هذه الأساليب لا تتناسب مع وجود أفكار متضمنة بالفعل حيث يقرأ المرء قطعة من الكتابة ويفهمها ويخلقها ويعدلها ويحكم عليها.

على الرغم من سلبيتي ، فإن ترجمة جوجل تقدم خدمة يقدرها الكثير من الناس بشكل كبير: فهي تؤثر على التحويلات السريعة والقذرة لمقاطع ذات مغزى مكتوبة باللغة A إلى سلاسل كلمات ذات معنى في اللغة B. يشعر الكثير من الناس بالرضا التام عن المنتوج النهائي ، وهو أمر مفهوم. إذا تمكنوا من "الحصول على الفكرة الأساسية" لمقطع بلغة لا يعرفونها ، فسيكونون سعداء. ليس هذا ما أعتقده شخصيًا أن كلمة الترجمة تعني ، ولكن بالنسبة إلى بعض الأشخاص ، إنها خدمة رائعة ، وبالنسبة لهم تعتبر ترجمة. حسنًا ، يمكنني رؤية ما يريدون ، وأفهم أنهم سعداء. محظوظ لهم!

الذكاء الاصطناعي الذي ليس لديه ما يتعلمه من البشر

داون تشان

لقد شاهدت مؤخرًا رسومًا بيانية شريطية صنعها عشاق التكنولوجيا يدعون أنهم يمثلون "جودة" الترجمات التي قام بها البشر وأجهزة الكمبيوتر ، وهذه الرسوم البيانية تصور أحدث محركات الترجمة على أنها تقع على مسافة قريبة من الترجمة على المستوى البشري. ومع ذلك ، بالنسبة لي ، مثل هذا التقدير الكمي لرائحة العلوم الزائفة غير القابلة للقياس الكمي ، أو ، إذا كنت تفضل ، المهووسين الذين يحاولون حساب الأشياء التي تستعصي عليها طبيعتها الفنية غير الملموسة والخفية. في رأيي ، يتراوح إنتاج "ترجمة جوجل" اليوم من ممتاز إلى بشع ، لكن لا يمكنني تحديد مشاعري حيال ذلك. فكر في المثال الأول الذي يتضمن عنصري "خاص به" و "هي". لقد حصل برنامج المثالية على جميع الكلمات تقريبًا بشكل صحيح ، ولكن على الرغم من هذا النجاح الطفيف ، فقد أخطأ الهدف تمامًا. كيف ، في مثل هذه الحالة ، ينبغي "تحديد" نوعية العمل؟ إن استخدام الرسوم البيانية الشريطية ذات المظهر العلمي لتمثيل جودة الترجمة هو ببساطة إساءة استخدام الزخارف الخارجية للعلم.

اسمحوا لي أن أعود إلى تلك الصورة الحزينة للمترجمين البشر ، والتي سرعان ما تجاوزها الزمن وعفا عليها ، وتحولت تدريجياً إلى لا شيء سوى وحدات تحكم في الجودة ومدققات نصية. هذه وصفة للوسطاء في أحسن الأحوال. لا يبدأ الفنان الجاد بقطعة هزيلة من المياه المليئة بالأخطاء ثم يصححها هنا وهناك لإنتاج عمل فني رفيع. هذه ليست طبيعة الفن. والترجمة فن.

في كتاباتي على مر السنين ، كنت أصر دائمًا على أن الدماغ البشري هو آلة - نوع معقد للغاية من الآلات - وقد عارضت بشدة أولئك الذين يقولون إن الآلات في جوهرها غير قادرة على التعامل مع المعنى. حتى أن هناك مدرسة من الفلاسفة تدعي أن أجهزة الكمبيوتر لا يمكنها أبدًا "امتلاك دلالات" لأنها مصنوعة من "الأشياء الخطأ" (السيليكون). بالنسبة لي ، هذا هراء بسيط. لن أتطرق إلى هذا النقاش هنا ، لكنني لا أريد أن أترك للقراء انطباعًا بأنني أعتقد أن الذكاء والفهم لا يمكن الوصول إليه إلى الأبد على أجهزة الكمبيوتر. إذا بدا لي في هذا المقال أنني أبدو بهذه الطريقة ، فذلك لأن التكنولوجيا التي كنت أناقشها لا تبذل أي محاولة لإعادة إنتاج الذكاء البشري. على العكس تمامًا: إنها تحاول وضع حد للذكاء البشري ، وتكشف مقاطع الإخراج المعروضة أعلاه بوضوح ثغراتها العملاقة.

من وجهة نظري ، لا يوجد سبب جوهري يمنع الآلات ، من حيث المبدأ ، يومًا ما من التفكير ؛ كن مبدعًا ، مضحكًا ، حنينًا ، متحمسًا ، خائفًا ، منتشيًا ، مستقيلًا ، متفائلًا ، وكنتيجة طبيعية ، قادرًا على الترجمة بشكل مثير للإعجاب بين اللغات. لا يوجد سبب أساسي لعدم نجاح الآلات يومًا ما في ترجمة النكات والتورية والسيناريوهات والروايات والقصائد ، وبالطبع مقالات مثل هذه. لكن كل هذا سيحدث فقط عندما تمتلئ الآلات بالأفكار والعواطف والتجارب مثل البشر. وهذا ليس قاب قوسين أو أدنى. في الواقع ، أعتقد أنه لا يزال بعيدًا للغاية. على الأقل هذا ما يأمله هذا المعجب مدى الحياة بعمق العقل البشري.

عندما يكتب محرك الترجمة يومًا ما رواية فنية في شعر باللغة الإنجليزية ، مستخدمًا مقياسًا دقيقًا للقافية الرباعية التفاعيل الغني بالذكاء ، والشفقة ، والحيوية الصوتية ، سأعرف أن الوقت قد حان بالنسبة لي لأرفع قبعتي وانحني.

* أخطأت هذه المقالة في الأصل في عدد اللغات التي يتوفر لها إصدار التعلم العميق من جوجل ترجمة. نحن نأسف للخطأ.


The Shallowness of Google Translate

The program uses state-of-the-art AI techniques, but simple tests show that it’s a long way from real understanding.

By Douglas Hofstadter

Nazar Abbas Photography / Getty

January 30, 2018

0 التعليقات: