تحضير مساعد جوجل ليكون متعددَ اللغات

يتزايد انتشار الأُسر التي يتحدَّث أفرادها عدةَ لغات، إذ أنّ مصادر عديدة تُشير إلى أنّ المتحدثين بلغات عِدّة يزيد عددهم على عدد نظائرهم من متحدثي اللغة الواحدة، وأنّ هذا العدد في عجلة الازدياد. وكنتيجة لهذا العدد المتزايد من متحدثي اللغات المتعددة فقد أصبح لزامًا على شركة جوجل تطوير منتجات تَدعم لغاتٍ عدة بشكلٍ فوريّ لخدمة المُستخدمين، حيث أننا نجهّز في الوقت الحالي دعمًا متعدِّد اللغات لمساعد جوجل “google assistant”، مما يُمكِّن المستخدم من التنقل بين لغتين عبر ما يبحثون عنه دون الاضطرار إلى العودة إلى إعدادات اللغة. فحالما يُحدِّد المستخدم لغتين من اللغات المدعومة، وهنّ الإنجليزيّة والفرنسيّة والإسبانيّة والألمانيّة والإيطاليّة واليابانيّة، فإنهم يستطيعون التحدث إلى مساعد جوجل الخاص بهم في أي من هذه اللغات فيستجيب لهم في الحال.

كان المستخدمون سابقًا يَضطرون إلى اختيار إعداد لغة واحد لضبط المساعد بحيث يغيرون بين الإعدادات في كل مرة يرغبون فيها باستعمال لغة أخرى. أما الآن، فهي عملية بسيطة مجانية وفي متناول أيدي الأسر ذات اللغات المتعددة.

إن مساعد جوجل قادر في الوقت الحالي على تمييز اللغة وترجمة البحث وتوفير استجابة باستخدام اللغة الصحيحة دون تغيير المستخدم لإعدادات المساعد. بيد أن الطريق إلى تطبيق هذه العملية لم يكن مفروشًا بالورود، فهو في الحقيقة خلاصة جهود سنوات عدة تضمن حل الكثير من المشاكل وتجاوز الكثير من التحديات. وقد قسمنا المشكلة في النهاية إلى ثلاثة أجزاء: وهي تمييز اللغات المتعددة وفهم اللغات المتعددة وتحسين التعرّف متعدد اللغات لمستخدمي مساعد جوجل.

فَهم اللغات المتعددة:

إنّ الناس قادرون على إدراك أن شخصًا ما يتحدث لغة أخرى حتى لو لم يكونوا قادرين على تحدث تلك اللغة، وذلك عن طريق الانتباه إلى صوتيات الكلام والتنغيم والسجل الصوتي إلخ. وعلى الرغم من ذلك، فإن تعريف إطار عمل حاسوبي لتعرُّف تلقائي على لغة محكيَّة يُعدُّ تحديًا كبيرًا حتى بمساعدة أنظمة التعرف التلقائي على الكلام. لأجل ذلك، بدأت جوجل عام 2013 العمل على تكنولوجيا تمييز اللغات المحكية LangID باستخدام الشبكات العصبونية العميقة “deep neural networks”.

في الوقت الحالي، فإن نماذج LangID في حالة تَمكُّنها من التفريق بين أزواج من اللغات في عدد يزيد عن 2000 زوج لغة بديل باستخدام الشبكات العصبية المتكررة وهي عائلة ناجحة وخاصة لمشاكل القولبة المتسلسلة مثل المشاكل الموجودة في التعرف بالكلام والتحقق الصوتي وتعرف المتحدث ومشاكل أخرى. إن العمل على مجموعات أكبر من مقاطع الصوت هو إحدى التحديات التي واجهناها، مما دعا بالحاجة إلى الحصول على نماذج يمكنها فهم لغات متعددة بمقياس معين والوصول إلى معيار لجودة النماذج حتى تعمل بشكل جيد.

إعلان

من البديهي أن التعرف الآلي على اللغات المحكية أكثر صعوبة من تمييز اللغة النصية والتي تقوم فيها تقنيات بسيطة في القاموس بالمهمة على أكمل وجه. إنه من الصعب مقارنة الأنماط المتكررة في زمن معين للكلمات المنطوقة، ذلك أن الكلمات المنطوقة يصعب تحديدها نظرًا لنطقها دون توقف وعلى سرعات مختلفة بالإضافة إلى تسجيل جهاز المايكروفون لأصوات الفوضى في خلفية الصوت.

مساعد جوجل وفهم اللغات المتعددة:

ينبغي إجراء عمليات متعددة على التوازي لفهم أكثر من لغة في آنٍ واحد بحيث يسفر عن كل منها نتائج إضافية، فهي لا تتيح للمساعد التعرف إلى اللغة التي ينطق بها البحث فحسب، وإنما تتيح له تحليل البحث وإنشاء أمر يمكن تطبيقه حتى على البيئة أحادية اللغة. فعلى سبيل المثال، إذا طلب مستخدم ضبط المنبه على الساعة السادسة مساءً فإنه لا بد أن يفهم مساعد جوجل أن ضبط المنبه يتضمن فتح تطبيق الساعة وملء القيمة التوضيحية للساعة السادسة مساءً والإشارة إلى أنه ينبغي ضبط المنبه لهذا اليوم.

إن جعل هذا يعمل على أي زوج من اللغات المدعومة هو تحدٍ حقيقي، ذلك أن المساعد يُنفِّذ العمل نفسه الذي يقوم به في حالة أحادي اللغة لكن الآن لا بد من تفعيل LangID ليس فقط بنظام واحد من أنظمة التعرف على الكلام، وإنما بنظامين أحاديّي اللغة من أنظمة التعرف الآلي على الكلام بشكل فوري. ومن المهم أن نشير إلى أن مساعد جوجل والخدمات الأخرى التي يتم الرجوع إليها عند بحث المستخدم تولد نتائج إضافية في وقت حقيقي بشكل غير متزامن من الضروري تقييمها خلال ثوان. وقد تم إنجاز هذا بمساعدة خوارزمية إضافية تُرتِّب الفرضيات الكتابية التي يوفِّرها كل من نظامي التعرف الآلي على الكلام باستخدام اللغات المرشحة التي تنتجها Langid وثقتنا بالتفريغ النصي وإعدادات المستخدم كاختيار الفنانين المفضلين.

مخطط لنظام التعرف على الكلام متعدد اللغات الذي يستخدمه مساعد جوجل يناقضه نظام التعرف على الكلام أحادي اللغة المعياري. وتستعمل خوارزمية الرتبة لتحديد فرضيات التعرف الأفضل من متعرفين أحاديي اللغة باستخدام معلومات مرتبطة عن المستخدم ونتائج Langid الإضافية. عندما يتوقف المستخدم عن الكلام فإن النموذج لا يحدد فقط لغة الحديث وإنما ما يقوله المستخدم. وبالطبع، فإن هذه العملية تتطلب بناءً متطورًا تأتي بتكلفة معالجة متزايدة واحتمالية تقديم زمن وصول غير ضروري.

تحسين التعرف الآلي متعدد اللغات:

كلما كان النظام أسرع في اتخاذ قرار حول أي لغة يتم التحدُّث بها، كان أفضل لتقليل التأثيرات غير المرغوب فيها، فإذا اختار النظام اللغة التي يتحدث بها قبل إنهاء المستخدم بحثه يوقف تشغيل كلام المستخدم من خلال المتعرف الضائع ثم يبعد الفرضية الضائعة وبذلك تنخفض تكلفة المعالجة وإنتاج زمن الوصول الممكن. ولقد درسنا طرقًا عديدة لتحسين النظام. فإحدى حالات الاستخدام التي درسناها هي أن الناس في العادة يستعملون اللغة ذاتها خلال استفسارهم وهي اللغة ذاتها التي يسمعها المستخدمون من المساعد باستثناء السؤال عن أشياء بأسماء مختلفة بلغات مختلفة.

هذا يعني في أغلب الأحوال أن الجزء الأول من الاستفسار يسمح للمساعد بتخمين اللغة المحكية بشكل تمهيدي حتى في جمل تحتوي على أسماء بلغة مختلفة. يتم تبسيط المهمة بهذه المطابقة المبكِّرة عن طريق التغيير إلى متعرِّف آلي أحادي اللغة بمفرده كما نفعل للاستفسارات أحادية اللغة. ورغم ذلك، فإن اتخاذ قرار سريع حول طريقة الالتزام بلغة ما وزمانها يتطلب نقلة تقنية نهائية، حيث نستعمل بالتحديد تقنية الغابة العشوائية التي تضم إشارات سياقية متعددة مثل نوع الجهاز المستخدم وعدد فرضيات الكلام التي عثر عليها وعدد مرات استقبالنا فرضيات متشابهة وعدم التيقن من نتائج المتعرف الآلي على الكلام ومرات تكرار استعمال اللغة.

وهناك طريقة إضافية لتبسيط جودة النظام وتحسينها وهي بتحديد قائمة اللغات المرشحة التي يختارها المستخدمون، حيث بإمكان المستخدمين اختيار لغتين من أصل 6 لغات تدعمها أجهزتنا المنزلية في الوقت الحالي والتي تتيح لنا دعم غالبية المتحدثين متعددي اللغات. وعلى الرغم من ذلك، نأمل أن نعالج الدعم ثلاثي اللغات لاحقًا مع استمرارنا في تحسين تقنياتنا، علمًا بأن هذا سيعزز تجربة المستخدم المتنامية.

من ثنائي اللغة إلى متعدد اللغات:

لقد كان هدفنا من البداية جعل المساعد تحادثيًا بشكل طبيعي لكافة المستخدمين، فالدعم متعدد اللغات ميزة يرتفع عليها الطلب وهو أمر وضع فريقنا بصماته عليه قبل سنوات خلت. بيد أن الأمر لا يقتصر فقط على وجود كثير من متحدثي اللغات المتعددة في العالم، فنحن أيضًا نسعى إلى تسهيل الحياة لمستخدمي لغات ثلاث أو العائلات التي تقيم في بيوت تُحكى فيها أكثر من لغتين. إننا على المسار الصحيح بوجود تحديثات اليوم، إذ أصبح بالإمكان تحسين أداء نموذج LANGID مع التعلم الآلي المتقدم وتقنيات التعرف الآلي على اللغة والكلام والتزام فريقنا. نقوم في الوقت الحالي بتعليم المعالج كيفية معالجة أكثر من لغتين بشكل فوري وإضافة لغات متعددة في المستقبل، فابقوا متأهبين.

 

إعلان

مصدر مصدر الترجمة
فريق الإعداد

إعداد: عمر العجيمي

تدقيق لغوي: فاطمة الملّاح

الصورة: gettyimages

اترك تعليقا