ذكاء اصطناعي مبتكر.. HONOR تكشف Magic V5 بتقنيات متقدمة لفهم الصوت بدقة فائقة

نموذج لغوي صوتي كبير يعمل على الجهاز يمثل نقلة نوعية في عالم الهواتف الذكية؛ أعلنت HONOR عن إطلاق أول نموذج لغوي صوتي كبير يعمل مباشرة على الجهاز ضمن إصدارات هاتف HONOR Magic V5، متجاوزة بذلك تحديات التعرف على الكلام متعدد اللغات والترجمة الفورية بزمن استجابة منخفض، مع توفير كفاءة عالية في تشغيل النماذج الضخمة على الأجهزة المحمولة.

تطوير نموذج لغوي صوتي كبير يعمل على الجهاز مع ضمان الخصوصية والأداء

تُعاني معظم حلول الترجمة الحالية من الاعتماد المفرط على الخدمات السحابية التي تثير مخاوف كبيرة بشأن خصوصية المستخدمين، خصوصًا خلال المكالمات الحساسة. بينما تقتصر بعض الحلول المحلية على التنازل عن سرعة وأداء الترجمة بسبب محدودية قدرة أجهزة الهواتف، قدمت HONOR نموذجًا لغويًا صوتيًا كبيرًا يعمل على الجهاز نفسه، ما يضمن سرعات استجابة منافسة للسحابة، ويعزز خصوصية المستخدمين بشكل كبير، دون التضحية بدقة الأداء أو كفاءة استهلاك الذاكرة.

فوائد استثنائية لنموذج لغوي صوتي كبير يعمل على الجهاز في تحسين الاتصال متعدد اللغات

توفر تقنية HONOR حلولًا مبتكرة تقلل استهلاك الذاكرة من 3-4 جيجابايت إلى 800 ميجابايت فقط، وهو ما يعادل توفير حوالي 75% من مساحة التخزين، عبر دمج ست حزم لغوية رئيسية تشمل العربية، الصينية، الإنجليزية، الألمانية، الفرنسية، الإسبانية، والإيطالية. تُلغي هذه الميزة الحاجة لتحميل حزم منفصلة لكل لغة بحجم 500 ميجابايت، مقدمة توفيرًا يصل إلى 2.78 جيجابايت. ومن أهم مميزات هذا النموذج اللغوي الصوتي الكبير الذي يعمل على الجهاز هو الترجمة الفورية أثناء التحدث، ما يسرع عملية الترجمة بنسبة 38% ويعزز دقتها بنسبة 16% مقارنة بالأساليب التقليدية التي تنتظر إتمام الجملة قبل الترجمة.

الأبحاث المعتمدة في INTERSPEECH 2025 تدعم تقنية نموذج لغوي صوتي كبير يعمل على الجهاز

تناولت الورقة البحثية الأولى، المعنونة “MFLA: Monotonic Finite Look-ahead Attention for Streaming Speech Recognition”، التحديات التقنية المتعلقة بتحقيق التعرف السريع والدقيق على الكلام على الأجهزة المحمولة، حيث دمجت HONOR بين آلية التكامل والإطلاق المستمر (CIF) واستراتيجية Wait-k، متغلبة بذلك على مشكلة الكمون العالي المرتبطة بالتعرف التلقائي على الكلام بسبب الطبيعة المستمرة للإشارات الصوتية، مما سمح بتحويل الإشارات إلى قرارات حدية منفصلة بكفاءة عالية.

أما الورقة الثانية، التي حملت عنوان “Novel Parasitic Dual-Scale Modeling for Efficient and Accurate Multilingual Speech Translation”، فقد قدّمت استراتيجية تسريع تعتمد على نموذج طفيلي مزدوج المقياس باستخدام العينة التخمينية بالتعاون مع جامعة شنغهاي جياو تونغ، معززة بذلك قدرة النماذج الصوتية الكبيرة على العمل بكفاءة في الزمن الحقيقي على الأجهزة محدودة الموارد، محققة زيادة في سرعة الاستنتاج بنسبة 38% دون التأثير على جودة الأداء.

  • خفض استهلاك الذاكرة من 3-4 جيجابايت إلى 800 ميجابايت
  • دمج ست حزم لغوية رئيسية لتوفير مساحة تخزين تتجاوز 2.7 جيجابايت
  • الترجمة الفورية أثناء التحدث بدقة متزايدة 16% وسرعة أفضل 38%
  • تطبيق استراتيجيات بحثية متقدمة لتحقيق زمن استجابة منخفض على الأجهزة المحمولة
الميزة النسبة أو القيمة
توفير مساحة التخزين حوالي 75%
زيادة سرعة الاستنتاج 38%
تحسين دقة الترجمة 16%
استهلاك الذاكرة 800 ميجابايت فقط

إن إعلان HONOR عن نموذج لغوي صوتي كبير يعمل على الجهاز يعكس التزامها العميق بتطوير تقنيات الذكاء الاصطناعي المتطورة التي تعمل محليًا، مقدمًا بذلك مستوى جديدًا من الخصوصية الفائقة والأداء القوي الذي يلبي احتياجات المستخدمين عبر الحدود اللغوية دون تنازلات في السرعة أو الدقة.