شاهد ايضاً

بينترست تختبر ميزة ذكاء اصطناعي لتحويل كتالوجات المنتجات إلى كولاجات قابلة للشراء

أعلنت منصة Pinterest هذا الأسبوع عن بدء اختبار ميزة جديدة تعتمد على الذكاء الاصطناعي تُعرف باسم "الكولاج التلقائي - Auto-Collages"، والتي تتيح للمعلنين تحويل كتالوجات منتجاتهم تلقائيًا إلى كولاجات مرئية قابلة للتسوق.

OpenAI تطلق o3-pro: أقوى نموذج ذكاء اصطناعي للاستدلال حتى الآن

أعلنت شركة OpenAI عن إطلاق نموذج o3-pro، وهو نسخة محسّنة من نموذج الذكاء الاصطناعي o3 الذي تم الكشف عنه في وقت سابق من هذا العام. وتصف الشركة النموذج الجديد بأنه الأكثر تقدمًا حتى الآن، مع تحسينات كبيرة في قدرات الاستدلال والفهم العميق.

يوتيوب يدعم الاقتصاد الأمريكي بـ55 مليار دولار

كشفت منصة يوتيوب "YouTube" في تقرير جديد صدر يوم الثلاثاء عن التأثير الاقتصادي الكبير الذي أصبح يتمتع به اقتصاد صناع المحتوى، حيث أظهرت البيانات أن النظام الإبداعي ليوتيوب ساهم بأكثر من 55 مليار دولار في الناتج المحلي الإجمالي للولايات المتحدة خلال عام 2024، كما دعم أكثر من 490 ألف وظيفة بدوام كامل، وفقًا لتحليل أجرته مؤسسة Oxford Economics.

تأجيل إطلاق نموذج OpenAI المفتوح حتى نهاية الصيف

أعلن سام ألتمان، الرئيس التنفيذي لشركة OpenAI، عن تأجيل إصدار أول نموذج مفتوح من OpenAI منذ سنوات، مشيرًا إلى أن الإصدار لن يتم في يونيو كما كان مخططًا، بل سيتم إطلاقه في وقت لاحق من هذا الصيف. جاء ذلك عبر منشور على منصة X (تويتر سابقًا)، حيث أوضح أن التأخير يعود إلى تطورات غير متوقعة في فريق الأبحاث.

“OpenAI” تؤكد على عطل في شات جي بي تي ونموذج Sora

أعلنت شركة OpenAI عن حدوث عطل تقني في خدماتها، بما في ذلك روبوت الدردشة ChatGPT ونموذج Sora لتوليد مقاطع الفيديو، مما أثر على تجربة المستخدمين حول العالم.

ميتا تكشف عن مترجم متعدد الوسائط يتقن 100 لغة بنموذج واحد

تدفع ميتا حدود تكنولوجيا ترجمة اللغات إلى آفاق جديدة من خلال حلاً مبتكرًا يقربنا من عالم غير متوقع في الخيال العلمي. وبالرغم من عدم التوصل بالضبط إلى مستوى الاتصال المستقبلي الذي يتم تصويره، فإن تقنيات الترجمة القائمة على الذكاء الاصطناعي تثبت جدارتها في تحويل تلك الأنظمة اللغوية المتعددة – التي تضم حوالي 6500 لغة – والتي يتواصل بها البشر حول العالم. ومع ذلك، ينشأ تحدي عند محاولة دمج نماذج متخصصة متعددة تبرز في مهام فردية مثل تحويل النص إلى كلام، أو الكلام إلى نص ، أو التحويلات المتبادلة بينهما. ويؤدي تعقيد هذه العملية إلى تجميع مجموعة من النماذج لتحقيق القدرات الشاملة المعروضة في منصات مثل ترجمة جوجل وخدمات اللغة المتعددة لفيسبوك.

وعلى خلفية تعقيدات الحساب الحاسوبي، قامت ميتا بتطوير نموذج واحد بمرونة فائقة. تقدم SeamlessM4T، وهو “نموذج متعدد اللغات والمهام الأساسي”، والذي تم تصميمه بدقة لترجمة ونسخ وتحويلات سلسة بين الكلام والنص، كما وضحت ميتا مدونتها اليوم. تمكن هذا الابتكار SeamlessM4T من التنقل بسلاسة بين ما يقرب من 100 لغة عبر مجموعة من الوظائف: من الكلام إلى النص، ومن النص إلى النص، ومن الكلام إلى الكلام، ومن النص إلى الكلام. وبصورة مثيرة للإعجاب، لا يدعم النموذج فقط هذه اللغات كإدخال وإخراج، بل يسهل أيضًا الانتقال بين اللغات بحيث يدعم 36 لغة إضافية، بما في ذلك الإنجليزية.

يسلط فريق أبحاث ميتا الضوء على قدرة SeamlessM4T على “تحسين الأداء بشكل كبير للغات ذات الموارد المنخفضة والمتوسطة التي يدعمها”، مع الحفاظ في الوقت نفسه على “أداء قوي في اللغات ذات الموارد العالية، مثل الإنجليزية والإسبانية والألمانية”. يتم بناء SeamlessM4T على الهيكلية الحالية لنموذج UnitY متعدد المهام، والذي يعتمد على PyTorch، والذي يبرع بالترجمات النمطية المتنوعة والاعتراف التلقائي بالكلام. يتضمن النموذج نظام BERT 2.0 لترميز الصوت، والذي يقسم المدخلات إلى مكونات رموز للتحليل الدقيق. بالإضافة إلى ذلك، يتم استخدام جهاز تكنولوجي HiFi-GAN لتوليد ردود الكلام بأداء رائع.

تكمل ميتا هذا النموذج الرائد بمستودع مفتوح الشفافية بعنوان “SeamlessAlign”، والذي يحوي مجموعة كبيرة من نصوص الترجمة من النص إلى الكلام ومن الكلام إلى النص. تم تجميع هذه الموارد المذهلة من “عشرات المليارات من الجمل” و”أربعة ملايين ساعة” من البيانات الصوتية المتاحة للجمهور. باستخدام هذه الكنوز، تمكنت الشركة من “محاذاة تلقائية لأكثر من 443,000 ساعة من الكلام مع النصوص” لتوليد حوالي 29,000 ساعة من محاذاة الكلام مع الكلام. أظهرت اختبارات القوة الجوانب البارزة لـ SeamlessM4T مقارنةً بالإصدار السابق، حيث حقق نسبة تحسن بنسبة 37 في المئة في مقاومة ضوضاء الخلفية، وزيادة بنسبة 48 في المئة في التعامل مع تباينات أسلوب القائم بالكلام.

- -

ومواكبةً لتقديم مساهماتها المفتوحة المصدر، قامت ميتا بتوفير SeamlessM4T للاستخدام العام. يعتبر الفريق SeamlessM4T تقدمًا مهمًا في خلق أنظمة متعددة المهام واستدعاء الباحثين والمطورين لبناء على هذه التقنية. مع الالتزام المستمر لميتا بالعلم المفتوح، يمكن الوصول إلى النموذج وبيانات التدريب والوثائق الشاملة على GitHub.