شاهد ايضاً

سيكون ارخص هاتف اقتصادي في السوق Itel Zeno 20

أعلنت شركة ايتل عن هاتفها الجديد Itel Zeno 20 الذي يأتي كخليفة مباشر لهاتف Zeno 10 الذي أطلقته في وقت سابق من هذا العام. الهاتف الجديد يستهدف الفئة الاقتصادية بشكل مباشر، ويتميز بسعره المذهل الذي لا يتجاوز 5,999 روبية هندية أي ما يعادل أقل من 70 دولارًا أمريكيًا، ليضع نفسه بقوة ضمن قائمة الهواتف الأرخص في عام 2025 مع تقديم مواصفات مقبولة تلبي احتياجات المستخدم اليومية.

ببطارية ضخمة أوبو تطرح هاتفها A6 5G الجديد

شهدت منصة TENAA الصينية اعتماد هاتف جديد من أوبو يحمل اسم الطراز PLS120، ومن المرجح أن يتم طرحه رسميًا في الأسواق تحت مسمى Oppo A6 5G. الهاتف الجديد يأتي بمواصفات قريبة من سلسلة Reno 14F 5G، إلا أنه يتفوق في بعض الجوانب ويختلف في أخرى.

جوجل تختبر بطاقات اتصال مخصصة على أندرويد لعرض صور وأسماء أصدقائك عند الاتصال

بدأت شركة Google في اختبار ميزة جديدة على نظام Android تتيح للمستخدمين إنشاء بطاقات اتصال مخصصة تظهر على الشاشة عند تلقي المكالمات من جهات الاتصال. الميزة متاحة حاليًا عبر الإصدارات التجريبية من تطبيقي جهات الاتصال Contacts والهاتف Phone على أندرويد، وتمنحك إمكانية إضافة لمسة شخصية لكل جهة اتصال لديك.

تسريبات جديدة عن حدث آبل 2025: الكشف عن سلسلة iPhone 17 ومع تحديثات Apple Watch وAirPods

تستعد شركة آبل لعقد حدثها السنوي المرتقب للكشف عن أحدث أجهزتها في 9 سبتمبر المقبل، حيث تشير التسريبات إلى أن الحدث سيشهد الإعلان عن سلسلة iPhone 17 الجديدة، إلى جانب تحديثات لساعات Apple Watch وسماعات AirPods. وكما جرت العادة، تسبق الحدث شائعات عديدة حول التصميم والمواصفات والأسعار، أبرزها تقديم أنحف آيفون في التاريخ تحت اسم iPhone Air، والذي قد يحل محل إصدار Plus.

هواوي تكشف عن ألوان جديدة لساعة Huawei Watch 5

أعلنت شركة هواوي عن إضافة خيارات ألوان جديدة لساعتها الذكية Huawei Watch 5، التي تم الكشف عنها عالميًا في شهر مايو، والتي تأتي مزودة بتقنية X-Tap المتطورة لقراءة المؤشرات الصحية بدقة أكبر. التحديث الجديد يشمل لونين حصريين سيتم طرحهما قريبًا، وهما الأخضر الشفقي Aurora Green والأزرق المجري Galaxy Blue.

شركة OpenAI تنسخ أكثر من مليون ساعة من YouTube لتدريب GPT-4

كشف تقرير نُشر في صحيفة نيويورك تايمز عن الجهود التي بذلتها الشركات الرائدة في مجال الذكاء الاصطناعي لتوسيع نطاق وصولها إلى بيانات التدريب.

في بداية هذا الأسبوع، أفادت صحيفة وول ستريت جورنال بأن شركات الذكاء الاصطناعي تواجه تحديًا في جمع بيانات التدريب عالية الجودة. وفي هذا السياق، ذكرت نيويورك تايمز بعض الإجراءات التي اتخذتها هذه الشركات لمواجهة هذه المشكلة. وكما هو متوقع، تتضمن هذه الإجراءات أفعالًا تتحرك في منطقة غير محددة بوضوح في قوانين حقوق النشر في مجال الذكاء الاصطناعي.

تبدأ القصة بشركة OpenAI التي، بحاجة ماسة للبيانات التدريبية، قامت بتطوير نموذجها Whisper لتحويل الصوت إلى نص لتجاوز هذه العقبة، وذلك عبر نسخ أكثر من مليون ساعة من مقاطع فيديو YouTube لتدريب GPT-4، أحدث نموذج لغوي كبير وأكثر تطورًا لديها. ووفقًا لتقرير نيويورك تايمز، كانت الشركة على علم بأن هذا الإجراء قد يتعارض مع القوانين، لكنها اعتبرت أنه استخدام مقبول قانونيًا. وكان الرئيس التنفيذي لـ OpenAI جريج بروكمان شخصيًا مشاركًا في جمع الفيديوهات المستخدمة في التدريب، حسبما ذكرت نيويورك تايمز.

صرح متحدث باسم OpenAI لموقع The Verge عبر البريد الإلكتروني بأن الشركة تجمع بيانات “فريدة” لكل نموذج لها بهدف “تعزيز فهمها للعالم” والحفاظ على تنافسيتها العالمية في مجال البحث. وأضاف أن الشركة تعتمد على “مصادر متنوعة تشمل البيانات المتاحة علنًا والشراكات للبيانات غير العلنية”، وأنها تدرس إنشاء بيانات تركيبية خاصة بها.

- -

وأفادت نيويورك تايمز بأن OpenAI استنفدت مصادر البيانات المفيدة في عام 2021، وبدأت بالنقاش حول نقل مقاطع فيديو YouTube والبودكاست والكتب الصوتية بعد استنفاد الموارد الأخرى. وكانت الشركة قد قامت بتدريب نماذجها باستخدام بيانات تتضمن الكود الحاسوبي من موقع Github، وقواعد الشطرنج، ومحتوى الدروس من Quizlet.

وفي سياق متصل، صرح متحدث باسم جوجل، مات برايانت، لموقع The Verge ايضاً عبر البريد الإلكتروني بأن الشركة “لاحظت تقارير غير مؤكدة” عن نشاط OpenAI، مشيرًا إلى أن “كل من ملفات robots.txt الخاصة بنا وشروط الخدمة تمنعان الاسترداد أو التنزيل غير المصرح به لمحتوى YouTube”، مؤكدًا موقف الشركة. وأشار إلى أن جوجل جمع أيضًا نصوصًا من YouTube وقام بتدريب نماذجه “على بعض محتوى YouTube، وفقًا لاتفاقياتنا مع مبدعي YouTube”.

كما أشارت نيويورك تايمز إلى أن قسم القانون في جوجل طلب من فريق الخصوصية للشركة تعديل لغة سياستها لتوسيع مجال استخدام بيانات المستخدمين، مثل أدوات المكتب مثل Google Docs، حيث تم إطلاق السياسة الجديدة بشكل متعمد في الأول من يوليو للاستفادة من التشتت الناجم عن عطلة عيد الاستقلال.

وبشكل مشابه، واجهت ميتا تحديات في توفر بيانات التدريب عالية الجودة، وفي تسجيلات استمعت إليها نيويورك تايمز، ناقش فريق الذكاء الاصطناعي لديها استخدام الأعمال المحمية بحقوق النشر دون إذن أثناء العمل على اللحاق بـ OpenAI. وبعد استكمال “تقريبًا كل كتاب ومقال وقصيدة وخبر باللغة الإنجليزية المتاحة على الإنترنت”، نظرت الشركة في اتخاذ خطوات مثل دفع تكاليف تراخيص الكتب أو حتى شراء ناشر كبير. وكانت محدودة أيضًا في طرق استخدام بيانات المستخدمين بسبب التغييرات التي أدخلتها في سياستها التي تركز على الخصوصية بعد فضيحة كامبريدج أناليتيكا.

وبشكل عام، تتصارع Google، OpenAI، وعالم تدريب الذكاء الاصطناعي بأسره مع ضياع بيانات التدريب بسرعة من نماذجهم، التي تتحسن كلما استوعبت المزيد من البيانات. وكتبت صحيفة وول ستريت هذا الأسبوع بأن الشركات قد تفوق على المحتوى الجديد بحلول عام 2028.

وتشمل الحلول المحتملة لهذه المشكلة التي ذكرتها الصحيفة يوم الاثنين تدريب النماذج على بيانات “تركيبية” تم إنشاؤها بواسطة نماذجهم الخاصة أو ما يُعرف بـ “تعلم المنهج”، الذي يتضمن تغذية النماذج ببيانات عالية الجودة بطريقة مرتبة على أمل أن يتمكنوا من استخدام “روابط أكثر ذكاءً بين المفاهيم” باستخدام معلومات أقل بكثير، ولكن لا توجد دراسات مؤكدة حتى الآن تثبت فعالية أي من النهجين. ومع ذلك، فإن الخيار الآخر للشركات هو استخدام أي شيء يمكنها العثور عليه، سواء كان لديها إذن أو لا، وبناءً على عدة دعاوى قضائية تم رفعها خلال العام الماضي أو نحو ذلك، يمكن القول إن هذه الطريقة، على سبيل المثال، هي أكثر من مجرد محفوفة بالمخاطر.