الذكاء الاصطناعي من مايكروسوفت الآن أفضل من البشر في تسمية الصور

الوفد 0 تعليق ارسل طباعة تبليغ حذف

 لطالما كان وصف الصورة بدقة، وليس فقط مثل الروبوت الجاهل، هو هدف الذكاء الاصطناعي.

 

 في عام 2016، قالت جوجل إن ذكاءها الاصطناعي يمكن أن يعلق على الصور تمامًا مثل البشر، بدقة 94%.

 

 قالت مايكروسوفت الآن إنها ذهبت إلى أبعد من ذلك، لقد أنشأ باحثوها نظام ذكاء اصطناعي أكثر دقة من البشر - لدرجة أنه الآن يجلس في أعلى لوحة المتصدرين لمعيار التسمية التوضيحية للصور nocaps.

 تدعي Microsoft أنها أفضل مرتين من نموذج التسمية التوضيحية للصور الذي تستخدمه منذ عام 2015.

 

 وعلى الرغم من أن هذا يعد معلمًا بارزًا بحد ذاته، فإن Microsoft لا تحتفظ بهذه التقنية لنفسها فقط، يقدم الآن نموذج التسمية التوضيحية الجديد كجزء من خدمات Azure المعرفية، إذ يمكن لأي مطور إدخاله في تطبيقاته.

 

 كما أنه متوفر اليوم في Seeing AI، تطبيق Microsoft للمستخدمين المكفوفين وضعاف البصر الذين يمكنهم سرد العالم من حولهم.

 

 وفي وقت لاحق من هذا العام، سيعمل نموذج التسمية التوضيحية أيضًا على تحسين العروض التقديمية في PowerPoint للويب و Windows و Mac، ستظهر أيضًا في Word و Outlook على الأنظمة الأساسية لسطح المكتب.

 

 قال إريك بويد، CVP من Azure AI، في مقابلة مع Engadget: "يعد شرح الصورة واحدًا من أصعب المشاكل في الذكاء الاصطناعي، فهي لا تمثل فقط فهم الكائنات في المشهد، ولكن كيفية تفاعلها، و كيف

أصفهم".

 

 يمكن أن يساعد تحسين تقنيات التسميات التوضيحية كل مستخدم، فهو يسهل العثور على الصور التي تبحث عنها في محركات البحث، وبالنسبة للمستخدمين ضعاف البصر، يمكن أن يجعل التنقل عبر الويب والبرامج أفضل بشكل كبير.


قال ليجوان وانج، مدير الأبحاث الرئيس في مختبر أبحاث ريدموند في مايكروسوفت: "ليس من غير المعتاد أن ترى الشركات تروج لابتكاراتها البحثية في مجال الذكاء الاصطناعي، ولكن من النادر جدًا نشر هذه الاكتشافات بسرعة في شحن المنتجات".

 

دفع Wang، الذي قاد تطوير نموذج التسميات التوضيحية الجديد، لدمجه في Azure بسرعة بسبب الفوائد المحتملة للمستخدمين، وقام فريقه بتدريب النموذج بالصور التي تم تمييزها بكلمات رئيسية محددة، مما ساعد في إعطائه لغة مرئية لا تمتلكها معظم أطر الذكاء الاصطناعي.

 

 عادةً ما يتم تدريب هذه الأنواع من النماذج بالصور والتعليقات التوضيحية الكاملة، مما يجعل من الصعب على النماذج معرفة كيفية تفاعل كائنات معينة.

أخبار ذات صلة

0 تعليق