هوش مصنوعی Grok-1.5 Vision معارفه شد؛ رقیب GPT-4V در فهمیدن تصاویر_آفتاب وطن

هوش مصنوعی Grok 15 Vision معارفه شد؛ رقیب GPT 4V در فهمیدن.webp

[ad_1]
به گزارش آفتاب وطن

مدتی پیش استارتاپ هوش مصنوعی «ایلان ماسک» یعنی xAI نسخه تازه چت‌بات خود Grok-1.5 را معارفه کرد. اکنون در ادامه رقابت این شرکت با OpenAI، مدل چندوجهی Grok-1.5 Vision یا Grok-1.5V رونمایی شد. این هوش مصنوعی اکنون علاوه‌بر آنکه می‌تواند متن را فهمیدن کند، قادر به پردازش نمودار، اسکرین‌شات‌ و تصاویر گوناگون است.

بر پایه اظهار xAI، نسخه Grok-1.5V می‌تواند با مدل‌های چندوجهی پیشرفته دیگر در قسمت‌هایی همانند استدلال چند رشته‌ای، فهمیدن نمودارهای علمی، چارت‌ها و تصاویر رقابت کند. Grok-1.5 ویژن به‌زودی برای افراد منتخب و برخی از کاربران جاری این چت‌بات در دسترس خواهد می بود.

Grok ویژن با قابلیت پردازش داده‌های تصویری و چندوجهی

xAI نسخه چندوجهی Grok را در هفت بنچمارک گوناگون با دیگر رقیب ها همانند GPT-4V قیاس کرده است که در برخی از آن‌ها این مدل برتری قابل‌توجهی را به‌ثبت رسانده است. خواندن متن در عکس، فهمیدن مسائل ریاضی، تبدیل فلوچارت به کد پایتون، تشکیل یک داستان از نقاشی و تبدیل جدول به فرمت فایل CSV از قابلیت‌های تازه نسخه ویژن Grok است.

قیاس Grok-1.5V با دیگر رقیب ها در بنچمارک‌های گوناگون

xAI مدل چندوجهی خود را با رقیب‌هایی همانند GPT-4V ،Claude 3Sonnet و جمینای پرو ۱.۵ قیاس کرده است و ادعا می‌کند که Grok-1.5V در بنچمارک RealWorldQA از رقبای خود بهتر عمل می‌کند؛ این بنچمارک تازه برای برسی مقدار فهمیدن دنیای واقعی تشکیل شده است.

بنچمارک RealWorldQA با منفعت گیری از بیشتر از ۷۰۰ عکس به همراه سوال‌وپاسخ برای هر مورد تشکیل شده است. در این تصاویر وسایل نقلیه گوناگون و اشیای دنیای واقعی وجود دارند. xAI این بنچمارک را با مجوز CC یا Creative Commons برای عموم انتشار می‌کند.

1713001756 400 هوش مصنوعی Grok 15 Vision معارفه شد؛ رقیب GPT 4V در فهمیدن
در اینجا Grok یک فلوچارت را که روی وایت‌برد کشیده شده است به کد پایتون تبدیل می‌کند.

شرکت هوش مصنوعی ایلان ماسک از وقتی که چت‌بات آن برای اولین‌بار در سال ۲۰۲۳ رونمایی شد، پیشرفت‌های بسیاری داشته است و دائماً نیز تلاش می‌کند تا با OpenAI و دیگر شرکت‌های پیشتاز هوش مصنوعی رقابت کند. اما این چت‌بات در این زمان چندان بی‌حاشیه نیز نبوده است. اخیراً محققان دریافتند که چت‌بات Grok می‌تواند به کاربران درمورد عمل های مجرمانه اطلاعاتی بدهد.

بااین‌وجود، xAI به‌جستوجو ساختن «هوش جامع مصنوعی سودمند» با قابلیت فهمیدن جهان است. این مقصد مشخص می کند که در ماه‌های آینده به‌روزرسانی‌های قابل توجهی برای فهمیدن چندوجهی و قابلیت‌های هوش مصنوعی مولد به Grok خواهد آمد.

دسته بنی مطالب

خبرهای ورزشی

اخبار پزشکی

اخبار اجتماعی

اخبار فرهنگی

کسب وکار

تازه‌ترین اخبار و تحلیل‌ها درباره انتخابات، سیاست، اقتصاد، ورزش، حوادث، فرهنگ و گردشگری را در آفتاب وطن بخوانید.

اخبار فناوری

[ad_2]

منبع