گوگل از Gemini 1.5 Pro با امکان پردازش ویدیوهای یک ساعته رونمایی کرد
[ad_1]
گوگل که هفته قبل نام چتبات Bard خود را به Gemini تحول داده می بود، اکنون از مدل Gemini 1.5 Pro رونمایی کرده است که بهگفتن جانشین Gemini 1.0 Pro طراحی شده است. کارکرد Gemini 1.5 Pro در برخی عرصهها نسبت به نسل قبلی خود بهبود یافته است که به گمان زیادً با اهمیت ترین بهبود آن به مقدار دادههایی مربوط میبشود که میتواند پردازش کند.
بر پایه بیانیه گوگل، Gemini 1.5 Pro میتواند نزدیک به ۷۰۰ هزار کلمه یا ۳۰ هزار خط کد بنویسد (۳۵ برابر زیاد تر از Gemini 1.0 Pro) و یک مدل چندوجهی است، به این معنی که کارکرد آن به متن محدود نمیبشود. علاوه بر این، Gemini 1.5 Pro میتواند تا ۱۱ ساعت صدا یا یک ساعت ویدیو به زبانهای گوناگون را دریافت کند.
Gemini 1.5 Pro که از روز قبل (بهگفتن نسخه پیشنمایش محدود) برای اکثر گسترشدهندگان و مشتریان در دسترس است، ابتدا فقط میتواند ۱۰۰ هزار کلمه را بهطور همزمان پردازش کند. این چنین فقط گسترشدهندگان قبول شده اجازه دارند تا از طریق ابزار گسترشدهنده GenAI AI Studio گوگل آن را آزمایش کنند. علاوه بر این، برخی مشتریان که از پلتفرم Vertex AI گوگل منفعت گیری می کنند نیز به Gemini 1.5 Pro دسترسی دارند.
معاون تحقیقات Google DeepMind از این مدل بهگفتن یک دستاورد بزرگ یاد کرده است و میگوید:
«وقتی که شما با مدلهای GenAI تعامل میکنید، اطلاعاتی که داخل و دریافت میکنید به عرصه تبدیل خواهد شد و هرچه سوالات و تعامل های شما طویلتر و پیچیدهتر باشد، عرصهای که مدل به آن نیاز دارد نیز طویلتر میبشود. ما امکان دسترسی به عرصه طویل را به روشی زیاد گسترده فراهم کردهایم.»
عرصه یک مدل هوش مصنوعی به دادههای ورودی (برای مثال متن) اشاره دارد که مدل قبل از تشکیل خروجی خود باید آنها را در نظر بگیرد. یک سوال ساده، همانند «چه فردی در انتخابات ریاست جمهوری ۲۰۲۰ آمریکا پیروز شد؟» یا حتی یک فیلمنامه، ایمیل یا کتاب الکترونیکی میتوانند بهگفتن یک عرصه عمل کنند.
[ad_2]
منبع