ورود جدیتر اپل به دنیای ابزارهای هوش مصنوعی؛ MGIE برای ویرایش عکس انتشار شد
[ad_1]
محققان اپل مدل هوش مصنوعی جدیدی را انتشار کردهاند که به کاربران اجازه میدهد بدون نیاز به نرمافزارهای ویرایش عکس، تغییرات مورد نظر خود در تصاویر را با دستورات زبانی توصیف کنند.
بر پایه گزارشهای حاضر، این مدل که MGIE نام دارد، با همکاری محققان اپل و دانشگاه کالیفرنیا، سانتا باربارا ساخته شده است و میتواند از طریق مطلبهای متنی، تصاویر را برش داده، اندازه آنها را تحول دهد، بچرخاند و به آن فیلترهایی اضافه کنند.
MGIE که مخفف MLLM-Guided Image Editing است، میتواند برای کارهای ساده و پیچیدهتر مربوط به ویرایش عکس همانند تحول اشیاء خاص یک عکس مورد منفعت گیری قرار بگیرد. در این مدل، دو کاربرد متفاوت مدلهای زبان چندوجهی را با یکدیگر ترکیب میکند. ابتدا یاد میگیرد که چطور خواست کاربران را تفسیر کند، سپس فکر میکند که تحول مورد نظر کاربر چطور به نظر میرسد.
آزمایش مدل هوش مصنوعی اپل
برای ویرایش یک عکس با MGIE، کاربران فقط نیاز است تا تحول موردنظر خود را تایپ کنند. محققان در مقاله خود برای نمایش کاربرد این مدل هوش مصنوعی، از عکس یک پیتزا پپرونی منفعت گیری کردند. آنها دستور «آن را سالمتر کن» را به مدل اراعه کردند و در روبه رو، MGIE در عکس خود از سبزیجات بیشتری منفعت گیری کرده است. این چنین عکسی از چند ببر در این مقاله نیز وجود دارد که زیاد تاریک است و محققان با ثبت دستور «اضافهکردن کنتراست زیاد تر برای همانندسازی نور»، عکس روشنتری تشکیل کردند.
محققان در مقاله خود میگویند:
«ما مطالعات گستردهای را از جنبههای گوناگون ویرایش انجام میدهیم و نشان میدهیم که MGIE ما بهطور موثر کارکرد خود را در عین نگه داری کارایی رقابتی بهبود میبخشد. ما این چنین معتقدیم که چارچوب هدایتشده توسط MLLM، در آینده میتواند به تحقیقات حوزه بینایی و زبان پشتیبانی کند.»
اپل MGIE را از طریق GitHub برای دانلود در دسترس قرار داده و این چنین نسخه آزمایشی تحت وب آن را در Hugging Face Spaces انتشار کرده است. اپل تا این مدت برنامههای خود در عرصه هوش مصنوعی را اظهار نکرده است و اشکار نیست که چه برنامهای برای این مدل دارد.
[ad_2]
منبع