ورود جدی‌تر اپل به دنیای ابزارهای هوش مصنوعی؛ MGIE برای ویرایش عکس انتشار شد

1707370985 ورود جدی‌تر اپل به دنیای ابزارهای هوش مصنوعی؛ MGIE برای

[ad_1]

محققان اپل مدل هوش مصنوعی جدیدی را انتشار کرده‌اند که به کاربران اجازه می‌دهد بدون نیاز به نرم‌افزارهای ویرایش عکس، تغییرات مورد نظر خود در تصاویر را با دستورات زبانی توصیف کنند.

بر پایه گزارش‌های حاضر، این مدل که MGIE نام دارد، با همکاری محققان اپل و دانشگاه کالیفرنیا، سانتا باربارا ساخته شده است و می‌تواند از طریق مطلب‌های متنی، تصاویر را برش داده، اندازه آن‌ها را تحول دهد، بچرخاند و به آن فیلترهایی اضافه کنند.

MGIE که مخفف MLLM-Guided Image Editing است، می‌تواند برای کارهای ساده و پیچیده‌تر مربوط به ویرایش عکس همانند تحول اشیاء خاص یک عکس مورد منفعت گیری قرار بگیرد. در این مدل، دو کاربرد متفاوت مدل‌های زبان چندوجهی را با یکدیگر ترکیب می‌کند. ابتدا یاد می‌گیرد که چطور خواست کاربران را تفسیر کند، سپس فکر می‌کند که تحول مورد نظر کاربر چطور به نظر می‌رسد.

آزمایش مدل هوش مصنوعی اپل

برای ویرایش یک عکس با MGIE، کاربران فقط نیاز است تا تحول موردنظر خود را تایپ کنند. محققان در مقاله خود برای نمایش کاربرد این مدل هوش مصنوعی، از عکس یک پیتزا پپرونی منفعت گیری کردند. آن‌ها دستور «آن را سالم‌تر کن» را به مدل اراعه کردند و در روبه رو، MGIE در عکس خود از سبزیجات بیشتری منفعت گیری کرده است. این چنین عکسی از چند ببر در این مقاله نیز وجود دارد که زیاد تاریک است و محققان با ثبت دستور «اضافه‌کردن کنتراست زیاد تر برای همانند‌سازی نور»، عکس روشن‌تری تشکیل کردند.

محققان در مقاله خود می‌گویند:

«ما مطالعات گسترده‌ای را از جنبه‌های گوناگون ویرایش انجام می‌دهیم و نشان می‌دهیم که MGIE ما به‌طور موثر کارکرد خود را در عین نگه داری کارایی رقابتی بهبود می‌بخشد. ما این چنین معتقدیم که چارچوب ‌هدایت‌شده توسط MLLM، در آینده می‌تواند به تحقیقات حوزه بینایی و زبان پشتیبانی کند.»

اپل MGIE را از طریق GitHub برای دانلود در دسترس قرار داده و این چنین نسخه آزمایشی تحت وب آن را در Hugging Face Spaces انتشار کرده است. اپل تا این مدت برنامه‌های خود در عرصه هوش مصنوعی را اظهار نکرده است و اشکار نیست که چه برنامه‌ای برای این مدل دارد.

[ad_2]

منبع