
Ars Technica
روز شنبه، سرویس تصویر هوش مصنوعی Midjourney آزمایش آلفا نسخه 4 (“v4”) مدل سنتز متن به تصویر خود را که برای مشترکین در سرور Discord در دسترس است، آغاز کرد. مدل جدید جزئیات بیشتری را نسبت به آنچه قبلاً در دسترس بود ارائه میکند، و الهام بخش برخی از هنرمندان هوش مصنوعی میشود که به این نکته توجه کنند که نسخه 4 تقریباً دریافت نتایج با کیفیت بالا از اعلانهای ساده را «بیش از حد آسان» میکند.
Midjourney در ماه مارس به عنوان بخشی از موج اولیه مدلهای سنتز تصویر هوش مصنوعی به روی عموم باز شد. به دلیل سبک متمایزش و به دلیل اینکه قبل از DALL-E و Stable Diffusion در دسترس عموم قرار گرفت، به سرعت طرفداران زیادی پیدا کرد. دیری نگذشت که آثار هنری ساخته شده توسط Midjourney با برنده شدن در مسابقات هنری، ارائه مطالبی برای ثبتهای بالقوه تاریخی حق چاپ و نمایش در وبسایتهای تصویرسازی سهام (که بعداً ممنوع شد) خبرساز شد.
با گذشت زمان، Midjourney مدل خود را با آموزش بیشتر، ویژگیهای جدید و جزئیات بیشتر اصلاح کرد. مدل پیشفرض فعلی، معروف به “v3” در ماه آگوست معرفی شد. اکنون Midjourney v4 توسط هزاران نفر از اعضای سرور Discord سرویس که تصاویر را از طریق ربات Midjourney ایجاد میکنند مورد آزمایش قرار میگیرد. کاربران در حال حاضر می توانند نسخه 4 را با اضافه کردن “–v 4” به درخواست های خود امتحان کنند.
دیوید هولز، بنیانگذار Midjourney در اعلامیه Discord نوشت: «V4 یک پایگاه کد کاملاً جدید و معماری کاملاً جدید هوش مصنوعی است. این اولین مدل ما است که بر روی یک ابرخوشه جدید هوش مصنوعی Midjourney آموزش دیده و بیش از 9 ماه در کار بوده است.

Ars Technica
در آزمایشهای مدل v4 Midjourney، متوجه شدیم که جزئیات بسیار بیشتری نسبت به نسخه 3 ارائه میکند، درک بهتری از اعلانها، ترکیببندی صحنههای بهتر و گاهی تناسب بهتر در موضوعات خود ارائه میدهد. هنگامی که به دنبال تصاویر فوتورئالیستی هستید، تشخیص برخی از نتایجی که دیدهایم از عکسهای واقعی با وضوح کمتر دشوار است.
به گفته هولز، سایر ویژگی های v4 عبارتند از:
– دانش بسیار بیشتر (در مورد موجودات، مکان ها و موارد دیگر)
– در درست کردن جزئیات کوچک (در همه شرایط) بسیار بهتر است
– به درخواست های پیچیده تر رسیدگی می کند (با سطوح مختلف جزئیات)
– بهتر است با صحنه های چند شی / چند شخصیت
– از عملکردهای پیشرفته مانند درخواست تصویر و چند فرمان پشتیبانی می کند
– پشتیبانی از –chaos arg (آن را از 0 تا 100 تنظیم کنید) برای کنترل انواع شبکه های تصویر
واکنش به Midjourney v4 روی Discord این سرویس مثبت بوده است، و طرفداران دیگر مدلهای سنتز تصویر – که به طور منظم با اعلانهای پیچیده دست به گریبان هستند تا به نتایج خوب دست یابند – توجه دارند.
یکی از Redditor به نام Jon Bristow در انجمن r/StableDiffusion پست کرد، “آیا کسی دیگر احساس می کند که Midjourney v4 “خیلی آسان” است؟ این “عکاسی از یک چهره از نمای نزدیک” بود و به نظر می رسد شما موفق به انجام آن نشده اید. از قبل ساخته شده بود.” در پاسخ، شخصی به شوخی گفت: “متأسفم برای مشاوران حرفه ای که شغل جدید خود را که یک ماه پیش ایجاد شده اند از دست خواهند داد.”
Midjourney می گوید که نسخه 4 هنوز در حالت آلفا است، بنابراین به مرور زمان به رفع ایرادات مدل جدید ادامه خواهد داد. این شرکت قصد دارد وضوح و کیفیت تصاویر ارتقا یافته نسخه 4 را افزایش دهد، نسبتهای صفحه سفارشی (مانند نسخه 3)، افزایش وضوح تصویر و کاهش مصنوعات متنی را اضافه کند. Midjourney با هزینه اشتراک ماهانه در دسترس است که بین 10 تا 50 دلار در ماه متغیر است.
با توجه به پیشرفتی که Midjourney در طول هشت ماه کار انجام داده است، ما نمی دانیم که پیشرفت سال آینده در سنتز تصویر چه به همراه خواهد داشت.
برو به بحث…
منبع: tarjome-news.ir