با Stable Diffusion، ممکن است دیگر هرگز آنچه را که آنلاین می بینید باور نکنید


سه تصویر ایجاد شده با Stable Diffusion
بزرگنمایی کنید / آیا می دانستید که آبراهام لینکلن یک گاوچران بود؟ Stable Diffusion انجام می دهد.

بنج ادواردز / انتشار پایدار

تولید تصویر هوش مصنوعی در اینجا به شکل بزرگی است. یک مدل ترکیبی متن باز که به تازگی منتشر شده است به نام Stable Diffusion به هر کسی که یک رایانه شخصی و یک پردازنده گرافیکی مناسب دارد این امکان را می دهد تا تقریباً هر واقعیت بصری را که می تواند تصور کند، تداعی کند. این می تواند تقریباً هر سبک بصری را تقلید کند، و اگر یک عبارت توصیفی به آن بدهید، نتایج مانند جادو روی صفحه نمایش شما ظاهر می شود.

برخی از هنرمندان خوشحال هستند توسط چشم انداز، دیگران از آن راضی نیستندو به نظر می رسد که جامعه در کل هنوز تا حد زیادی از تحول سریع انقلاب فناوری که از طریق جوامع در توییتر، Discord و Github رخ می دهد، بی اطلاع است. سنتز تصویر مسلماً مفاهیمی به بزرگی اختراع دوربین – یا شاید ایجاد خود هنر بصری را به همراه دارد. حتی حس تاریخ ما نیز ممکن است به خطر بیفتد، بسته به اینکه اوضاع چگونه از بین برود. در هر صورت، Stable Diffusion موج جدیدی از ابزارهای خلاقانه یادگیری عمیق را رهبری می‌کند که آماده انقلابی در ایجاد رسانه‌های بصری هستند.

ظهور سنتز تصویر یادگیری عمیق

Stable Diffusion زاییده فکر عماد مستاک، مدیر سابق صندوق تامینی مستقر در لندن است که هدفش ارائه برنامه های جدید یادگیری عمیق به توده ها از طریق شرکت خود، Stability AI است. اما ریشه های سنتز تصویر مدرن به سال 2014 برمی گردد، و Stable Diffusion اولین مدل سنتز تصویر (ISM) نبود که امسال موج ایجاد کرد.

حتما بخوانید:
بسته بندی اصولی

در آوریل 2022، OpenAI DALL-E 2 را معرفی کرد، که رسانه های اجتماعی را با توانایی خود در تبدیل صحنه ای که با کلمات نوشته شده است (به نام “اعلان”) به تعداد زیادی از سبک های بصری که می تواند خارق العاده، واقعی یا حتی پیش پا افتاده باشد، شوکه کرد. افرادی با دسترسی ممتاز به ابزار بسته، فضانوردانی سوار بر اسب، خرس‌های عروسکی در حال خرید نان در مصر باستان، مجسمه‌های بدیع به سبک هنرمندان مشهور و موارد دیگر خلق کردند.

تصویری از وب سایت OpenAI DALL-E 2.
بزرگنمایی کنید / تصویری از وب سایت OpenAI DALL-E 2.

OpenAI

اندکی پس از DALL-E 2، گوگل و متا مدل های هوش مصنوعی متن به تصویر خود را معرفی کردند. MidJourney که از مارس 2022 به عنوان یک سرور Discord در دسترس است و چند ماه بعد برای عموم باز شد، برای دسترسی هزینه دریافت می‌کند و به افکت‌های مشابهی می‌رسد، اما با کیفیتی زیباتر و گویاتر از پیش‌فرض.

سپس Stable Diffusion وجود دارد. در 22 آگوست، Stability AI مدل تولید تصویر منبع باز خود را منتشر کرد که مسلماً از نظر کیفیت با DALL-E 2 مطابقت دارد. همچنین وب سایت تجاری خود را به نام DreamStudio راه اندازی کرد که دسترسی به زمان محاسبه برای تولید تصاویر با Stable Diffusion را می فروشد. برخلاف DALL-E 2، هر کسی می‌تواند از آن استفاده کند، و از آنجایی که کد انتشار پایدار منبع باز است، پروژه‌ها می‌توانند آن را با محدودیت‌های کمی ایجاد کنند.

تنها در هفته گذشته، ده‌ها پروژه که Stable Diffusion را در جهت‌های جدید رادیکال پیش می‌برد، شروع به کار کردند. و مردم با استفاده از تکنیکی به نام “img2img” که هنر بازی MS-DOS را “ارتقای” کرده است، به نتایج غیرمنتظره ای دست یافته اند. گرافیک Minecraft تبدیل شده است به صحنه های واقع گرایانه تبدیل شد، صحنه ای از علاءالدین را به سه بعدی تبدیل کرد، خط خطی های کودکانه را به تصاویری غنی ترجمه کرد و خیلی چیزهای دیگر. ترکیب تصویر ممکن است ظرفیت تجسم گسترده ایده‌ها را برای مخاطبان انبوه به ارمغان بیاورد، موانع ورود را کاهش دهد و در عین حال توانایی‌های هنرمندانی را که از این فناوری استقبال می‌کنند، تسریع بخشد، درست مانند Adobe Photoshop در دهه 1990.

حتما بخوانید:
قیمت و خرید لباس مرد عنکبوتی سیاه |09101717765
پرتره‌های Duke Nukem، The Secret of Monkey Island، King's Quest VI، و Star Control II به‌روزرسانی‌های فن‌های مبتنی بر انتشار پایدار را دریافت کردند.
بزرگنمایی کنید / پرتره‌های Duke Nukem، The Secret of Monkey Island، King’s Quest VI، و Star Control II به‌روزرسانی‌های فن‌های مبتنی بر انتشار پایدار را دریافت کردند.

اگر یک سری مراحل تا حدی محرمانه را دنبال کنید، می توانید Stable Diffusion را به صورت محلی اجرا کنید. در دو هفته گذشته، ما آن را بر روی رایانه شخصی ویندوزی با پردازنده گرافیکی 12 گیگابایتی Nvidia RTX 3060 اجرا کرده ایم. این می تواند تصاویر 512×512 را در حدود 10 ثانیه ایجاد کند. در 3090 Ti، این زمان به چهار ثانیه در هر تصویر کاهش می یابد. این رابط‌ها نیز به سرعت در حال تکامل هستند و از رابط‌های خط فرمان خام و نوت‌بوک‌های Google Colab به رابط‌های گرافیکی پیشرفته‌تر (اما هنوز پیچیده‌تر) جلو می‌روند، با رابط‌های بسیار صیقلی‌تر به زودی. بنابراین اگر از نظر فنی تمایل ندارید، محکم دست نگه دارید: راه حل های آسان تری در راه است. و اگر همه چیز شکست خورد، می توانید یک نسخه آزمایشی را به صورت آنلاین امتحان کنید.




منبع: tarjome-news.ir

دیدگاهتان را بنویسید

hacklink al hd film izle php shell indir siber güvenlik türkçe anime izle Fethiye Escort android rat duşakabin fiyatları fud crypter hack forum bayan escort - vip elit escort lyft accident lawyer garnet trade güvenilir mihtml nullednulled themesViagragercekhoca.org