مدل های انتشار تصاویر در هوش مصنوعی

یک چارچوب هوش مصنوعی جدید و بالقوه انقلابی به نام “Blackout Diffusion” تصاویری را از یک تصویر کاملاً خالی تولید می کند (مدل های انتشار تصاویر در هوش مصنوعی) به این معنی که بر خلاف سایر مدل های انتشار مولد، الگوریتم یادگیری ماشینی برای شروع نیازی به شروع تصادفی ندارد.
Blackout Diffusion که در کنفرانس بینالمللی اخیر در مورد یادگیری ماشین ارائه شد، با مدل های انتشار تصاویر در هوش مصنوعی که با مدلهای انتشار فعلی، مانند DALL-E یا Midjourney قابل مقایسه هستند ارائه می کند، اما به منابع محاسباتی کمتری نسبت به این مدلها نیاز دارند.
خاویر سانتوس، محقق هوش مصنوعی در آزمایشگاه ملی لوس آلاموس و یکی از نویسندگان این مقاله می گوید: مدل سازی مولد انقلاب صنعتی بعدی را با قابلیت کمک به بسیاری از وظایف، مانند تولید کد نرم افزار، اسناد قانونی، و حتی هنر به ارمغان می آورد.
میتوان از مدلسازی مولد برای انجام اکتشافات علمی استفاده کرد، و کار تیم ما پایه و الگوریتمهای عملی را برای استفاده از مدلسازی انتشار مولد برای مسائل علمی که ماهیت پیوسته ندارند، تعیین کرد.
مدل های انتشار تصاویر در هوش مصنوعی نمونههایی شبیه به دادههایی ایجاد میکنند که روی آنها آموزش دیدهاند. آنها با گرفتن یک تصویر و اضافه کردن مکرر نویز کار می کنند تا زمانی که تصویر قابل تشخیص باشد. در طول فرآیند، مدل سعی می کند یاد بگیرد که چگونه آن را به حالت اولیه خود بازگرداند.
مدلهای فعلی به نویز ورودی نیاز دارند، به این معنی که برای شروع تولید تصاویر به نوعی داده نیاز دارند.
ین تینگ لین، فیزیکدان لوس آلاموس که همکاری Blackout Diffusion را رهبری می کرد، گفت: ما نشان دادیم که کیفیت نمونه های تولید شده توسط Blackout Diffusion با مدل های فعلی با استفاده از یک فضای محاسباتی کوچکتر قابل مقایسه است.
بیشتر بخوانید:
کارت گرافیک دوگانه اینتل Arc B580؛ قدرتی نو در راه است؟
یکی دیگر از جنبه های منحصر به فرد Blackout Diffusion فضایی است که در آن کار می کند. مدل های انتشار تصاویر موجود در فضاهای پیوسته کار می کنند، به این معنی که فضایی که در آن کار می کنند متراکم و بی نهایت است. با این حال، کار در فضاهای پیوسته پتانسیل آنها را برای کاربردهای علمی محدود می کند.
لین گفت: «برای اجرای مدل های انتشار تصاویر در هوش مصنوعی مولد موجود، از نظر ریاضی، انتشار باید در یک حوزه پیوسته باشد نمیتواند گسسته باشد.
از سوی دیگر، چارچوب نظری تیم در فضاهای گسسته کار می کند (به این معنی که هر نقطه در فضا با فاصله ای از نقاط دیگر جدا شده است)، که فرصت هایی را برای کاربردهای مختلف مانند متن و کاربردهای علمی باز می کند.
این تیم Blackout Diffusion را روی تعدادی از مجموعه دادههای استاندارد شده، از جمله پایگاهداده موسسه ملی استاندارد و فناوری اصلاحشده، آزمایش کرد. مجموعه داده CIFAR-10 که دارای تصاویری از اشیاء در 10 حوزه مختلف است. و CelebFaces Attributes Dataset که از بیش از 200000 تصویر از چهره انسان تشکیل شده است.
علاوه بر این، این تیم از ماهیت گسسته Blackout Diffusion برای روشن کردن چندین تصور غلط در مورد چگونگی مدل های انتشار تصاویر در هوش مصنوعی در داخل استفاده کرد و درک انتقادی از مدلهای انتشار مولد ارائه کرد.
آنها همچنین اصول طراحی را برای کاربردهای علمی آینده ارائه می کنند. لین گفت: «این اولین مطالعه بنیادی در مورد مدل های انتشار تصاویر در هوش مصنوعی حالت گسسته را نشان میدهد و راه را برای کاربردهای علمی آینده با دادههای گسسته نشان میدهد.
این تیم توضیح میدهد که مدلسازی انتشار مولد به طور بالقوه میتواند زمان صرف شده برای اجرای بسیاری از شبیهسازیهای علمی بر روی ابررایانهها را به شدت افزایش دهد، که هم از پیشرفت علمی پشتیبانی میکند و هم ردپای کربن علم محاسبات را کاهش میدهد. برخی از نمونههای متنوعی که آنها ذکر میکنند، دینامیک مخزن زیرسطحی، مدلهای شیمیایی برای کشف دارو، و بیان ژن تک مولکولی و تک سلولی برای درک مکانیسمهای بیوشیمیایی در موجودات زنده است.
تالیف:
فروشگاه اینترنتی آ.اس.پ (اقتباس از مقالهای از Techxplore)
در صورت استفاده از این مقاله، نام و آدرس فروشگاه اینترنتی آ.اس.پ را به عنوان منبع ذکر کنید.