مدل های انتشار تصاویر در هوش مصنوعی - فروشگاه اینترنتی آ.اس.پ

یک چارچوب هوش مصنوعی جدید و بالقوه انقلابی به نام “Blackout Diffusion” تصاویری را از یک تصویر کاملاً خالی تولید می کند (مدل های انتشار تصاویر در هوش مصنوعی) به این معنی که بر خلاف سایر مدل های انتشار مولد، الگوریتم یادگیری ماشینی برای شروع نیازی به شروع تصادفی ندارد.

Blackout Diffusion که در کنفرانس بین‌المللی اخیر در مورد یادگیری ماشین ارائه شد، با مدل های انتشار تصاویر در هوش مصنوعی که با مدل‌های انتشار فعلی، مانند DALL-E یا Midjourney قابل مقایسه هستند ارائه می کند، اما به منابع محاسباتی کمتری نسبت به این مدل‌ها نیاز دارند.

خاویر سانتوس، محقق هوش مصنوعی در آزمایشگاه ملی لوس آلاموس و یکی از نویسندگان این مقاله می گوید: مدل سازی مولد انقلاب صنعتی بعدی را با قابلیت کمک به بسیاری از وظایف، مانند تولید کد نرم افزار، اسناد قانونی، و حتی هنر به ارمغان می آورد.

می‌توان از مدل‌سازی مولد برای انجام اکتشافات علمی استفاده کرد، و کار تیم ما پایه و الگوریتم‌های عملی را برای استفاده از مدل‌سازی انتشار مولد برای مسائل علمی که ماهیت پیوسته ندارند، تعیین کرد.

مدل های انتشار تصاویر در هوش مصنوعی نمونه‌هایی شبیه به داده‌هایی ایجاد می‌کنند که روی آنها آموزش دیده‌اند. آنها با گرفتن یک تصویر و اضافه کردن مکرر نویز کار می کنند تا زمانی که تصویر قابل تشخیص باشد. در طول فرآیند، مدل سعی می کند یاد بگیرد که چگونه آن را به حالت اولیه خود بازگرداند.

مدل‌های فعلی به نویز ورودی نیاز دارند، به این معنی که برای شروع تولید تصاویر به نوعی داده نیاز دارند.

ین تینگ لین، فیزیکدان لوس آلاموس که همکاری Blackout Diffusion را رهبری می کرد، گفت: ما نشان دادیم که کیفیت نمونه های تولید شده توسط Blackout Diffusion با مدل های فعلی با استفاده از یک فضای محاسباتی کوچکتر قابل مقایسه است.

بیشتر بخوانید: افشای داده‌های کاربران از طریق آدرس آی پی IP

یکی دیگر از جنبه های منحصر به فرد Blackout Diffusion فضایی است که در آن کار می کند. مدل های انتشار تصاویر موجود در فضاهای پیوسته کار می کنند، به این معنی که فضایی که در آن کار می کنند متراکم و بی نهایت است. با این حال، کار در فضاهای پیوسته پتانسیل آنها را برای کاربردهای علمی محدود می کند.

لین گفت: «برای اجرای مدل های انتشار تصاویر در هوش مصنوعی مولد موجود، از نظر ریاضی، انتشار باید در یک حوزه پیوسته باشد نمی‌تواند گسسته باشد.

از سوی دیگر، چارچوب نظری تیم در فضاهای گسسته کار می کند (به این معنی که هر نقطه در فضا با فاصله ای از نقاط دیگر جدا شده است)، که فرصت هایی را برای کاربردهای مختلف مانند متن و کاربردهای علمی باز می کند.

این تیم Blackout Diffusion را روی تعدادی از مجموعه داده‌های استاندارد شده، از جمله پایگاه‌داده موسسه ملی استاندارد و فناوری اصلاح‌شده، آزمایش کرد. مجموعه داده CIFAR-10 که دارای تصاویری از اشیاء در 10 حوزه مختلف است. و CelebFaces Attributes Dataset که از بیش از 200000 تصویر از چهره انسان تشکیل شده است.

علاوه بر این، این تیم از ماهیت گسسته Blackout Diffusion برای روشن کردن چندین تصور غلط در مورد چگونگی مدل های انتشار تصاویر در هوش مصنوعی در داخل استفاده کرد و درک انتقادی از مدل‌های انتشار مولد ارائه کرد.

آنها همچنین اصول طراحی را برای کاربردهای علمی آینده ارائه می کنند. لین گفت: «این اولین مطالعه بنیادی در مورد مدل های انتشار تصاویر در هوش مصنوعی حالت گسسته را نشان می‌دهد و راه را برای کاربردهای علمی آینده با داده‌های گسسته نشان می‌دهد.

این تیم توضیح می‌دهد که مدل‌سازی انتشار مولد به طور بالقوه می‌تواند زمان صرف شده برای اجرای بسیاری از شبیه‌سازی‌های علمی بر روی ابررایانه‌ها را به شدت افزایش دهد، که هم از پیشرفت علمی پشتیبانی می‌کند و هم ردپای کربن علم محاسبات را کاهش می‌دهد. برخی از نمونه‌های متنوعی که آنها ذکر می‌کنند، دینامیک مخزن زیرسطحی، مدل‌های شیمیایی برای کشف دارو، و بیان ژن تک مولکولی و تک سلولی برای درک مکانیسم‌های بیوشیمیایی در موجودات زنده است.

تالیف:
فروشگاه اینترنتی آ.اس.پ (اقتباس از مقاله‌ای از Techxplore)
در صورت استفاده از این مقاله، نام و آدرس فروشگاه اینترنتی آ.اس.پ را به عنوان منبع ذکر کنید.

لغو پاسخ