تصاویر بالا نشان دهنده تلاش هوش مصنوعی برای بازسازی برنده کلی سال 2021 است. عکسی از یک صبح مه آلود پاییزی در شمال ایتالیا که از یک کلیسای بالای تپه گرفته شده است.
دستورات متنی هستند که توسط اپراتورهای انسانی نوشته شده و به هوش مصنوعی می گویند که چه تصویری تولید کند.
در این تست، دستور فقط به این موضوع اشاره میکند که کلیسا در تصویر قرار دارد، اما به صراحت آن را به عنوان زاویه دید تعریف نمیکند. این ابهام باعث میشود Midjourney و Stable Diffusion عکسهایی از یک کلیسای روستایی به سبک ایتالیایی که توسط غبار صبحگاهی احاطه شده است تولید کنند. DALLE-2 تصویری بسیار نزدیکتر به برنده ایجاد میکند و یک دره مه آلود (البته از جمله یک برج کلیسا) ایجاد میکند که توسط خورشید ضعیف صبح روشن میشود.
این انجمن میگوید این نتایج اهمیت استفاده از سوژه مناسب و زمینه مناسب با هر تولیدکننده تصویر هوش مصنوعی را برجسته میکند و نشان میدهد که این نوع مقایسه مستقیم احتمالاً یک رقابت منصفانه نیست.
برای اینکه هوش مصنوعی تصاویر رقابتی تولید کند که می تواند مردم را فریب دهد تا عکس ها واقعی هستند، این انجمن دستورالعمل ها را تغییر داد تا شامل عباراتی مانند “برنده جایزه”، “4K” و توضیحات مکان ها و رویدادهای واقعی شود.
با تقسیمبندی به چهار موضوع، بینندگان میتوانند ایدهای درباره نحوه عملکرد تولیدکنندههای تصویر هوش مصنوعی مختلف داشته باشند. این انجمن DALL-E را به عنوان “عالی در ثبت فیزیک و ویژگی های ساختاری”، Midjourney را به عنوان “خلاق ترین در فرماندهی و شاید بهترین نور” و Stable Diffusion را به عنوان “در ترکیب بندی عالی” توصیف می کند.