مقالات ( بلاگ )

هوش مصنوعی DALL-E چیست؟ چطور رایگان از DALL-E استفاده کنیم؟

آیا تا به حال فکر کرده اید که یک اسب شاخدار در سفینه فضایی یا غروب خورشید به سبک ون گوگ چگونه خواهد بود؟ خوب، اکنون می توانید با DALL-E، یک سیستم هوش مصنوعی که می تواند تصاویر را از توضیحات متنی ایجاد کند، متوجه شوید. DALL-E توسط OpenAI، یک سازمان تحقیقاتی که مایکروسافت با آن شریک است، توسعه یافته است. DALL-E می‌تواند تصاویری اصلی، واقعی و گاهی شگفت‌انگیز تولید کند. می تواند مفاهیم، ​​ویژگی ها و سبک ها را به روش های مختلف ترکیب کند. در این مقاله، نحوه عملکرد DALL-E، کارهایی که می تواند و نمی تواند انجام دهد و چگونه می توانید از آن برای ایجاد تصاویر شگفت انگیز با هوش مصنوعی استفاده کنید را بررسی خواهیم کرد.

 تصویر اسب شاخ‌دار تولید شده توسط هوش مصنوعی

هوش مصنوعی چیست؟

هوش مصنوعی یا ai توانایی ماشین‌ها یا نرم‌افزارها برای انجام کارهایی است که به هوش انسانی نیاز دارد، مانند تشخیص گفتار، تصمیم‌گیری، یادگیری، حل مسئله و خلاقیت. هوش مصنوعی از الگوریتم ها و فناوری های مختلفی استفاده می کند که به نام های یادگیری ماشینی، پردازش زبان طبیعی، بینایی کامپیوتر و هوش محاسباتی نامیده می شوند. هوش مصنوعی را می توان به دو دسته تقسیم کرد: هوش مصنوعی باریک و هوش مصنوعی عمومی. هوش مصنوعی باریک نوعی از هوش مصنوعی است که فقط در یک حوزه خاص مانند ترجمه زبان یا بازی شطرنج عملکرد خوبی دارد. هوش مصنوعی عمومی نوعی از هوش مصنوعی است که می تواند در هر حوزه ای در سطح انسانی یا بالاتر از آن عمل کند.

هوش مصنوعی DALL-E چیست؟

DALL·E یک سیستم هوش مصنوعی است که می تواند تصاویر را از توضیحات متن ایجاد کند. این توسط OpenAI، یک سازمان تحقیقاتی که مایکروسافت با آن شریک است، توسعه یافته است. DALL·E می تواند تصاویری اصیل، واقعی و گاهی غافلگیرکننده ایجاد کند. می تواند مفاهیم، ​​ویژگی ها و سبک ها را به روش های مختلف ترکیب کند. به عنوان مثال می تواند یک تک شاخ، یک سفینه فضایی یا یک غروب خورشید را بکشد یا می تواند یک تک شاخ در یک سفینه فضایی یا غروب خورشید را به سبک ون گوگ بکشد.

 

DALL·E توسط یک مدل شبکه عصبی که از دو جزء CLIP و VQ-VAE استفاده می کند، تغذیه می شود. CLIP مدلی است که می تواند از هر جفت متن و تصویر یاد بگیرد و کارهای مختلفی مانند طبقه بندی تصویر، تشخیص اشیا و زیرنویس را انجام دهد. VQ-VAE مدلی است که می تواند یک تصویر را به یک نمایش با ابعاد پایین تر فشرده کند و سپس آن را به یک تصویر با وضوح بالا بازسازی کند. با ترکیب این دو مدل، DALL·E می‌تواند یک تصویر را به دنباله‌ای از نشانه‌های گسسته رمزگذاری کند و سپس آن را بر اساس یک پیام متنی دوباره به تصویر رمزگشایی کند.

 

DALL·E از نام هنرمند سالوادور دالی و شخصیت پیکسار WALL·E نامگذاری شده است. این توسط OpenAI در ژانویه 2021 معرفی شد. از آن زمان، OpenAI چندین به روز رسانی و بهبود برای DALL·E منتشر کرده است، مانند outpainting²، inpainting³ و variations4. در جولای 2022، OpenAI DALL·E 25 را راه‌اندازی کرد که تصاویر واقعی‌تر و دقیق‌تر را با وضوح 4 برابر بیشتر از DALL·E 1 تولید می‌کند. در اکتبر 2022، OpenAI DALL·E 3 را معرفی کرد که به طور قابل‌توجهی تفاوت‌های ظریف و جزئیات بیشتری را نسبت به نسخه‌های قبلی درک می‌کند.

 

DALL·E از طریق وب سایت OpenAI در دسترس عموم است، که می توانید آن را به صورت رایگان با برخی محدودیت ها امتحان کنید. همچنین می توانید از طریق ChatGPT به DALL·E دسترسی پیدا کنید، که یک چت ربات هوش مصنوعی است که از مدل GPT-4 OpenAI استفاده می کند. ChatGPT می تواند به شما کمک کند تا درخواست های مناسب برای DALL·E ایجاد کنید و تصاویر خود را با بازخورد ساده اصلاح کنید. همچنین می توانید از DALL·E از طریق API OpenAI استفاده کنید، که به شما امکان می دهد DALL·E را در برنامه های خود ادغام کنید.

 

DALL·E ابزاری سرگرم‌کننده و خلاق است که به شما امکان می‌دهد خود را ابراز کنید و امکانات جدید را با هوش مصنوعی کشف کنید. شما می توانید از آن برای ساخت آثار هنری، طراحی لوگو، تولید میم و موارد دیگر استفاده کنید. با این حال، قوانین و محدودیت هایی وجود دارد که باید از آنها آگاه باشید:

  • -شما نباید از DALL·E برای ایجاد تصاویر مضر، توهین آمیز، غیرقانونی یا ناقض حقوق دیگران استفاده کنید. DALL·E چنین تصاویری را فیلتر می‌کند و در صورت نقض شرایط استفاده، ممکن است حساب شما را تعلیق کند.
  • – باید به حریم خصوصی و مالکیت معنوی دیگران احترام بگذارید. از DALL·E برای ایجاد تصاویری که حاوی اطلاعات شخصی، داده های حساس یا محتوای دارای حق چاپ هستند استفاده نکنید.
  • – باید منبع تصاویری را که با DALL·E ایجاد می کنید، بشناسید. آنها را به عنوان مال خود ادعا نکنید و بدون اجازه از آنها برای مقاصد تجاری استفاده نکنید.

مزایای استفاده از هوش مصنوعی DALL-E چیست؟

برخی از مزایای استفاده از هوش مصنوعی DALL-E عبارتند از:

  • – DALL-E می تواند تصاویر اصلی، واقعی و گاهی شگفت انگیز را از توضیحات متن ایجاد کند. می تواند مفاهیم، ​​ویژگی ها و سبک ها را به روش های مختلف ترکیب کند. به عنوان مثال، می تواند یک تکشاخ در یک سفینه فضایی یا غروب خورشید را به سبک ون گوگ بکشد.
  • – DALL-E توسط یک مدل شبکه عصبی تغذیه می شود که از دو جزء CLIP و VQ-VAE استفاده می کند. CLIP مدلی است که می تواند از هر جفت متن و تصویر یاد بگیرد و کارهای مختلفی مانند طبقه بندی تصویر، تشخیص اشیا و زیرنویس را انجام دهد. VQ-VAE مدلی است که می‌تواند یک تصویر را به یک نمایش با ابعاد پایین‌تر فشرده کند و سپس آن را دوباره به یک تصویر با وضوح بالا بازسازی کند.
  • – DALL-E از طریق پلتفرم های مختلف مانند وب سایت OpenAI، ChatGPT و Bing Image Creator در دسترس عموم است. می‌توانید از DALL-E برای ایجاد تصاویر شگفت‌انگیز با هوش مصنوعی استفاده کنید، اما باید از برخی محدودیت‌ها و قوانینی که برای استفاده از آن اعمال می‌شود آگاه باشید.
  • – DALL-E یک ابزار سرگرم کننده و خلاق است که به شما امکان می دهد خود را بیان کنید و امکانات جدید را با هوش مصنوعی کشف کنید. می‌توانید از آن برای ساختن هنر، طراحی لوگو، تولید میم‌ها و موارد دیگر استفاده کنید.

تفاوت DALL-E و GPT–4 چیست؟

DALL-E و GPT-4 هر دو سیستم های هوش مصنوعی هستند که می توانند متن و تصاویر را از پیام های متنی ایجاد کنند. آنها توسط OpenAI، یک سازمان تحقیقاتی که مایکروسافت با آن شریک است، توسعه یافته اند. با این حال، آنها تفاوت هایی در ویژگی ها، قابلیت ها و کاربردهای خود دارند.

 

DALL-E یک سیستم هوش مصنوعی است که می تواند تصاویر را از توضیحات متن ایجاد کند. این می تواند تصاویری اصیل، واقعی و گاهی شگفت انگیز ایجاد کند. می تواند مفاهیم، ​​ویژگی ها و سبک ها را به روش های مختلف ترکیب کند. به عنوان مثال، می تواند یک تکشاخ در یک سفینه فضایی یا غروب خورشید را به سبک ون گوگ بکشد. DALL-E توسط یک مدل شبکه عصبی تغذیه می شود که از دو جزء CLIP و VQ-VAE استفاده می کند. CLIP مدلی است که می تواند از هر جفت متن و تصویر یاد بگیرد و کارهای مختلفی مانند طبقه بندی تصویر، تشخیص اشیا و زیرنویس را انجام دهد. VQ-VAE مدلی است که می تواند یک تصویر را به یک نمایش با ابعاد پایین تر فشرده کند و سپس آن را به یک تصویر با وضوح بالا بازسازی کند. با ترکیب این دو مدل، DALL-E می‌تواند یک تصویر را به دنباله‌ای از نشانه‌های مجزا رمزگذاری کند و سپس آن را بر اساس یک اعلان متنی به یک تصویر رمزگشایی کند.

 

GPT-4 یک سیستم هوش مصنوعی است که می تواند متنی را از پیام های متنی ایجاد کند. می تواند متنی منسجم، روان و مرتبط تولید کند. می تواند وظایف مختلفی مانند درک زبان طبیعی، تولید زبان طبیعی و تعامل زبان طبیعی را انجام دهد. به عنوان مثال، می تواند به سؤالات پاسخ دهد، مقاله بنویسد یا با انسان چت کند. GPT-4 توسط یک مدل شبکه عصبی که از معماری ترانسفورماتور استفاده می کند تغذیه می شود. ترانسفورماتور مدلی است که می تواند از هر دنباله ای از داده ها مانند کلمات، جملات یا پاراگراف ها یاد بگیرد. از مکانیسم های توجه برای تمرکز بر مهمترین بخش های داده ها و نادیده گرفتن موارد نامربوط استفاده می کند. با استفاده از تعداد زیادی لایه و پارامتر، GPT-4 می‌تواند از حجم عظیمی از داده‌های متنی بیاموزد و متنی با کیفیت بالا بر اساس اعلان متن² تولید کند.

 

DALL-E و GPT-4 هر دو از طریق پلتفرم های مختلف مانند وب سایت OpenAI، ChatGPT و Bing Image Creator در دسترس عموم هستند. شما می توانید از DALL-E و GPT-4 برای ایجاد متن و تصاویر شگفت انگیز با هوش مصنوعی استفاده کنید، اما باید از محدودیت ها و قوانینی که در مورد استفاده از آنها اعمال می شود آگاه باشید. می توانید از این منابع درباره DALL-E و GPT-4 و نحوه کار آنها بیشتر بیاموزید:

 

  1.  DALL·E: ایجاد تصاویر از متن¹
  2.  GPT-4: مدل های زبان یادگیرندگان کمی هستند²
  3.  نحوه استفاده از Bing Image Creator: Comprehensive Guides (2023)³
  4.  نحوه استفاده از Bing Image Creator برای ایجاد تصاویر جالب هوش مصنوعی⁴

چطور با هوش مصنوعی DALL-E عکس ایجاد کنیم؟

DALL-E یک سیستم هوش مصنوعی است که می تواند تصاویر را از توضیحات متن ایجاد کند. این توسط OpenAI، یک سازمان تحقیقاتی که مایکروسافت با آن شریک است، توسعه یافته است. DALL-E می‌تواند تصاویری اصلی، واقعی و گاهی شگفت‌انگیز تولید کند. می تواند مفاهیم، ​​ویژگی ها و سبک ها را به روش های مختلف ترکیب کند. به عنوان مثال، می تواند یک تکشاخ در یک سفینه فضایی یا غروب خورشید را به سبک ون گوگ بکشد.

 

برای ایجاد عکس با هوش مصنوعی DALL-E می توانید از یکی از پلتفرم های زیر استفاده کنید:

 

وب‌سایت OpenAI: می‌توانید به وب‌سایت OpenAI بروید و پیام متنی خود را در کادر جستجو وارد کنید. یک اعلان توضیح متنی است که می خواهید تصویر به چه شکل باشد. برای مثال، می‌توانید «یک گربه زیبا با عینک آفتابی» یا «قلعه فانتزی در ابرها» را تایپ کنید. سپس چندین گزینه از تصاویر تولید شده توسط DALL-E را بر اساس درخواست شما مشاهده خواهید کرد. همچنین می توانید برخی از پارامترها مانند دما و نمونه برداری از بالا را برای تغییر تصادفی یا تنوع تصاویر تنظیم کنید.

ChatGPT: می‌توانید از ChatGPT، یک ربات چت هوش مصنوعی که از مدل GPT-4 OpenAI استفاده می‌کند، برای تعامل با DALL-E با استفاده از زبان طبیعی استفاده کنید. می توانید به ChatGPT بروید و DALL-E 3 Beta را از منوی کشویی در بالای صفحه انتخاب کنید. سپس می‌توانید درخواست خود را تایپ کنید یا از ChatGPT بخواهید که به شما در تولید آن کمک کند. سپس ChatGPT چهار تصویر ایجاد شده توسط DALL-E را بر اساس درخواست شما به شما نشان می دهد. همچنین می توانید به ChatGPT بازخورد بدهید تا تصاویر خود را با دستورات ساده اصلاح کند.

Bing Image Creator: می توانید از Bing Image Creator استفاده کنید، قابلیتی که به شما امکان می دهد با هوش مصنوعی تصاویر شگفت انگیزی ایجاد کنید. می توانید به چت بینگ بروید یا مایکروسافت اج را باز کنید و نماد چت بینگ یا ایجاد تصویر بینگ را در نوار کناری انتخاب کنید. سپس می‌توانید درخواست خود را در کادر جستجو وارد کنید یا یکی از دسته‌های پیشنهادی را انتخاب کنید. سپس Bing Image Creator چندین گزینه از تصاویر ایجاد شده توسط DALL-E را بر اساس درخواست شما به شما نشان می دهد. همچنین می توانید تصاویر خود را ویرایش، ذخیره یا با دیگران به اشتراک بگذارید.

DALL-E یک ابزار سرگرم کننده و خلاق است که به شما امکان می دهد خود را بیان کنید و امکانات جدید را با هوش مصنوعی کشف کنید. شما می توانید از آن برای ساخت آثار هنری، طراحی لوگو، تولید میم و موارد دیگر استفاده کنید. با این حال، قوانین و محدودیت هایی وجود دارد که باید از آنها آگاه باشید:

 

  • شما نباید از DALL-E برای ایجاد تصاویر مضر، توهین آمیز، غیرقانونی یا ناقض حقوق دیگران استفاده کنید. DALL-E چنین تصاویری را فیلتر می‌کند و در صورت نقض شرایط استفاده ممکن است حساب شما را تعلیق کند.
  • شما باید به حریم خصوصی و مالکیت معنوی دیگران احترام بگذارید. از DALL-E برای ایجاد تصاویری که حاوی اطلاعات شخصی، داده های حساس یا محتوای دارای حق چاپ هستند استفاده نکنید.
  • شما باید منبع تصاویری را که با DALL-E ایجاد می‌کنید، بشناسید. آنها را به عنوان مال خود ادعا نکنید و بدون اجازه از آنها برای مقاصد تجاری استفاده نکنید.

 

تفاوت DALL-E با بقیه هوش‌های مصنوعی؟

Bing Image Creator قابلیتی است که به شما امکان می دهد با هوش مصنوعی تصاویر شگفت انگیزی ایجاد کنید. شما می توانید از آن برای ساخت آثار هنری، طراحی لوگو، تولید میم و موارد دیگر استفاده کنید. با این حال، Bing Image Creator تنها سازنده تصویر در بازار نیست. سازندگان تصویر دیگری نیز وجود دارند که ویژگی ها، قابلیت ها و قیمت های متفاوتی دارند. در اینجا مقایسه مختصری از Bing Image Creator با برخی از دیگر سازندگان تصویر محبوب وجود دارد:

 

– DALL·E 2: DALL·E 2 یک سیستم هوش مصنوعی است که می تواند تصاویر را از توضیحات متن ایجاد کند. این توسط OpenAI، یک سازمان تحقیقاتی که مایکروسافت با آن شریک است، توسعه یافته است. DALL·E 2 می تواند تصاویری اصیل، واقعی و گاهی غافلگیرکننده ایجاد کند. می تواند مفاهیم، ​​ویژگی ها و سبک ها را به روش های مختلف ترکیب کند. به عنوان مثال، می تواند یک تکشاخ در یک سفینه فضایی یا غروب خورشید را به سبک ون گوگ بکشد. DALL·E 2 از طریق وب سایت OpenAI در دسترس عموم است، که می توانید آن را به صورت رایگان با برخی محدودیت ها امتحان کنید. همچنین می‌توانید از طریق ChatGPT به DALL·E 2 دسترسی داشته باشید که یک ربات چت هوش مصنوعی است که از مدل GPT-4 OpenAI استفاده می‌کند. ChatGPT می تواند به شما کمک کند تا درخواست های مناسب برای DALL·E 2 ایجاد کنید و تصاویر خود را با بازخورد ساده اصلاح کنید. همچنین می توانید از DALL·E 2 از طریق API OpenAI استفاده کنید، که به شما امکان می دهد DALL·E 2 را در برنامه های خود ادغام کنید. استفاده از DALL·E 2 رایگان است اگرچه فقط 15 اعتبار رایگان در ماه دریافت خواهید کرد. اعتبارهای اضافی را می توان با قیمت 15 دلار برای 115 درخواست اضافی خریداری کرد.

 

  • – Midjourney: Midjourney یک تولید کننده تصویر قدرتمند هوش مصنوعی است که تمایل دارد در جزئیات دقیق و ویژگی های صورت بهتر کار کند. این می تواند هر چیزی از تصاویر سبک گرفته تا تصاویر واقعی عکس را مدیریت کند و کنترل بیشتری را در فرآیند ایجاد ارائه می دهد. Midjourney در Discord، یک پلت فرم ارتباط اجتماعی میزبانی می شود. می توانید با پیوستن به سرور Discord و استفاده از دستورات اسلش برای تولید تصاویر از Midjourney استفاده کنید. Midjourney همچنین دارای یک برنامه وب است که به شما امکان می دهد تصاویر خود را آپلود کنید و عناصر هوش مصنوعی را به آنها اضافه کنید. استفاده از Midjourney رایگان نیست. این سه طرح اشتراک را ارائه می دهد: Basic (5 دلار در ماه)، Pro (10 دلار در ماه) و Premium (20 دلار در ماه). هر طرح به شما تعداد متفاوتی از اعتبارات تصویری در ماه و همچنین دسترسی به ویژگی‌ها و مزایای مختلف را می‌دهد.
  • – Microsoft Designer: Microsoft Designer یک ویژگی است که به شما کمک می کند ارائه ها، اسناد و خبرنامه هایی با ظاهر حرفه ای با پیشنهادها و الگوهای مبتنی بر هوش مصنوعی ایجاد کنید. مایکروسافت دیزاینر همچنین می‌تواند تصاویر را از پیام‌های متنی تولید کند، اما فقط برای دسته‌های خاص مانند نمادها، برچسب‌ها، نمودارها، نمودارها و نقشه‌ها. Microsoft Designer با برنامه های Microsoft 365 مانند PowerPoint، Word، Outlook و Teams یکپارچه شده است. می‌توانید با تایپ درخواست خود در کادر جستجو یا انتخاب یکی از دسته‌های پیشنهادی، از Microsoft Designer استفاده کنید. Microsoft Designer سپس چندین گزینه را برای انتخاب یا ویرایش بیشتر به شما نشان می دهد. Microsoft Designer برای مشترکین Microsoft 365 رایگان است.

همانطور که می بینید، Bing Image Creator نقاط قوت و ضعف خاص خود را در مقایسه با سایر سازندگان تصویر دارد. Bing Image Creator کاملا رایگان و برای استفاده آسان است. این می تواند تصاویر را در سبک ها و فرمت های مختلف مانند عکس های واقعی، کارتون ها، طرح ها، نقاشی ها، آرم ها، آیکون ها و موارد دیگر ایجاد کند. با این حال، Bing Image Creator همیشه تصاویری با کیفیت بالا یا ثابت تولید نمی کند. اغلب با ویژگی های صورت و جزئیات ظریف دست و پنجه نرم می کند. همچنین ابزار ویرایش یا دکمه های تغییرات سریع ندارد.

آیا DALL-E یک ai هست یا یک سرویس و خدمات؟

DALL-E یک سیستم هوش مصنوعی است که می تواند تصاویر را از توضیحات متن ایجاد کند. این توسط OpenAI، یک سازمان تحقیقاتی که مایکروسافت با آن شریک است، توسعه یافته است. DALL-E یک سرویس نیست، بلکه یک ویژگی است که از طریق پلتفرم های مختلف مانند وب سایت OpenAI، ChatGPT و Bing Image Creator در دسترس است. شما می توانید از DALL-E برای ایجاد تصاویر شگفت انگیز با هوش مصنوعی استفاده کنید، اما باید از محدودیت ها و قوانینی که برای استفاده از آن اعمال می شود آگاه باشید.

 

آیا از عکس‌های DALL-E (دال-ای) می‌توان مقاصد تجاری استفاده کرد؟

خیر، نمی توانید از Bing Image Creator برای مقاصد تجاری استفاده کنید. با توجه به بخش شرایط استفاده از Bing’s Image Creator، شما فقط می‌توانید از تصاویری که ایجاد می‌کنید برای “هدف شخصی قانونی و غیرتجاری” استفاده کنید. این بدان معنی است که شما نمی توانید به هیچ وجه تصاویر را بفروشید، مجوز دهید یا از آن سود ببرید. همچنین نمی توانید از تصاویر برای تبلیغ یا تبلیغ هر محصول، خدمات یا برندی استفاده کنید. اگر می‌خواهید از تصاویر برای مقاصد تجاری استفاده کنید، باید از مایکروسافت اجازه بگیرید و اعتبار ایجاد تصویر را بپردازید.

 

Bing Image Creator قابلیتی است که به شما امکان می دهد با هوش مصنوعی تصاویر شگفت انگیزی ایجاد کنید. شما می توانید از آن برای ساخت آثار هنری، طراحی لوگو، تولید میم و موارد دیگر استفاده کنید. با این حال، محدودیت ها و قوانینی وجود دارد که باید از آنها آگاه باشید:

  • – شما فقط می توانید 100 تصویر را به صورت رایگان در هر حساب ایجاد کنید. اگر می خواهید تصاویر بیشتری ایجاد کنید، باید برای اعتبار ایجاد تصویر هزینه کنید.
  • – شما نباید از Bing Image Creator برای ایجاد تصاویر مضر، توهین آمیز، غیرقانونی یا ناقض حقوق دیگران استفاده کنید. Bing Image Creator چنین تصاویری را فیلتر می‌کند و در صورت نقض شرایط استفاده، ممکن است حساب شما را تعلیق کند.
  • – باید به حریم خصوصی و مالکیت معنوی دیگران احترام بگذارید. از Bing Image Creator برای ایجاد تصاویری که حاوی اطلاعات شخصی، داده های حساس یا محتوای دارای حق چاپ هستند استفاده نکنید.
  • – باید منبع تصاویری را که با Bing Image Creator ایجاد می‌کنید، بشناسید. آنها را به عنوان مال خود ادعا نکنید و بدون اجازه از آنها برای مقاصد تجاری استفاده نکنید.

آیا می توانم از DALL·E برای ایجاد تصاویر برای وبلاگ یا وب‌سایت خود استفاده کنم؟

این بستگی به هدف و محتوای وبلاگ یا وب سایت شما دارد. طبق مرکز راهنمای OpenAI¹، می‌توانید از DALL·E برای ایجاد تصاویر فقط برای استفاده شخصی و غیرتجاری خود استفاده کنید. این بدان معنی است که شما نمی توانید به هیچ وجه تصاویر را بفروشید، مجوز دهید یا از آن سود ببرید. همچنین نمی توانید از تصاویر برای تبلیغ یا تبلیغ هر محصول، خدمات یا برندی استفاده کنید. اگر می‌خواهید از DALL·E برای هر هدف تجاری استفاده کنید، باید از مایکروسافت اجازه بگیرید و اعتبارات ایجاد تصویر را بپردازید.

 

با این حال، برخی از کاربران گزارش داده‌اند که قصد دارند از تصاویر DALL·E برای پروژه‌های تجاری استفاده کنند، مانند تصویرسازی برای کتاب‌های کودکان، هنر برای خبرنامه‌ها، هنر مفهومی و شخصیت‌ها برای بازی‌ها، تابلوهای روحی برای مشاوره طراحی، و استوری‌برد برای فیلم‌ها⁴. OpenAI به صراحت اعلام نکرده است که آیا این مجاز است یا خیر، اما ممکن است به ماهیت و محدوده پروژه بستگی داشته باشد. قبل از استفاده از تصاویر DALL·E برای هر هدف تجاری، باید با یک متخصص حقوقی مشورت کنید.

 

در هر صورت همیشه باید به حریم خصوصی و مالکیت معنوی دیگران احترام بگذارید. از DALL·E برای ایجاد تصاویری که حاوی اطلاعات شخصی، داده های حساس یا محتوای دارای حق چاپ هستند استفاده نکنید. همچنین باید منبع تصاویری را که با DALL·E ایجاد می‌کنید، بشناسید. آنها را به عنوان مال خود ادعا نکنید یا بدون اجازه از آنها استفاده نکنید.

چطور کیفیت تصاویر تولید شده توسط هوش مصنوعی را بهتر کنم؟

کیفیت تصاویر تولید شده توسط Bing Image Creator به عوامل متعددی مانند اعلان متن، پارامترهای مدل و تکنیک‌های پس از پردازش بستگی دارد. در اینجا چند نکته در مورد چگونگی بهبود کیفیت تصاویر تولید شده توسط Bing Image Creator آورده شده است:

  • – اعلان‌های واضح و خاص بنویسید: Bing Image Creator می‌تواند تصاویر را از هر متنی ایجاد کند، اما زمانی که متن مختصر، توصیفی و بدون ابهام باشد، بهتر عمل می‌کند. به عنوان مثال، به جای نوشتن “یک سگ” می توانید بنویسید “لابرادور رتریور قهوه ای با قلاده قرمز”. همچنین می‌توانید از صفت‌ها، قیدها و اصلاح‌کننده‌ها برای اضافه کردن جزئیات و تغییرات بیشتر به درخواست‌های خود استفاده کنید. به عنوان مثال، می توانید بنویسید “یک سگ کارتونی زیبا با عینک آفتابی و کلاه” یا “یک نقاشی واقع گرایانه از یک سگ به سبک مونه”.
  • – آزمایش با پارامترهای مختلف: Bing Image Creator دارای چندین پارامتر است که می توان آنها را برای بهبود عملکرد آن تنظیم کرد، مانند دما، نمونه برداری top-p و اندازه تصویر. دما تصادفی یا تنوع تصاویر تولید شده را کنترل می کند. دمای بالاتر باعث ایجاد تصاویر متنوع و خلاقانه تر و همچنین خطاها و نویز بیشتری می شود. دمای پایین‌تر، تصاویر ثابت‌تر و دقیق‌تری را تولید می‌کند، اما تصاویر خسته‌کننده‌تر و تکراری‌تری نیز ایجاد می‌کند. نمونه برداری Top-p احتمال انتخاب توکن ها یا پیکسل های محتمل برای تصویر را کنترل می کند. نمونه برداری بالاتر از top-p تصاویر منسجم و واقعی تر، اما همچنین تصاویر قابل پیش بینی تر و مشابه را تولید می کند. نمونه‌برداری پایین‌تر از بالا، تصاویر شگفت‌انگیز و بدیع‌تر، اما همچنین تصاویر تحریف‌شده‌تر و غیرواقعی‌تر را تولید می‌کند. اندازه تصویر وضوح یا کیفیت تصاویر تولید شده را کنترل می کند. اندازه تصویر بزرگتر، تصاویر دقیق تر و واضح تر، اما زمان و هزینه محاسبات بیشتری را تولید می کند. اندازه تصویر کوچکتر، تصاویری با جزئیات کمتر و تار ایجاد می کند، اما زمان و هزینه محاسباتی کمتری نیز ایجاد می کند.
  • – از تکنیک های پس پردازش استفاده کنید: Bing Image Creator می تواند تصاویری اصیل، واقعی و گاهی شگفت انگیز ایجاد کند، اما همیشه کامل یا رضایت بخش نیستند. شما می توانید از تکنیک های پس پردازش برای بهبود یا اصلاح تصاویر تولید شده بر اساس ترجیحات یا نیازهای خود استفاده کنید. به عنوان مثال، می‌توانید از ابزارهایی مانند Topaz Photo AI¹، Photoshop² یا GIMP³ برای ارتقاء، تیز کردن، برش، چرخش، فیلتر کردن یا ویرایش تصاویر استفاده کنید. همچنین می‌توانید از ابزارهایی مانند Midjourney، Artbreeder یا RunwayML برای ایجاد تغییرات، درون‌یابی یا انیمیشن‌های تصاویر استفاده کنید.

نکاتی برای پرامپت‌نویسی بهتر در DALL-E

نوشتن دستورات بهتر مهارتی است که می تواند به شما کمک کند از دستیارهای نوشتن هوش مصنوعی مانند ChatGPT یا Grammarly بیشترین بهره را ببرید. دستورات دستورات متنی هستند که برای درخواست کاری مانند ایجاد پست وبلاگ، ایمیل یا داستان به دستیار نوشتن هوش مصنوعی وارد می‌کنید. یک درخواست خوب باید واضح، خاص و آموزنده باشد تا هوش مصنوعی بتواند نیازهای شما را درک کند و متنی با کیفیت بالا تولید کند که با انتظارات شما مطابقت داشته باشد. در اینجا چند نکته برای نوشتن دستورات بهتر وجود دارد:

 

  1. – دستورات را به زبان طبیعی بنویسید: دستیارهای نوشتن هوش مصنوعی برای درک زبان معمولی طراحی شده اند، بنابراین نیازی به استفاده از نحو پیچیده یا اصطلاحات فنی ندارید. فقط طوری عادی بنویس که انگار با یک انسان صحبت می کنی. به عنوان مثال، به جای نوشتن «یک پست وبلاگ 500 کلمه ای درباره مزایای مدیتیشن با کلمات کلیدی سئو ایجاد کنید»، می توانید بنویسید «یک پست وبلاگ بنویسید که چرا مدیتیشن برای شما خوب است و از کلماتی استفاده کنید که افراد در گوگل جستجو می کنند».
  2. – از مفاهیم پیچیده اجتناب کنید: دستیاران نوشتن هوش مصنوعی در مدیریت مفاهیم انتزاعی یا مبهم مانند کنایه، کنایه یا استعاره خیلی خوب نیستند. آنها ممکن است درخواست شما را اشتباه تفسیر کنند یا متنی را تولید کنند که بی معنی یا نامربوط است. سعی کنید از مفاهیم ساده و ملموسی استفاده کنید که هوش مصنوعی بتواند به راحتی آنها را درک کند. به عنوان مثال، به جای نوشتن «یک داستان خنده‌دار درباره گربه‌ای که فکر می‌کند سگ است» بنویسید، می‌توانید «داستانی بنویسید درباره گربه‌ای که مانند سگ رفتار می‌کند و همه را می‌خنداند».
  3. – از جزئیات خاص استفاده کنید: دستیاران نوشتن هوش مصنوعی زمانی بهتر کار می کنند که جزئیات و نمونه های خاصی را به آنها ارائه دهید که می تواند خلاقیت و منطق آنها را هدایت کند. هرچه جزئیات بیشتری ارائه دهید، متن تولید شده دقیق تر و مرتبط تر خواهد بود. به عنوان مثال، به جای نوشتن “یک ایمیل برای دعوت از کسی به جلسه” بنویسید، “یک ایمیل بنویسید تا جان اسمیت را به جلسه ای در روز دوشنبه در ساعت 10 صبح دعوت کنید تا در مورد پروژه جدید بحث کنید. دستور جلسه، مکان، و مدت زمان جلسه».
  4. – زمینه را ارائه دهید: دستیاران نوشتن هوش مصنوعی ممکن است دانش یا اطلاعات کافی در مورد کار یا موضوع شما نداشته باشند، به خصوص اگر تخصصی یا تخصصی باشد. می‌توانید با دادن اطلاعات زمینه‌ای یا زمینه‌ای که می‌تواند به آنها در درک پیام شما و تولید متن مناسب کمک کند. به عنوان مثال، به جای نوشتن “نوشتن توضیحات محصول برای ساعت هوشمند”، می توانید “نوشتن یک محصول” را بنویسید.
  5. توضیحاتی برای ساعت هوشمندی که ضربان قلب، کالری، قدم‌ها و کیفیت خواب شما را ردیابی می‌کند. این ساعت هوشمند Fitbit Sense نام دارد و قیمت آن 299 دلار است. این برای افرادی طراحی شده است که می خواهند سلامت و تناسب اندام خود را بهبود بخشند.”
    – گرامر و علائم نگارشی صحیح: دستیاران نوشتن هوش مصنوعی ممکن است نتوانند اشتباهات گرامری و نقطه گذاری شما را در دستور شما تصحیح کنند و حتی ممکن است آنها را در متن تولید شده کپی کنند. بنابراین، قبل از وارد کردن آن در دستیار نوشتن هوش مصنوعی، باید مطمئن شوید که دستور شما از نظر گرامری صحیح است و به درستی علامت گذاری شده است. این به هوش مصنوعی کمک می کند تا درخواست شما را بهتر درک کند و متنی با کیفیت بالاتر تولید کند. به عنوان مثال، به جای نوشتن «یک مقاله در مورد چگونگی تغییر جهان کووید-۱۹» بنویسید، می‌توانید «یک مقاله بنویسید که چگونه کووید-۱۹ دنیا را تغییر داد».

 

 

نتیجه‌گیری:

در نتیجه، DALL-E یک سیستم هوش مصنوعی است که می تواند تصاویر را از توضیحات متن ایجاد کند. این توسط OpenAI، یک سازمان تحقیقاتی که مایکروسافت با آن شریک است، توسعه یافته است. DALL-E می‌تواند تصاویری اصلی، واقعی و گاهی شگفت‌انگیز تولید کند. می تواند مفاهیم، ​​ویژگی ها و سبک ها را به روش های مختلف ترکیب کند. شما می توانید از DALL-E برای ایجاد تصاویر شگفت انگیز با هوش مصنوعی استفاده کنید، اما باید از محدودیت ها و قوانینی که برای استفاده از آن اعمال می شود آگاه باشید. شما می توانید از طریق پلتفرم های مختلف مانند وب سایت OpenAI، ChatGPT و Bing Image Creator به DALL-E دسترسی پیدا کنید. DALL-E یک ابزار سرگرم کننده و خلاق است که به شما امکان می دهد خود را بیان کنید و امکانات جدید را با هوش مصنوعی کشف کنید.

نوشته قبلی

چگونه طراح بهتری نسبت به خودتان باشید

نوشته بعدی

معرفی هوش مصنوعی بینگ مایکروسافت (bing image creator)

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

سبد خرید
ورود

هنوز حساب کاربری ندارید؟

ایجاد حساب کاربری