Хиймэл оюун ашиглан текстээр өгсөн командыг зураг дүрслэл болгон хувиргагч DALL-E платформ 3 дахь хувилбараа бэлэн болгожээ.
Энэ удаагийн хувилбар нь хэрэглэгчид ChatGPT ашиглан, зураг дүрслэл үүсгэх команд текст үүсгэх боломжтой болсон, аюулгүй байдлын хувьд илүү сайжирсан зэрэг онцлогтой ажээ.
DALL-E нь текст командыг зураг болгон хувиргадаг хиймэл оюуны программ бөгөөд өмнөх DALL-E 2 хувилбар нь өгөгдсөн текстийг орхигдуулах, буруу дүрслэх зэрэг алдаа гаргадаг байсан бол OpenAI компани энэ удаагийн шинэ хувилбар нь өгөгдсөн командыг маш сайн ойлгож, илүү нарийн дүрслэл үүсгэж чадна гэж мэдэгдсэн байна.
DALL-E 3 хувилбарын хамгийн том давуу тал нь ChatGPT-тэй нэгтгэгдсэн явдал бөгөөд ингэснээр хэрэглэгчид өөрсдөө DALL-E-д зориулсан урт командын текст өөрөө бодож боловсруулах шаардлагагүй, ямар зураг дүрслэл үүсгэх гэж байгаагаа ChatGPT-д тайлбарлаж өгөхөд, чатбот уг дэлгэрэнгүй командыг үүсгэж өгнө гэсэн үг. Текст команд хэдий чинээ дэлгэрэнгүй байхын хэрээр DALL-E илүү сайн зураг дүрслэл үүсгэдэг билээ.
The Verge мэдээллийн сайтад зориулан танилцуулга хийхдээ DALL-E бүтээгдэхүүний багийн ахлах судлаач Адитья Рамеш ChatGPT-д хандан, уулан дунд нээх рамен рестораны лого бүтээхэд туслахыг хүсэв. ChatGPT дэлгэрэнгүй текст команд үүсгэж, DALL-E уг командын дагуу логоны 4 өөр хувилбар гарган, санал болгожээ.
The Verge багийнханд хамгийн их таалагдсан нь мөнх цаст уулын оройг рамен гоймонгоор дүрсэлж, уулын салаагаар шөл урсаж, чанасан өндөгийг гоёлын чулуу шиг газарт шигтгэсэн лого байсан ч бодит амьдрал дээр рестораны лого гэхээсээ илүү ямар нэг брэндийн мерчандайз бүтээгдэхүүний зураг шиг харагдаж байв. Юутай ч OpenAI компанийн зүгээс DALL-E болон ChatGPT-г хослуулснаар хэрэглэгчид илүү сайн AI урлагийн бүтээл туурвих боломжтой болж байгаа гэжээ.
DALL-E анхны хувилбар 2021 оны нэгдүгээр сард нээлтээ хийхэд бусад ийм төрлийн платформууд болох Stability AI болон Midjourney нар бэлэн болоогүй байв. Гэвч DALL-E нь зураг дүрслэл үүсгэхдээ өрөөсгөл хандлага баримталдаг, мөн түүнийг ашиглан бодит мэт дүрслэлтэй зүй бус агуулга(explicit content) бүтээх явдал их байна гэсэн шүүмжлэл гарсны дагуу 2-р хувилбарыг 2022 онд гаргахын өмнө компанийн зүгээс хяналт тавих зорилгоор DALL-E 2 хэрэглэхийг хүссэн хэрэглэгчдийг жагсаалтанд бүртгэж үзжээ. Гэсэн ч 2022 оны есдүгээр сард OpenAI тус хүлээлгийн жагсаалтыг хүчингүй болгож, шинэ хувилбараа олон нийтэд нээлттэй ашиглуулахаар болсон юм.
Харин энэ удаагийн шинэ хувилбар нь аравдугаар сард хамгийн эхлээд ChatGPT Plus болон Enterprise хэрэглэгчдийн гар дээр очих бол дараа нь судалгааны лабораториуд болон API үйлчилгээний хэрэглэгчдэд нээлттэй болох ажээ. Харин олон нийтэд зориулсан үнэгүй хувилбар хэзээ гарах талаар мэдээлэл өгөөгүй байна.
OpenAI компани өмнөх хувилбарууд дээр гарсан шүүмжлэлүүдийг үйл ажиллагаандаа тусгаж ажилласны үр дүнд DALL-E 3 хувилбар дээр аливаа нэгэн байдлаар үзэн ядалт, доромжлол агуулсан зураг үүсгэхээс сэргийлэх аюулгүй байдлын арга хэмжээнүүд суулгаж өгчээ. Тэд энэ аюулгүй байдлын системийн цоорхойг эрж хайж, эвдэх зорилготой мэргэжилтнүүдийн багтай хамтран ажилласны үндсэн дээр командын текстийг ангилах, зүй бус болон хүчирхийлэл агуулсан дүрслэл үүсгэхэд ашигладаг үгсийг хэрэгсэхгүй орхих зэргийг машин сургалтын аргаар шинэ модельдоо суулгаж өгсөн байна. Мөн нэрийг нь оруулах байдлаар ямар нэгэн олны танил хүний зураг дүрслэлийг үүсгэж өгөхгүй байхаар тохируулга хийсэн гэжээ.
Тус компанийн бодлогын судалгааны ажилтан Сандини Агарвал дээр дурдсан аюулгүй байдлын системийг маш найдвартай гэж үнэлж байгаа ч шинэ модель нь төгс бүтээл биш учраас одоо ч сайжруулалт хийгдэж байна гэв.
Мөн тэд одоо амьд байгаа уран бүтээлчдийн бүтээл туурвих арга барилаар зураг үүсгэхгүй гэж мэдэгджээ. Учир нь DALL-E 2 хувилбарыг ашиглан, алдартай уран бүтээлчдийн уран зургийн хэв маягаар дуурайлган, зураг дүрслэл бүтээх явдал их гарсан билээ.
Мөн OpenAI компани оюуны өмчийн элдэв маргаанаас зайлсхийхийн тулд зураач, уран бүтээлчдийг өөрсдийн бүтээлүүдээ ирээдүйд бүтээгдэх текстээс зураг үүсгэгч AI программуудад ашиглуулахгүй байх сонголт санал болгож байна.
Зохиогчийн эрхийг нь эзэмшдэг зураг нь OpenAI-н вэбсайт дээр байршсан тохиолдолд хүсэлт гарган, устгуулж болох ба ингэснээр DALL-E-н дараагийн хувилбарууд цаашид дээрх уран бүтээлтэй төстэй болоод ижил арга барилаар бүтээгдсэн зургуудыг хэрэглэгчдэд харуулахгүй түгжих юм.
Ингэхийн учир нь хэсэг уран бүтээлчид DALL-E-н өрсөлдөгчид болох Stability AI, Midjourney платформууд болон DeviantArt уран зургийн вэбсайтууд хиймэл оюуны модель хөгжүүлэхдээ өөрсдийнх нь оюуны өмчийг зөвшөөрөлгүй ашигласан хэмээн шүүхэд өгсөн тохиолдол гарсан байдаг.
Эх сурвалж: theverge