/2023.04.05/: Өнгөрсөн сард олон нийтийн сүлжээнд АНУ-ын ерөнхийлөгч асан Дональд Трамп Нью-Йорк хотын цагдаагийн албан хаагчдад баривчлагдлаа гэсэн мэдээлэл зурагтайгаа цацагдаж, олныг шуугиулсан.
Үүнтэй зэрэгцэн Ромын Пап лам Фрэнсис сөдөн хүрэм, цагаан пүүзтэй алхаж яваа зураг сошиал орчинд эрчимтэй тархсан билээ.
Дэлхий даяар олон сая хүмүүс энэ зурагт мэдээнд итгэж цааш нь түгээхдээ эдгээр зургууд нь бодитоор өрнөсөн үйл явдалтай огт холбоогүй, өөрөөр хэлбэл, хиймэл оюун ухааны тусламжтайгаар үүсгэсэн зурагт хууртсан гэдгээ хэд хоногийн дараа олж мэдсэн юм.
Бодит зургаас огт ялгарахгүй зураг дүрслэлийг хиймэл оюун ухаан хэрхэн үүсгэж бий болгодог талаар болон эдгээр программууд нь ямар технологи дээр суурилсан талаар бид товч мэдээлэл бэлтгэлээ.
AI Text To Image Generators гэж юу вэ?
Хиймэл оюун ухааны технологид суурилсан маш олон программ хангамж, үйлчилгээнүүд бидний өдөр тутмын амьдралд нэвтэрч байгаагийг нэг нь “text-to-image generators” буюу хэрэглэгчийн бичиж өгсөн текстээс зураг дүрслэл үүсгэгч программууд юм.
Интернэт орчин дахь тоо томшгүй зураг дүрслэлийг ашиглан, ‘artificial neural network’ буюу хиймэл нейроны сүлжээг хөгжүүлж бий болгосон эдгээр программууд нь эхлээд бичиж өгсөн текстийг хүлээн авч боловсруулаад, түүнийхээ дагуу зураг дүрслэл үүсгэдэг онцлогтой.
Текст бичиж өгөхөөс авахуулаад, бэлэн зураг үүсч бий болох хүртэл хэдхэн секунд шаардагддаг тул хэрэглэгч “уран бүтээл”-ээ тэр дор нь харах боломжтой.
Гэхдээ программ хангамж ийм өндөр түвшинд очих хүртэл нейроны сүлжээг маш их хэмжээний өгөгдөл ашиглан сургах шаардлага үүсдэг. Хэлд орж буй хүүхэд үгсийг хооронд нь холбож сурах, мөн ямар нэг биетийн оноосон нэрийг цээжлэх үйл явцыг дотроо нэг төсөөлөөд үзээрэй. Хиймэл нейроны сүлжээг сургах нь дээрхтэй яг ижил процесс бөгөөд хүнийг бодвол асар хурдтайгаар, мөн их хэмжээний өгөгдөлтэй нэг дор танилцаж сурах чадвартайгаараа ялгаатай.
Тоо томшгүй олон зурагтай танилцаж сургаснаар AI программ нь
- Ямар биетийг юу гэж нэрлэж байгааг сурч авах
- Зураг дээрх дүрслэлүүд, дүрүүд хоорондоо хэрхэн зохицдог, нийцэл үүсгэдэг талаарх ойлголтыг машин сургалтаар дамжуулан олж авдаг ажээ.
Ингэснээр AI программ нь хүний бичиж өгсөн текстийг оновчтой хүлээн авч боловсруулах чадвартай болох ба “хөөрхөн бяцхан гөлөг бөмбөгөөр тоглож байна” гэж бичсэн командыг биелүүлэхдээ өөрийн мэдлэгийн сангаас гөлөгний болон бөмбөгний дүрслэлийг сонгож аваад, эдгээр дүрслэлүүдийг яаж нэг зурагт буулгавал утга учиртай харагдах вэ гэдгийг мөн бодолцдог байна.
Хийсвэр төсөөлөл сайтай ч өөрөө зурах авьяасгүй хүмүүст эдгээр AI программууд маш их хэрэг болдог төдийгүй мэргэжлийн уран бүтээлчид ч ашиглах нь бий. Тиймдээ ч энэ төрлийн программууд нь энгийн хүмүүсээс эгэлгүй бүтээх төрөх боломжийг бий болгож, бүтээлч байдлыг урьд өмнө байгаагүйгээр дэмжсэн алхам болж байгаа билээ.
Одоогоор хэрэглэгчид Open AI компанийн бүтээл DALL-E, Midjouney Inc-ийн хөгжүүлсэн Midjourney болон Stability AI компанийн бүтээл Stable Diffusion зэрэг программыг түлхүү хэрэглэж байна.
Программ тус бүр өөр өөрийн давуу болон сул талтай бөгөөд товчхондоо Midjouney нь анхлан суралцагч болон энгийн хэрэглэгчдэд ойлгоход хялбар бүтэцтэй, байхад Stable Diffusion нь мэргэжлийн уран бүтээлчдэд түлхүү зориулагдсан нарийн чимхлүүр тохиргоотой, мөн ажиллуулахад өндөр хүчин чадалтай компьютер ашиглах шаардлага гардаг зэрэг онцлогтой.
Харин DALL-E нь хийсвэр сэтгэлгээ, уран сэтгэмжийн хувьд нөгөө хоёроосоо арай илүү боловч нийтийн хүртээл болж амжаагүй байна. Түүний хялбаршуулсан хувилбар болох DALL-E mini программыг үнэ төлбөргүй хэрэглэх боломжтой.
Гэвч хиймэл оюун ухаанд суурилсан зураг дүрслэл үүсгэх программын хөгжилтэй зэрэгцээд түүний талаарх эргэлзээ, маргаан дагуулсан асуудлууд гарсаар байна. 2022 оны есдүгээр сард бид дижитал уран зургийн тэмцээнд дээрх дурдсан Midjourney программ ашиглан зурсан уран бүтээл тэргүүн байранд шалгарч, мэргэжлийн уран бүтээлчдийн эгдүүцлийг төрүүлсэн талаар мэдээлж байсан.
Харин өнгөрсөн сард дэлхий даяар цахим орчинд AI ашиглаж үүсгэсэн зураг олон сая хүнийг итгүүлж чадсан нь энэ төрлийн технологи хөгжих нь боломжоос гадна эрсдэл дагуулж болохыг харуулсан үйл явдал болов.
Иймд AI хөгжүүлэгчид цаашид өөрсдийн бүтээгдэхүүний зүй зохистой хэрэглээнд анхаарч, худал мэдээлэл үүсгэх, түгээх болон буруу зорилгоор ашиглагдахаас сэргийлэх хязгаарлалтууд хийх байх гэсэн хүлээлт аяндаа төрж байна.
Хүсвэл бидний өмнө нийтэлсэн ChatGPT-ийн талаар мөн ЭНД ДАРЖ унших боломжтой.