/2023.11.28/ SpaceTalk#10 энэ удаад “Сонгуулийн үеэр AI технологийг ашиглан хийх хуурамч мэдээлэлтэй хэрхэн тэмцэж болох вэ, AI гэж юуг хэлээд байна вэ” гэдэг сэдвээр Онотой ярилцлаа. Оно АНУ-д дата аналистаар ажиллаж байсан, “Машин сургалтын эхлэл” номыг орчуулан гаргасан.
Ярилцлагыг твиттер орчинд сонсох боломжтой:
— Ари (@ariunbileg) November 22, 2023
-AI хөгжүүлэхэд хөрөнгө санхүүжилт хэр шаардлагатай вэ?
-Маш их. Юун түрүүнд, хүний нөөц буюу энэ чиглэлээрх мэргэжилтнүүд шаардлагатай. Монголд энэ талаар нэлээд дутагдалтай, ялангуяа AI чиглэлээр. Миний мэдэж байгаагаар Монгол Улсын хэмжээнд 20-30 хүн энэ чиглэлээр боломжийн туршлагатай болсон байх. Сонирхож, судалж байгаа хүмүүсийг нийлүүлвэл 200-300 болж магад. Хоёрдугаарт, тоо боддог процессор дутагдалтай. Энэ нь маш үнэтэй байдаг. Энэ процессор нь компьютерийн процессороос арай өөр буюу GPU нь зэрэгцээ байдлаар тоо бодоход илүү хурдан ажилладаг, энэ нь өндөр үнэтэй. Хэрэв би монгол хэлээр модель сургана гэвэл 2-3 ширхэг процессор хэрэгтэй. Гүүгл, Амазоны клауд компьютерийг ашиглая гэвэл цагаар төлбөр тооцдог учир нэлээн үнэтэй. Тэгээд процессороо угсрах гэх зэрэгт дахиад хүний нөөц хэрэгтэй. Open AI хөгжүүлэхэд зориулсан анхны супер компьютер 150 мянган долларын үнэтэй байсан гэдэг.
-AI-аар хаана суръя гэвэл хамгийн сургалт сайтай вэ?
-Би бол Хятад, эсвэл АНУ л гэж хэлнэ. Америк бол технологийн сургалтаараа илүү, мөн Silicon Valley-д хамгийн чадвартай мэргэжилтнүүд цуглачихсан ажиллаж байгаа гэдэг утгаараа. Гэхдээ Deep learning-аар патент авч байгаа тоогоороо Хятад АНУ-ыг давах болсон. Хятадын хэрэглэж байгаа моделиуд нэлээд сайжирсан харагдана лээ. АНУ-д PhD хийсэн хятад хүмүүс нутаг руугаа очиж ажилладаг, тэндээ технологийг өндөр хөгжүүлдэг. Мэдээж Энэтхэгийг бас дурьдахгүй байж болохгүй.
-AI дэлхий дахинд хэр хэмжээнд хүртлээ хөгжсөн бэ?
-ChatGPT өнгөрөгч жил гарч ирсэн бөгөөд саяхан API гаргасан. Энэ нь программ хөгжүүлэгчдэд тухайн үйлчилгээг гаргахад амархан аргыг бий болгочихлоо. ChatGPT-г мотор гэж үзвэл хөгжүүлэгчид өөрсдөө мотор хийх шаардлагагүйгээр тухайн моторын хүчин чадлыг ашиглах боломжтой гэсэн үг шүү дээ. Нөгөө талаас нээлттэй эхийн моделиуд бас гараад ирсэн. ChatGPT-г бодвол арай сул боловч маш олон зүйл хийж болно. АНУ-ын хэд хэдэн хотод өөрөө явдаг такси, хотоос хот руу хоол хүргэдэг робот, ачааны машины Self Driving хэрэглэхээр туршиж байна. Ачааны машин дээр хууль эрхзүйн орчин нь л шаардлагатай байгаа байх. Хятад мөн ялгаагүй хөгжиж байгаа.
-Аль салбарын хөгжил AI-тай хамт хамгийн хурдтай явж байгаа бол?
-Тайлан судалгаануудаас харахад санхүүгийн салбар AI-ийг хамгийн их буюу 40 хувьтай ашиглаж байна. Мөнгө эргэлддэг салбар учир хөрөнгө оруулалт их хийгддэг байх.
-Ачааны машины хувьд хууль зүйн зохицуулалт шаардлагатай гэлээ. Энэ талаар тодруулахгүй юу?
-АНУ-д том ачааны машинаар ачаа зөөдөг, ингэхдээ хурдны зам ашигладаг. Гэхдээ том ачааны машины хувьд явах зам нь харьцангуй хязгаарлалттай байдаг тул энд Self Driving ашиглах боломжтой. АНУ-ын нэг захаас нөгөө зах руу явахад 36-45 цаг шаардлагатай байдаг гээд үзвэл хүн жолооч замдаа амарч явсаар 2-3 өдөр зарцуулдаг. Хэрэв түүнийг роботоор орлуулчихвал замдаа саатахгүй, мөн жолоочид өгөх цалингаа хэмнэчихнэ. Гэхдээ хуулийн хүрээнд гарсан асуудал нь тест бүрэн хийгдээгүй, заримдаа моделиуд алдаа гаргаж байсан. Гэхдээ сүүлийн үеийн мэдээллийг хараахан аваагүй байна.
-Монголд AI хөгжиж байгаа юу?
-Хөгжиж байгаа. Хүмүүсийн хамгийн сайн мэдэх нь Чимэгэ аппликэйшн. Мөн санхүүгийн аппликэйшнүүд өдөр тутамдаа ашиглаж байгаа. Чадалтай инженерүүд бий шүү. Харин зураг болон видеон дээр ажиллаж байгаа хүн цөөхөн байх шиг.
-AI хөгжүүлэлтэд нэг талаас оролцогч нь хэрэглэгчид. Хятад зэрэг улс нь олон хэрэглэгчтэй учир хурдан хөгжих боломжтой, АНУ бол англи хэл дээр учир мөн хэрэглэгч олонтой. Тэгвэл манай улс шиг цөөн хүн амтай улсын хувьд англи хэлээр хөгжүүлэх үү, эсвэл монгол хэлээрээ хөгжүүлэх үү?
-Хятад, Энэтхэг хүн ам ихтэй учир дата хангалттай. Жиргээний текст датаг жишээ болгон авахад энд модель хийж болдог. Жишээ нь, тодорхой сэдэв дээрх жиргээнүүдийг түүж аваад анализ хийж болно. Тэр сэдэвт хүмүүс ямар бодолтой байгааг гаргаж ирнэ, их дата цугласан бол үр дүнг нь дараа дараагийн жиргээн дээр ашиглах боломжтой. Монгол хэлээр дата бага байвал бидний модель сайн ажиллахгүй гэсэн үг. Тэгвэл англи хэл рүүгээ шилжих үү, монгол хэлээрээ сургах ёстой юу гэдэг асуудал гарна. Миний байр суурь бол монгол хэлээрээ байх ёстой.
-Тэгвэл маш их цаг хугацаа орох юм биш үү?
-Мэдээж их орно. Монгол хэл дээр хийх зүйл маш их бий. Үүнийг ганц нэг хүн хийж чадахгүй, олон хүн, хэдэн жилийг зарцуулж хийдэг зүйл.
-AI хөгжилд төр оролцож болох уу?
-Төрийн оролцох хязгаарыг сайн тогтоож өгөх хэрэгтэй. Дата олж авахад амархан байлгахаар зохицуулалтыг төр хийж өгвөл бидэнд хэрэгтэй л байх. Гэхдээ түүнээс илүү зүйлд оролцоно гэвэл хэцүү. Data ownership, data access гэх мэт.
-AI-тай холбоотойгоор аливаа улсын улс төрийн сонгуульд оролцсон туршлага байдаг уу?
-Сонгуульд ашигласан хамгийн маргаантай кэйс бол Кэмбриж аналитик. АНУ-ын 2016 оны Ерөнхийлөгчийн сонгууль болон Brexit санал хураалтад нөлөөлсөн гэж үздэг. Кэмбриж аналитикийн ажилласан зарчим нь фэйсбүүк дээрх хүмүүсийн мэдээллийг түүж аваад, профайлуудыг нь үзэл бодлоор нь таниад, фэйсбүүкийн мэдээлэл харуулдаг алгоритмыг ашиглан тухайн хүний үзэл бодолд нөлөөлөх мэдээллийг тараасан гэдэг. Таамаглалаар маш олон сонгогчийн профайлыг гаргаад, Трампын төлөө санал өгөх хандлагатай хүн байвал тэдэнд түүнийг нь бататгасан мэдээллийг нь харуулах, эсрэг байр суурьтай хүмүүст бодолд нь нөлөөлөх мэдээллийг харуулаад, сонголтоо гаргаагүй байгаа сонгогчдын хувьд тэдний бодлыг өөрчилж болохоор мэдээллийг харуулсан гэдэг. Гол нь хүмүүсийн зөвшөөрөлгүйгээр датаг нь ашигласан гэдэг нь өөрөө асуудал үүсгэсэн. Гэвч контент үйлдвэрлэл дээр хүмүүс төвлөрч ярилцаагүй.
-Фэйсбүүкийг ашиглаад манай сонгуульд нөлөөлөх боломж байх уу?
-Тархи угаах мессэжийг хийх боломжтой, онолын хувьд. Хувь хүмүүс бид түүнийг мэдэх аргагүй.
-Ерөнхийлөгчийг хятадаар мэндчилгээ дэвшүүлж буй мэт хуурамч видео гарлаа. Үндэсний аюулгүй байдалд нөлөөлөх хэмжээнд нөлөөлөхүйц худал мэдээлэл гээд Эрүүгийн хуулиар шийтгэнэ гэж ярьлаа. AI-ийг сонгуулиар хязгаарлах боломж байх уу?
-Байгаа. Гэхдээ манайд хэрэгжих үү гэвэл хэцүү. Мета жишээ нь хуурамч мэдээлэлтэй тэмцэхдээ “Хуурамч мэдээлэл, үнэн мэдээлэл” гэсэн датан дээр моделио сургаад, автоматаар ялгадаг гэж ойлгож болно. Иймэрхүү модель нь фэйсбүүкт монгол хэл дээр зөв ажиллаж чадах уу гэдэг нь явцуу. Яагаад гэвэл монгол хэлний дата дутагдалтай гэх бэрхшээлтэй учирна. Зураг, видеон дээр бол энэ модель ажиллах байх. Гэхдээ текст датан дээр тулгуурласан тохиолдолд сайн ажиллахгүй байж мэднэ.
-Хуулиар, эсвэл захиргааны аргаар зогсоох боломжтой юу? Торгоно шүү, баривчлана шүү гэх зэргээр?
-Захиргааны аргаар зогсооно гэдэг нь хэцүү. Нэгдүгээрт, тухайн мэдээлэл хуурамч байна уу гэдгийг таних шаардлагатай. Үүнд тодорхой хугацааг зарцуулна. Хоёрдугаарт, хуурамч байна гэж танихын зэрэгцээ хэн түүнийг тараасан бэ гэдгийг мэдэх хэрэгтэй. Тухайн хүний IP хаяг. Гэхдээ энэ нь өөр компьютер дээр суухад л солигдчихно. Хэрэв мета үнэхээр энэ чиглэлээр хуурамч мэдээлэл таньдаг модель боловсруулаад тэр нь монгол хэл дээр сайн ажиллаж чадах юм бол үүсгэсэн даруйд нь түүнийг блоколдог, мьют хийдэг аргууд хэрэглэхийг үгүйсгэхгүй.
-Ерөнхийлөгчийг хуурамчаар хийсэн видеог хэн ч хийж чадна гэж өөрөө хэллээ. Тэгвэл сонгуулиар өрсөлдөгч нараа намнахын тулд элдэв төрлийн видео, фото хийх боломж байх уу?
-Байлгүй яахав. Моделийг нь л олчихвол хийх бол асуудал биш. Гэхдээ түүнийг таньж сурах хэрэгтэй. Жишээ нь сая Ерөнхийлөгчийн видео гэхэд толгой нь дээш доош хөдлөх, ам нь хөдлөхөөс өөр хөдөлгөөн хийж чадахгүй байгааг анзаарч болно. Хүн бүтэн биеэрээ хөдөлсөн зэрэг хөдөлгөөн ихтэй видеог жишээ нь AI хийж чадахгүй. Нэг гар нь арай өөрөөр хөдлөх, хоёр нүдний анивчих нь зөрөх зэрэг алдаа гарна. Зурган дээр хүртэл хуруу нь дутуу гарах асуудал бий. Зураг, видеон дээр мета дата гэж байдаг. Энэ нь тухайн видео, зургийг хэзээ, хэн хийсэн бэ гэдэг дата нь байдаг гэсэн үг. Сүүлийн үед хуурамч зураг, видеог таних моделиуд мөн сургах болсон.
Сонсогч @davandai:
-Ерөнхийлөгчийн бичлэг цацагдсаны дараа М, Э гэдэг хоёр хүн тролл аккаунтаараа тараасныг тогтоосон. Тролл аккаунтыг гүйцэтгэх ажлын шугамаар IP хаягаар нь олдог. Аливаа хүний утас, компьютер нь өөрийн гэсэн кодтой бөгөөд тухайн утас руу ямар сим орж байна, утас, компьютер нь ямар аккаунтууд руу орж байна гэдэг нь гарч ирнэ. Тэгэхээр тролл аккаунт нээчихээд бусдыг доромжлоод, гүтгээд байвал түүнийг гүйцэтгэх ажиллагааны хүрээнд олчихно. Гэхдээ IP хаягааасаа VPN ашиглан нуугдах боломжтой. Жишээ нь, баригдлаа гэхэд VPN ашиглаж байсан тохиолдолд ямар ямар сайтууд руу нэвтэрч байсныг илрүүлэх боломжгүй. Нэг талаас технологи хөгжих тусам гэмт хэрэг илүү нарийн төвөгтэй болдог, нөгөө талаасаа түүнийг илрүүлэх арга механизм ч нарийн болж байна.
-Гэхдээ утасны симээр илрүүлнэ гэхээр зөвхөн монголд байгаа хүнийг илрүүлэх боломжтой гэсэн үг үү? Гадаадаас бичээд байвал боломжгүй биз дээ?
-Гар утас өөрөө үйлдвэрээсээ кодтой гарч байгаа, тэр кодоор нь илрүүлчихнэ. Гадаад, дотоодод байх ялгаагүй. Тролл аккаунт нээчихээд “илрэхгүй” гэж мөрөөдөөд байдаг хүмүүст хэлэхэд илрүүлэхэд ямар ч асуудалгүй.
-Ямар аккаунтыг тролл аккаунт гэх вэ? Жишээ нь, Танхай эмээ тролл аккаунт мөн үү?
-Манайд хуулийн тодорхойлолт бол байхгүй. Энэ дэлхий дахинд тохиолдож байгаа л асуудал байх. Бот аккаунт бол автоматаар ажиллагааг л хэлж байгаа. Сонгуультай холбоотойгоор тролл аккаунтын тодорхойлолтыг гаргах нь зөв байх. Одоогоор бол нэр нүүрээ нуучихаад бусдыг гүтгэж, доромжлоод байгаа бол түүнийг гүйцэтгэх ажиллагаагаар илрүүлж, зохих шийтгэлийг оноож байгаа болов уу.
-Ярилцсанд баярлалаа.