Generative AI буюу үүсгэгч хиймэл оюуны тухай

Нийтлэсэн Б Билгүүн
2023-11-21
928

ChatGPT шиг хүчирхэг хиймэл оюуны системүүд хэрхэн ажилладаг вэ?

Хэдхэн жилийн өмнө хүмүүсийн дунд хиймэл оюун гэх ойлголтыг өгөгдөлд үндэслэн таамаглал дэвшүүлэн сурах боломжтой машин сургалтын загварууд гэх хандлага түлхүү явж ирсэн. Жишээлбэл, эрүүл мэндийн салбарт өвчтөний рентген зурагд хавдрын шинж тэмдэг илэрсэн эсэх, эсвэл банкны зээлдэгчдийн зээлээ төлөхгүй байх магадлалыг урьдчилан таамаглах гэх мэт. Харин үүсгэгч хиймэл оюун нь үүсгэгч загваруудыг ашиглан текст, зураг эсвэл бусад контент үүсгэх чадвартай. Өөрөөр хэлбэл тодорхой өгөгдлийн багцын талаар таамаглал дэвшүүлэхээс илүүтэйгээр шинэ өгөгдөл үүсгэхэд сургагдсан машин сургалтын загвар гэж үзэж болно. Энэ нь оролтын буюу сургалтын өгөгдлүүдийн загвар, бүтцийг сурсны үр дүнд дараа нь ижил төстэй шинж чанартай шинэ өгөгдлийг шинээр үүсгэх чадвартай систем юм. Шуугиан тариад буй ChatGPT болон түүнтэй төстэй технологиуд нь цоо шинэ зүйл биш. Эдгээр хүчирхэг машин сургалтын загварууд нь 50 гаруй жилийн өмнөх судалгаа, тооцооллын ололт дээр суурилж байна. Үүсгэгч хиймэл оюуны анхны жишээ бол Марковын процесс (эсвэл дараалал) гэж нэрлэгддэг энгийн загвар юм. Энэхүү загварыг 1906 онд санамсаргүй процессыг загварчлах статистикийн аргыг нэвтрүүлсэн Оросын математикч Андрей Марковын нэрээр нэрлэжээ. Марковын процесс нь үйл явдал бүрийн магадлал нь зөвхөн өмнөх үйл явдлын төлөвөөс хамаарах боломжтой үйл явдлын дарааллыг дүрсэлсэн стохастик загвар юм. Энгийнээр хэлбэл "Дараа нь юу болох нь зөвхөн өнөөгийн нөхцөл байдлаас хамаарна" гэж ойлгож болно. Марковын процессууд нь Монте-Карло мэтийн ерөнхий стохастик симуляцийн аргуудын суурь болдог бөгөөд Байесийн статистик, термодинамик, статистикийн механик, физик, хими, эдийн засаг, санхүүгийн таамаглалд ихэвчлэн хэрэглэгддэг.

ChatGPT болон үүнтэй төстэй системүүдийн үндсэн загварууд нь Марковын загвартай бараг адилхан ажилладаг. Гэхдээ нэг том ялгаа нь ChatGPT нь илүү том, илүү төвөгтэй, олон тэрбум параметртэй байдаг. Мөн энэ нь интернэт дэх нийтэд нээлттэй текстэн мэдээллийн дийлэнхийг нь буюу асар их хэмжээний өгөгдөл дээр сургагдсан байдаг. Энэхүү асар том бичвэрт үг, өгүүлбэрүүд тодорхой хамаарал бүхий дарааллаар гарч ирдэг. Энэхүү дарааллын давтамжийн мэдээллийг ашиглан текстийг урьдчилан таамаглах боломжтой дэд хэсгүүдэд хуваах зарчмаар ажилладаг байна.

Мэдээ бэлтгэсэн: Симуляци, тооцооллын салбарын ЭША - Б.Төмөрхуяг

Эх сурвалж: Explained: Generative AI | MIT News | Massachusetts Institute of Technology

Generative artificial intelligence - Wikipedia

Markov chain - Wikipedia