Захын мэдрэлийн хараа нь хүмүүст бидний харааны шугамд шууд харагдахгүй байгаа дүрсийг бага нарийвчлалтайгаар харах боломжийг олгодог. Энэ чадвар нь бидний харааны талбарыг өргөжүүлж, машины хажуу талаас нь ойртож буй тээврийн хэрэгслийг илрүүлэх зэрэг олон нөхцөл байдалд тустай. Хүмүүсээс ялгаатай нь хиймэл оюун ухаан нь захын мэдрэлийн хараагүй байдаг. Компьютерын харааны загваруудыг ийм чадвараар сайжруулж нь ойртож буй аюулыг илүү үр дүнтэй илрүүлэх эсвэл хүн ирж буй объектыг анзаарах эсэхийг урьдчилан таамаглахад тусална. Энэ чиглэлд нэг алхам хийснээр MIT-ийн судлаачид машин сургалтын загварт захын мэдрэлийн харааг дуурайх боломжийг гаргах зорилгоор зургийн өгөгдлийн багцыг боловсруулсан. Энэхүү өгөгдлийн багц бүхий сургалтын загварууд нь хүнээс муу гүйцэтгэлтэй байсан ч харааны захын объектуудыг илрүүлэх загварын чадварыг сайжруулсан болохыг олж мэдэв. Үр дүн нь хүнээс ялгаатай нь объектын хэмжээ, үзэгдэл дэх харааны эмх замбараагүй байдлын хэмжээ нь хиймэл оюуны гүйцэтгэлд хүчтэй нөлөө үзүүлээгүй болохыг харуулсан. Маш олон янзын загваруудыг туршиж үзсэн бөгөөд тэднийг сургаж байсан ч тэрхүү загварууд хэдийгээр бага зэргээр сайжирлаа ч хүний захын мэдрэлийн харааны системтэй дөхөж очихгүй л байна.
Тэгэхээр асуудал нь: Эдгээр загваруудад юу дутагдаж байна вэ?” энэ судалгааг нарийвчлан харуулсан нийтлэлийн хамтран зохиогч, доктор Ваша ДуТелл хэлэв. Энэ асуултад хариулах нь судлаачдад дэлхий ертөнцийг хүмүүстэй илүү адилхан харж чадах машин сургалтын загваруудыг бүтээхэд тусална. Жолоочийн аюулгүй байдлыг сайжруулахаас гадна ийм загваруудыг хүмүүст үзэхэд хялбар дэлгэц бүтээхэд ашиглаж болно. Нэмж дурдахад хиймэл оюуны загварт захын мэдрэлийн харааг илүү гүнзгий сургах нь судлаачдад хүний зан төлөвийг илүү сайн таамаглахад тусална гэж зохиолч Энн Харрингтон нэмж хэлэв. Захын мэдрэлийн харааг загварчлах нь хэрэв захын хэсэгт дүрслэгдсэн зүйлийн мөн чанарыг үнэхээр олж авч чадвал илүү их мэдээлэл цуглуулахын тулд нүдийг хөдөлгөдөг харааны дүр зураг дахь шинж чанаруудыг ойлгоход тусална гэж тэр тайлбарлав. Тэдний хамтран зохиогчид нь цахилгааны инженер, компьютерын шинжлэх ухааны чиглэлээр төгссөн оюутан Марк Хамилтон; Аюуш Тевари, докторын дараах; Саймон Стент, Тоёота судалгааны хүрээлэнгийн судалгааны менежер; болон ахлах зохиолч Уильям Т.Фриман, Томас, Герд Перкинс нарын цахилгааны инженер, компьютерын шинжлэх ухааны профессор, Компьютерын шинжлэх ухаан, хиймэл оюун ухааны лабораторийн (CSAIL) гишүүн; болон Рут Розенхольц, тархи, танин мэдэхүйн шинжлэх ухааны тэнхимийн ерөнхий судлаач, CSAIL-ийн гишүүн. Судалгааг Сургалтын төлөөллийн олон улсын бага хуралд танилцуулна. “Хүн машинтай харьцах үед — машин, робот, хэрэглэгчийн интерфейс — бол тухайн хүн юу харж байгааг ойлгох нь маш чухал юм. Захын алсын хараа нь энэ ойлголтод чухал үүрэг гүйцэтгэдэг гэж” Rosenholtz хэлэв.
Захын мэдрэлийн харааг
дуурайлгав.
Урд гараа сунгаж, эрхий
хуруугаа дээш тавь — Таны өнгөц зургийн эргэн тойрон дахь жижиг хэсэг нь таны
нүдний торлог бүрхэвчийн дундах жижиг хонхор нь хамгийн хурц харааг өгдөг. Таны
харж чадах бусад бүх зүйл таны харааны захад байна. Таны харааны кортекс нь тэр
хурц фокусын цэгээс холдох тусам нарийвчлал багатай, найдвартай дүр зургийг
илэрхийлдэг.
Хиймэл оюун ухаанд захын
мэдрэлийн харааг загварчлах олон арга нь зургийн ирмэгийг бүдгэрүүлэх замаар
энэхүү муудаж буй нарийн ширийн зүйлийг илэрхийлдэг боловч харааны мэдрэл болон
харааны бор гадаргын мэдээллийн алдагдал нь илүү төвөгтэй байдаг.
Судлаачид энэхүү өөрчилсөн техникийг ашиглан хүн зах руу цааш харах үед үүсдэг нарийн ширийн зүйлсийн алдагдлыг илэрхийлэхийн тулд тодорхой хэсэгт илүү бүтэцтэй мэт харагдах хувирсан зургуудын асар том мэдээллийн багцыг бий болгосон. Дараа нь өгөгдлийн багцыг ашиглан компьютерын харааны хэд хэдэн загварыг сургаж, объектыг илрүүлэх ажлын гүйцэтгэлтэй харьцуулсан. “Туршилтыг хэрхэн зохион байгуулахдаа маш ухаалаг байх ёстой байсан тул үүнийг машин сургалтын загварт туршиж үзэх боломжтой байсан.
Өвөрмөц гүйцэтгэл
Хүн болон загварт нэг зураг нь захад байрлах зорилтот объекттой байснаас
бусад нь ижил төстэй хувирсан хос зургуудыг үзүүлэв. Дараа нь оролцогч бүрээс
зорилтот объектоор зургийг сонгохыг хүссэн. “Биднийг үнэхээр гайхшируулсан нэг зүйл бол хүмүүс захын объектуудыг маш сайн илрүүлж байсан явдал юм.
Дор хаяж 10 өөр багц зургийг үзсэн бөгөөд энэ нь хэтэрхий хялбар байсан. Бид
жижиг, жижиг объектуудыг ашиглах шаардлагатай хэвээр байсан гэж” Harrington
нэмж хэлэв.
Судлаачид загваруудыг
өгөгдлийн багцаараа эхнээс нь сургах нь гүйцэтгэлийг хамгийн их нэмэгдүүлж,
объектыг илрүүлэх, таних чадварыг нь сайжруулдаг болохыг тогтоожээ. Загварыг
өгөгдлийн багцаараа нарийн тааруулах нь урьдчилан бэлтгэгдсэн загварыг шинэ даалгавар
гүйцэтгэхийн тулд өөрчлөх үйл явц нь гүйцэтгэлийн өсөлтийг бууруулахад
хүргэсэн.
Гэхдээ ямар ч тохиолдолд хиймэл оюуны загварууд хүн шиг сайн биш байсан
бөгөөд ялангуяа захын мэдрэлийн хараа объектуудыг илрүүлэхэд муу байсан. Тэдний гүйцэтгэл нь хүний захын мэдрэлийн системтэй адилхан
ажилладаггүй. “Энэ нь загварууд нь эдгээр илрүүлэх даалгавруудыг хийхтэй адил
контекстийг ашигладаггүйг харуулж магадгүй юм. Загваруудын стратеги өөр байж
магадгүй гэж” Харрингтон хэлэв
Судлаачид эдгээр ялгааг үргэлжлүүлэн судлахаар төлөвлөж байгаа бөгөөд
харааны захад хүний чадварыг урьдчилан таамаглах загварыг гаргах зорилготой юм.
Энэ нь жишээлбэл, жолооч нарт харагдахгүй аюулын талаар сэрэмжлүүлдэг хиймэл
оюун ухааны системийг идэвхжүүлж чадна. Тэд мөн бусад судлаачдад олон нийтэд
нээлттэй мэдээллийн багцаараа компьютерын харааны нэмэлт судалгаа хийхэд урам зориг өгнө гэж найдаж байна.
“Энэ ажил нь бидэнд байгаа фоторецепторын тоо хязгаарлагдмал тул хүний захын мэдрэлийн харааг муу гэж үзэх ёсгүй, харин бодит даалгаврыг гүйцэтгэхэд бидэнд
оновчтой дүрслэл болж хувь нэмэр оруулах учраас чухал юм. Энэ бол маш чухал үр
дагавар дагуулна гэж Жастин Гарднер хэлэв, энэ ажилд оролцоогүй Стэнфордын их сургуулийн сэтгэл судлалын тэнхимийн дэд профессор. “Түүгээр ч
зогсохгүй мэдрэлийн сүлжээний загварууд сүүлийн жилүүдэд ахиц дэвшил гарсан
хэдий ч энэ тал дээр хүний чадварыг орлож чадахгүй байгаа нь хүний харааны
мэдрэл судлалаас суралцахын тулд хиймэл оюун ухааны судалгааг нэмэгдүүлэхэд
хүргэж байгааг уг ажил харуулж байна. Энэхүү ирээдүйн судалгаанд захын мэдрэлийн харааг дуурайх зорилгоор
зохиогчдын өгсөн зургийн мэдээллийн сан ихээхэн тус болно.”
Энэ ажлыг Тоёота судалгааны хүрээлэн болон MIT CSAIL METEOR тэтгэлэг хэсэгчлэн дэмжиж байна.
Эх сурвалж: https://news.mit.edu/2024/researchers-enhance-peripheral-vision-ai-models-0308
Мэдээ бэлтгэсэн : Мэдээллийн технологийн салбар Ц. Бямбадэлгэр