Хиймэл оюун ухаан, компьютерийн хараа тасралтгүй хөгжиж буй энэ ертөнцөд объект илрүүлэх нь хамгийн чухал ажлуудын нэг болж байна. Энэ нь өөрийгөө жолооддог машинд саад тотгорыг тодорхойлох, хяналтын системд хөдөлгөөнийг бодит цаг хугацаанд хянах гэх мэт олон салбарт нэн чухал үүрэг гүйцэтгэдэг. Объект илрүүлэх загварууд эдгээр сорилтуудыг даван туулж, олон салбарт хувьсгал хийж байна.
YOLO (You Only Look Once) загвар бөгөөд бодит цагийн өндөр хурд, нарийвчлалыг гайхалтай тэнцвэржүүлснээр объект илрүүлэх технологийн хөгжлийг шинэ түвшинд хүргэсэн. YOLOv11 бол энэ уламжлалыг үргэлжлүүлэн, урьд өмнө байгаагүйгээр илүү хурдан, илүү нарийвчлалтай, илүү үр дүнтэй объект илрүүлэх технологийг нэвтрүүлж буй инновацийн оргил үе юм. Энэхүү шинэ хувилбар нь хиймэл оюун ухааны хэрэглээний хүрээг тэлж, бодит цагийн хэрэглээнд илүү оновчтой шийдэл санал болгож байна.
YOLOv11 нь олон жилийн судалгаа, хөгжүүлэлтийн үр дүнг нэгтгэн, объект илрүүлэх технологийн шинэ стандартыг тогтоож, ирээдүйн дэвшилтэд хөтөлж буй нь дамжиггүй.
Жозеф Редмон , Сантош Диввала , Росс Гиршик , Али Фархади нар CVPR дээр " Та зөвхөн нэг удаа харна уу: Нэгдмэл, бодит цагийн объект илрүүлэх " нэртэй нийтлэлээ нийтэлж , YOLO нэртэй хувьсгалт загварыг танилцуулсан. Гол зорилго нь нарийвчлалыг алдагдуулахгүйгээр илүү хурдан, нэг удаагийн илрүүлэх алгоритмыг бий болгох явдал юм. Энэ нь регрессийн бодлого болох бөгөөд дүрсийг FNN-ээр дамжуулж, олон объектын хязгаарлах хайрцагны координат болон тус тусын ангиллыг олж авдаг.
YOLOv1-ийг нэвтрүүлснээс хойш загвар нь хэд хэдэн давталт хийсэн бөгөөд тус бүр нь нарийвчлал, хурд, үр ашгийн хувьд сүүлийнх дээрээ сайжирсан. YOLO-ийн өөр хувилбаруудын гол үе шатууд энд байна:
YOLOv11-ийн архитектур нь YOLOv8, YOLOv9, YOLOv10 зэрэг YOLO-ийн өмнөх хувилбаруудад нэвтрүүлсэн дэвшлүүд дээр тулгуурлан хурд, нарийвчлалыг хоёуланг нь оновчтой болгох зорилготой юм. YOLOv11-ийн архитектурын гол шинэчлэлүүд нь C3K2 блок , SPFF модуль болон C2PSA блокуудыг тойрон эргэлддэг бөгөөд эдгээр нь бүгд өндөр хурдтай дүгнэлт гаргахын зэрэгцээ орон зайн мэдээллийг боловсруулах чадварыг сайжруулдаг.
Дүгнэлт
Дүгнэж хэлэхэд, YOLOv11 нь хурд , нарийвчлал , үр ашгийн дээд зэргийн хослолыг санал болгодог объект илрүүлэх чухал үе шат юм . Үүний архитектурын сайжруулалтууд болох C3K2 блокуудыг үр ашигтайгаар задлах, C2PSA анхаарлын механизм зэрэг дүрсний чухал хэсгүүдэд анхаарлаа төвлөрүүлэх нь YOLOv8, YOLOv10 зэрэг өмнөх хувилбаруудаас гүйцэтгэлийг нь дээшлүүлдэг. MAP оноо болон FPS хурдыг нэмэгдүүлснээр YOLOv11 нь бодит цагийн объект илрүүлэх хил хязгаарыг давж байна.
Загварын уян хатан чанар нь түүнийг бие даан жолоодохоос эхлээд эмнэлгийн дүрслэл хүртэлх бодит амьдрал дээрх янз бүрийн хэрэглээнд гол нэр дэвшигч болгодог бөгөөд үүнд нарийвчлал, хурдан дүгнэлт хоёулаа чухал байдаг. YOLOv11-ийн олон цар хүрээтэй илрүүлэлт , орон зайн анхаарлын төвд байгаа дэвшилтүүд нь объектын нарийн төвөгтэй бүтэцтэй орчинд илүү сайн ажиллахын зэрэгцээ хурдан дүгнэлт гаргах чадвараа хадгалан үлдэх боломжийг олгодог.
Мэдээ бэлтгэсэн :
Мэдээллийн технологийн салбарын ЭША Н.Баатар