YOLOv11-г объект илрүүлэх

Нийтлэсэн С Сонинжаргал
2024-11-21
264

Хиймэл оюун ухаан, компьютерийн хараа тасралтгүй хөгжиж буй энэ ертөнцөд объект илрүүлэх нь хамгийн чухал ажлуудын нэг болж байна. Энэ нь өөрийгөө жолооддог машинд саад тотгорыг тодорхойлох, хяналтын системд хөдөлгөөнийг бодит цаг хугацаанд хянах гэх мэт олон салбарт нэн чухал үүрэг гүйцэтгэдэг. Объект илрүүлэх загварууд эдгээр сорилтуудыг даван туулж, олон салбарт хувьсгал хийж байна.

YOLO (You Only Look Once) загвар бөгөөд бодит цагийн өндөр хурд, нарийвчлалыг гайхалтай тэнцвэржүүлснээр объект илрүүлэх технологийн хөгжлийг шинэ түвшинд хүргэсэн. YOLOv11 бол энэ уламжлалыг үргэлжлүүлэн, урьд өмнө байгаагүйгээр илүү хурдан, илүү нарийвчлалтай, илүү үр дүнтэй объект илрүүлэх технологийг нэвтрүүлж буй инновацийн оргил үе юм. Энэхүү шинэ хувилбар нь хиймэл оюун ухааны хэрэглээний хүрээг тэлж, бодит цагийн хэрэглээнд илүү оновчтой шийдэл санал болгож байна.

YOLOv11 нь олон жилийн судалгаа, хөгжүүлэлтийн үр дүнг нэгтгэн, объект илрүүлэх технологийн шинэ стандартыг тогтоож, ирээдүйн дэвшилтэд хөтөлж буй нь дамжиггүй.

Жозеф Редмон , Сантош Диввала , Росс Гиршик , Али Фархади нар CVPR дээр " Та зөвхөн нэг удаа харна уу: Нэгдмэл, бодит цагийн объект илрүүлэх " нэртэй нийтлэлээ нийтэлж , YOLO нэртэй хувьсгалт загварыг танилцуулсан. Гол зорилго нь нарийвчлалыг алдагдуулахгүйгээр илүү хурдан, нэг удаагийн илрүүлэх алгоритмыг бий болгох явдал юм. Энэ нь регрессийн бодлого болох бөгөөд дүрсийг FNN-ээр дамжуулж, олон объектын хязгаарлах хайрцагны координат болон тус тусын ангиллыг олж авдаг.

YOLOv1-ийг нэвтрүүлснээс хойш загвар нь хэд хэдэн давталт хийсэн бөгөөд тус бүр нь нарийвчлал, хурд, үр ашгийн хувьд сүүлийнх дээрээ сайжирсан. YOLO-ийн өөр хувилбаруудын гол үе шатууд энд байна:

YOLOv1 (2016) : Хурдны зориулалтаар бүтээгдсэн анхны YOLO загвар нь бодит цагийн гүйцэтгэлд хүрсэн боловч бүдүүн сүлжээний системээс болж жижиг объект илрүүлэхэд бэрхшээлтэй байсан.
YOLOv2 (2017) : Багцын хэвийн байдал, зангуу хайрцаг, өндөр нарийвчлалтай оролтыг нэвтрүүлснээр илүү нарийвчлалтай таамаглал дэвшүүлж, нутагшуулалт сайжирсан.
YOLOv3 (2018) : Онцлог пирамидуудыг ашиглан олон цар хүрээтэй таамаглал дэвшүүлсэн бөгөөд энэ нь янз бүрийн хэмжээ, масштабтай объектуудыг илрүүлэх чадварыг сайжруулсан.
YOLOv4 (2020) : Мозайк нэмэгдүүлэх, өөрийгөө дайсагналцах сургалт зэрэг өгөгдлийг нэмэгдүүлэх сайжруулахад анхаарлаа төвлөрүүлэхийн зэрэгцээ илүү хурдан дүгнэлт гаргахын тулд үндсэн сүлжээг оновчтой болгоход чиглэв.
YOLOv5 (2020) : Албан ёсны судалгааны баримт бичиггүйн улмаас маргаантай байсан ч YOLOv5 нь PyTorch-д хэрэгжсэний улмаас өргөн хэрэглэгдэж, практикт ашиглахад оновчтой болсон.
YOLOv6, YOLOv7 (2022) : Загварын хэмжээс, нарийвчлалыг сайжруулж, захын төхөөрөмжүүд дээр онцгой сайн гүйцэтгэлтэй байсан загварын илүү үр ашигтай хувилбаруудыг (YOLOv7 Tiny гэх мэт) нэвтрүүлсэн.
YOLOv8 : YOLOv8 нь CSPDarkNet-ийн тулгуур ба замын нэгтгэл зэрэг архитектурын өөрчлөлтүүдийг нэвтрүүлж, өмнөх хувилбараас хурд, нарийвчлалыг сайжруулсан.
YOLOv11 (2024) : YOLO-ийн хамгийн сүүлийн хувилбар болох YOLOv11 нь C3K2 блок , SPFF (Орон зайн пирамид хуримтлуулах хурдан) болон C2PSA зэрэг дэвшилтэт анхаарал татах механизм бүхий илүү үр ашигтай архитектурыг танилцуулж байна . YOLOv11 нь YOLO-ийн танигдсан бодит цагийн дүгнэлтийн хурдыг хадгалахын зэрэгцээ жижиг объект илрүүлэх чадварыг сайжруулах, нарийвчлалыг сайжруулах зорилготой юм.

YOLOv11-ийн архитектур нь YOLOv8, YOLOv9, YOLOv10 зэрэг YOLO-ийн өмнөх хувилбаруудад нэвтрүүлсэн дэвшлүүд дээр тулгуурлан хурд, нарийвчлалыг хоёуланг нь оновчтой болгох зорилготой юм. YOLOv11-ийн архитектурын гол шинэчлэлүүд нь C3K2 блок , SPFF модуль болон C2PSA блокуудыг тойрон эргэлддэг бөгөөд эдгээр нь бүгд өндөр хурдтай дүгнэлт гаргахын зэрэгцээ орон зайн мэдээллийг боловсруулах чадварыг сайжруулдаг.

Дүгнэлт

Дүгнэж хэлэхэд, YOLOv11 нь хурд , нарийвчлал , үр ашгийн дээд зэргийн хослолыг санал болгодог объект илрүүлэх чухал үе шат юм . Үүний архитектурын сайжруулалтууд болох C3K2 блокуудыг үр ашигтайгаар задлах, C2PSA анхаарлын механизм зэрэг дүрсний чухал хэсгүүдэд анхаарлаа төвлөрүүлэх нь YOLOv8, YOLOv10 зэрэг өмнөх хувилбаруудаас гүйцэтгэлийг нь дээшлүүлдэг. MAP оноо болон FPS хурдыг нэмэгдүүлснээр YOLOv11 нь бодит цагийн объект илрүүлэх хил хязгаарыг давж байна.

Загварын уян хатан чанар нь түүнийг бие даан жолоодохоос эхлээд эмнэлгийн дүрслэл хүртэлх бодит амьдрал дээрх янз бүрийн хэрэглээнд гол нэр дэвшигч болгодог бөгөөд үүнд нарийвчлал, хурдан дүгнэлт хоёулаа чухал байдаг. YOLOv11-ийн олон цар хүрээтэй илрүүлэлт , орон зайн анхаарлын төвд байгаа дэвшилтүүд нь объектын нарийн төвөгтэй бүтэцтэй орчинд илүү сайн ажиллахын зэрэгцээ хурдан дүгнэлт гаргах чадвараа хадгалан үлдэх боломжийг олгодог.

Эх сурвалж : https://medium-com.translate.goog/@nikhil-rao-20/yolov11-explained-next-level-object-detection-with-enhanced-speed-and-accuracy-2dbe2d376f71?_x_tr_sl=en&_x_tr_tl=mn&_x_tr_hl=en&_x_tr_pto=wapp&_x_tr_hist=true

Мэдээ бэлтгэсэн :

Мэдээллийн технологийн салбарын ЭША Н.Баатар