Vision Transformer

Нийтлэсэн Н Хишигжаргал
2024-11-25
1150

Vision Transformer (ViT) нь компьютерийн харааны хамгийн сүүлийн үеийн архитектур бөгөөд дүрс таних янз бүрийн ажлуудад өргөн хэрэглэгдэж байгаа Convolutional Neural Networks (CNN) тэй өрсөлдөхүйц чадвартай архитектур болж гарч ирсэн.

Хэдийгээр CNN нь олон жилийн турш компьютерийн харааны салбарт ноёрхож байсан ч ViT шинэ загварууд нь тооцооллын үр ашиг, нарийвчлалын хувьд бараг дөрөв дахин илүү үр дүнг үзүүлж, компьютерийн харааны олон ажил дээр илүү сайн гүйцэтгэлтэй болсон.

ViT загварыг 2021 онд ICLR 2021 дээр хэвлэгдсэн "An Image is Worth 16*16 Words: Transformers for Image Recognition at Scale" сэдэвт эрдэм шинжилгээний илтгэлд танилцуулсан.

ViT нь объект илрүүлэх, дүрсийг сегментчлэх, дүрс ангилах, үйлдэл таних зэрэг даалгавруудад өргөн хэрэглэгддэг.

Эх сурвалж: An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale.

arXiv preprint arXiv:2010.11929.

Мэдээ бэлтэгсэн: Мэдээллийн технологийн салбарын ЭША Б. Номуундалай

Бусад мэдээлэл

Танин мэдэхүй

МАШИН СУРГАЛТ АШИГЛАН ШИНЭ КОРОНАВИРУС ХААНА ҮҮСЭХИЙГ ТААМАГЛАХ НЬ

Нийтлэсэн Билгүүн
1 жилийн өмнө

Танин мэдэхүй

CPU болон GPU хоорондын ялгаа ба хэрэглээ

Нийтлэсэн Билгүүн
1 жилийн өмнө

Танин мэдэхүй

Transformer архитектур

Нийтлэсэн Билгүүн
1 жилийн өмнө

Танин мэдэхүй

ТОГТВОРТОЙ ХӨГЖЛИЙН ТӨЛӨӨХ ШИНЖЛЭХ УХААН, ТЕХНОЛОГИЙН ХАМТАРСАН СУДАЛГААНЫ ХӨТӨЛБӨРИЙГ (SCIENCE AND TECHNOLOGY RESEARCH PARTNERSHIP FOR SUSTAINABLE DEVELOPMENT PROGRAM, JAPAN) ХЭРЭГЖҮҮЛЭХЭЭР БОЛЛОО.

Нийтлэсэн Хишигжаргал
1 жилийн өмнө

Танин мэдэхүй

Виртуал ертөнцөөр дамжуулан хиймэл оюуныг сургаж байна

Нийтлэсэн Билгүүн
1 жилийн өмнө

Танин мэдэхүй

2024 онд анхаарал татаж буй хиймэл оюун ухааны 3 чухал чиг хандлага

Нийтлэсэн Билгүүн
1 жилийн өмнө

Vision Transformer

Бусад мэдээлэл

МАШИН СУРГАЛТ АШИГЛАН ШИНЭ КОРОНАВИРУС ХААНА ҮҮСЭХИЙГ ТААМАГЛАХ НЬ

CPU болон GPU хоорондын ялгаа ба хэрэглээ

Transformer архитектур

ТОГТВОРТОЙ ХӨГЖЛИЙН ТӨЛӨӨХ ШИНЖЛЭХ УХААН, ТЕХНОЛОГИЙН ХАМТАРСАН СУДАЛГААНЫ ХӨТӨЛБӨРИЙГ (SCIENCE AND TECHNOLOGY RESEARCH PARTNERSHIP FOR SUSTAINABLE DEVELOPMENT PROGRAM, JAPAN) ХЭРЭГЖҮҮЛЭХЭЭР БОЛЛОО.

Виртуал ертөнцөөр дамжуулан хиймэл оюуныг сургаж байна

2024 онд анхаарал татаж буй хиймэл оюун ухааны 3 чухал чиг хандлага

Хиймэл оюунт туслах системүүд шинэ шатанд гарч байна

"Artemis II" хөлгийн гишүүд сансраас нарны хиртэлтийг анх удаа харжээ.

Эрүүл мэндийн үнэлгээ гаргадаг ухаалаг толийг танилцууллаа

Хиймэл оюуны сөрөг дүр төрх загваруудын зан төлөвт нөлөөлдөг

Нейросуулгацын тусламжтайгаар хараагүй хүмүүсийн харааг сэргээх боломж бүрдэж байна.

Ангараг дээр суурьшил байгуулах боломж

Сонгодог геометрийн олон арван жилийн нууц тайлагдлаа: "Бонне"-гийн хос гадаргууг анх удаа илрүүлэв

ChatGPT анхдагч математик баталгаа гаргаж чаддаг болохыг судалгаа харууллаа

Физикийн мэдлэгт суурилсан нейроны сүлжээ (PINN)

Монголд кибер халдлагын эрсдэл нэмэгдэж, QR код болон системийн эмзэг байдлыг ашигласан халдлагууд анхаарал татаж байна.

ХЭРХЭН “ӨГӨГДЛИЙН ШИНЖЭЭЧ” БОЛОХ ВЭ?

Дэлхийн Монгол математикч Шарайн Мянгат

Өгөгдөл ба мэдээллийн тухай

ЕРТӨНЦИЙН ӨНГИЙГ БИД ХЭРХЭН ХАРДАГ ВЭ?

ХЭВИЙН ТАРХАЛТ БИДНИЙ АМЬДРАЛД...

МАТЕМАТИК БИДНИЙ ӨДӨР ТУТМЫН АМЬДРАЛД

ӨНГИЙГ ХЭРХЭН ХЭМЖДЭГ ВЭ?

СУДАЛГААНЫ ӨГӨГДЛИЙН МЕНЕЖМЕНТ

ПИФАГОР БА МАТЕМАТИК

Зургийн файлын форматыг ойлгох нь