#day27. YOLO detection algorithm #100daychallenge

Ivana Medojevic
3 min readMay 1, 2020

--

Akronim YOLO je od You Only Look Once. Naziv je dobio po svojoj jedinstvenosti. Prethodno razvijeni algoritmi uglavnom rade na principu kretanja prozora po slici ili na nekom podsetu regiona na slici (primer ‘šetanja’ filtera po slici u konvolucijskom sloju). Dok Yolo u samo jednom prolazu direktno vrši optimizaciju performansi prepoznavanja na slici. Biće još priče o ovome. Postoje 3 verzije ovog algoritma, prva je objavljena 2015. godine, prvi update je napravljen 2016. a poslednja verzija je izašla 2018. godine. Na sajtu autora možete videti detalje.

Photo by Marten Newhall on Unsplash

Prva verzija ovog algoritma (Redmon i dr. 2015) je objavljena 2015. godine i predstavljala je korak dalje u domenu detekcije objekata kako na slikama tako i u aplikacijama u realnom vremenu. Ovaj algoritam daje brze i dobre rezultate pri detekciji više objekata na slici i uglavnom se koristi za rešavanje ovog problema. Arhitektura ove mreže se ugleda na GoogLeNet mrežu. Sastoji se od 24 konvolucijska sloja praćena sa dva potpuno povezana sloja. Za treniranje je korišćena Darknet platforma (Redmon 2013).

Arhitektura YOLO mreže (Redmon i dr. 2015)

Druga verzija Yolo v2, (Redmon i Farhadi 2016) predstavlja ideju o primeni “anchor box”, koji će biti objašnjen dodatno, i primeni algoritma k-srednjih vrednosti za izračunavanje dimenzija ovih okvira u cilju smanjenja prvobitne vrednosti greške (eng. Detection error) na izlazu.

Darknet 19, mreža Yolo v2 (Redmon i Farhadi 2016)

Yolo v2 ima poboljšanu mrežnu strukturu, Darknet-19 i umesto potpuno povezanog sloja i Softmax f-je na izlazu koristi konvolucijski sloj.
Takođe uvodi batch normalization, klasifikator visoke rezolucije, dimenzione klastere, direktnu predikciju lokacije, prepoznavanje sitnijih karakteristika, višestruke obuke i druge metode koje znatno unapređuju prvobitnu verziju.

Yolo v3 (Redmon i Farhadi 2018) je poboljšana verzija Yolo v2. Koristi višestruko predviđanje za detekciju konačnog cilja, mreža je daleko kompleksnija od verzije v2 i još bolje izvršava detekciju objekata manjih dimenzija.

U ovom kratkom delu su definisane osnovne razlike i unapređenja u verzijama. U sledećoj priči će biti detaljnije funkcionisanje algoritma paralelno sa pomenutim unapređenjima.

Do sutra…

No matter how slow you progress, you are still way ahead of everyone who is not trying.’

Reference:

Redmon, J., Divvala, S., Girshick, R., Farhadi, A. 2015. You Only Look Once: Unified, Real-Time Object Detection. The IEEE Conference on Computer Vision and Pattern Recognition (CVPR). pp. 779–788. arXiv:1506.02640

Redmon, J., Farhadi, A. 2017. Yolo9000: Better, faster, stronger. Computer Vision and Pattern Recognition (CVPR). IEEE Conference on, pp.6517–6525.

Redmon, J., Farhadi, A. 2018. YOLOv3: An Incremental Improvement. https://pjreddie.com/media/files/papers/YOLOv3.pdf)

Redmon, Ј. Darknet: open source neural network in c. http://pjreddie.com/darknet/ 2013–2016. приступљено 30.5.2019.

--

--

Ivana Medojevic
Ivana Medojevic

Written by Ivana Medojevic

Ph.D. student, interesting in machine learning, deep learning. Multitasking mom. Future data analyst/DL engineer.

No responses yet