#dan32. Anchor boxes #100daychallenge
Rekla sam u prvoj priči o Yolo, #dan28, da je odgovorna ona ćelija u kojoj se nalazi centar objekta i onda algortiam dodeljuje klasu tom objektu. Šta se dešava kada se centar dva objekta nalazi u istom bounding box-u, odnono okviru, ćeliji? Koji objekat će algoritam prepoznati?
Na scenu stupa ideja o Anchor box-evima.
Ovi okviri služe za detekciju dva objekta koji se preklapaju kao i za rešavanje slučajeva kada se u jednoj ćeliji nalazi centar više objekata, kao što je prikazan primer na slici. Definiše se broj anchor boxes a dimenzije se računaju korišćenjem algoritma k-srednjih vrednosti na trening setu.
Ukoliko se definišu dva okvira, izlaz je sledeći:
Dakle Anchor box-evi su okviri tačno definisanih dimenzija pomoću kojih detekujemo objekte na slici a posebno su korisni kod situacije gore opisane. Dimenzije Anchor-a možete vi da istrenirate za vaš trening set ili postoje već predefinisane dimenzije koje su istrenirane na nekim poznatim setovima kao što je COCO set.
Treća i poslednja trenutno algortima Yolo v3 koristi tačno 9 Anchor boxes. Primer dimenzija Anchor boxes koje su istrenirane na COCO data setu (Lin i dr. 2014):
anchors = 10,13; 16,30; 33,23; 30,61; 62,45; 59,119; 116,90; 156,198; 373,326.
I ovi Anchori super rade kod mnogih istraživačkih pitanja. Ja sam odlične rezultate dobila za detektovanje maline i sa ovim okvirima.
Pomoću k-means algoritma ćete dobiti vaše boxeve tako što će algoritam izračunati srednju vrednost dimenzija svih okvira kojima ste vi labelirali vaše objekte u trening setu.
Anchori koje sam ja dobila za maline su bili npr: anchors = 24,26, 29,46, 31,80, 38,60, 42,45, 45,66, 46,81, 64,75, 66,42. Sa mojim Anchor-ima sam poboljšala performanse za par procenata.
Do sutra…