Na prvi pogled, aplikacije za identifikaciju muzike mogu izgledati jednostavno. Moglo bi se pomisliti da samo prepoznaju tekst, isto kao i bilo koji glasovni asistent, i pretražuju ga u bazi podataka kako bi vam rekli koja je pjesma u pitanju.

Međutim, većina aplikacija za prepoznavanje muzike može da kaže koji je naslov instrumentala ili čak onoga ko pjeva. Umjesto da se analizira tekst pjesme, vi zapravo pretražujete tražite “otiske” koji su jedinstveni za svaku pjesmu.

Vjerovatno svoj mobilni telefon možete da otključate otiskom prsta, koji se sastoji od rasporeda linija na vašem prstu koji je jedinstven.

Slično tome, kada držite mikrofon da biste snimili kratak dio neke pjesme, ovaj snimak pretvara se u obrasce podataka koje aplikacije mogu da potraže u svjoj bazi podataka.

Često se, sigurno, dešava da čujete neku pjesmu na javnom mjestu. Pozadinska buka i “izobličenje” prouzrokovano zvučnicima mogu da znače da ta pjesma neće biti prepoznata.

Ocrtavanje zvuka

Informacije o video snimku mogu da se pretvore u 3D grafikon, koji se zove spektrogram i predstavlja promjenu frekvencija tokom određenog vremena. U obzir se uzima i amplituda, odnosno jačina zvuka.

Umjesto da uzmu u obzir cijele pjesme prilikom vršenja pretrage, aplikacije za prepoznavanje često uzimaju samo “vrhove“ grafikona.

“Otiske prstiju” neke pjesme, tako, uzimaju samo u najvišim tačkama frekvencije u datom vremenskom okviru, a zatim iz najvećih amplituda unutar tih tačaka. Kod aplikacije Shazam, na primjer, metoda omogućava da se ovako izvuče većina nepotrebnih dijelova audio-snimka, poput pozadinske buke.

Takođe, čini veličinu otisaka dovoljno malom da je potrebno nekoliko milisekundi da se pjesma prepozna u ogromnoj bazi podataka.

Foto: depositphotos, JohanSwanepoel

Izvor: B92


Prethodni članakAlfa Romeo – Priča iz slavne prošlosti
Naredni članakToyota Supra 2.0 i 3.0 – u čemu je razlika? (VIDEO)