Google se celým postupem pochlubil na svém blogu. Čelil zde totiž několika překážkám. Rozpoznávání na Pixelech totiž funguje ve dvou fázích – telefon prvně nahraje přibližně 8sekundovou nahrávku, kterou v rychlosti prolétne a rozdělí po sekundách na 7 dvousekundových částí. Ty porovná s databází a najde podobné písničky. Poté ji naskenuje podruhé, již podrobněji a finálně určí danou skladbu.

V telefonu se nachází několik desítek tisíc ukázek (přesné číslo Google nezveřejnil), které se aktualizují v závislosti na aktuálních trendech a poloze uživatele, stále je to ale jen zlomek hudby, která je k dispozici například v rámci streamovacích služeb.

Pro použití online tak musel zčtyřnásobit velikost neuronových sítí, které se na rozpoznávání podílí a původní dělení nahrávek po sekundách zkrátil na půl sekundy, čímž navýšil přesnost. Pro zrychlení také poupravil samotný index databáze, kde zvýhodňuje populární písničky, aby k jejich určení došlo rychleji.

Novinka je již nyní dostupná v rámci Google vyhledávání v telefonech – stačí spustit funkci Sound Search či se dotázat Co je to za písničku?