Graficzna reprezentacja cech mowy danej osoby wydrukowana na papierze jest znana jako odcisk głosu. Nazywany również spektrogramem dźwiękowym, może być używany do identyfikacji mówcy, ponieważ wzorce mowy są unikalne dla danej osoby.
Jakie informacje znajdują się w zapisie głosowym?
Zdefiniowany jako podpis oparty na danych biometrycznych, odciski głosu mogą być wykorzystywane do pozytywnej identyfikacji mówcy na podstawie cech fizycznych, a mianowicie specyficznej konfiguracji jam głosowych (gardło, marynarka ubytki i usta) oraz artykulatory (wargi, zęby, język i podniebienie miękkie).
Czy odciski głosu są dopuszczalne w sądzie?
Spektrogram niezidentyfikowanego mówcy jest porównywany ze spektrogramem mówcy zidentyfikowanego w celu znalezienia podobnych wzorców. Większość sądów, które rozpatrzyły to pytanie, orzekła, że dowód w postaci odcisków głosowych jest dopuszczalny. Zobacz Stany Zjednoczone przeciwko … zaprzeczono 439 US 1117 (1979).
Jak powstaje odcisk głosowy?
Aby stworzyć indywidualny odcisk głosu, użytkownicy dostarczają jedną lub więcej próbek mowy rejestracyjnej do modelu DNN, a następnie DNN jest dostrajany, aby poznać unikalne cechy mowy danej osoby. Proces modelowania DNN odbywa się bezpośrednio na próbkach mowy (tj. nieprzetworzonych plikach WAV) – nie jest wymagane wyodrębnianie cech.
Jak działa identyfikacja głosowa?
Rozpoznawanie głosu działa poprzez analizę ponad 100 fizycznych i behawioralnychczynników, aby stworzyć unikalny odcisk głosu dla każdej osoby. Czynniki te obejmują wymowę, nacisk, szybkość mowy i akcenty, a także cechy fizyczne, takie jak trakt głosowy, usta i przewody nosowe.