
Il sistema di trascrizione alla base delle applicazioni fornite da PerVoice si chiama AUDIOMA ed è il risultato dell'industrializzazione della tecnologia “Transcribe” di FBK/RST* che PerVoice utilizza in esclusiva nei settori di attività della società.
La tecnologia “Transcribe” effettua la trascrizione automatica di segnali audio in differenti fasi: in primo luogo il segnale audio è diviso in regioni acusticamente omogenee e le porzioni del segnale che contengono il discorso sono identificate e raggruppate in base alla loro somiglianza acustica. Quindi, i segmenti del discorso sono trascritti con due o più passaggi di riconoscimento, alternati a normalizzazione acustica e adattamento dei modelli acustici.
In questo modo è possibile trascrivere un segnale dal contenuto sconosciuto, comprese porzioni di non-parlato, e produrre una trascrizione delle porzioni di parlato, assieme ad una classificazione delle porzioni di segnale suddivisi in categorie quali: voce maschile/femminile, parlato in banda larga/stretta, parlato con sottofondo silenzioso/rumoroso, ecc.
Oltre al testo può essere generata una sequenza di meta-dati corrispondenti all’identificazione del parlatore, al suo genere, all’individuazione di “named entity” (nomi di società, indirizzi), alla punteggiatura. Queste informazioni possono essere utilizzate per vari scopi, quali l’indicizzazione automatica, la trascrizione di convegni o assemblee, i riassunti automatici, la traduzione automatica del parlato.
La tecnologia descritta consente al sistema AUDIOMA prestazioni eccellenti e caratteristiche tecniche di tutto rilievo quali:
(*) Fondazione "Bruno Kessler" di Trento, sezione Ricerca Scientifica e Tecnologica, già ITC/IRST.
PerVoice opera insieme a Centri di Ricerca e società innovative leader nel settore del riconoscimento vocale e del linguaggio naturale.


I sistemi di trascrizione risiedono presso il più importante provider del Trentino: