Introduzione

La tecnologia del riconoscimento vocale ha fatto passi da gigante negli ultimi anni, la dimostrazione è l' avanzato strumento di riconoscimento vocale presente di default su Win 7. I primi motori e modelli acustici risalgono alla prima metà degli anni 80 in ambiente DOS, da allora sono sorti svariati progetti di ricerca portati avanti da diversi centri di ricerca universitaria di tutto il mondo. Lo scopo di questa guida è descrivere passo passo il procedimento da seguire per ottenere un sistema di riconoscimento vocale professionale.

Requisiti Software

Ubuntu 12.04 32 bit - Free
Dragon Naturally Speaking 11 Premium edition - Non Free
Wine 1.4 - Free
Platypus - Free

Requisiti hardware

Requisiti minimi

CPU: 1 GHz Intel Pentium o equivalente processore AMD, o 1.66 GHz Intel Atom processor. (Richiesto set di istruzioni SSE2.)
Cache Processore: 512 KB'
Memoria(RAM): 1 GB per Windows XP e Windows Vista, 2GB per Windows 7 e Windows Server 2003/2008.'
Spazio Libero su disco: 2.5 GB (2.8 GB per versioni non-english)'
DVD-ROM drive (richiesto per l'installazione)
Microsoft Internet Explorer 6 o superiore
Nuance-approved elimina-rumore microfono headset (o equivalente)
Sound card capace di supportare 22 kHz e regisytrazione a 16 bit.

Requisiti consigliati

CPU: Intel Pentium 2.4 GHz (dual 1.8 GHz core processor) equivalente processore AMD. (Richiesto set di istruzioni SSE2.)
Cache Processore: 2 MB'
Memoria (RAM): 2 GB RAM per Windows XP e Windows Vista, 4 GB per Windows 7 e Windows Server 2003/2008 64-bit.

Installazione

Installare wine

Installazione Dragon Naturally SPeaking

Installare il programma in un WINEPREFIX differente da ~/.wine in modo da evitare di perdere le impostazioni semmai la directory principale venisse compromessa, aprire un terminale e digitare:

export WINEPREFIX=$HOME/.dictation

Procedere all'installazione di Dragon Naturally Speaking, navigando fino alla cartella di destinazione del file setup.exe. Se i file si trovano su CD-ROM prima vanno copiati su disco.

Terminata l' installazione, è possibile procedere all'avvio del programma, alla sua configurazione e registrazione che per ora può anche essere effettuato nel desktop attuale. La configurazione richiede diversi minuti in quanto si deve creare il profilo utente e la vostra voce dovrà essere riconosciuta.

Se durante i test di prova del microfono si dovessero ricevere degli errori potrebbe voler dire che o il proprio microfono è di bassa qualità o che ci si trova in un ambiente troppo rumoroso, oppure si ha il microfono disattivato. Per controllare lo stato della periferica andate nel terminale e digitare:

alsamixer -V all

Assicurarsi che la periferica capture sia abilitata e che i livelli del vostro microfono siano a circa metà, è importante che il volume non sia troppo alto altrimenti il captureing risulterà disturbato e riceverete messaggi di errore. Se in Alsamixer il microfono non compare significa che si hanno dei problemi con i driver della scheda audio, ed occorre risolverli prima di poter utilizzare la periferica.

Una volta terminata la fase di configurazione dovrebbe essere tutto funzionante, si avrà di fronte una sobria toolbar con la varie opzioni . Selezionate in questa l' icona sulla sinistra per abilitare il microfono e andare nel menu Strumenti e selezionare Dragon Pad.

Iniziare a parlare e si vedranno le parole pronunciate scorrere fluentemente nell'editor di testo. Se la velocità risulta rallentata ciò è imputabile al fatto che il programma ancora non riconosce la propria voce e fa fatica ad elaborare i dati, cosa che viene superata in qualche settimana di utilizzo e di ottimizzazione delle librerie acustiche, oppure potrebbe essere dovuto ad una carenza di memoria RAM. Se si utilizza un sistema che rientra appena nei requisiti minimi la velocità di scrittura sarà ridotta, ad ogni modo la modalità dettatura risulta più che utilizzabile e l'esecuzione dei comandi impartiti è pressoché perfetto.

Passare all'installazione di Platypus, un programma che consentirà di esportare in tempo reale i dati catturati da Dragon Naturally Speaking e passarli in automatico all'host Linux.

Installazione Platypus

Creare nella propria home la cartella platypus.
Scaricabile Platypus dal sito del progetto.
Scompattare il file platypus.zipnella cartella precedentemente creata.
Installare i pacchetti wine1.4-dev,libX11-dev e libXtst-dev necessari alla compilazione del programma.
Creare nella propria home, se non presente la cartella Desktop.

Avviare la compilazione digitando i comandi:

cd
cd platypus/platypus 
./configure -l /usr/lib/i386-linux-gnu
make
sudo make install

Nella cartella Desktop ora è presente il lanciatore platypus.desktop. Spostarlo sul desktop.

Configurazione Platypus

Per utilizzare comandi vocali aprire con un editor di testo il file ~/.dictation/drive_c/Program\ Files/Platypus/platypus_commands

Scrivere a sinistra il comando e destra la combinazione di tasti, ad esempio:

"nuova scheda"    "Control_L t"

Pronunciando "nuova scheda" in Firefox si aprirà una nuova scheda.

Modifica del lanciatore

Il lanciatore di Playpus va modificato perché così com'è non funziona, e poiché l'obiettivo è far sì che Platypus venga lanciato nello stesso desktop di Dragon Naturally Speaking, di default Wine invece assegna due desktop virtuali differenti ai due programmi.

Per risolvere il problema è sufficiente modificare con un editor di testo il lanciatore platypus.desktop presente sul desktop

cancellarne il contenuto e sostituirlo con quanto segue:

[Desktop Entry]

Comment[en_US]=

Comment=

Encoding=UTF-8

Exec=env WINEPREFIX="$HOME/.dictation" wine C:\\\\Program\\ Files\\\\Platypus\\\\platypus.exe

GenericName[en_US]=

GenericName=

Icon=$HOME/.local/share/icons/platypus.png

MimeType=

Name[en_US]=Platypus

Name=Platypus

Path=/$HOME/.dictation/dosdevices/c:/Program Files/Platypus

StartupNotify=true

Terminal=false

TerminalOptions=

Type=Application

Version=1.0

X-DBUS-ServiceName=

X-DBUS-StartupType=

X-KDE-SubstituteUID=false

X-KDE-Username=

Salvare le modifiche.

Avviare il lanciatore NatSpeak.exe e, una volta caricato, avviare Platypus dal lanciatore appena modificato.

Lanciatore DNS + Platyplus

Per realizzare un semplice lanciatore che permetta di caricare contemporaneamente Dragon Naturally Speaking e Platypus Creare con un editor di testo sul proprio desktop il file DNS+Platypus.desktop

e copiarvi al suo interno:

[Desktop Entry]

Comment[en_US]=

Comment=

Exec=wine explorer /desktop=natspeak.exe,800x600 $HOME/.dictation/drive_c/Program\\ Files/Nuance/NaturallySpeaking11/Program/natspeak.exe | wine explorer /desktop=natspeak.exe,800x600 $HOME/.dictation/drive_c/Program\\ Files/Platypus/platypus.exe\n

GenericName[en_US]=DNS+platypus

GenericName=DNS+platypus

Icon=/usr/share/icons/Faenza/apps/128/preferences-system-performance.png

MimeType=

Name[en_US]=DNS+platy

Name=DNS+platy

Path=

StartupNotify=true

Terminal=false

TerminalOptions=

Type=Application

X-DBUS-ServiceName=

X-DBUS-StartupType=

X-KDE-SubstituteUID=false

X-KDE-Username=

(Ovviamente le stringhe relative a KDE possono essere eliminate o sostituite così come il path dell' icona). Salvare le modifiche.

Sempre nel terminale digitare:

chmod 775 $HOME/Scrivania/DNS+Platypus.desktop

Test dell'installazione

Avviare il file appena DNS+Platypus.desktop creato. Dovrebbe aprirsi un desktop virtuale 800x600 di Wine con dentro Dragon Naturally Speaking e Platypus.
Tenere la finestra di Platypus in primo piano per farlo funzionare.
Abilitate il microfono su Dragon Naturally Speaking
Aprire un editordi testo grafico e iniziare a parlare, se tutto è andato bene si vedranno le parole pronunciate comparire nell' editor di testo.

CategoryNuoviDocumenti CategoryHomepage

CesarePolonara/Speech_Recognition_(DNS11+Wine1.4+Platypus)_Ubuntu12.04_32bit (l'ultima modifica è del 30/03/2015 18.36.38, fatta da vipri-alessandro)