Problemi in questa pagina? Segnalali in questa discussione
Introduzione
La tecnologia del riconoscimento vocale ha fatto passi da gigante negli ultimi anni, la dimostrazione è l' avanzato strumento di riconoscimento vocale presente di default su Win 7. I primi motori e modelli acustici risalgono alla prima metà degli anni 80 in ambiente DOS, da allora sono sorti svariati progetti di ricerca portati avanti da diversi centri di ricerca universitaria di tutto il mondo. Lo scopo di questa guida è descrivere passo passo il procedimento da seguire per ottenere un sistema di riconoscimento vocale professionale.
Requisiti Software
Ubuntu 12.04 32 bit - Free
Dragon Naturally Speaking 11 Premium edition - Non Free
Wine 1.4 - Free
Platypus - Free
Requisiti hardware
Requisiti minimi
- CPU: 1 GHz Intel Pentium o equivalente processore AMD, o 1.66 GHz Intel Atom processor. (Richiesto set di istruzioni SSE2.)
- Cache Processore: 512 KB'
- Memoria(RAM): 1 GB per Windows XP e Windows Vista, 2GB per Windows 7 e Windows Server 2003/2008.'
- Spazio Libero su disco: 2.5 GB (2.8 GB per versioni non-english)'
- DVD-ROM drive (richiesto per l'installazione)
- Microsoft Internet Explorer 6 o superiore
- Nuance-approved elimina-rumore microfono headset (o equivalente)
- Sound card capace di supportare 22 kHz e regisytrazione a 16 bit.
Requisiti consigliati
- CPU: Intel Pentium 2.4 GHz (dual 1.8 GHz core processor) equivalente processore AMD. (Richiesto set di istruzioni SSE2.)
- Cache Processore: 2 MB'
- Memoria (RAM): 2 GB RAM per Windows XP e Windows Vista, 4 GB per Windows 7 e Windows Server 2003/2008 64-bit.
Installazione
Installare wine
Installazione Dragon Naturally SPeaking
Installare il programma in un WINEPREFIX differente da ~/.wine in modo da evitare di perdere le impostazioni semmai la directory principale venisse compromessa, aprire un terminale e digitare:
export WINEPREFIX=$HOME/.dictation
Procedere all'installazione di Dragon Naturally Speaking, navigando fino alla cartella di destinazione del file setup.exe. Se i file si trovano su CD-ROM prima vanno copiati su disco.
Terminata l' installazione, è possibile procedere all'avvio del programma, alla sua configurazione e registrazione che per ora può anche essere effettuato nel desktop attuale. La configurazione richiede diversi minuti in quanto si deve creare il profilo utente e la vostra voce dovrà essere riconosciuta.
Se durante i test di prova del microfono si dovessero ricevere degli errori potrebbe voler dire che o il proprio microfono è di bassa qualità o che ci si trova in un ambiente troppo rumoroso, oppure si ha il microfono disattivato. Per controllare lo stato della periferica andate nel terminale e digitare:
alsamixer -V all
Assicurarsi che la periferica capture sia abilitata e che i livelli del vostro microfono siano a circa metà, è importante che il volume non sia troppo alto altrimenti il captureing risulterà disturbato e riceverete messaggi di errore. Se in Alsamixer il microfono non compare significa che si hanno dei problemi con i driver della scheda audio, ed occorre risolverli prima di poter utilizzare la periferica.
Una volta terminata la fase di configurazione dovrebbe essere tutto funzionante, si avrà di fronte una sobria toolbar con la varie opzioni . Selezionate in questa l' icona sulla sinistra per abilitare il microfono e andare nel menu Strumenti e selezionare Dragon Pad.
Iniziare a parlare e si vedranno le parole pronunciate scorrere fluentemente nell'editor di testo. Se la velocità risulta rallentata ciò è imputabile al fatto che il programma ancora non riconosce la propria voce e fa fatica ad elaborare i dati, cosa che viene superata in qualche settimana di utilizzo e di ottimizzazione delle librerie acustiche, oppure potrebbe essere dovuto ad una carenza di memoria RAM. Se si utilizza un sistema che rientra appena nei requisiti minimi la velocità di scrittura sarà ridotta, ad ogni modo la modalità dettatura risulta più che utilizzabile e l'esecuzione dei comandi impartiti è pressoché perfetto.
Passare all'installazione di Platypus, un programma che consentirà di esportare in tempo reale i dati catturati da Dragon Naturally Speaking e passarli in automatico all'host Linux.
Installazione Platypus
Creare nella propria home la cartella platypus.
Scaricabile Platypus dal sito del progetto.
Scompattare il file platypus.zipnella cartella precedentemente creata.
Installare i pacchetti wine1.4-dev,libX11-dev e libXtst-dev necessari alla compilazione del programma.
Creare nella propria home, se non presente la cartella Desktop.
Avviare la compilazione digitando i comandi:
cd cd platypus/platypus ./configure -l /usr/lib/i386-linux-gnu make sudo make install
Nella cartella Desktop ora è presente il lanciatore platypus.desktop. Spostarlo sul desktop.
Configurazione Platypus
Per utilizzare comandi vocali aprire con un editor di testo il file ~/.dictation/drive_c/Program\ Files/Platypus/platypus_commands
Scrivere a sinistra il comando e destra la combinazione di tasti, ad esempio:
"nuova scheda" "Control_L t"
Pronunciando "nuova scheda" in Firefox si aprirà una nuova scheda.
Modifica del lanciatore
Il lanciatore di Playpus va modificato perché così com'è non funziona, e poiché l'obiettivo è far sì che Platypus venga lanciato nello stesso desktop di Dragon Naturally Speaking, di default Wine invece assegna due desktop virtuali differenti ai due programmi.
Per risolvere il problema è sufficiente modificare con un editor di testo il lanciatore platypus.desktop presente sul desktop
cancellarne il contenuto e sostituirlo con quanto segue:
[Desktop Entry] Comment[en_US]= Comment= Encoding=UTF-8 Exec=env WINEPREFIX="$HOME/.dictation" wine C:\\\\Program\\ Files\\\\Platypus\\\\platypus.exe GenericName[en_US]= GenericName= Icon=$HOME/.local/share/icons/platypus.png MimeType= Name[en_US]=Platypus Name=Platypus Path=/$HOME/.dictation/dosdevices/c:/Program Files/Platypus StartupNotify=true Terminal=false TerminalOptions= Type=Application Version=1.0 X-DBUS-ServiceName= X-DBUS-StartupType= X-KDE-SubstituteUID=false X-KDE-Username=
Salvare le modifiche.
Avviare il lanciatore NatSpeak.exe e, una volta caricato, avviare Platypus dal lanciatore appena modificato.
Lanciatore DNS + Platyplus
Per realizzare un semplice lanciatore che permetta di caricare contemporaneamente Dragon Naturally Speaking e Platypus Creare con un editor di testo sul proprio desktop il file DNS+Platypus.desktop
e copiarvi al suo interno:
[Desktop Entry] Comment[en_US]= Comment= Exec=wine explorer /desktop=natspeak.exe,800x600 $HOME/.dictation/drive_c/Program\\ Files/Nuance/NaturallySpeaking11/Program/natspeak.exe | wine explorer /desktop=natspeak.exe,800x600 $HOME/.dictation/drive_c/Program\\ Files/Platypus/platypus.exe\n GenericName[en_US]=DNS+platypus GenericName=DNS+platypus Icon=/usr/share/icons/Faenza/apps/128/preferences-system-performance.png MimeType= Name[en_US]=DNS+platy Name=DNS+platy Path= StartupNotify=true Terminal=false TerminalOptions= Type=Application X-DBUS-ServiceName= X-DBUS-StartupType= X-KDE-SubstituteUID=false X-KDE-Username=
(Ovviamente le stringhe relative a KDE possono essere eliminate o sostituite così come il path dell' icona). Salvare le modifiche.
Sempre nel terminale digitare:
chmod 775 $HOME/Scrivania/DNS+Platypus.desktop
Test dell'installazione
Avviare il file appena DNS+Platypus.desktop creato. Dovrebbe aprirsi un desktop virtuale 800x600 di Wine con dentro Dragon Naturally Speaking e Platypus.
Tenere la finestra di Platypus in primo piano per farlo funzionare.
Abilitate il microfono su Dragon Naturally Speaking
- Aprire un editordi testo grafico e iniziare a parlare, se tutto è andato bene si vedranno le parole pronunciate comparire nell' editor di testo.