Problemi in questa pagina? Segnalali in questa discussione
Introduzione
La tecnologia del riconoscimento vocale ha fatto passi da gigante negli ultimi anni, la dimostrazione è l' avanzato strumento di riconoscimento vocale presente di default su Win 7. I primi motori e modelli acustici risalgono alla prima metà degli anni 80 in ambiente DOS, da allora sono sorti svariati progetti di ricerca portati avanti da diversi centri di ricerca universitaria di tutto il mondo. Lo scopo di questa guida è descrivere passo passo il procedimento da seguire per ottenere un sistema di riconoscimento vocale professionale.
Requisiti Software
Ubuntu 12.04 32 bit - Free
Dragon Naturally Speaking 11 Premium edition - Non Free
Wine 1.4 - Free
Platypus - Free
Requisiti hardware
Requisiti minimi
- CPU: 1 GHz Intel Pentium o equivalente processore AMD, o 1.66 GHz Intel Atom processor. (Richiesto set di istruzioni SSE2.)
- Cache Processore: 512 KB'
- Memoria(RAM): 1 GB per Windows XP e Windows Vista, 2GB per Windows 7 e Windows Server 2003/2008.'
- Spazio Libero su disco: 2.5 GB (2.8 GB per versioni non-english)'
- DVD-ROM drive (richiesto per l'installazione)
- Microsoft Internet Explorer 6 o superiore
- Nuance-approved elimina-rumore microfono headset (o equivalente)
- Sound card capace di supportare 22 kHz e regisytrazione a 16 bit.
Requisiti consigliati
- CPU: Intel Pentium 2.4 GHz (dual 1.8 GHz core processor) equivalente processore AMD. (Richiesto set di istruzioni SSE2.)
- Cache Processore: 2 MB'
- Memoria (RAM): 2 GB RAM per Windows XP e Windows Vista, 4 GB per Windows 7 e Windows Server 2003/2008 64-bit.
Installazione
Installare wine
Installazione Dragon Naturally SPeaking
E' consigliabile installare il programma in un WINEPREFIX differente da $HOME/.wine in modo da evitare di perdere le impostazioni semmai la directory princiaple venisse compromessa, aprite un terminale e digitate:
export WINEPREFIX=$HOME/.dictation |
Sempre nella stessa sessione di terminale procedete all'installazione di Dragon Naturally Speaking, navigando fino alla directory di destinazione del file setup.exe. Se i file si trovano su CD prima vanno copiati su HD. Terminata l' installazione potete procedere al lancio del programma ed alla sua configurazione e registrazione che per ora può anche essere effettuato nel desktop attuale. La configurazione richiede diversi minuti in quanto si deve creare il profilo utente e la vostra voce dovra essere riconosciuta. Se durante i test di prova del microfono doveste ricevere degli errori potrebbe voler dire o che il vostro microfono è di bassa qualità, o che siete in un ambiente troppo rumuroso, oppure che avete il microfono disattivato. Per controllare lo stato della periferica andate nel terminale e digitate:
alsamixer -V all |
Assicuratevi che la periferica capture sia abilitata e che i livelli del vostro microfono siano a circa metà, è importante che il volume non sia troppo alto altrimenti il captureing risulterà disturbato e riceverete messaggi di errore. Se in alsamixer il vostro microfono non compare significa che avete dei problemi con i driver della vostra scheda audio, e dovete cercare di risolverli prima di poter utilizzare la periferica. Una volta terminata la fase di configurazione dovrebbe essere tutto funzionante, avrete di fronte una sobria toolbar con la varie opzioni, selezionate l' icona sulla sinistra per abilitare il microfono e andate nel menu Strumenti e selezionate Dragon Pad . Ora iniziate a parlare e se tutto è andato a buon fine dovreste vedere le vostre parole scorrere fluentemente nell' editor di testo. Se la velocità risulta rallentata ciò è imputabile al fatto che il programma ancora non riconosce la vostra voce e fa fatica ad elaborare i dati, cosa che viene superata in qualche settimana di utilizzo e di ottimizzazione delle librerie acustiche, oppure potrebbe essere dovuto ad una carenza di memoria RAM. Se utilizzate un sistema come il mio che rientra appena nei requisiti minimi comunque non aspettatevi le velocità citate all' inizio, ad ogni modo la modalità dettatura risulta più che utilizzabile e l' impartimento dei comandi è pressochè perfetto con un ritardo di circa mezzosecondo tra il comando e l' azione.
Fatto ciò bisogna ora passare all' installazione di un programma geniale che ci consentirà di esportare in tempo reale i dati catturati da DNS e passarli in automatico all' host Linux, per questo ci viene in soccorso Platypus.
Installazione Platypus
Il programma è scaricabile qui http://thenerdshow.com/platypus.html dove ci sono anche le istruzioni di installazione e configurazione, purtroppo però le informazioni sono obsolete e durante la configurazione e la compilazione si incontrano diversi messaggi di errore vediamo come risolverli ed istallare il programma. Scaricare il file platypus.zip dal sito e scompattarlo in una directory operativa precedentemente creata, digitare:
mkdir $HOME/platypus |
unzip PERCORSO_DEL_FILE_ZIP/platypus.zip $HOME/platypus |
Ora sempre nel terminale digitate:
sudo apt-get install wine1.4-dev libX11-dev libXtst-dev |
Una volta installati i pacchetti necessari alla compilazione andate in $HOME e controllate se la cartella del desktop si chiama Desktop o Scrivania, nel caso si chiamasse scrivania, digitate nel terminale :
mkdir Desktop |
E' necessario creare la directory temporaneamente perchè la compilazione cercherà questa cartella. Moversi nella directory $HOME/platypus/platypus e digitate nel terminale:
./configure -l /usr/lib/i386-linux-gnu |
questo è necessario poichè il PATH delle librerie necessarie alla configurazione in ubuntu 12.04 è differente da quello di default
Ora date:
make && make install |
e il gioco è fatto. Nella cartella $HOME/Desktop ora è presente il lanciatore platypus.desktop . Potete spostarlo su Scrivania ed eliminare la cartella Desktop precedentemente creata con:
rm -r Desktop |
(Solo nel caso in cui di default la vostra cartella si chiami Scrivania !)
Configurazione Platypus
Per utilizzare comandi vocali è sufficiente editare il file $HOME/.dictation/drive_c/Program\ Files/Platypus/platypus_commands digitando:
sudo nano $HOME/.dictation/drive_c/Program\ Files/Platypus/platypus_commands |
scrivendo a sinistra il comando e destra l' azione, ad esempio:
"nuova scheda" "Control_L t"
che farà sì che dicendo nuova scheda in firefox si aprirà una nuova scheda (Ctrl+t)...
Modifica del lanciatore
Il lanciatore va modificato perchè così com'è non funziona, e poichè il nostro obiettivo è far sì che platypus venga lanciato nello stesso desktop di DNS, di default wine invece assegna due desktop virtuali differenti ai due programmi.
Per risolvere la questione è sufficiente modificare il lanciatore, digitate nel terminale:
sudo nano $HOME/Scrivania/platypus.desktop |
cancellate il contenuto e copiate questo:
[Desktop Entry]
Comment[en_US]=
Comment=
Encoding=UTF-8
Exec=env WINEPREFIX="$HOME/.dictation" wine C:\\\\Program\\ Files\\\\Platypus\\\\platypus.exe
GenericName[en_US]=
Icon=$HOME/.local/share/icons/platypus.png
Name[en_US]=Platypus
Name=Platypus
Path=/$HOME/.dictation/dosdevices/c:/Program Files/Platypus
StartupNotify=true
Terminal=false
Type=Application
Version=1.0
X-DBUS-ServiceName=
X-DBUS-StartupType=
X-KDE-SubstituteUID=false
X-KDE-Username=
salvate e chiudete. Ora per far partire il tutto potrete aprire dapprima il lanciatore NatSpeak.exe e una volta caricato aprire Platypus dal lanciatore appena modificato.
Lanciatore DNS + Platyplus
Per realizzare un semplice lanciatore che permetta di caricare entrambi contemporaneamente basta digitare nel terminale:
sudo nano $HOME/Scrivania/DNS+Platypus.desktop |
e copiare al suo interno:
||[Desktop Entry]
Comment[en_US]=
Comment=
Exec=wine explorer /desktop=natspeak.exe,800x600 $HOME/.dictation/drive_c/Program\\ Files/Nuance/NaturallySpeaking11/Program/natspeak.exe | wine explorer /desktop=natspeak.exe,800x600 $HOME/.dictation/drive_c/Program\\ Files/Platypus/platypus.exe\n
GenericName[en_US]=DNS+platypus
GenericName=DNS+platypus
Icon=/usr/share/icons/Faenza/apps/128/preferences-system-performance.png
Name[en_US]=DNS+platy
Name=DNS+platy
Path=
StartupNotify=true
Terminal=false
Type=Application
X-DBUS-ServiceName=
X-DBUS-StartupType=
X-KDE-SubstituteUID=false
X-KDE-Username=
(Ovviamente le stringhe relative a KDE possono essere eliminate o sostituite così come il path dell' icona). Salvate e uscite. Sempre nel terminale digitate:
sudo chmod 775 $HOME/Scrivania/DNS+Platypus.desktop |
Test
A questo punto potete testare il tutto lanciando il file appena creato DNS+Platypus e dovrebbe aprirsi un desktop virtuale 800x600 di wine con dentro Naturally Speaking e Platypus... Fatto ciò abilitate il microfono su DNS aprite gedit o kate e iniziate a parlare, se tutto è andato bene dovreste vedere le vostre parole comparire nell' editor di testo.
N.B. La finestra di Platypus generalmente deve stare in primo piano per funzionare.
Buon divertimento !