Indice

Introduzione
Requisiti Software
Requisiti hardware
1. Requisiti minimi
2. Requisiti consigliati
Installazione
1. Installazione Dragon Naturally SPeaking
2. Installazione Platypus
  1. Configurazione Platypus
  2. Modifica del lanciatore
Lanciatore DNS + Platyplus
Test

Questa guida è stata verificata solo con versioni obsolete di Ubuntu, potrebbe non essere più valida. Vuoi contribuire ad aggiornarla? Clicca qui!

Problemi in questa pagina? Segnalali in questa discussione

Introduzione

La tecnologia del riconoscimento vocale ha fatto passi da gigante negli ultimi anni, la dimostrazione è l' avanzato strumento di riconoscimento vocale presente di default su Win 7. I primi motori e modelli acustici risalgono alla prima metà degli anni 80 in ambiente DOS, da allora sono sorti svariati progetti di ricerca portati avanti da diversi centri di ricerca universitaria di tutto il mondo. Lo scopo di questa guida è descrivere passo passo il procedimento da seguire per ottenere un sistema di riconoscimento vocale professionale.

Requisiti Software

Ubuntu 12.04 32 bit - Free
Dragon Naturally Speaking 11 Premium edition - Non Free
Wine 1.4 - Free
Platypus - Free

Requisiti hardware

Requisiti minimi

CPU: 1 GHz Intel Pentium o equivalente processore AMD, o 1.66 GHz Intel Atom processor. (Richiesto set di istruzioni SSE2.)
Cache Processore: 512 KB'
Memoria(RAM): 1 GB per Windows XP e Windows Vista, 2GB per Windows 7 e Windows Server 2003/2008.'
Spazio Libero su disco: 2.5 GB (2.8 GB per versioni non-english)'
DVD-ROM drive (richiesto per l'installazione)
Microsoft Internet Explorer 6 o superiore
Nuance-approved elimina-rumore microfono headset (o equivalente)
Sound card capace di supportare 22 kHz e regisytrazione a 16 bit.

Requisiti consigliati

CPU: Intel Pentium 2.4 GHz (dual 1.8 GHz core processor) equivalente processore AMD. (Richiesto set di istruzioni SSE2.)
Cache Processore: 2 MB'
Memoria (RAM): 2 GB RAM per Windows XP e Windows Vista, 4 GB per Windows 7 e Windows Server 2003/2008 64-bit.

Installazione

Installare wine

Installazione Dragon Naturally SPeaking

E' consigliabile installare il programma in un WINEPREFIX differente da $HOME/.wine in modo da evitare di perdere le impostazioni semmai la directory princiaple venisse compromessa, aprite un terminale e digitate:

export WINEPREFIX=$HOME/.dictation

Sempre nella stessa sessione di terminale procedete all'installazione di Dragon Naturally Speaking, navigando fino alla directory di destinazione del file setup.exe. Se i file si trovano su CD prima vanno copiati su HD. Terminata l' installazione potete procedere al lancio del programma ed alla sua configurazione e registrazione che per ora può anche essere effettuato nel desktop attuale. La configurazione richiede diversi minuti in quanto si deve creare il profilo utente e la vostra voce dovra essere riconosciuta. Se durante i test di prova del microfono doveste ricevere degli errori potrebbe voler dire o che il vostro microfono è di bassa qualità, o che siete in un ambiente troppo rumuroso, oppure che avete il microfono disattivato. Per controllare lo stato della periferica andate nel terminale e digitate:

alsamixer -V all

Assicuratevi che la periferica capture sia abilitata e che i livelli del vostro microfono siano a circa metà, è importante che il volume non sia troppo alto altrimenti il captureing risulterà disturbato e riceverete messaggi di errore. Se in alsamixer il vostro microfono non compare significa che avete dei problemi con i driver della vostra scheda audio, e dovete cercare di risolverli prima di poter utilizzare la periferica. Una volta terminata la fase di configurazione dovrebbe essere tutto funzionante, avrete di fronte una sobria toolbar con la varie opzioni, selezionate l' icona sulla sinistra per abilitare il microfono e andate nel menu Strumenti e selezionate Dragon Pad . Ora iniziate a parlare e se tutto è andato a buon fine dovreste vedere le vostre parole scorrere fluentemente nell' editor di testo. Se la velocità risulta rallentata ciò è imputabile al fatto che il programma ancora non riconosce la vostra voce e fa fatica ad elaborare i dati, cosa che viene superata in qualche settimana di utilizzo e di ottimizzazione delle librerie acustiche, oppure potrebbe essere dovuto ad una carenza di memoria RAM. Se utilizzate un sistema come il mio che rientra appena nei requisiti minimi comunque non aspettatevi le velocità citate all' inizio, ad ogni modo la modalità dettatura risulta più che utilizzabile e l' impartimento dei comandi è pressochè perfetto con un ritardo di circa mezzosecondo tra il comando e l' azione.

Fatto ciò bisogna ora passare all' installazione di un programma geniale che ci consentirà di esportare in tempo reale i dati catturati da DNS e passarli in automatico all' host Linux, per questo ci viene in soccorso Platypus.

Installazione Platypus

Il programma è scaricabile qui http://thenerdshow.com/platypus.html dove ci sono anche le istruzioni di installazione e configurazione, purtroppo però le informazioni sono obsolete e durante la configurazione e la compilazione si incontrano diversi messaggi di errore vediamo come risolverli ed istallare il programma. Scaricare il file platypus.zip dal sito e scompattarlo in una directory operativa precedentemente creata, digitare:

mkdir $HOME/platypus

unzip PERCORSO_DEL_FILE_ZIP/platypus.zip $HOME/platypus

Ora sempre nel terminale digitate:

sudo apt-get install wine1.4-dev libX11-dev libXtst-dev

Una volta installati i pacchetti necessari alla compilazione andate in $HOME e controllate se la cartella del desktop si chiama Desktop o Scrivania, nel caso si chiamasse scrivania, digitate nel terminale :

mkdir Desktop

E' necessario creare la directory temporaneamente perchè la compilazione cercherà questa cartella. Moversi nella directory $HOME/platypus/platypus e digitate nel terminale:

./configure -l /usr/lib/i386-linux-gnu

questo è necessario poichè il PATH delle librerie necessarie alla configurazione in ubuntu 12.04 è differente da quello di default

Ora date:

make && make install

e il gioco è fatto. Nella cartella $HOME/Desktop ora è presente il lanciatore platypus.desktop . Potete spostarlo su Scrivania ed eliminare la cartella Desktop precedentemente creata con:

rm -r Desktop

(Solo nel caso in cui di default la vostra cartella si chiami Scrivania !)

Configurazione Platypus

Per utilizzare comandi vocali è sufficiente editare il file $HOME/.dictation/drive_c/Program\ Files/Platypus/platypus_commands digitando:

sudo nano $HOME/.dictation/drive_c/Program\ Files/Platypus/platypus_commands

scrivendo a sinistra il comando e destra l' azione, ad esempio:

"nuova scheda" "Control_L t"

che farà sì che dicendo nuova scheda in firefox si aprirà una nuova scheda (Ctrl+t)...

Modifica del lanciatore

Il lanciatore va modificato perchè così com'è non funziona, e poichè il nostro obiettivo è far sì che platypus venga lanciato nello stesso desktop di DNS, di default wine invece assegna due desktop virtuali differenti ai due programmi.

Per risolvere la questione è sufficiente modificare il lanciatore, digitate nel terminale:

sudo nano $HOME/Scrivania/platypus.desktop

cancellate il contenuto e copiate questo:

[Desktop Entry]

Comment[en_US]=

Comment=

Encoding=UTF-8

Exec=env WINEPREFIX="$HOME/.dictation" wine C:\\\\Program\\ Files\\\\Platypus\\\\platypus.exe

GenericName[en_US]=

GenericName=

Icon=$HOME/.local/share/icons/platypus.png

MimeType=

Name[en_US]=Platypus

Name=Platypus

Path=/$HOME/.dictation/dosdevices/c:/Program Files/Platypus

StartupNotify=true

Terminal=false

TerminalOptions=

Type=Application

Version=1.0

X-DBUS-ServiceName=

X-DBUS-StartupType=

X-KDE-SubstituteUID=false

X-KDE-Username=

salvate e chiudete. Ora per far partire il tutto potrete aprire dapprima il lanciatore NatSpeak.exe e una volta caricato aprire Platypus dal lanciatore appena modificato.

Lanciatore DNS + Platyplus

Per realizzare un semplice lanciatore che permetta di caricare entrambi contemporaneamente basta digitare nel terminale:

sudo nano $HOME/Scrivania/DNS+Platypus.desktop

e copiare al suo interno:

||[Desktop Entry]

Comment[en_US]=

Comment=

Exec=wine explorer /desktop=natspeak.exe,800x600 $HOME/.dictation/drive_c/Program\\ Files/Nuance/NaturallySpeaking11/Program/natspeak.exe | wine explorer /desktop=natspeak.exe,800x600 $HOME/.dictation/drive_c/Program\\ Files/Platypus/platypus.exe\n

GenericName[en_US]=DNS+platypus

GenericName=DNS+platypus

Icon=/usr/share/icons/Faenza/apps/128/preferences-system-performance.png

MimeType=

Name[en_US]=DNS+platy

Name=DNS+platy

Path=

StartupNotify=true

Terminal=false

TerminalOptions=

Type=Application

X-DBUS-ServiceName=

X-DBUS-StartupType=

X-KDE-SubstituteUID=false

X-KDE-Username=

(Ovviamente le stringhe relative a KDE possono essere eliminate o sostituite così come il path dell' icona). Salvate e uscite. Sempre nel terminale digitate:

sudo chmod 775 $HOME/Scrivania/DNS+Platypus.desktop

Test

A questo punto potete testare il tutto lanciando il file appena creato DNS+Platypus e dovrebbe aprirsi un desktop virtuale 800x600 di wine con dentro Naturally Speaking e Platypus... Fatto ciò abilitate il microfono su DNS aprite gedit o kate e iniziate a parlare, se tutto è andato bene dovreste vedere le vostre parole comparire nell' editor di testo.

N.B. La finestra di Platypus generalmente deve stare in primo piano per funzionare.

Buon divertimento !

CategoryNuoviDocumenti