8230
Commento:
|
8670
aggiornata
|
Le cancellazioni sono segnalate in questo modo. | Le aggiunte sono segnalate in questo modo. |
Linea 1: | Linea 1: |
## page was renamed from Francesco de Virgilio/EternalLands ## page was renamed from Giochi/RpgMmporg/EternalLands #LANGUAGE it = Eternal Lands = ||<#EAE5DA -4 : tablewidth="100%" tablestyle="float: center; font-size: 0.85em;" style="border: medium none ;-moz-border-radius-topleft: 15px ;-moz-border-radius-topright: 15px;-moz-border-radius-bottomleft: 15px ;-moz-border-radius-bottomright: 15px ;">'''ETERNAL LANDS'''|| |
= UbuntuGames script (UGS) = '''UGS''' è uno script in [:Programmazione/Python:Python] realizzato per automatizzare l'inserimento delle nuove voci all'interno del [:Giochi:Portale Giochi] del [:Documentazione/Indice:Wiki] di Ubuntu-it. In particolare, lo script si occupa di facilitare la compilazione della tabella informativa relativa ad ogni gioco, oltre a svolgere altre varie funzioni. Lo script è rilasciato sotto licenza GPL v3. |
Linea 7: | Linea 5: |
||<#EAE5DA -4 : tablewidth="40%" tablestyle="float: right; font-size: 0.80em;" style="border: medium none ;-moz-border-radius-topleft: 15px ;-moz-border-radius-topright: 15px;"> {*} '''Scheda Tecnica'''|| ||<#EAE5DA : 25% style="border: medium none ;"> '''Categoria:'''||<#EAE5DA : 25% style="border: medium none ;"> MMORPG|| ||<#EAE5DA : 25% style="border: medium none ;"> '''N° di giocatori:'''||<#EAE5DA : 25% style="border: medium none ;"> Multigiocatore|| ||<#EAE5DA : 25% style="border: medium none ;"> '''Download:'''||<#EAE5DA : 25% style="border: medium none ;"> 39,9 MB|| ||<#EAE5DA : 25% style="border: medium none ;"> '''Sito Ufficiale:'''||<#EAE5DA : 25% style="border: medium none ;"> [http://www.eternal-lands.com]|| ||<#EAE5DA : 25% style="border: medium none ;-moz-border-radius-bottomleft: 15px ;"> '''Requisiti minimi:'''||<#EAE5DA : 25% style="border: medium none ;-moz-border-radius-bottomright: 15px ;"> '''''Processore:''''' Pentium 3 - 800MHZ[[BR]] '''''Memoria RAM:''''' 256MB[[BR]] '''''Scheda Video:''''' 3D da 32MB con supporto per OpenGL|| |
== Utilità == Lo script permette di evitare errori comuni durante la scrittura delle pagine di wiki nel Portale Giochi: * permette anche ai meno esperti della formattazione wiki di poter completare la tabella descrittiva senza difficoltà; * permette anche ai meno esperti di ottenere facilmente il codice da inserire nelle pagine di lista ([:Giochi/Azione], [:Giochi/RpgMmorpg:RpgMmorpg], ecc.); * evita che si possa creare una nuova pagina con un NomeWiki errato (controllo NomeWiki sia sul nome del gioco che su quello dell'utente); * evita che si dimentichi di inserire la licenza; * evita che vengano caricate immagini con lo stesso nome, o con nomi non significativi; * evita che si dimentichi la Category in fondo alla pagina; |
Linea 14: | Linea 14: |
== Download e Avvio == 0. La versione più aggiornata dello script è attualmente scaricabile con il comando da terminale{{{ cd wget http://fradeve.altervista.org/ugs-0.8.8.zip}}} 0. Al termine del download, [:AmministrazioneSistema/FormatiDiCompressione:estrarre] il pacchetto; è possibile anche farlo da terminale, con il comando{{{ cd unzip ugs-*.zip}}} 0. Eliminare l'archivio, ormai inutile, con il comando{{{ rm ugs-*.zip}}} 0. Entrare nella cartella dello script ed eseguirlo, con i comandi{{{ cd ugs python ugs.py}}} |
|
Linea 15: | Linea 27: |
== Rilasci e versioni == '''0.8.8''' * aggiunto supporto per tutti i browser (Firefox, Konqueror, Lynx, Netscape); dovrebbe supportare anche Internet Explorer; * supportato l'inserimento di "qualsiasi" nei campi Processore, RAM e Scheda video (automaticamente convertito in minuscolo nel caso si scriva "Qualsiasi"); * aggiunta la pulizia dei file dalla cartella `ugs/risultati`, ed eliminati eventuali messaggi d'errore legati all'assenza del file opzionale `lista.txt`; * è stato pulito un bel pò il codice, e create le funzioni "def" per snellire il processo del NomeWiki e della pulizia dei file. '''0.8''' * aggiunto controllo su quantità di RAM (MiB, GiB); * aggiunto controllo sulla grandezza del download (KiB, MiB); * aggiunto controllo sull'indirizzo del sito (supporto per "http://", "www" e "ftp://"); * migliorata leggibilità e pulizia dello script; ordinate sequenze delle azioni. '''0.7''' * aggiunta funzione di creazione della voce per i menù di sezione; * ottimizzato e ridotto il comando di avvio; * inserita funzione che controlla automaticamente la maiuscola all'inizio della descrizione della voce di lista; * sistemate cartelle dello script ed eliminati file inutili; * eliminata opzione non funzionante "modifica dati"; '''0.6''' * trasformazione di qualsiasi nome del gioco inserito dall'utente in un NomeWiki; * inserimento veloce di Categoria, N° Giocatori, Download, Sito Ufficiale, Requisiti Minimi; * selezione assistita della Licenza; * rinomina automaticamente l'immagine del gioco con il nome del gioco stesso; * inserimento della !CategoryGiochi solo se la guida è completa; * apertura diretta (in modalità ''edit'') della pagina Prove dell'utente (se la guida è incompleta) o direttamente della pagina del gioco (se la guida è completa); se il [:NomeWiki:NomeUtente] digitato alla richiesta non è corretto (per esempio, se scrivo ''Francesco de virgilio'' al posto di ''!FrancescoDeVirgilio''), viene automaticamente corretto dallo script. |
|
Linea 16: | Linea 52: |
== Note == * Il risultato dell'esecuzione dello script è visbile nei file `risultato.txt` e `lista.txt`, generati ''temporaneamente'' all'interno della cartella `usg/risultati`, ma copiati nella propria '''Home'''. * La cartella `ugs/non_modificare` contiene file essenziali per ottenere risultati corretti, quindi non vanno modificati nè rinominati. * Lo script attualmente supporta tutti i browser per GNU/Linux e dovrebbe funzionare anche su Windows con Internet Explorer. * Per il corretto funzionamento dello script, non bisogna rimuovere nessuno dei file dalla cartella `ugs`. * Alcune opzioni presenti nello script permettono di entrare nel Wiki di Ubuntu-it direttamente in modalità ''edit'', per cui, prima di utilizzarlo, è consigliabile essere iscritti al Wiki. -------------- [[BR]][[BR]][[BR]][[BR]][[BR]][[BR]][[BR]][[BR]][[BR]] = In lavorazione = = OCR - ''Optical Character Recognition'' = Con l'acronimo OCR si indica una tecnologia che consente di convertire le scansioni contenente testo in testo semplice. Ciò permette di risparmiare spazio su disco, modificare il testo o fare ricerche all'interno di esso. |
|
Linea 17: | Linea 64: |
* Il gioco è un MMORPG (Multi Massive On Line RPG) con una storia interessante: una civiltà fu innalzata per poter costruire un proprio mondo; per questo motivo i suoi abitanti si muovono continuamente per tutta l'estensione del suo territorio. * In Eternal Lands hai molte missioni da completare e vari oggetti ed abilità da sviluppare.Puoi, per esempio, estrarre minerali, forgiare armi, combinare oggetti tra loro e creare pozioni, armature, elmetti ed equipaggiamento in generale. |
Il [:Repository/Componenti:componente] '''universe''' di Ubuntu contiene i seguenti software OCR, pronti per l'[:AmministrazioneSistema/InstallareProgrammi:installazione]: * tesseract-ocr * ocrad * gocr |
Linea 20: | Linea 69: |
== Tesseract == === Introduzione === Il software che, in rapporto agli altri, produce i migliori risultati è Tesseract. È una tecnologia inizialmente sviluppata dai laboratori HP tra il 1985 e il 1995, che è stata rilasciata come Open Source nel 2005. Tesseract può riconoscere testi in 7 differenti linguaggi: inglese, tedesco, francese, italiano, spagnolo, portoghese brasiliano e olandese. È possibile, se necessario, installare più di un dizionario ed utilizzarli contemporaneamente. Il software non supporta l'analisi dei layout, quindi non si possono elaborare in automatico scansioni di testi multicolonna, immagini, equazioni, ecc. Inoltre, supporta come unico formato di input le immagini TIFF. |
|
Linea 21: | Linea 75: |
||<#EAE5DA -4 : tablewidth="50%" tablestyle="float: center; font-size: 0.85em;" style="border: medium none ;-moz-border-radius-topleft: 15px ;-moz-border-radius-topright: 15px;">''' {*} Screenshot del gioco'''|| ||<#EAE5DA : 30% style="border: medium none ;-moz-border-radius-bottomleft: 15px ;-moz-border-radius-bottomright: 15px ;">attachment:el.png|| |
=== Utilizzo === Tesseract è attualmente uno strumento utilizzabile solamente da riga di comando (è in lavorazione un'integrazione con l'interfaccia grafica di OCROpus). Dopo averlo installato, il programma può essere usato con il comando {{{tesseract <percorso del file TIFF> <nome del file di output> }}} Tesseract darà automaticamente al file prodotto l'estensione `.txt`. È importante che l'immagine TIFF abbia estensione `.tif` e non `.tiff`. Il comando, quindi, dovrebbe apparire come segue: {{{tesseract /home/utente/input.tif output }}} Dove `utente` è il nome della cartella Home dell'account in uso, `input.tif` è il documento che deve essere convertito e `output` è il documento che Tesseract creerà come `output.txt`. L'estensione `.txt` sarà aggiunta automaticamente da Tesseract. |
Linea 24: | Linea 85: |
== Installazione == /!\ NB: Tutto ciò che è riportato di seguito và eseguito nel Terminale di Ubuntu Linux. |
=== Preparare le immagini === Tesseract accetta solo immagini TIFF. Per ottimizzare le immagini per l'acquisizione con Tesseract, procedere come segue: * assicurarsi di avere installato '''[:Grafica/Gimp:GIMP]'''. * aprire '''GIMP''' e andare nel menù '''''Immagine -> Modalità''''' ed assicurarsi che l'immagine sia '''RGB''' o in '''Scala di grigi'''. * Selezionare dal menù '''''Strumenti -> Colore -> Soglia''''' e scegliere un valore di soglia adeguato. * Selezionare dal menù '''''Immagine -> Modalità -> Indicizzata''''' e dalle opzioni selezionare '''1-bit''' e '''Nessun dithering'''. |
Linea 27: | Linea 92: |
* 1. Entrare nel terminale e digitare: {{{ $ cd /usr/local/games }}} * 2. In questa cartella creiamone un'altra per il gioco, di nome "el": {{{ $ sudo mkdir el }}} * 3. Entriamo nella cartella creata: {{{ $ cd el }}} * 4. Fatto ciò, scarichiamo qui dentro il gioco: {{{ $ sudo wget http://el.other-life.com/downloads/el_133_linux_full.zip }}} * 5. Finito il download del gioco, estraiamolo dal file zip: {{{ $ sudo unzip el_133_linux_full.zip }}} * 6. Abbiamo quasi terminato. Inseriamo nel menù "Applicazioni > Giochi" l'icona del gioco: {{{ $ sudo gedit /usr/share/applications/eternal-lands.desktop }}} * 7. Fatto ciò, apparirà una finestra di testo vuota. Inseriamo il seguente contenuto: {{{ [Desktop Entry] Type=Application Version=1.33 Encoding=UTF-8 Name=Eternal Lands GenericName=MMORPG 3D Comment=A MMORPG 3D Game Icon=/usr/local/games/el/icon.bmp Exec=/usr/local/games/el/el-132.x86.linux.static Terminal=false StartupNotify=false Categories=Application;Game;ArcadeGame }}} |
=== Usare Tesseract con PDF multipagine === Spesso, i documenti scansionati vengono salvati come immagini in documenti PDF. Usando '''!ImageMagick''' ([:AmministrazioneSistema/InstallareProgrammi:installabile] tramite il pacchetto '''''imagemagick''''' reperibile dal componente [:Repository/Componenti:componente] '''universe'''), le singole pagine possono essere estratte come file TIFF per poi essere processate con Tesseract. Il seguente script può aiutare ad automatizzare il processo. |
Linea 67: | Linea 95: |
(./) Salvare (CTL+O) ed uscire dal documento (CTRL+X). Per aprire il gioco basta cliccare sull'icona nel menù delle applicazioni. | {{{#!/bin/sh PAGINE=100 # set to the number of pages in the PDF SORGENTE=book.pdf # set to the file name of the PDF OUTPUT=book.txt # set to the final output file RESOLUTION=600 # set to the resolution the scanner used (the higher, the better) |
Linea 69: | Linea 101: |
|| /!\ NB: Caso o game não abrir na pasta jogos que está na aplicações, vá na "Pasta Pessoal" que esta no '''Locais''' do Ubuntu e clique em: '''''Sistema de Arquivos > usr > local > games > el, ''''' depois clique em ''' "el.x86.linux.bin" ''' só pra aparecer a tela, aí na próxima vez que quiser jogar vai funcionar o ícone do game na pasta de Jogos normal. || | touch $OUTPUT for i in `seq 1 $PAGINE`; do convert -monochrome -density $RESOLUTION $SOURCE\[$i\] page$i.tif tesseract page$i.tif page$i cat $OUTPUT page$i.txt > temp.txt rm $OUTPUT rm page$i.tif rm page$i.txt mv temp.txt $OUTPUT done}}} |
Linea 71: | Linea 112: |
== Colocando as músicas do Eternal Lands == (./) Quando você está jogando o Eternal Lands, se percebe uma coisa.... Cade o som do game? |
Dopo aver avviato lo script, il testo trasformato dall'OCR dovrebbe essere contenuto nel file `libro.txt`. |
Linea 74: | Linea 114: |
(./) Calme-se o game tem som sim, então faça a seguinte dica: {1} Clique aqui http://www.eternal-lands.com/page/music.php e faça o download clicando em ''''' "Full Download, Music & .pll files (66MB zip file)" ''''' {2} Acabado o download do arquivo, vamos mover para o pasta "music" que esta dentro do diretório "el", e entra neste diretório pra descompactá-lo: {{{ $ sudo mv music_full.zip /usr/local/games/el/music }}} {{{ $ cd /usr/local/games/el/music }}} {{{ $ sudo unzip music_full.zip }}} {3} Está pronto, agora entre no game que vai ouvir o som do game!!! :D {*} ''''' Agradecimento pela ajuda do amigo " LedStyle ", por fazer este tutorial de instalação do game. ''''' {OK} = Kq = ||<#EAE5DA -4 : tablewidth="100%" tablestyle="float: center; font-size: 0.85em;" style="border: medium none ;-moz-border-radius-topleft: 15px ;-moz-border-radius-topright: 15px;-moz-border-radius-bottomleft: 15px ;-moz-border-radius-bottomright: 15px ;">'''KQ'''|| ||<#EAE5DA -4 : tablewidth="40%" tablestyle="float: right; font-size: 0.80em;" style="border: medium none ;-moz-border-radius-topleft: 15px ;-moz-border-radius-topright: 15px;"> {*} '''SCHEDA TECNICA'''|| ||<#EAE5DA : 25% style="border: medium none ;"> '''Categoria:'''||<#EAE5DA : 25% style="border: medium none ;"> RPG (stile Final Fantasy 1)|| ||<#EAE5DA : 25% style="border: medium none ;"> '''N° di giocatori:'''||<#EAE5DA : 25% style="border: medium none ;"> Giocatore singolo|| ||<#EAE5DA : 25% style="border: medium none ;"> '''Download:'''||<#EAE5DA : 25% style="border: medium none ;"> 2 MB|| ||<#EAE5DA : 25% style="border: medium none ;"> '''Sito ufficiale:'''||<#EAE5DA : 25% style="border: medium none ;"> [http://kqlives.sourceforge.net]|| ||<#EAE5DA : 25% style="border: medium none ;-moz-border-radius-bottomleft: 15px ;"> '''Requisiti minimi:'''||<#EAE5DA : 25% style="border: medium none ;-moz-border-radius-bottomright: 15px ;"> '''''Processore:''''' Pentium 2 - 500MHZ[[BR]] '''''Memoria RAM:''''' 128MB[[BR]] '''''Scheda video:''''' Onboard con non meno di 8MB|| ''' "Gioco di RPG nello spirito di Final Fantasy" ''' * KQ é è un gioco nello spirito di quelli sviluppati in console, come Il Segreto di Mana, come Final Fantasy I o Zelda. KQ è rilasciato sotto licenza GPL. * ureiros diferentes para visitar cidades, comprar armas e equipamento, aprender a mágica, matar monstros, e talvez você encontrará eventualmente a equipe de funcionários mágica de Xenarum! ||<#EAE5DA -4 : tablewidth="50%" tablestyle="float: center; font-size: 0.85em;" style="border: medium none ;-moz-border-radius-topleft: 15px ;-moz-border-radius-topright: 15px;">''' {*} Screenshot del gioco'''|| ||<#EAE5DA : 30% style="border: medium none ;-moz-border-radius-bottomleft: 15px ;-moz-border-radius-bottomright: 15px ;"> attachment:kq2.png|| == Installazione del gioco == Vai in '''Programmi''' > '''Aggiungi/Rimuovi...''', cerca "''kq''", segna la casella di spunta per il gioco e dai l'OK. http://nighto.net/downloads/ubuntugames/kq.png Se il gioco durante la ricerca non viene trovato, assicurarsi di aver attivato il repository ''universe'' in '''Programmi''' > '''Aggiungi/Rimuovi...''' > '''Proprietà'''. http://nighto.net/downloads/ubuntugames/adicionar-remover-propriedades.png Il gioco sarà installato, e potrà essere aperto da '''Programmi''' > '''Giochi''' > '''KQ'''. O, se preferisci... {1} Si può procedere ad una facile installazione del gioco anche da terminale: digitare: {{{ sudo apt-get install kq kq-data }}} I seguenti passi sono necessari per le versioni più vecchie di Ubuntu: {2} Quando il terminale ha completato l'installazione, vai nel'editor del Menù (__no Ubuntu Dapper esta em__: Programmi>Accessori>Alacarte). {3} Clicca su Giochi ed inserisci qui una nuova voce, con i seguenti dati: || Name: KQ || || Comment: RPG (Stile Final Fantasy 1) || || Command: /usr/games/kq || || Icon: /usr/share/games/kq/kq.xpm || |
= Ulteriori risorse = * [http://code.google.com/p/tesseract-ocr/ Sito ufficiale di Tesseract] * [http://www.gnu.org/software/ocrad/ocrad.html Sito ufficiale di GNU Ocrad] * [http://jocr.sourceforge.net/ Sito ufficiale di GOCR] |
UbuntuGames script (UGS)
UGS è uno script in [:Programmazione/Python:Python] realizzato per automatizzare l'inserimento delle nuove voci all'interno del [:Giochi:Portale Giochi] del [:Documentazione/Indice:Wiki] di Ubuntu-it. In particolare, lo script si occupa di facilitare la compilazione della tabella informativa relativa ad ogni gioco, oltre a svolgere altre varie funzioni. Lo script è rilasciato sotto licenza GPL v3.
Utilità
Lo script permette di evitare errori comuni durante la scrittura delle pagine di wiki nel Portale Giochi:
- permette anche ai meno esperti della formattazione wiki di poter completare la tabella descrittiva senza difficoltà;
permette anche ai meno esperti di ottenere facilmente il codice da inserire nelle pagine di lista ([:Giochi/Azione], [:Giochi/RpgMmorpg:RpgMmorpg], ecc.);
evita che si possa creare una nuova pagina con un NomeWiki errato (controllo NomeWiki sia sul nome del gioco che su quello dell'utente);
- evita che si dimentichi di inserire la licenza;
- evita che vengano caricate immagini con lo stesso nome, o con nomi non significativi;
- evita che si dimentichi la Category in fondo alla pagina;
Download e Avvio
La versione più aggiornata dello script è attualmente scaricabile con il comando da terminale
cd wget http://fradeve.altervista.org/ugs-0.8.8.zip
Al termine del download, [:AmministrazioneSistema/FormatiDiCompressione:estrarre] il pacchetto; è possibile anche farlo da terminale, con il comando
cd unzip ugs-*.zip
Eliminare l'archivio, ormai inutile, con il comando
rm ugs-*.zip
Entrare nella cartella dello script ed eseguirlo, con i comandi
cd ugs python ugs.py
Rilasci e versioni
0.8.8
- aggiunto supporto per tutti i browser (Firefox, Konqueror, Lynx, Netscape); dovrebbe supportare anche Internet Explorer;
- supportato l'inserimento di "qualsiasi" nei campi Processore, RAM e Scheda video (automaticamente convertito in minuscolo nel caso si scriva "Qualsiasi");
aggiunta la pulizia dei file dalla cartella ugs/risultati, ed eliminati eventuali messaggi d'errore legati all'assenza del file opzionale lista.txt;
è stato pulito un bel pò il codice, e create le funzioni "def" per snellire il processo del NomeWiki e della pulizia dei file.
0.8
- aggiunto controllo su quantità di RAM (MiB, GiB);
- aggiunto controllo sulla grandezza del download (KiB, MiB);
aggiunto controllo sull'indirizzo del sito (supporto per "http://", "www" e "ftp://");
- migliorata leggibilità e pulizia dello script; ordinate sequenze delle azioni.
0.7
- aggiunta funzione di creazione della voce per i menù di sezione;
- ottimizzato e ridotto il comando di avvio;
- inserita funzione che controlla automaticamente la maiuscola all'inizio della descrizione della voce di lista;
- sistemate cartelle dello script ed eliminati file inutili;
- eliminata opzione non funzionante "modifica dati";
0.6
trasformazione di qualsiasi nome del gioco inserito dall'utente in un NomeWiki;
- inserimento veloce di Categoria, N° Giocatori, Download, Sito Ufficiale, Requisiti Minimi;
- selezione assistita della Licenza;
- rinomina automaticamente l'immagine del gioco con il nome del gioco stesso;
inserimento della CategoryGiochi solo se la guida è completa;
apertura diretta (in modalità edit) della pagina Prove dell'utente (se la guida è incompleta) o direttamente della pagina del gioco (se la guida è completa); se il [:NomeWiki:NomeUtente] digitato alla richiesta non è corretto (per esempio, se scrivo Francesco de virgilio al posto di FrancescoDeVirgilio), viene automaticamente corretto dallo script.
Note
Il risultato dell'esecuzione dello script è visbile nei file risultato.txt e lista.txt, generati temporaneamente all'interno della cartella usg/risultati, ma copiati nella propria Home.
La cartella ugs/non_modificare contiene file essenziali per ottenere risultati corretti, quindi non vanno modificati nè rinominati.
- Lo script attualmente supporta tutti i browser per GNU/Linux e dovrebbe funzionare anche su Windows con Internet Explorer.
Per il corretto funzionamento dello script, non bisogna rimuovere nessuno dei file dalla cartella ugs.
Alcune opzioni presenti nello script permettono di entrare nel Wiki di Ubuntu-it direttamente in modalità edit, per cui, prima di utilizzarlo, è consigliabile essere iscritti al Wiki.
In lavorazione
OCR - ''Optical Character Recognition''
Con l'acronimo OCR si indica una tecnologia che consente di convertire le scansioni contenente testo in testo semplice. Ciò permette di risparmiare spazio su disco, modificare il testo o fare ricerche all'interno di esso.
Il [:Repository/Componenti:componente] universe di Ubuntu contiene i seguenti software OCR, pronti per l'[:AmministrazioneSistema/InstallareProgrammi:installazione]:
- tesseract-ocr
- ocrad
- gocr
Tesseract
Introduzione
Il software che, in rapporto agli altri, produce i migliori risultati è Tesseract. È una tecnologia inizialmente sviluppata dai laboratori HP tra il 1985 e il 1995, che è stata rilasciata come Open Source nel 2005. Tesseract può riconoscere testi in 7 differenti linguaggi: inglese, tedesco, francese, italiano, spagnolo, portoghese brasiliano e olandese. È possibile, se necessario, installare più di un dizionario ed utilizzarli contemporaneamente. Il software non supporta l'analisi dei layout, quindi non si possono elaborare in automatico scansioni di testi multicolonna, immagini, equazioni, ecc. Inoltre, supporta come unico formato di input le immagini TIFF.
Utilizzo
Tesseract è attualmente uno strumento utilizzabile solamente da riga di comando (è in lavorazione un'integrazione con l'interfaccia grafica di OCROpus). Dopo averlo installato, il programma può essere usato con il comando {{{tesseract <percorso del file TIFF> <nome del file di output> }}} Tesseract darà automaticamente al file prodotto l'estensione .txt. È importante che l'immagine TIFF abbia estensione .tif e non .tiff. Il comando, quindi, dovrebbe apparire come segue: {{{tesseract /home/utente/input.tif output }}} Dove utente è il nome della cartella Home dell'account in uso, input.tif è il documento che deve essere convertito e output è il documento che Tesseract creerà come output.txt. L'estensione .txt sarà aggiunta automaticamente da Tesseract.
Preparare le immagini
Tesseract accetta solo immagini TIFF. Per ottimizzare le immagini per l'acquisizione con Tesseract, procedere come segue:
assicurarsi di avere installato [:Grafica/Gimp:GIMP].
aprire GIMP e andare nel menù Immagine -> Modalità ed assicurarsi che l'immagine sia RGB o in Scala di grigi.
Selezionare dal menù Strumenti -> Colore -> Soglia e scegliere un valore di soglia adeguato.
Selezionare dal menù Immagine -> Modalità -> Indicizzata e dalle opzioni selezionare 1-bit e Nessun dithering.
Usare Tesseract con PDF multipagine
Spesso, i documenti scansionati vengono salvati come immagini in documenti PDF. Usando ImageMagick ([:AmministrazioneSistema/InstallareProgrammi:installabile] tramite il pacchetto imagemagick reperibile dal componente [:Repository/Componenti:componente] universe), le singole pagine possono essere estratte come file TIFF per poi essere processate con Tesseract. Il seguente script può aiutare ad automatizzare il processo.
{{{#!/bin/sh PAGINE=100 # set to the number of pages in the PDF SORGENTE=book.pdf # set to the file name of the PDF OUTPUT=book.txt # set to the final output file RESOLUTION=600 # set to the resolution the scanner used (the higher, the better)
touch $OUTPUT for i in seq 1 $PAGINE; do
- convert -monochrome -density $RESOLUTION $SOURCE\[$i\] page$i.tif tesseract page$i.tif page$i
cat $OUTPUT page$i.txt > temp.txt rm $OUTPUT rm page$i.tif rm page$i.txt mv temp.txt $OUTPUT
done}}}
Dopo aver avviato lo script, il testo trasformato dall'OCR dovrebbe essere contenuto nel file libro.txt.
Ulteriori risorse
[http://code.google.com/p/tesseract-ocr/ Sito ufficiale di Tesseract]
[http://www.gnu.org/software/ocrad/ocrad.html Sito ufficiale di GNU Ocrad]
[http://jocr.sourceforge.net/ Sito ufficiale di GOCR]