PDA

View Full Version : Scurire il testo di un file PDF per stamparlo


NaTaLoR
17-11-2008, 16:55
Salve, ho un file pdf composto da testo e immagini, si tratta di un documento abbastanza lungo, scannerizzato e salvato come pdf.
Se cerco di stampare questo documento il testo e' poco leggibile, perche' e' grigio scuro anziche' nero e si confonde spesso con lo sfondo.
Come posso rendere neri tutti i caratteri di questo documento, per poterli stampare e leggerli agevolmente?
Immagino che mi serva un programma che possa fare il riconoscimento del testo e che poi mi permetta di scurire i caratteri, me ne consigliate uno e mi indicate la procedura? Adobe Acrobat 9 puo' farlo? Se si mi dite come?
Grazie infinite.

red_pill
17-11-2008, 17:16
Ci provo. Fermo restando quanto hai scritto ("documento abbastanza lungo"), perchè non provare a variare la modalità di stampa? Quando vai a stampare il file dovresti cercare tra le opzioni della tua stampante e, magari, provare ad aumetare il getto d'inchiostro. Potrebbe essere?

Ripeto, se il file è lungo, non ti conviene (secondo me) rimaneggiarlo con altri programmi di grafica - ci hai pensato altrimenti: come faresti? Mh. Se usi Microsoft Office, potresti avere installato un programma chiamato Document Imaging (o simile) che a sua volta configura una stampante virtuale. Se non desideri seguire quanto ti ho scritto precedentemente, puoi provare allora a sfruttare questa stampante e poi, automaticamente, eseguire il riconoscimento OCR sul documento esportando lo stesso in *.DOC o *.TXT.

Non conosco altri metodi più semplici, diciamo.
Spero di esserti stato un pochino di aiuto.
Ciao.

red_pill
17-11-2008, 17:19
Sto leggendo qui (http://www.nntp.it/comp-grafica/799635-ocr-freeware-che-legga-da-pdf-esiste.html).
Da quel che ho capito l'Acrobat può fare ciò che chiedi; poi non so, personalmente non ho mai provato. E visto che il link che ti ho segnalato non sembra finire con una soluzione, qui (http://help.adobe.com/it_IT/Acrobat/8.0/Standard/help.html?content=WS58a04a822e3e50102bd615109794195ff-7f6f.html) (IT) v'è spiegato anche come correggere eventuali errori del riconoscimento OCR usando appunto l'Acrobat.

Ciao. :)

NaTaLoR
17-11-2008, 23:47
Cambiare le impostazioni della stampante per stampare piu' scuro ci ho pensato, ma il problema rimane perche' stampa piu' scuro anche lo sfondo, che continua a disturbare la lettura, e le immagini vengono incasinate (fanno parte del documento e sono necessarie pure quelle).
Ho avuto modo di aprire il pdf con acrobat (non il reader, acrobat proprio), ho visto che fa il riconoscimento del testo ma poi? Come faccio a scurire i caratteri? Purtroppo devo chiedere ogni volta il piacere a un amico che ce l'ha installato in ufficio per usare questo programma, ma non posso occupargli il pc troppo a lungo per smanettare con le impostazioni :(
Qualcuno sa come posso fare?

red_pill
18-11-2008, 20:28
Mh, perdonami se insisto ma prova ad usare anche Document Imaging (sempre che sul tuo PC sia installato). Ti ho descritto la procedura, abbastanza semplice. Se proprio vuoi modificare le pagine del PDF con un programma di Grafica 2D, puoi usare questo programma (clicca qui (http://www.print-driver.it/howto/conversione_pdf_in_jpeg.html)) che consente di esportare ogni pagina del PDF in immagine JPEG - al link a cui ti rimando c'è scritto come eseguire l'intera procedura di esportazione. Certo è che poi ti servono programmi di foto-ritocco atti appunto ad aumentare il contrasto ecc.

Sempre che non mi sbagli, penso di aver capito che il tuo PDF non è proprio composto da paginette semplici. Si tratta per caso di vere e proprie immagini alle quali è stato sovrapposto un testo (magari in grigetto)? 'Sto PDF come è fatto? Descrivilo, è in B/N? a Colori? Boh... Se è in B/N personalmente non so cosa consigliarti perchè è ovvio che vedrai sempre meno aumentando il getto di inchiostro (ed io ignoro ciò), ma se è a colori (ennesima ipotesi) qualcosa dovresti riuscire a vedere ugualmente (penso io).

Fammi sapere se desideri.
Ciao.

NaTaLoR
19-11-2008, 09:13
Il pdf è in bianco e nero, e' composto da testo e immagini, tutto su uno sfondo con un motivo grigio chiaro.
Poichè deriva da una scannerizzazione, i caratteri del testo non sono neri, ma grigio scuro, sul monitor si leggono abbastanza bene (e anche adobe li ha riconosciuti come testo) ma quando li vado a stampare si confondono con lo sfondo.
Quindi avrei bisogno di scurire soltanto i caratteri, lasciando inalterato lo sfondo (altrimenti la lettura sara' sempre faticosa) e le immagini (che stampandole piu' scure si capiscono meno).
Un programma di fotoritocco sarebbe in grado di riconoscere il testo e rendere tutti i caratteri neri, senza dover intervenire carattere per carattere?

NaTaLoR
20-11-2008, 08:44
nessuno riesce a darmi una mano?
:help:

red_pill
20-11-2008, 09:31
Devo dedurre che tu non abbia installato Document Imaging, a questo punto. Quello potrebbe fare benissimo ciò che chiedi, ma a quanto pare insisti solo sui programmi di grafica. E tra le altre cose, se hai letto bene, ti ho anche consigliato di visitare certi link... l'hai fatto? hai provato? Boh... come è andata?

qui (http://www.omniformat.com/download.html) << "OmniFormat supports Optical Character Recognition (OCR) and may also be used to convert images and documents to rights managed PDF files." (EN, Freeware)
Se ancora non ti va, o non ti fidi (perchè mi sembra assurdo che tu non abbia provato almeno una delle soluzioni che ti ho proposto) visita questo link (http://www.verypdf.com/download/download.htm) << vi potrai trovare convertitori da immagini a PDF leggibili ed eventualmente riconoscibili con una scansione OCR. Il software che "ti serve" puoi recuperarlo da qui (http://3d2f.com/programs/65-696-image-to-pdf-ocr-converter-download.shtml) (EN, Shareware)

Scusa la franchezza, ma adesso di programmi ne hai...
Fammi sapere se desideri.

Ciao.

raffaele2006
20-11-2008, 11:18
nessuno riesce a darmi una mano?
:help:
Il suggerimento più "pulito" te l'ho ha dato red_pill con Document Imaging.

Ma tu sembra che le risposte nemmeno le leggi:read:

NaTaLoR
24-11-2008, 15:00
Le risposte le leggo.. ma non avendo document imaging non potevo provare.
Pensavo si potesse fare con acrobat, che avevo gia' a disposizione, e cercavo una procedura per rendere i caratteri neri con quello.
Mi sono procurato document imaging, ho aperto il file e ho fatto il riconoscimento del testo. Ma ora?
Se esporto a word mi salta l'impaginazione, oltre al fatto che il riconoscimento che ha fatto e' in gran parte sbagliato (come dicevo lo sfondo interferisce con i caratteri).
C'e' un modo per rendere i caratteri piu' scuri, usando documenti imaging, senza passare tutto a word?
Oppure usando adobe?

NaTaLoR
24-11-2008, 15:10
Ps ribadisco che non cerco necessariamente un programma di riconoscimento del testo, né di esportazione dei pdf.
Mi serve un programma che, dopo aver "capito" che quella parte di documento e' un testo, mi dia gli strumenti per renderlo piu' scuro, poi non importa se il riconoscimento che ha fatto e' accurato. Sia con adobe che con document imaging riesco a fare meta' del lavoro, ovvero faccio la scansione ocr e tutti i caratteri sono effettivamente considerati parti di testo, che posso evidenziare ecc. ma non trovo in nessuno la possibilità di renderle neri i caratteri.

NaTaLoR
02-12-2008, 19:25
help?

brown
03-12-2008, 08:16
usa openoffice3+estensione per pdf .. cosi ti diventa come un doc