PDA

View Full Version : sicurezza e OCR


sarracino5
05-11-2010, 10:33
se non è la sezione giusta prego i mod di spostare la discussione!

vorrei sapere se esistono caratteri invisibili da inserire all'interno di un testo word o pdf per fare in modo che un OCR non riconosca ed analizzi il testo!

grazie mille

ziozetti
07-11-2010, 00:40
O di OCR sta per optical, se è invisibile non lo vede e non lo riconosce...

sarracino5
07-11-2010, 17:49
grazie mille fin qui ci ero arrivato!
ora grazie alla protezione del pdf a 256 bit
sono riuscito ad impedire nell'ordine
a trasformarlo in word sia con abby che con scansoft
ad impedire che venga letto da systran, omnipage e finereader
a bloccare la stampa con risoluzione massima di 150 dpi
impedire che venga esportato con acrobat stesso in altri formati
ovviamente che all'interno di pdf che sia effettuato il copia incolla
che sia craccata la pssword di pdf sia con programmi online che con qualcuno scaricato (non mi ricordo i nomi)

le mie domande sono ora

1 a 150 dpi essendo quasi solo testo verrà riconosciuto lo stesso una volta stampato?
2 con linux si possono aggirare queste protezioni?
3 esistono altri modi di aggirarle che potrei provare?
4 per word come faccio?

ziozetti
07-11-2010, 22:35
1 a 150 dpi essendo quasi solo testo verrà riconosciuto
lo stesso una volta stampato?

Certo che si, è sufficiente un buono scanner... e magari prima una buona stampante. Se suoi stamparlo puoi scannerizzarlo.

wjmat
08-11-2010, 01:05
la stampa puoi anche bloccarla completamente mi risulta
con questo file un utente cosa deve poter fare?

sarracino5
08-11-2010, 12:32
meglio poter dire cosa non deve fare
deve poter leggerlo, e quindi senza passw di lettura apertura e forse stamaparlo!
sapevo di poter impedire la stampa ma per adesso volevo evitare!
tutto il resto voglio che sia impedito!

sostanzialmente il testo non deve essere disponibile elettronicamente...

sarracino5
08-11-2010, 12:36
Certo che si, è sufficiente un buono scanner... e magari prima una buona stampante. Se suoi stamparlo puoi scannerizzarlo.

avevi ragione ho fatto la prova con la mia stampante (che cetamente non è ottima... ) e il testo oltre a leggersi perfettamente è in grado di essere scannerizzato
per questo mi chiedevo se esistesse tipo uno script che impedisse grazie a caratteri speciali nascoti il riconoscimento!
ho letto che alcuni hacker per evitare che la loro posta spam sia individuata dagli antispam ocr riescono a modificare il testo, con scrittura tipo corsivo o rovesciando alcune lettere ho visto come, ma risulta illeggibile! e questa invece è una caratteristica che non deve perdere!

wjmat
08-11-2010, 13:59
diciamo quindi che non deve essere nemmeno stampabile per evitare la scannerizzazione da carta
le pagine sono tante? perchè volendo uno potrebbe comunque farsi gli screenshot a video e ricomporre il mosaico :D
potresti in alternativa inserire uno sfondo di "disturbo" sempre che poi si riesca a leggere :)

wizard1993
08-11-2010, 17:45
diciamo quindi che non deve essere nemmeno stampabile per evitare la scannerizzazione da carta
le pagine sono tante? perchè volendo uno potrebbe comunque farsi gli screenshot a video e ricomporre il mosaico :D
potre in alternativa inserire uno sfondo di "disturbo" sempre che poi si riesca a leggere :)

e poi arrivare ai captcha (o come si chiamano) che non si leggono nemmeno?

wjmat
08-11-2010, 18:12
e poi arrivare ai captcha (o come si chiamano) che non si leggono nemmeno?
estremizzando si arriverebbe a quello :D

sarracino5
08-11-2010, 22:29
diciamo quindi che non deve essere nemmeno stampabile per evitare la scannerizzazione da carta
le pagine sono tante? perchè volendo uno potrebbe comunque farsi gli screenshot a video e ricomporre il mosaico :D
potresti in alternativa inserire uno sfondo di "disturbo" sempre che poi si riesca a leggere :)

la pagine sarebbero un centinaio su per giù!
interessante l'idea del fondo di disturbo! ho provato con la filigrana di word (prima della trasformazione in pdf) ma non si vede nulla (la filigrana dico)

sono andato a vedermi che sono i chapta....
non esiste un programma che quando si stampa il file inverta una lettera di 180° o la rifletta o la ruoti?
non permettendo a questo punto neanche un ocr?

ziozetti
09-11-2010, 10:58
la pagine sarebbero un centinaio su per giù!
interessante l'idea del fondo di disturbo! ho provato con la filigrana di word (prima della trasformazione in pdf) ma non si vede nulla (la filigrana dico)

Hai selezionato tutte le eventuali opzioni di stampa?

non esiste un programma che quando si stampa il file inverta una lettera di 180° o la rifletta o la ruoti?
non permettendo a questo punto neanche un ocr?
Sono tutti palliativi, rendono più difficile la scansione ma chi ha necessità di "rubarti" il file lo farà.

sarracino5
09-11-2010, 17:02
Hai selezionato tutte le eventuali opzioni di stampa?

Sono tutti palliativi, rendono più difficile la scansione ma chi ha necessità di "rubarti" il file lo farà.

bè che non sia inviolabile è ovvio! ma è atrettanto vero che non andrà in mano al "condor" però volevo sapere quali mezzi si potessero ulteriormente usare per provarli io stesso ed eventualemnte adottare ulteriori contromisure!
nessuno mi ha detto con linux!