Logo Zephyrnet

Come eseguire l'OCR di un PDF

Data:

L'OCR (riconoscimento ottico dei caratteri) rappresenta una svolta per chiunque lavori con documenti PDF. I PDF sono noti per essere difficili da modificare e cercare. Quando si esegue l'OCR di un PDF, si garantisce che il testo venga scansionato ed estratto, rendendolo completamente ricercabile, modificabile e accessibile. 

In questa guida confronteremo vari metodi di elaborazione OCR dei PDF per aiutarti a scegliere quello migliore che si adatta alle tue esigenze. Discuteremo di Adobe Acrobat, di strumenti open source e di soluzioni basate sull'intelligenza artificiale. Inoltre, risponderemo a domande comuni, ad esempio come eseguire l'OCR di un PDF su un Mac, rendere ricercabile un PDF OCR e condivideremo suggerimenti su come migliorare la precisione dell'OCR.

Seguici per trasformare i tuoi flussi di lavoro PDF.

1. Utilizzo di Adobe Acrobat Pro

Adobe Acrobat Pro è considerato lo standard di riferimento per i PDF con OCR. In qualità di leader del settore nel software PDF, Adobe integra Acrobat Pro con funzionalità OCR avanzate che gestiscono facilmente documenti complessi.

Puoi eseguire l'OCR di un documento utilizzando Acrobat Pro in due modi:

Metodo 1

  1. Apri il file PDF in Adobe Acrobat Pro.
  2. Fare clic su "Tutti gli strumenti" nella barra degli strumenti.
  3. Apparirà un menu che elenca tutti gli strumenti disponibili. Fare clic su "Modifica PDF".
  4. Acrobat applicherà automaticamente l'OCR e convertirà il testo.
  5. Il documento è ora completamente modificabile e ricercabile. Cambia il carattere o aggiungi annotazioni secondo necessità. Puoi anche cercare il documento utilizzando lo strumento Trova.

Metodo 2

  1. Apri Adobe Acrobat Pro. 
  2. Fare clic su "Tutti gli strumenti" nella barra degli strumenti.
  3. Apparirà un menu che elenca tutti gli strumenti disponibili. Fare clic su "Scansione e OCR".
  4. Nello strumento Scansione e OCR, seleziona il file PDF di cui desideri eseguire l'OCR o scansiona un documento fisico direttamente utilizzando uno scanner collegato.
  5. Fare clic su "Migliora" se l'immagine necessita di essere ripulita. Ciò migliorerà la precisione dell'OCR. 
  6. Fare clic su "Riconosci testo" per avviare il processo OCR. Una volta completato, il PDF diventerà ricercabile e modificabile. Ora puoi modificare il testo.

Il vantaggio essenziale dell'utilizzo di Acrobat Pro è il suo motore OCR avanzato, in grado di gestire layout complessi, documenti a più colonne, scansioni a bassa risoluzione e testo scritto a mano con elevata precisione. È disponibile su dispositivi Windows, Mac e Android e puoi anche accedere a queste funzionalità online. Inoltre, è collegato all'app Adobe Mobile Scan, consentendoti di scansionare documenti mentre sei in movimento e sincronizzarli con la tua libreria Acrobat.

Tuttavia, devi essere abbonato ad Acrobat Pro per accedere alle funzionalità OCR. Il prezzo dell'abbonamento è pari a US$ 19.99/mese. Inoltre, sebbene ti consenta di caricare più file, dovrai eseguire l'OCR di ciascun file uno per uno manualmente. Quindi, se hai molti file da elaborare, può diventare noioso.

Gli strumenti OCR open source come Tesseract offrono un'alternativa gratuita per convertire i PDF in file ricercabili e modificabili. Anche se potrebbero non essere così completi come le soluzioni commerciali come Adobe Acrobat, forniscono un discreto livello di precisione per la maggior parte dei casi d'uso. 

Tesseract è disponibile per Windows, Mac e Linux. Dovrai prima installarlo sul tuo computer per usarlo. Una volta installato, puoi seguire questi passaggi per eseguire l'OCR di un PDF:

  1. Apri il file PDF in uno strumento di visualizzazione o editor come PDFelement. 
  2. Seleziona l'area o la pagina di cui desideri eseguire l'OCR e acquisisci uno screenshot. Ritaglia l'immagine se necessario.
  3. Apri Terminale per accedere a Tesseract. Se Tesseract non viene trovato nel Terminale, modifica il percorso della variabile di ambiente per indirizzarlo alla directory di installazione di Tesseract.
  4. Copia il percorso del file immagine che desideri sottoporre a OCR. Ad esempio: "C:UsersJohnDoePicturesScreenshotsScreenshot 230844.png"
  5. Immettere il seguente comando nel Terminale: "C:UsersJohnDoePicturesScreenshots>tesseract Screenshot 230844.png". Questo eseguirà l'OCR sull'immagine e convertirà qualsiasi testo trovato in un formato modificabile. 
  6. Una volta completato l'OCR, Tesseract genererà un file contenente tutto il testo estratto.
  7. Apri questo file in qualsiasi editor di testo per visualizzare e modificare il contenuto sottoposto a OCR. Puoi anche inserire il comando `–help` per ottenere l'elenco completo delle opzioni Tesseract, se necessario.

Il vantaggio fondamentale di Tesseract è che è completamente gratuito e open source, quindi non è necessario pagare alcun costo di licenza. Funziona bene su scansioni pulite e documenti digitati. 

Tuttavia, ha difficoltà con testo scritto a mano, layout complessi, sfondi colorati e scansioni a bassa risoluzione. Se i tuoi documenti sono puliti e digitati, Tesseract offre una soluzione gratuita per le esigenze OCR di base. 

Puoi migliorare la precisione di Tesseract preelaborando le scansioni prima di eseguire l'OCR, regolando la luminosità o il contrasto, applicando filtri, upscalando le immagini e altro ancora.

3. Utilizzo dell'OCR PDF di Nanonets

Nanonets è una soluzione di elaborazione dei documenti basata sull'intelligenza artificiale che offre funzionalità OCR avanzate. A differenza di Acrobat Pro o Tesseract, Nanonets è completamente online e non richiede installazione. Carica semplicemente i tuoi PDF sulla loro piattaforma cloud e inizia immediatamente a elaborarli utilizzando algoritmi OCR all'avanguardia. Può persino elaborare intere cartelle e centinaia di PDF in una volta sola.

I nanonet possono gestire qualsiasi cosa, dai semplici documenti digitati ai layout complessi con annotazioni scritte a mano, sfondi colorati, grafici e tabelle, utilizzando modelli di deep learning per ottenere un'elevata precisione su tutti i tipi di documenti.

Ecco come funziona:

  1. Visita Nanonets.com e crea un account gratuito.
  2. Seleziona un modello OCR dall'ampia gamma di modelli preaddestrati di Nanonets per fatture, ricevute o ordini di acquisto. Puoi anche creare un modello personalizzato su misura per i tuoi tipi di documenti specifici.
  3. Carica documenti che rappresentano i diversi layout e campi dati che devi estrarre. Nanonets analizzerà questi campioni per comprendere la struttura dei tuoi documenti.
  4. Definisci i campi chiave che desideri acquisire, come data, importo totale e dati della tabella. Puoi acquisire dati in quasi tutti i formati, incluse tabelle, testo, JSON o XML. Nanonets estrarrà automaticamente i dati dai tuoi PDF e li stamperà nel formato richiesto.
  5. Una volta configurato, carica i tuoi documenti PDF che devono essere sottoposti a OCR. Nanonets elaborerà i file utilizzando OCR avanzato e algoritmi intelligenti di estrazione dei dati per convertirli in formati ricercabili e modificabili con output di dati strutturati. 
  6. I dati estratti sono organizzati e strutturati in modo ordinato per poter essere inseriti direttamente in altri sistemi aziendali senza alcuno sforzo manuale. Puoi esportarlo come JSON, XML o formati personalizzati.

Nanonets offre una versione gratuita con un massimo di 500 pagine di elaborazione in modo che tu possa testarlo senza alcun costo. Dopodiché costa $ 0.3 per pagina per l'OCR.

A differenza di altre soluzioni, Nanonets è altamente scalabile. Può elaborare migliaia di pagine all'ora, garantendo che, indipendentemente dal volume, i tuoi file vengano elaborati quasi istantaneamente.

Puoi configurare webhook per trasmettere i dati elaborati ad altre app o utilizzare le API per sviluppatori di Nanonets per creare integrazioni personalizzate.

Come migliorare il processo OCR dei PDF

La tecnologia OCR, se implementata in modo efficace, può farti risparmiare tempo e risorse. Immagina di poter ridurre tempo di inserimento dati per campo del 95%. Il tuo team potrebbe concentrarsi su attività più significative rispetto al banale inserimento di dati.

Esploriamo i suggerimenti per migliorare l'accuratezza e l'efficacia del processo OCR dei PDF:

1. Preelaborare le scansioni prima dell'OCR

Se hai a che fare con documenti scansionati, puoi regolare la luminosità, il contrasto e la nitidezza e applicare filtri o tecniche di miglioramento dell'immagine per ridurre il rumore e migliorare la chiarezza. 

Ciò aumenterà significativamente la precisione dell'OCR. L'app Scanner di Adobe è dotata di funzionalità di miglioramento delle immagini integrate. Puoi anche utilizzare strumenti come PaperScan e NAPS2 per ripulire le scansioni. Dopo queste modifiche, puoi salvare le immagini modificate come PDF prima di eseguire l'OCR.

2. Configurare i flussi di lavoro di convalida e le gerarchie di approvazione

Migliora la qualità dei dati impostando regole di convalida per i dati estratti. Ad esempio, se il numero dell'ordine in un documento non ha cinque cifre, viene automaticamente rifiutato o contrassegnato per la revisione manuale. In questo modo puoi individuare gli errori di estrazione e approvare solo i dati validi. Puoi anche integrare il tuo sistema OCR con database per convalidare i dati estratti.

È possibile impostare gerarchie di approvazione in cui i dipendenti junior esaminano prima i dati, seguiti dai dipendenti senior per l'approvazione finale. Con le notifiche automatizzate e gli aggiornamenti di stato in tempo reale, puoi mantenere la trasparenza ed evitare la caccia all'approvazione, con conseguente elaborazione dei documenti più rapida.

3. Crea flussi di lavoro automatizzati

Immagina di gestire un'autonoleggio e di poter esportare automaticamente i dati della patente di guida dei clienti a Salesforce o inviare i dati delle fatture a QuickBooks senza alcun lavoro manuale. Non solo ottimizzerà il tuo PDF OCR ma anche le attività a valle.

L'integrazione della tua soluzione OCR con le app aziendali tramite API rende possibile questa automazione. Ad esempio, con Nanonets, puoi semplicemente impostare trigger in base a eventi come il completamento dell'elaborazione dei documenti, l'estrazione dei dati o il caricamento di un nuovo file. L'integrazione esporterà automaticamente i dati strutturati da Nanonet ai sistemi aziendali desiderati, tra cui QuickBooks, Xero, Microsoft Dynamics, Zendesk e molti altri, eliminando gli sforzi manuali e garantendo un flusso di dati senza interruzioni tra i sistemi.

4. Investi in OCR avanzato con funzionalità AI/ML

A differenza dell’OCR basato su regole, i modelli di intelligenza artificiale sono adattivi: imparano continuamente dalle correzioni umane e migliorano nel tempo. Ad esempio, Nanonets offre un modello di intelligenza artificiale proprietario addestrato su milioni di documenti, che gli consente di gestire in modo efficiente layout complessi e impegnativi.

L'OCR basato sull'intelligenza artificiale ti consente di estrarre informazioni dai documenti senza perdere il contesto. Può gestire diverse lingue, unità monetarie, legali o di misura. Questo livello di intelligenza non è possibile con l'estrazione basata su modelli o guidata da regole che si basa su posizioni esatte dei campi.

5. Addestrare i modelli AI-OCR

Sebbene le soluzioni OCR basate sull'intelligenza artificiale siano dotate di modelli pre-addestrati, addestrarli ulteriormente sui tipi di documenti e layout specifici può aumentare ulteriormente la precisione. Ad esempio, Nanonets ti consente di caricare un set campione di documenti che rappresentano i vari modelli, formati e campi che desideri acquisire.

Questi esempi aiutano il modello a comprendere la struttura dei documenti e a ottimizzare il processo OCR PDF. È inoltre possibile fornire feedback correggendo gli errori di estrazione identificati durante la convalida. Questa formazione human-in-the-loop migliora continuamente le prestazioni del modello di intelligenza artificiale.

6. Crea modelli OCR personalizzati quando richiesto

A volte, i modelli preaddestrati potrebbero non coprire tutte le complessità dei documenti. Ad esempio, potresti avere documenti specifici del settore con campi e formati univoci. In questi casi, puoi collaborare con il tuo fornitore di OCR per creare modelli di intelligenza artificiale personalizzati addestrati specificamente sui tuoi documenti. 

Con Nanonet, gli utenti possono creare modelli personalizzati specifici per i tipi di documenti e i campi da estrarre. Possono caricare documenti di esempio e annotarli con le etichette che desiderano estrarre. L’intelligenza artificiale apprende quindi da questi esempi ed è addestrata a riconoscere ed estrarre le informazioni specificate. Il sistema richiede almeno dieci esempi per ciascuna etichetta per ottenere una precisione ottimale e gli utenti possono monitorare il numero di esempi per ciascuna etichetta e aggiungerne altri secondo necessità.

Come iniziare con Nanonets PDF OCR

Nanonets semplifica l'utilizzo dell'OCR PDF. Basta registrarsi per un account gratuito sul sito web di Nanonets. Non è necessario fornire una carta di credito. 

Ecco una guida per aiutarti a iniziare:

  1. Iscriviti per un account gratuito: Visita Nanonets.com e registrati per un account gratuito: non è richiesta la carta di credito.
  2. Crea o scegli un modello: puoi creare un modello OCR personalizzato per i tuoi tipi di documenti specifici o selezionare tra i modelli preaddestrati di Nanonets per fatture, ricevute e altro.
  3. Configura l'importazione automatica: Inoltra e-mail o collega l'archiviazione cloud per importare nuovi PDF in Nanonets per l'elaborazione OCR continua automaticamente.
  4. Carica documenti di esempio: carica almeno 10 documenti di esempio che rappresentano i vari modelli, formati e campi dati che desideri estrarre. Ciò contribuirà ad addestrare il modello di intelligenza artificiale.
  5. Definire i campi da estrarre: specifica semplicemente i nomi per i campi dati critici che desideri estrarre dai tuoi documenti, come Data, Importo, Dati tabella, ecc.
  6. Imposta le convalide: configura le regole per convalidare i dati estratti e contrassegnare eventuali errori da correggere per garantire la precisione.
  7. Elabora i tuoi file: carica i tuoi documenti PDF. I nanonet li elaboreranno istantaneamente con l'OCR e l'estrazione intelligente dei dati.
  8. Esaminare e approvare i dati: controlla i dati estratti e approva le voci valide. Mantieni la trasparenza con gli aggiornamenti di stato.
  9. Esportare i dati nei sistemi aziendali: una volta approvati, esporta senza problemi i dati strutturati nel tuo ERP, contabilità, CRM o altri sistemi.
  10. Automatizza i flussi di lavoro: imposta i trigger per trasmettere i dati alle app quando un documento viene elaborato o i dati vengono estratti. Elimina gli sforzi manuali.

Nel complesso, Nanonets rende semplice e veloce l'aggiunta di funzionalità OCR intelligenti ai flussi di lavoro dei documenti. Il motore AI ad autoapprendimento offre un'elevata precisione fin dall'inizio, consentendo al tempo stesso la personalizzazione per gestire documenti complessi. Le integrazioni perfette con i sistemi aziendali consentono una vera automazione end-to-end.

Concludendo

L'OCR intelligente e l'estrazione dei dati possono aiutare a ottenere un enorme valore dai flussi di lavoro dei documenti. La chiave è scegliere una soluzione come Nanonets che offra fin dall’inizio l’OCR basato sull’intelligenza artificiale e consenta la personalizzazione per esigenze specifiche. 

Grazie alle funzionalità self-service per creare modelli personalizzati, l'accuratezza e l'automazione migliorano continuamente anche con l'evoluzione dei tuoi documenti. In definitiva, ciò garantisce la possibilità di gestire dati non strutturati su larga scala per favorire la produttività e la crescita.

spot_img

L'ultima intelligenza

spot_img