Zephyrnet Logosu

PDF'ye OCR nasıl yapılır

Tarih:

OCR (Optik Karakter Tanıma), PDF belgeleriyle çalışan herkes için oyunun kurallarını değiştiren bir özelliktir. PDF'lerin düzenlenmesi ve içinde arama yapılmasının zor olmasıyla ünlüdür. Bir PDF'ye OCR işlemi uyguladığınızda, metnin taranmasını ve çıkarılmasını sağlayarak metnin tamamen aranabilir, düzenlenebilir ve erişilebilir olmasını sağlar. 

Bu kılavuzda, gereksinimlerinize en uygun olanı seçmenize yardımcı olmak için PDF'leri OCR'ye dönüştürmenin çeşitli yöntemlerini karşılaştıracağız. Adobe Acrobat'ı, açık kaynak araçlarını ve yapay zeka destekli çözümleri tartışacağız. Ek olarak, Mac'te bir PDF'nin nasıl OCR'lanacağı, bir PDF OCR'nin aranabilir hale getirilmesi gibi genel soruları yanıtlayacağız ve OCR doğruluğunu artırmaya yönelik ipuçları paylaşacağız.

PDF iş akışlarınızı dönüştürmek için takip edin.

1. Adobe Acrobat Pro'yu Kullanma

Adobe Acrobat Pro, PDF'lerin OCRlanması için altın standart olarak kabul edilir. PDF yazılımında sektör lideri olan Adobe, Acrobat Pro'yu karmaşık belgeleri kolayca işleyen gelişmiş OCR özellikleriyle donatır.

Acrobat Pro'yu kullanarak bir belgeyi iki şekilde OCR'layabilirsiniz:

Yöntem 1

  1. PDF dosyasını Adobe Acrobat Pro'da açın.
  2. Araç çubuğunda “Tüm Araçlar”a tıklayın.
  3. Mevcut tüm araçları listeleyen bir menü görünecektir. “PDF'yi Düzenle”ye tıklayın.
  4. Acrobat otomatik olarak OCR uygulayacak ve metni dönüştürecektir.
  5. Belge artık tamamen düzenlenebilir ve aranabilir durumdadır. Gerektiğinde yazı tipini değiştirin veya ek açıklamalar ekleyin. Belgede Bul aracını kullanarak da arama yapabilirsiniz.

Yöntem 2

  1. Adobe Acrobat Pro'yu açın. 
  2. Araç çubuğunda “Tüm Araçlar”a tıklayın.
  3. Mevcut tüm araçları listeleyen bir menü görünecektir. “Tara ve OCR” seçeneğine tıklayın.
  4. Tarama ve OCR aracında, OCR yapmak istediğiniz PDF dosyasını seçin veya fiziksel bir belgeyi doğrudan bağlı bir tarayıcıyı kullanarak tarayın.
  5. Görüntünün temizlenmesi gerekiyorsa "Geliştir"e tıklayın. Bu, OCR doğruluğunu artıracaktır. 
  6. OCR işlemini başlatmak için “Metni Tanı”ya tıklayın. Tamamlandığında PDF aranabilir ve düzenlenebilir hale gelecektir. Artık metni düzenleyebilirsiniz.

Acrobat Pro kullanmanın temel avantajı, karmaşık düzenleri, çok sütunlu belgeleri, düşük çözünürlüklü taramaları ve el yazısı metinleri yüksek doğrulukla işleyebilen gelişmiş OCR motorudur. Windows, Mac ve Android cihazlarda mevcuttur ve bu özelliklere çevrimiçi olarak da erişebilirsiniz. Üstelik Adobe Mobile Scan uygulamanıza bağlı olup, belgeleri hareket halindeyken taramanıza ve bunları Acrobat kitaplığınızla senkronize etmenize olanak tanır.

Ancak OCR özelliklerine erişebilmek için Acrobat Pro abonesi olmanız gerekir. Aboneliğin fiyatı şu şekildedir: 19.99 ABD$/ay. Ayrıca, birden fazla dosya yüklemenize izin verirken, her dosyayı tek tek manuel olarak OCR yapmanız gerekecektir. Dolayısıyla, işlenecek çok sayıda dosyanız varsa sıkıcı olabilir.

Tesseract gibi açık kaynaklı OCR araçları, PDF'leri aranabilir, düzenlenebilir dosyalara dönüştürmek için ücretsiz bir alternatif sunar. Adobe Acrobat gibi ticari çözümler kadar tam özellikli olmasalar da çoğu kullanım durumunda makul düzeyde doğruluk sağlarlar. 

Tesseract Windows, Mac ve Linux'ta mevcuttur. Kullanmak için öncelikle bilgisayarınıza yüklemeniz gerekmektedir. Kurulduktan sonra PDF'ye OCR yapmak için şu adımları takip edebilirsiniz:

  1. PDF dosyasını PDFelement gibi bir görüntüleyici veya düzenleyici araçta açın. 
  2. OCR yapmak istediğiniz alanı veya sayfayı seçin ve ekran görüntüsünü alın. Gerekirse görüntüyü kırpın.
  3. Tesseract'a erişmek için Terminali açın. Tesseract Terminal'de bulunamazsa, Tesseract kurulum dizinine yönlendirmek için ortam değişkeni yolunu düzenleyin.
  4. OCR'a eklemek istediğiniz görüntü dosyasının yolunu kopyalayın. Örneğin: "C:UsersJohnDoePicturesScreenshotsScreenshot 230844.png"
  5. Terminal'e şu komutu girin: “C:UsersJohnDoePicturesScreenshots>tesseract Screenshot 230844.png”. Bu, görüntü üzerinde OCR'yi çalıştıracak ve bulduğu metni düzenlenebilir bir formata dönüştürecektir. 
  6. OCR tamamlandıktan sonra Tesseract, çıkarılan tüm metni içeren bir dosya oluşturacaktır.
  7. OCR içeriğini görüntülemek ve düzenlemek için bu dosyayı herhangi bir metin düzenleyicide açın. Gerekirse Tesseract seçeneklerinin tam listesini almak için `–help` komutunu da girebilirsiniz.

Tesseract'ın kritik avantajı tamamen ücretsiz ve açık kaynak olması, dolayısıyla herhangi bir lisans ücreti ödemenize gerek olmamasıdır. Temiz taramalarda ve yazılı belgelerde iyi çalışır. 

Ancak el yazısı metinler, karmaşık düzenler, renkli arka planlar ve düşük çözünürlüklü taramalarla mücadele ediyor. Belgeleriniz temiz ve daktilo edilmişse Tesseract, temel OCR ihtiyaçları için ücretsiz bir çözüm sunar. 

OCR'yi çalıştırmadan önce taramaları ön işleme tabi tutarak (parlaklığı veya kontrastı ayarlayarak, filtreler uygulayarak, görüntülerin ölçeğini yükselterek ve daha fazlasını yaparak) Tesseract'ın doğruluğunu artırabilirsiniz.

3. Nanonets'in PDF OCR'ını Kullanma

Nanonets, gelişmiş OCR yetenekleri sunan yapay zeka destekli bir belge işleme çözümüdür. Acrobat Pro veya Tesseract'ın aksine Nanonets tamamen çevrimiçidir ve kurulum gerektirmez. PDF'lerinizi bulut platformuna yüklemeniz yeterlidir ve platform bunları en son teknolojiye sahip OCR algoritmalarını kullanarak hemen işlemeye başlar. Hatta tüm klasörleri ve yüzlerce PDF'yi tek seferde işleyebilir.

Nanonet'ler, tüm belge türlerinde yüksek doğruluk elde etmek için derin öğrenme modellerini kullanarak, basit yazılmış belgelerden el yazısıyla yazılmış açıklamalar, renkli arka planlar, grafikler ve tablolar içeren karmaşık düzenlere kadar her şeyi işleyebilir.

İşte nasıl çalışır:

  1. Türkiye Dental Sosyal Medya Hesaplarından bizi takip edebilirsiniz. Nanonets.com ve ücretsiz bir hesap oluşturun.
  2. Faturalar, makbuzlar veya satın alma siparişleri için Nanonets'in önceden eğitilmiş geniş model yelpazesinden bir OCR modeli seçin. Ayrıca belirli belge türlerinize göre uyarlanmış özel bir model de oluşturabilirsiniz.
  3. Çıkarmanız gereken farklı düzenleri ve veri alanlarını temsil eden belgeleri yükleyin. Nanonets, belgelerinizin yapısını anlamak için bu örnekleri analiz edecektir.
  4. Tarih, toplam tutar ve tablo verileri gibi yakalamak istediğiniz önemli alanları tanımlayın. Tablolar, metin, JSON veya XML dahil hemen hemen her formattaki verileri yakalayabilirsiniz. Nanonets, verileri PDF'lerinizden otomatik olarak çıkaracak ve gerekli formatta yayınlayacaktır.
  5. Yapılandırıldıktan sonra OCR işlemine tabi tutulması gereken PDF belgelerinizi yükleyin. Nanonets, dosyaları gelişmiş OCR ve akıllı veri çıkarma algoritmalarını kullanarak işleyecek ve bunları yapılandırılmış veri çıkışıyla aranabilir, düzenlenebilir formatlara dönüştürecek. 
  6. Çıkarılan veriler, manuel çaba gerektirmeden doğrudan diğer iş sistemlerine aktarabilmeniz için düzgün bir şekilde organize edilmiş ve yapılandırılmıştır. JSON, XML veya özel formatlarda dışa aktarabilirsiniz.

Nanonets, 500'e kadar işlem sayfası içeren ücretsiz bir sürüm sunar, böylece hiçbir ücret ödemeden test edebilirsiniz. Bundan sonra maliyeti sayfa başına 0.3 ABD doları OCR için.

Diğer çözümlerin aksine Nanonets oldukça ölçeklenebilirdir. Saatte binlerce sayfayı işleyebilir ve hacmi ne olursa olsun dosyalarınızın neredeyse anında işlenmesini sağlar.

İşlenmiş verileri diğer uygulamalara aktarmak için web kancaları ayarlayabilir veya özel entegrasyonlar oluşturmak için Nanonets'in geliştirici API'lerini kullanabilirsiniz.

PDF OCR süreci nasıl geliştirilir?

OCR teknolojisi etkili bir şekilde uygulandığında zamandan ve kaynaklardan tasarruf etmenizi sağlayabilir. azaltabildiğinizi hayal edin Alan başına veri giriş süresi %95 arttı. Ekibiniz sıradan veri girişinden daha anlamlı görevlere odaklanabilir.

PDF OCR sürecinizin doğruluğunu ve etkinliğini artıracak ipuçlarını inceleyelim:

1. Taramaları OCR'dan önce ön işleme tabi tutun

Taranmış belgelerle çalışıyorsanız parlaklığı, kontrastı ve keskinliği ayarlayabilir ve gürültüyü azaltmak ve netliği artırmak için filtreler veya görüntü geliştirme teknikleri uygulayabilirsiniz. 

Bu, OCR doğruluğunu önemli ölçüde artıracaktır. Adobe'nin Tarayıcı uygulaması yerleşik görüntü geliştirme özellikleriyle birlikte gelir. Taramaları temizlemek için PaperScan ve NAPS2 gibi araçları da kullanabilirsiniz. Bu düzenlemelerin ardından düzenlenen görüntüleri OCR'yi çalıştırmadan önce PDF olarak kaydedebilirsiniz.

2. Doğrulama iş akışlarını ve onay hiyerarşilerini ayarlayın

Çıkarılan veriler için doğrulama kuralları ayarlayarak veri kalitesini artırın. Örneğin, bir belgedeki sipariş numarası beş haneli değilse otomatik olarak reddedilir veya manuel inceleme için işaretlenir. Bu şekilde çıkarma hatalarını yakalayabilir ve yalnızca geçerli verileri onaylayabilirsiniz. Çıkarılan verileri doğrulamak için OCR sisteminizi veritabanlarıyla da entegre edebilirsiniz.

Kıdemsiz çalışanların verileri ilk önce incelediği, ardından kıdemli çalışanların son imzayı attığı onay hiyerarşileri oluşturabilirsiniz. Otomatik bildirimler ve canlı durum güncellemeleri sayesinde şeffaflığı koruyabilir ve onay takibini önleyerek belge işlemenin daha hızlı olmasını sağlayabilirsiniz.

3. Otomatik iş akışları oluşturun

Bir araba kiralama işlemi yürüttüğünüzü ve müşterilerin sürücü belgesi verilerini otomatik olarak Salesforce'a aktarabildiğinizi veya herhangi bir manuel çalışma olmadan fatura verilerini QuickBooks'a gönderebildiğinizi hayal edin. Yalnızca PDF OCR'nizi optimize etmekle kalmayacak, aynı zamanda aşağı yönlü etkinlikleri de optimize edecektir.

OCR çözümünüzü API'ler aracılığıyla iş uygulamalarıyla entegre etmek bu otomasyonu mümkün kılar. Örneğin Nanonets ile belge işlemenin tamamlanması, veri çıkarma veya yeni bir dosya yükleme gibi olaylara dayalı tetikleyicileri kolayca ayarlarsınız. Entegrasyon, yapılandırılmış verileri Nanonets'ten QuickBooks, Xero, Microsoft Dynamics, Zendesk ve diğerleri dahil olmak üzere istenilen iş sistemlerine otomatik olarak aktaracak ve manuel çabaları ortadan kaldıracak ve sistemler arasında kesintisiz veri akışı sağlayacak.

4. AI/ML yetenekleriyle gelişmiş OCR'ye yatırım yapın

Kurallara dayalı OCR'nin aksine yapay zeka modelleri uyarlanabilir; sürekli olarak insan düzeltmelerinden öğreniyor ve zaman içinde gelişiyor. Örneğin Nanonets, milyonlarca belge üzerinde eğitilmiş özel bir yapay zeka modeli sunarak karmaşık ve zorlu düzenleri verimli bir şekilde yönetmesine olanak tanıyor.

Yapay zeka destekli OCR, bağlamı kaybetmeden belgelerden bilgi alabilmenizi sağlar. Farklı dilleri, parasal, yasal veya ölçü birimlerini işleyebilir. Bu düzeyde bir zeka, kesin saha konumlarına dayanan şablon tabanlı veya kurallara dayalı çıkarmayla mümkün değildir.

5. AI-OCR modellerini eğitin

Yapay zeka destekli OCR çözümleri önceden eğitilmiş modellerle birlikte gelirken, bunları belirli belge türleriniz ve düzenleriniz konusunda daha fazla eğitmek doğruluğu daha da artırabilir. Örneğin Nanonets, yakalamak istediğiniz çeşitli şablonları, formatları ve alanları temsil eden örnek bir belge seti yüklemenize olanak tanır.

Bu örnekler, modelin belgelerinizin yapısını anlamasına ve PDF OCR sürecinde ince ayar yapmasına yardımcı olur. Doğrulama sırasında belirlenen ayıklama hatalarını düzelterek de geri bildirim sağlayabilirsiniz. Bu döngüdeki insan eğitimi, yapay zeka modelinin performansını sürekli olarak artırır.

6. Gerektiğinde özel OCR modelleri oluşturun

Bazen önceden eğitilmiş modeller belgelerinizdeki tüm karmaşıklıkları kapsamayabilir. Örneğin, benzersiz alan ve formatlara sahip sektöre özel belgeleriniz olabilir. Bu gibi durumlarda, özellikle belgeleriniz üzerinde eğitilmiş özel yapay zeka modelleri oluşturmak için OCR satıcınızla birlikte çalışabilirsiniz. 

Nanonets ile kullanıcılar, kendi belge türlerine ve çıkartılacak alanlarına özel özel modeller oluşturabilirler. Örnek belgeleri yükleyebilir ve çıkarmak istedikleri etiketlerle bunlara açıklama ekleyebilirler. Yapay zeka daha sonra bu örneklerden öğrenir ve belirtilen bilgileri tanımak ve çıkarmak için eğitilir. Sistem, optimum doğruluğu elde etmek için her etiket için en az on örnek gerektirir ve kullanıcılar her etiket için örnek sayısını izleyebilir ve gerektiğinde daha fazlasını ekleyebilir.

Nanonets PDF OCR'a nasıl başlanır?

Nanonets, PDF OCR'ye başlamayı kolaylaştırır. Nanonets web sitesinde ücretsiz bir hesap açmanız yeterlidir. Kredi kartı vermenize gerek yoktur. 

İşte başlamanıza yardımcı olacak bir kılavuz:

  1. Ücretsiz bir hesap için kaydolun: Ziyaret etmek Nanonets.com ve ücretsiz bir hesaba kaydolun; kredi kartı gerekmez.
  2. Bir model oluşturun veya seçin: Belirli belge türleriniz için özel bir OCR modeli oluşturabilir veya faturalar, makbuzlar ve daha fazlası için Nanonets'in önceden eğitilmiş modelleri arasından seçim yapabilirsiniz.
  3. Otomatik içe aktarmayı ayarla: Otomatik olarak sürekli OCR işlemi için yeni PDF'leri Nanonet'lere aktarmak üzere e-postaları iletin veya bulut depolama alanına bağlanın.
  4. Örnek belgeleri yükleyin: Çıkarmak istediğiniz çeşitli şablonları, formatları ve veri alanlarını temsil eden en az 10 örnek belge yükleyin. Bu yapay zeka modelinin eğitilmesine yardımcı olacaktır.
  5. Çıkarılacak alanları tanımlayın: Belgelerinizden çıkarmak istediğiniz Tarih, Tutar, Tablo Verileri vb. gibi kritik veri alanlarına ad vermeniz yeterlidir.
  6. Doğrulamaları ayarlama: Çıkarılan verileri doğrulamak için kuralları yapılandırın ve doğruluğu sağlamak amacıyla hataları düzeltmek üzere işaretleyin.
  7. Dosyalarınızı işleyin: PDF belgelerinizi yükleyin. Nanonet'ler bunları OCR ve akıllı veri çıkarma yoluyla anında işleyecektir.
  8. Verileri inceleyin ve onaylayın: Çıkarılan verileri kontrol edin ve geçerli girişleri onaylayın. Durum güncellemeleriyle şeffaflığı koruyun.
  9. Verileri iş sistemlerine aktarın: Onaylandıktan sonra yapılandırılmış verileri ERP'nize, muhasebenize, CRM'nize veya diğer sistemlerinize sorunsuz bir şekilde aktarın.
  10. İş akışlarını otomatikleştirin: Bir belge işlendiğinde veya veriler çıkarıldığında uygulamalara veri akışı sağlamak için tetikleyicileri ayarlayın. Manuel çabaları kaldırın.

Genel olarak Nanonets, belge iş akışlarınıza akıllı OCR yeteneklerinin eklenmesini hızlı ve kolay hale getirir. Kendi kendine öğrenen yapay zeka motoru, karmaşık belgelerin işlenmesi için özelleştirmeye olanak tanırken, başlangıçtan itibaren yüksek doğruluk sağlar. İş sistemleriyle kusursuz entegrasyonlar, gerçek anlamda uçtan uca otomasyona olanak tanır.

Tamamlayan

Akıllı OCR ve veri çıkarma, belge iş akışlarından muazzam değer elde etmenize yardımcı olabilir. Önemli olan, başlangıçtan itibaren yapay zeka destekli OCR sunan ve belirli ihtiyaçlara göre özelleştirmeye olanak tanıyan Nanonets gibi bir çözümü seçmektir. 

Özel modeller oluşturmaya yönelik self servis yetenekleri sayesinde, belgeleriniz geliştikçe doğruluk ve otomasyon da sürekli olarak gelişir. Sonuçta bu, üretkenliği ve büyümeyi artırmak için yapılandırılmamış verileri uygun ölçekte işleyebilmenizi sağlar.

spot_img

En Son İstihbarat

spot_img