PDF'ye OCR bilgisi ekleme

23

Bir belgenin kaliteli bir şekilde taranması; böyle bir tarama pdf formatındadır.

Ok_ bilgisini pdf'ye nasıl ekleyebilirim, böylece aranabilir mi? Aranabilirlik ile, pdf'yi evince ile görüntülerken, CTRL-F'nin pdf içeriğinde arama yapmamı sağladığını düşünüyorum.

    
sordu fdierre 07.06.2012 10:56

5 cevap

14

pdfsandwich

İstediğinizi yapar ve Ubuntu deb paketleri sağlar. OCR motoru olarak tesseract kullanır. Aşağıdaki çağrı, metin katmanını taranmış PDF'nize ekler:

pdfsandwich scanned.pdf

Aşağıdakiler aynıdır ancak başka bir dilde (ISO 639-2 kodu, tesseract-ocr-LANGCODE paketini indir) ve düzeni ayarlar:

pdfsandwich  -verbose -lang spa -layout single scanned.pdf

Herhangi bir hatayla karşılaşırsanız lütfen Sourceforge'dan son sürüm debresini indirin .

Yasal Uyarı: pdfsandwich'in geliştiricisiyim ve bu yüzden açıkça önyargılıyım.

    
verilen cevap Tobias Elze 25.07.2014 15:27
7

Hile yapan iki proje vardır: GScan2PDF ve OCRFeeder

    
verilen cevap Aldi 07.06.2012 23:24
3

İdeal olmayan bir çözüm buldum ama çok etkili bir çözüm.

Wine aracılığıyla PDF X-Change Görüntüleyiciyi kullanıyorum. Mevcut görüntü tabanlı pdf'ye bir metin katmanı ekleyen bir OCR özelliğine sahiptir.

Böylece, bu görünmez katmandan metin arayabilir ve kopyalayabilirsiniz.

    
verilen cevap To Do 19.02.2013 11:31
2

Komut satırı çözümü için pdfocr 'i kullanabilirsiniz.

Kısaca, yazılımı yükleyin:

$ sudo apt-get install python-software-properties
$ sudo add-apt-repository ppa:gezakovacs/pdfocr
$ sudo apt-get update
$ sudo apt-get install pdfocr

Ardından pdfocr komutunu çalıştırın:

$ pdfocr -i scanned.pdf -o scanned.with.search.pdf

Ubuntu 12.04 LTS'de benim için çalıştı.

    
verilen cevap Robert Citek 23.03.2014 21:23
1

Kolayca uygulanabilen ve aynı kalitede girdi dosyası artı makul boyutta bir çıktı pdf sağlayan bir çözüm OCRmyPDF'dir:

İşte

    
verilen cevap user127022 08.11.2017 17:47

Etiketlerdeki diğer soruları oku