Görsellerden nasıl metin çıkarabilirim?

21

Görselleri metinlerden nasıl çıkarabilirim?

Taranan dosyalar hakkında konuşmuyorum, ancak sınıftaki yazı tahtasının yüksek çözünürlüklü bir resmini çekerken olduğu gibi bahçe çeşitliliği görüntüleri de güzel bir şekilde el yazısı; ya da bir tarif kitabındaki bir sayfayı fotoğrafladığınızda ve tarifi metin biçiminde istiyorsanız.

Bunun için ücretsiz ve açık bir yazılım var mı?

Tesseract denedim ve sonuçlar çok kötüydü.

    
sordu Strapakowsky 31.08.2011 10:33

2 cevap

24

Resimlerden metin ayıklama eylemine OCR denir ve Ubuntu'nun OCR'ye adanmış bir wiki sayfası vardır. Bu sayfadan:

Kullanılabilir OCR araçları

Ubuntu Universe depoları aşağıdaki OCR araçlarını içerir:

  1. gocr - Bir komut satırı OCR
  2. fuzzyocr - resim eklerini kontrol etmek için spamassassin eklentisi
  3. libhocr0 - İbranice OCR
  4. okrad - Optik Karakter Tanıma programı
  5. ocrfeeder - Belge düzeni analizi ve optik karakter tanıma sistemi
  6. ocropus - doküman analizi ve OCR sistemi
  7. tesseract-ocr

Ubuntu multiverse deposu ayrıca şunları içerir:

  1. çivi yazısı - çoklu dil OCR sistemi

Bazı paketler güncel değil, ancak gayri resmi taze olanlar Alex_P PPA 'da bulunabilir. : ppa: alex-p / notesalexp). Bir PPA kullanmadıysanız bir PPA'dan nasıl yazılım ekleyeceğinizi kontrol edin.

düzenle: Yorumda görüldüğü gibi, Clara OCR var ama Hardy'de stuk var ve web siteleri 2009'un son güncellendiği gibi.

    
verilen cevap Rinzwind 31.08.2011 10:55
14

tesseract-ocr , diğerleriyle karşılaştırıldığında harika olacaktır. Yükleme için, sudo apt-get install tesseract-ocr komutunu çalıştırın.

Kullanım tesseract filename.jpg output.txt .

Yukarıdaki komut output.txt üretecektir.

Uygun dili seçmeyi düşünebilirsiniz. Bu durumda tesseract-ocr-LANG paketini yüklemeniz gerekecektir, burada LANG üç harfli ISO 639-2 dil kodu. Şu anda 16.04 repoda 108 dilin var. Sonra da tesseract filename.jpg output -l LANG kullanın.

    
verilen cevap Sudhir Belagali 18.04.2016 05:44

Etiketlerdeki diğer soruları oku