Tesseract-ocr

Tesseract-ocr

Im Moment gibt es kein besseres freies Programm zur Texterkennung als Tesseract-ocr.

Wenn man ein OCR Programm installieren will das tesseract-ocr verwendet, stellt man fest das sich teseract-ocr nicht installieren lässt aus dem Manjaro beziehungsweise aus dem AUR Repository.

Das heisst, man kommt beim öffnen des Tools eine Fehlermeldung.

Deshalb lädt man Tesseract direct von Github herunter und installiert es mit dieser Anleitung:

Zuerst muss man die Datei: tesseract-5.2.0.tar.gz Downloaden.

Dazu öffnet man die github adresse von Tesseract-ocr mit folgendem Link:

https://github.com/tesseract-ocr/tesseract/releases

Man klickt auf: Source code (tar.gz)

Jetzt wird die Datei heruntergeladen.

Die Installationsanleitung findet man auch auf:

https://tesseract-ocr.github.io/tessdoc/Compiling.html

Für die Installation unter Manjaro muss man folgende Schritte ausführen:

Wenn man als Installations-Verzeichnis Home/local wählt, führt man diese Befehle aus:

$ ./autogen.sh
$ ./configure –prefix=$HOME/local/
$ make
$ make install

Damit ist Tesseract installiert. Tesseract ist ein Kommandozeilen Tool.

Um die Texterkennung einer Datei durchzuführen lautet der Befehl:

$ tesseract -l deu Bild.png Ausgabedatei

So erhält man eine Datei namens Ausgabedatei mit dem Text aus dem Bild.

Dieser Text enthält keine Formatierungen nur Zeilenumbrüche.

Die Ausgabedatei ist ein einfaches Textdokument.

Wenn man vom Text direkt ein PDF bekommen möchte, nennt man die Ausgabedatei: Ausgabedatei.pdf.

Man kann zusätzlich das Tool Tesseract-gui installieren. Damit bekommt man eine Grafische Oberfläche für Tesseract.

Wenn man den GimageReader installiert wird Tesseract dort integriert.

Eigentlich wird mit der Installation Tesseract automatisch installiert, dass hat bei mir aber nicht funktioniert.

Der Ocrfeeder integriert ebenfalls Tesseract. Auch damit kann man arbeiten.

Tesseract sollte auch mit Gscan2pdf und mit Xsane funktionieren.

Alternativ zu Tesseract kann auch Cuneiform installiert werden.

Für Cuneiform gibt es die Grafische Oberfläche Yagf. Dieses Programm stürzt, auf meinem Computer, leider bei der Texterkennung ab.

Fazit:

Texterkennung «OCR» ist mit Linux nicht weit fortgeschritten.

Die Texterkennung funktioniert zwar sehr gut aber es ist nicht möglich ein kompletes Layout zu erkennen und wieder entsprechend formatiert auszugeben.

Es sei den man benutzt ein gekauftes Produkt oder man benutzt ein Online-OCR Tool wie: https://ocr.space/oder https://pdf-texterkennung.online-umwandeln.de/.

 

Mehr Videos findet man auf meinem Youtube Kanal linuxcoach:
https://www.youtube.com/@linuxcoach

Ein weiterer Interessanter Artikel zu diesem Thema:
https://computer-experte.ch/shotwell-fuer-linux-fotos-einordnen-und-bearbeiten/

Texterkennung