Alle Optionen
squeeze  ] [  sid  ] [  experimental  ]
[ Quellcode: ocropus  ]

Paket: ocropus-data (0.3.1-3)

Links für ocropus-data

Screenshot

Debian-Ressourcen:

Quellcode-Paket ocropus herunterladen:

Betreuer:

Externe Ressourcen:

Ähnliche Pakete:

System zur Dokumentenanalyse und optischen Zeichenerkennung -- Datendateien

OCRopus (tm) ist ein System zur Dokumentenanalyse und optischen Zeichenerkennung (Optical Character Recognition, OCR) auf dem neuesten Stand der Technik. Seine Merkmale sind statistische Modellierung natürlicher Sprache, Mehrsprachigkeit und modularer Aufbau von Layout-Analyse und Zeichenerkennung.

Das OCRopus-Hauptprogramm basiert auf zwei Forschungsprojekten. Das eine ist eine in der Mitte der 90er Jahre entwickelte leistungsstarke Handschrifterkennung. Sie wurde vom US Census Bureau (Volkszählungsamt) angewendet. Das zweite hat neuartige, leistungsstarke Layout-Analysen zum Inhalt.

Die Entwicklung von OCRopus wird von Google gefördert und ist zunächst für Dokumentenkonvertierung in großem Umfang mit hohem Durchsatz gedacht. Es wird auch ein ausgezeichnetes OCR-System für viele andere Anwendungen sein.

Das Paket ocropus-data enthält die von OCRopus benötigten architekturunabhängigen Daten.

Markierungen: Unterstützung für Barrierefreiheit: Texterkennung (OCR), Rolle: Anwendungsdaten

ocropus-data herunterladen

Download für alle verfügbaren Architekturen
Architektur Paketgröße Größe (installiert) Dateien
all 4.360,1 kB11.080,0 kB [Liste der Dateien]