VietOCR : OCR pour les documents en Vietnamiens - Phần mềm nhận dạng tiếng Việt (Mã nguồn mới)

Publié le par lolond

Avanr pour reconnaîre les docfuments en vietnamorns scannés, bous devons utiliser VireDov de Viện Công nghệ thông tin avec une quamité ordinaire. Nous avons découvert un OCR supérieur acec un taux de réussi de 97  % : VietOCR qui utilise des éléments de Java et du .NET.

 

                 VietOCR (Mã nguồn mới)

Trước đây có máy scan cứ phải mua phần mềm Vietdoc của Viện Công nghệ thông tin với giá khoảng 8 tr/bản. Đắt mà chất lượng bình thường.Mới tìm được phần mềm vietocr sử dụng mã nguồn mở, xác xuất nhận dạng đúng hiện nay là 97% và phiên bản sau sẽ nâng lên hơn nữa.VietOCR, hiện có trong Java and .NET executable, là một GUI frontend cho Tesseract OCR engine. Cả hai phiên bản đều có giao diện tương tự và có cùng khả năng nhận diện ký tự từ các loại dạng ảnh phổ thông. Chương trình còn có khả năng vận hành như một ứng dụng console, thi hành lệnh từ command line.Batch processing cũng được hỗ trợ. Chương trình theo dõi một watch folder cho các tập tin ảnh mới, tự động xử lý chúng qua OCR engine, và xuất kết quả nhận dạng ra một output folder.Language data cho Việt ngữ và Anh ngữ đã được gói kèm với chương trình. Data cho các ngôn ngữ khác có thể hạ tải từ Tesseract website và cần đặt vào tessdata folder.

(selon vungtroitinhoc.com)

Publié dans ** BUREAUTIQUES

Commenter cet article

Phần mềm bán hàng 29/06/2015 10:05

Thêm một phần mềm hay nữa, cám ơn bạn nhiều nhé