OCR Test - Works offline 0.6.0

Giấy phép: Miễn phí ‎Kích cỡ tệp: 10.49 MB
‎Xếp hạng người dùng: 2.8/5 - ‎6 ‎Phiếu

Ứng dụng thử nghiệm để nhận dạng ký tự quang học (OCR) Ứng dụng này là một ứng dụng thử nghiệm mà tôi đã phát triển vài năm trước đây chứng tỏ việc sử dụng công cụ Tesseract OCR để nhận dạng văn bản trong hình ảnh được chụp bởi máy ảnh thiết bị. Ứng dụng này chạy OCR trên thiết bị & ndash của bạn; mà không cần tải hình ảnh của bạn lên máy chủ & và phù hợp để nhận dạng các từ riêng lẻ hoặc cụm từ văn bản ngắn, nhưng ứng dụng này dành cho những người có sở thích và nhà phát triển phần mềm quan tâm đến OCR và không dành cho khán giả nói chung. Trái ngược với API Mobile Vision của Google, ứng dụng này có thể nhận dạng văn bản được in bằng phông chữ không dựa trên tiếng Latinh trong khi ngoại tuyến. Để đạt được điều này, ứng dụng này kết hợp một lượng lớn dữ liệu đào tạo bất thường cho một số ngôn ngữ. Dữ liệu đào tạo này được lưu trữ trên điện thoại của bạn và ứng dụng này chiếm nhiều dung lượng hơn các ứng dụng thông thường. Không có xử lý trước hình ảnh được thực hiện bởi ứng dụng này trước khi giao khung hình ảnh đã chụp cho Tesseract, vì vậy ứng dụng không được điều chỉnh cho bất kỳ trường hợp sử dụng cụ thể nào và kết quả là, độ chính xác và tốc độ nhận dạng của nó phụ thuộc rất nhiều vào các yếu tố tình huống như phối cảnh, ánh sáng và loại phông chữ. Mã nguồn cho ứng dụng này có sẵn trên GitHub (với những thay đổi nhỏ để phù hợp với các hạn chế kích thước tệp GitHub). Mã cho ứng dụng này là sự kết hợp của mã liên quan đến máy ảnh mã nguồn mở từ dự án máy quét mã vạch ZXing và mã nhận dạng ký tự quang học mã nguồn mở từ dự án Tesseract OCR. CHỤP VĂN BẢN Ảnh chụp một tấm mặc định chạy OCR trên ảnh chụp nhanh được chụp khi bạn nhấp vào nút chụp, như ảnh thông thường. Khi hộp kiểm "xem trước liên tục" được chọn, ứng dụng sẽ hiển thị màn hình hiển thị động, theo thời gian thực về những gì thiết bị nhận ra ngay bên cạnh khung ngắm máy ảnh. Chế độ xem trước liên tục hoạt động tốt nhất trên thiết bị nhanh. SỬ DỤNG ỨNG DỤNG NÀY & Trỏ thiết bị vào một vùng văn bản nhỏ và chạm vào nút chụp trên màn hình để bắt đầu OCR. & Để nhận dạng từng ký tự Trung Quốc/Nhật Bản/Hàn Quốc, hãy đặt chế độ phân đoạn trang thành "ký tự đơn". ĐỘ CHÍNH XÁC NHẬN DẠNG & Các yếu tố khác nhau có thể khiến OCR thất bại: chiếu sáng không đồng đều, văn bản cách điệu hoặc văn bản không có đủ độ tương phản từ nền. Cố gắng có ánh sáng tốt. & Giữ thiết bị ổn định và đảm bảo ảnh đang được lấy nét. & Nếu bạn cần quét một khối văn bản lớn hoặc toàn bộ tài liệu, hãy thử một ứng dụng quét tài liệu như Text Fairy. Ngôn ngữ & Ứng dụng này hỗ trợ một số ngôn ngữ / tập lệnh không được Google Dịch công nhận. & Ngôn ngữ được hỗ trợ cho OCR: Afrikaans Albanian Tiếng Amharic Tiếng ả rập Tiếng Assam Tiếng Azerbaijan Tiếng Azerbaijan (Kirin) Basque Belarusian Bengali Bosnia Lép Miến điện Catalan Thành phố Cebuano Cherokee Tiếng Trung (Giản thể) Tiếng Trung Quốc (Phồn thể) Croatian Séc Đan mạch Hà lan Dzongkha (Dzongkha) Anh Tiếng Anh, Trung cấp (1100-1500) Esperanto Estonia Finnish Frankish Pháp Tiếng Pháp, Miền Trung (khoảng 1400-1600) Galician Georgian Gruzia - Cũ Đức Tiếng Hy Lạp, Cổ đại (-1453) Tiếng Hy Lạp, Hiện đại (1453-) Gujarati Haiti Hebrew Hindi Hungary Icelandic Indonesia Tiếng Inuktitut Ailen Ý Ý - Cũ Nhật Java Kannada Kazakh Khmer Triều tiên Kurd Kyrgyz Lao Latin Latvia Lithuanian Macedonia Malay Malayalam Maltese Marathi Nepali Na uy Oriya Tiếng Pashto Persian Ba lan Bồ đào nha Punjabi Rumani Nga Sanskrit Serbia Tiếng Serbia (Latinh) Sinhala Slovak Tiếng slovenia Tây ban nha Tiếng Tây Ban Nha - Cũ Tiếng Swahili Thụy điển Người Syriac Tagalog Tiếng Tajik Tamil Telugu Thái Tây tạng Tiếng Tigrinya Thổ nhĩ kỳ Ukraina Tiếng urdu Tiếng Duy Ngô Nhĩ Tiếng Uzbek Tiếng Uzbek (Kirin) Việt Welsh Yiddish GHI CHÚ THIẾT BỊ SAMSUNG & Trên các thiết bị Samsung Galaxy, bạn có thể cần nhấn lâu nút menu để đặt tùy chọn.

lịch sử phiên bản

  • Phiên bản 0.5.14 đăng trên 2014-05-11
  • Phiên bản 0.4.3 đăng trên 2011-05-13
    Một số bản sửa lỗi và cập nhật

Chi tiết chương trình