Tin Công Nghệ

Nhận dạng ký tự thông minh? Đã đến lúc nâng cấp (1) !

529 Views
Công nghệ nhận dạng ký tự thông minh được phát triển vào những năm 90 dựa trên OCR và khớp mẫu để tự động trích xuất dữ liệu có thể đọc được của máy từ tài liệu. Dữ liệu có thể đọc được của máy này sau đó sẽ được sử dụng để giúp các công ty tự động xử lý tài liệu.

Mục tiêu của iOCR là giúp các doanh nghiệp xử lý các quy trình dựa trên giấy mà không cần bất kỳ sự can thiệp nào của con người bằng cách tự động hóa việc trích xuất dữ liệu từ các tài liệu giấy. Với sự gia tăng của học sâu (DL) kể từ những năm 2010, các giải pháp trích xuất dữ liệu dựa trên DL có thể đạt được tỷ lệ tự động hóa cao hơn nhiều so với các giải pháp iOCR.

Vấn đề này vẫn còn phù hợp. Chuyển đổi kỹ thuật số là điều bắt buộc đối với các doanh nghiệp. Tuy nhiên, việc số hóa không hề dễ dàng, đặc biệt là đối với các công ty có dữ liệu chủ yếu được lưu trữ trong các tài liệu dạng giấy. Theo một nghiên cứu được thực hiện bởi AIIM, 49% khối lượng thu thập dữ liệu là giấy và các doanh nghiệp cần chuyển đổi tài liệu giấy của họ thành hệ thống kỹ thuật số để tận dụng dữ liệu trong tài liệu kỹ thuật số.

=> Tham Khảo: Phần mềm quản lý công văn giấy tờ 

Nhận dạng ký tự thông minh (ICR) là gì?

Nhận dạng ký tự thông minh (ICR) là gì?

 

NHẬN DẠNG KÝ TỰ THÔNG MINH (ICR)  LÀ GÌ?


Nhận dạng ký tự thông minh (ICR) hoặc nhận dạng ký tự quang học thông minh (iOCR) là một phiên bản mở rộng của công nghệ nhận dạng ký tự quang học (OCR) giúp chuyển đổi hình ảnh được quét của văn bản thành dữ liệu có thể đọc được bằng máy chủ yếu sử dụng nhận dạng mẫu dựa trên quy tắc.

Đây không phải là định nghĩa bạn có thể tìm thấy khi tìm định nghĩa của ICR. Có vẻ như hầu hết các định nghĩa về chủ đề này được viết bởi các nhà cung cấp nhằm phóng đại khả năng của danh mục giải pháp của họ. ICR hay iOCR là một công nghệ mỏng manh dẫn đến mức độ tự động hóa thấp. Do đó, các công ty đang chuyển từ các giải pháp iOCR sang các giải pháp trích xuất dữ liệu dựa trên học sâu và sự quan tâm đến ICR đang giảm xuống như được thấy dưới đây:

 

SỰ KHÁC BIỆT GIỮA ICR & OCR LÀ GÌ ?


Trong khi OCR chuyển đổi hình ảnh thành văn bản, ICR chuyển đổi hình ảnh thành dữ liệu máy có thể đọc được. Bạn có thể thấy bên dưới Google Cloud Vision OCR chuyển đổi hình ảnh thành văn bản:

Sự khác biệt giữa ICR và OCR là gì?

Sự khác biệt giữa ICR và OCR là gì?

IOCR sẽ chuyển đổi văn bản thành dữ liệu có cấu trúc. Để có thể thực hiện điều này, iOCR hoạt động với các loại tài liệu cụ thể mà các trường dữ liệu cụ thể cần được thu thập. Tại đây, bạn có thể thấy hóa đơn được chia sẻ dưới dạng hình ảnh được chuyển đổi thành dữ liệu máy có thể đọc được:

Sự khác biệt giữa ICR và OCR là gì?

Sự khác biệt giữa ICR và OCR là gì?

Trong ví dụ này, bạn cũng có thể thấy rằng rủi ro về thuế trong các tài liệu và tạo hồ sơ kế toán. Điều này nằm ngoài những gì mà người chơi iOCR thường cung cấp và cho phép tự động hóa quy trình hơn nữa. Để biết thêm, vui lòng đọc bài viết của chúng tôi về tự động hóa hóa đơn .

Ngoài ra, ICR là một công nghệ đắt tiền hơn vì nó tiến xa hơn OCR một bước và cung cấp dữ liệu có thể đọc được của máy. Nếu bạn muốn tìm hiểu thêm về công nghệ nhận dạng ký tự quang học, vui lòng xem các bài viết liên quan của chúng tôi:

Xem Thêm: