Tin Công Nghệ

Phần mềm nhận dạng chữ viết tay tiếng việt trong hình ảnh scan

2304 Views
Cùng với sự phát triển của kỷ nguyên 4.0, các sản phẩm công nghệ ngày càng được áp dụng phổ biến, trong đó phải kể đến phần mềm nhận dạng chữ tiếng việt (hay phần mềm nhận dạng chữ viết tay OCR).

Công nghệ này đang này càng được ứng dụng phổ biến, đa dạng đến nhiều lĩnh vực của đời sống: từ văn bản cho đến hình ảnh, các thông tin đều được nhận dạng trích xuất chuyên nghiệp.

Thực tế về nhận dạng chữ viết tay

Mỗi ngày, các cơ quan nhà nước nhận được rất nhiều văn bản cần nhập lại vào phần mềm.

  • Các đơn vị ngân hàng – bảo hiểm – Viễn thông có nhiều thông tin khách hàng cần phải xử lý.

  • Các đơn vị nghiên cứu thị trường có khối lượng lớn phiếu khảo sát cần nhập lại.

  • Trường học phải xử lý phiếu dự thi của thí sinh.

  • Doanh nghiệp phải quản lý hồ sơ của người lao động.

  • Tất cả những thông tin này đều yêu cầu phải nhập lại để đưa vào hệ thống của tổ chức. Tuy nhiên, việc nhập thủ công các trường thông tin, gõ văn bản với nhiều loại form khác nhau công gây tốn thời gian, công sức, thậm chí tiềm ẩn nhiều nguy cơ sai sót.

Đứng trước vấn đề nan giải liên quan đến vấn đề nhập liệu này, cần có một phần mềm nhận dạng chữ viết tiếng việt hay một giải pháp tương tự để giải quyết bài toán hóc búa trên.

>> Xem thêm bài viết: Phần mềm nhận dạng chữ viết tay được áp dụng ở đâu?

Thực tế nhận dạng chữ viết tay

Hình ảnh minh họa: Thực trạng vấn đề lưu trữ tài liệu bằng chữ viết tay

Giới thiệu giải pháp nhận dạng và trích xuất thông tin IONE

Xuất phát từ thực trạng trên, công nghệ nhận dạng và trích xuất thông tin tự động IONE đã ra đời. Với công nghệ hiện đại và tính năng thông minh IONE được xem như một phần mềm nhận dạng chữ viết tay có thể giải quyết các vấn đề về nhận dạng và trích xuất thông tin tài liệu, hình ảnh, từ đó giúp giảm thiểu công việc nhập liệu thủ công và những sai xót không đáng có trong quá trình nhập liệu.

Công nghệ IONE là công nghệ nhận dạng chữ viết tay và bóc tách thông tin thông minh. Kiến trúc công nghệ như sau:

Giới thiệu giải pháp nhận dạng và trích xuất thông tin IONE

Hình ảnh minh họa: Công nghệ IONE - công nghệ nhận dạng chữ viết tay thông minh

Ảnh đầu vào qua các modules, api của công nghê ̣IONE cho ra dữ liêụ văn bản, metadata để lưu trữ hoăc̣ tích hơp̣ vào các ứng duṇg khác. Các tính năng của công nghê ̣IONE bao gồm:

  • Nhận dạng toàn văn.

  • Nhận dạng theo biểu mẫu.

  • Tạo file pdf/a (file pdf có thêm lớp text giúp tìm kiếm trực tiếp trên file).

  • Bóc tách thông tin Văn bản hành chính.

  • Bóc tách thông tin Chứng minh nhân dân.

  • Bóc tách thông tin Sổ đỏ, Hợp đồng, Tờ trình.

  • Bóc tách thông tin Phiếu khảo sát, Phiếu dự thi vào ĐHQGHN.

  • Bóc tách thông tin Các biểu mẫu ngân hàng.

  • Số hóa giản đồ.

  • Nhận dạng dấu tick.

  • Nhận dạng số viết tay

Tính năng của phần mềm nhận dạng chữ viết tay tiếng việt IONE

Nhận dạng thông tin văn bản hành chính

IONE cung cấp giải pháp trích xuất trường thông tin cần lấy từ văn bản hành chính như tờ trình, công văn, quyết định,… như: cơ quan ban hành, trích yếu nội dung, ngày tháng, số ký hiệu, nơi nhận, người ký… để đưa vào phần mềm quản lý văn bản hoặc phiếu trình. IONE cung cấp giải pháp nhận dạng toàn văn (fulltext) để trích xuất nội dung ứng dụng lập chỉ mục hoặc ứng dụng cho các nghiệp vụ; tạo file pdfsearchable để giúp người dùng tìm kiếm nội dung trực tiếp ngay trên file PDF.

Bóc tách thông tin chứng minh thư nhân dân

Đối với ngân hàng công ty bảo hiểm hay đơn vị viễn thông, phần mềm nhận dạng chữ tiếng việt cung cấp giải pháp nhận dạng và trích xuất thông tin từ bản scan chứng minh nhân dân một cách dễ dàng theo các trường như tên, ngày tháng năm sinh, quê quán, số CMT, ngày cấp… giúp việc khai thác thông tin nhanh chóng, chính xác, tiết kiệm thời gian. Cùng tham khảo giải pháp bóc tách chứng minh thư của IONE.

Bóc tách thông tin sổ đỏ

Các ứng dụng như IONE sẽ cung cấp giải pháp nhận dạng và trích xuất thông tin số đỏ tự động. Người dùng không cần phải nhập tay các trường thông tin mà chỉ cần đưa bản scan vào là thông tin tự động được bóc tách để đưa vào hệ thống lưu trữ và phần mềm ứng dụng.

Bóc tách thông tin phiếu khảo sát, dự thi

Một ứng dụng khác của phần mềm nhận dạng chữ tiếng việt và xử lý biểu mẫu là Bóc tách thông tin sinh viên dự thi vào ĐHQG. Đầu vào là phiếu dự thi có dán ảnh, in thông tin của thí sinh như SBD, Ho ̣tên, Số CMND. Module cho ra danh sách các thí sinh có ảnh và thông tin nêu trên ở dạng văn bản (text). Công nghệ cũng nhận dạng, xử lý và bóc tách thông tin phiếu khảo sát qua công nghệ nhận dạng dấu tích giúp giảm bớt khó khăn trong quá trình nhập liệu. 

Bạn có thể tìm hiểu thêm một số giải pháp khác của IONE tại đây

Ưu điểm của giải pháp:

  • Nhận dạng tiếng Việt chính xác từ 90 đến 98%.

  • Số hóa giản đồ, hình ảnh đạt độ chính xác > 90%.

  • Xử lý song song, đạt hiệu suất 6s/trang.

  • Bóc tách dữ liệu tự động không phụ thuộc mẫu tài liệu.

  • Sẵn sàng tích hợp với các hệ thống của khách hàng.

  • Cơ chế học máy giúp hệ thống tự động nâng cao độ chính xác.

Lợi ích của công nghệ IONE

Nhận dạng và bóc tách thông tin nhanh chóng với lượng lớn tài liệu trong thời gian ngắn

IONE có khả năng nhận dạng và trích xuất thông tin nhanh chóng lượng lớn tài liệu trong thời gian ngắn với cơ chế xử lí song song dữ liệu, hiệu xuất xử lí 6s/trang và nhận dạng chữ viết tay chính xác đến 90%

Tiết kiệm thời gian nhập liệu thủ công, giảm thiều nhân lực nhập liệu

Thay vì nhập tay thông tin từ nhiều loại form, biểu mẫu, làm mất nhiều thời gian nhập liệu, IONE đem đến giải pháp bóc tách thông tin không phụ thuộc biểu mẫu, giúp tiết kiệm thời gian nhập liệu, giảm thiểu nhân lực nâng cao năng suất và hiệu quả công việc lên đến tối đa. Bên cạnh đó, File pdfsearchable của IONE giúp người dùng tìm kiếm nội dung nhanh chóng và trực tiếp ngay trên file PDF, giúp rút ngắn thời gian xử lí dữ liệu.

Đảm bảo độ chính xác so với tài liệu gốc

Cơ chế học máy của IONE giúp hệ thống tự động nâng cao độ chính xác. Ngoài ra, hệ thống này còn không bị giới hạn về ngôn ngữ, có thể nhận dạng và trích xuất thông tin với mọi tài liệu của nước ngoài và Việt Nam. Đặc biệt là khả năng nhận dạng tiếng việt của có độ chính xác lên đến 98%.

Công nghệ nhận dạng và bóc tách thông tin tự động IONE hiện đang được phát triển bởi Công ty Cổ phần Thương mại và Phát triển công nghệ FSI. Công nghệ đã và đang được triển khai trong nhiều dự án trọng điểm, có quy mô lớn trong phạm vị cả nước.

Để biết thêm thông tin chi tiết xin liên hệ với chúng tôi:

CÔNG TY CỔ PHẦN ĐẦU TƯ THƯƠNG MẠI VÀ PHÁT TRIỂN CÔNG NGHỆ FSI

Văn phòng Hà Nội: Tầng 11, tòa nhà CTM, số 139 Cầu Giấy, Quan Hoa, Cầu Giấy, HN

Điện thoại: 0904 805 255

Email: info@fsivietnam.com.vn