Download as pptx, pdf, or txt
Download as pptx, pdf, or txt
You are on page 1of 34

TRƯỜNG ĐẠI HỌC CẦN THƠ

Khoa CNTT&TT

Bảo vệ thuyết minh đề tài sinh viên chất lượng cao

Đề tài
Xây Dựng Ứng dụng Chuyển Đổi Từ
Hình Ảnh Hoặc File Pdf Sang Văn Bản
Dạng Text Bằng Công Nghệ OCR

GVHD: PGS.TS. Nguyễn Thái Nghe

SVTH: Nguyễn Quốc Bảo


Phạm Đức Nguyên
Nguyễn Tuấn Khanh
Nguyễn Lê Phúc Tiến
Trần Lê Duy
TÌNH HÌNH ỨNG DỤNG CÔNG NGHỆ OCR

 TRONG NƯỚC  NGOÀI NƯỚC


TÌNH HÌNH ỨNG DỤNG CÔNG NGHỆ OCR TRONG NƯỚC

Trong thời kì hiện đại ngày nay thì nhu Việc đang ngày càng nhiều dữ liệu thông tin
cầu chúng ta phải làm việc và thao tác xuất hiện, một hình ảnh thì có thể có nhiều
trực tiếp với thông tin ở nhiều loại định định dạng khác nhau bao gồm: PNG, JPG,
dạng là ngày càng phổ biến. Và với sự GIF, BMP và nó vô tình trở thành một vấn đề
phát triển mạnh của ngành khoa học máy lớn, vì thông thường chúng ta sẽ không thể
tính, nhất là về lĩnh vực trí tuệ nhân tạo sao chép và chỉnh sửa văn bản từ hình ảnh
(AI) đang là xu hướng thì đã mở ra nhiều thô.
hướng phát triển đầy tiềm năng trong lĩnh
vực phân tích ảnh, trích xuất thông tin
giúp chúng ta dễ dàng thao tác, chỉnh sửa
TÌNH HÌNH ỨNG DỤNG CÔNG NGHỆ OCR TRONG NƯỚC

- Công nghệ nhận dạng chữ thông minh IONE của FSI

- Cvs Vision Ocr của Computer Vision Vietnam

- FPT.AI Reader Flex


TÌNH HÌNH ỨNG DỤNG CÔNG NGHỆ OCR NGOÀI NƯỚC

Không chỉ phát triển trong nước mà Một trong những người tiên phong đó là
trên thế giới công nghệ OCR cũng Google khi họ cho ra mắt Google Drive,
đang là một xu hướng rất được chú đây là một trong những công cụ lưu trữ
trọng ở thời điểm hiện tại. trực tuyến tốt nhất hiện nay.

Ngoài ra còn có dịch vụ đến từ


Datamolino bằng cách sử dụng API
trích xuất dữ liệu OCR hóa đơn của các
công ty và có thể xử lý số lượng lớn
Ngày nay các loại sách báo, tư liệu cần
TÍNH
được lưu trữ dưới dạng văn bản số rất
phổ biến. Văn bản số có ưu điểm như
CẤP
cập nhật, sửa chữa, cũng như trao đổi
nhanh chóng hơn so với văn bản in giấy
THIẾT
truyền thống. Mặt khác, qua thời gian thì
chất lượng văn bản in giấy sẽ kém đi
CỦA
nhưng văn bản số vẫn không bị hư hỏng.
Đây là một nhiệm vụ thực tế trong nhiều
ĐỀ
lĩnh vực, chẳng hạn như trong các thư
viện và nhà xuất bản.
TÀI
Nhằm cải thiện và phát triển hơn về việc ứng
MỤC
dụng công nghệ OCR giúp nhận dạng và trích
xuất thông tin từ hình ảnh sang dạng văn bản
TIÊU
phục vụ cho nhu cầu xử lý thông tin của khách CỦA
hàng và người dùng được dễ dàng hơn, chính
xác hơn và là tiền nghiên cứu để phục vụ hỗ ĐỀ
trợ cho việc phát triển các chương trình ứng
dụng tự động khác. TÀI
ĐỐI TƯỢNG NGHIÊN CỨU

Ảnh về các Các công cụ giúp


loại giấy tờ toàn diện về OCR
Các loại định dạng Tesseract, OpenCV.
thông tin.

Xây dựng các mô Các ngôn ngữ


hình OCR với API lập trình
NanOnets OCR Python, Javascript và các
Tải lên dữ liệu hình ảnh, thư viện phục vụ phân
chú thích nó và đặt mô tích.
hình.
PHẠM VI NGHIÊN CỨU

Nghiên cứu các Nghiên cứu


thông tin về nội dung tất cả các
cần trích xuất từ hình định dạng về
ảnh hoặc file Pdf hình ảnh

Font chữ và các kí tự đặc biệt JPEG, PNG, ảnh trích xuất từ DICOM
CÁCH TIẾP CẬN VÀ PHƯƠNG PHÁP NGHIÊN CỨU

Lý thuyết về AI và công Các công cụ cần thiết


nghệ OCR và thư viện lập trình

TIẾP CẬN

Các thuật toán liên Thử nghiệm trên


quan đến nhận thực tế để nhận
dạng hình ảnh, xử lí dạng và chuyển đổi
hình ảnh, phân thông tin từ hình
đoạn và nhận dạng ảnh của chứng
kí tự minh thư thành
dạng text.
PHƯƠNG PHÁP NGHIÊN CỨU

Đề tài sử dụng tổng hợp các phương


pháp nghiên cứu truyền thống và hiện
đại: Thu thập dữ liệu về các loại phông
chữ khác nhau, phông chữ máy in
laser và nhiều phông chữ máy đánh
chữ không theo tỷ lệ. Ứng dụng hệ
thống nhận dạng ký tự quang học để
cung cấp tính năng nhận dạng văn
bản tự động bằng trí tuệ nhân tạo.
NỘI DUNG NGHIÊN CỨU

Thu thập, phân tích các Phân tích các đặc


tài liệu có liên quan đến điểm vị trí của chữ viết
đề tài. được in trên hình ảnh.

Thu thập dữ liệu về Nghiên cứu, đánh


các loại hình ảnh giá khảo sát các
phổ biến hiện có ngôn ngữ lập trình
(CCCD, CMND,…) và các công nghệ
AI dùng để nhận
dạng, đánh dấu
chữ từ hình ảnh
THANK
S!
Do you have any questions?

baob1910618@student.ctu.edu.vn
086 961 7630
OUR PROGRESS

NEPTUNE VENUS
Neptune is the farthest Venus is the second
planet from the Sun planet from the Sun

MERCURY MARS
Mercury is the closest Despite being red, Mars is
planet to the Sun actually a cold place
Fonts & colors used
This presentation has been made using the following fonts:

Rajdhani
(https://fonts.google.com/specimen/Rajdhani)

Fira Sans Condensed


(https://fonts.google.com/specimen/Fira+Sans+Condensed)

#0c343d #00c3b1 #cc4125 #f3f3f3


Use our editable graphic resources...
You can easily resize these resources, keeping the quality. To change the color, just ungroup the resource and
click on the object you want to change. Then, click on the paint bucket and select the color you want. Don’t
forget to group the resource again when you’re done.
JANUARY FEBRUARY MARCH APRIL MAY JUNE

PHASE 1

Task 1

Task 2

PHASE 2

Task 1

Task 2

JANUARY FEBRUARY MARCH APRIL

PHASE
1

Task 1

Task 2
...and our sets of editable icons
You can resize these icons, keeping the quality.
You can change the stroke and fill color; just select the icon and click on the paint bucket/pen.
In Google Slides, you can also use Flaticon’s extension, allowing you to customize and add even more icons.
Educational Icons Medical Icons
Business Icons Teamwork Icons
Help & Support Icons Avatar Icons
Creative Process Icons Performing Arts Icons
Nature Icons
SEO & Marketing Icons

You might also like