Professional Documents
Culture Documents
Báo_Cáo_Thực_Tập_Kỹ_Thuật_new (1)
Báo_Cáo_Thực_Tập_Kỹ_Thuật_new (1)
ELECTRONIC ENGINEERING
-----□□□□-----
Đơn vị tiếp nhận: Công ty Phát triển Dịch vụ Truyền Hình (MyTV)
Hanoi, 5-2024
Project I
ET-LUH K66
Project I
ET-LUH K66
Project I
Trong kỳ thực tập kỹ thuật của học kỳ 2023.1, em đã có cơ hội tiếp xúc với một
loạt công nghệ đa dạng, bao gồm máy chủ, thiết bị, phần mềm Cisco Packet Tracker
8.2.2. Thời gian này đã mở ra một tầm nhìn mới về thực tế doanh nghiệp, giúp em
áp dụng kỹ năng xử lý tình huống, tìm kiếm thông tin và kiến thức từ trường học
vào thực tế. Kỳ thực tập này đã đem lại cho em không chỉ những kỹ năng mới mà
còn một cách suy nghĩ sáng tạo hơn, cùng với việc rèn luyện sự kỷ luật để đối mặt
với các thách thức trong quá trình học và làm việc. Trong vòng hai tháng thực tập
tại MyTV, em đã hưởng ứng sự hỗ trợ nhiệt huyết từ đồng nghiệp cùng các cán bộ
của công ty. Nhờ sự hỗ trợ này, em đã nhanh chóng làm quen với tài liệu kỹ thuật,
cải thiện hoạt động phần mềm với ít lỗi hơn và nắm vững phương pháp tìm kiếm
thông tin. Thêm vào đó, hướng dẫn chi tiết từ các anh chị nhân viên đã giúp em hiểu
rõ hơn về các công nghệ, công cụ kỹ thuật cần thiết và vai trò của chúng trong bối
cảnh làm việc thực tế. Nhờ đó, em đã biết cách tập trung vào những công nghệ thực
sự quan trọng. Sự đồng đội tốt của nhóm thực tập cũng đã chung tay hỗ trợ em, tạo
điều kiện cho sự tiến bộ chung của tất cả.
ET-LUH K66
Project I
Contents
Chương 1. Giới thiệu về Công ty................................................................................7
1.1 Giới thiệu chung................................................................................................7
1.2. Lĩnh vực hoạt động...........................................................................................7
1.3. Sứ mệnh............................................................................................................8
1.4. Giá trị cốt lõi.....................................................................................................8
1.5. Triết lý kinh doanh...........................................................................................8
1.6. Cơ cấu tổ chức..................................................................................................9
Chương 2. Nội dung thực tập....................................................................................10
2.1 Các vị trí công việc trong công ty...................................................................10
2.1.1 Chuyên viên Kỹ thuật Truyền hình..........................................................10
2.2.2 Backend Developer..................................................................................11
2.2.3 Fresher......................................................................................................11
Chương 3. Phân tích và triển khai dự án...................................................................13
3.1 Mục đích và đối tượng sản phẩm....................................................................13
3.1.1 Mục đích đề tài.........................................................................................13
3.1.2 Đối tượng sử dụng....................................................................................13
3.1.3 Yêu cầu chức năng và phi chức năng.......................................................13
3.1.4 Phạm vi đề tài...........................................................................................14
3.2 Yêu cầu bài toán..............................................................................................14
3.3 Tìm hiểu và lựa chọn mô hình.........................................................................15
3.3.1 So sánh Machine Learning và Deep Learning.........................................15
3.3.2 Tìm hiểu và so sánh một số model Deep Learning..................................16
3.3.3 Edge AI và Tiny Machine Learning.........................................................17
3.3.4 Giới thiệu thuật toán FOMO....................................................................18
3.3.5 Lựa chọn dataset...........................................................................................21
Chương 4. Thử nghiệm và kết quả............................................................................22
4.1. Chọn lọc ảnh phù hợp trong dataset và triển khai model trên PC..................22
ET-LUH K66
Project I
ET-LUH K66
Project I
Công ty phát triển dịch vụ truyền hình MyTV hoạt động trong lĩnh vực cung
cấp dịch vụ truyền hình trực tuyến và đa nền tảng. Các hoạt động của công ty có thể
bao gồm:
Phát sóng
truyền
hình trực
tuyến
Chiến
Xây dựng
lượng và
nền tảng
tiếp thị
streaming
quảng cáo
Hợp tác và
mua bán
bản quyền
Phát sóng truyền hình trực tuyến: Cung cấp các kênh truyền hình, chương trình,
và nội dung giải trí qua internet, cho phép người dùng xem từ các thiết bị di động,
máy tính bảng, và máy tính.
ET-LUH K66
Project I
Xây dựng nền tảng streaming: Phát triển và duy trì nền tảng công nghệ để phát
sóng truyền hình trực tuyến, bao gồm cả ứng dụng di động, trang web, và giao diện
người dùng.
Sản xuất nội dung: Tạo ra các chương trình truyền hình, series phim, chương trình
tin tức, và các loại nội dung giải trí khác để phát sóng trên các kênh của mình.
Hợp tác và mua bản quyền: Liên kết với các nhà sản xuất nội dung, các nhà phân
phối phim, và các đối tác khác để mua bản quyền phát sóng các chương trình phổ
biến và chất lượng.
Phát triển công nghệ: Nghiên cứu và áp dụng các công nghệ mới như trí tuệ nhân
tạo, học máy, và phân tích dữ liệu để cải thiện trải nghiệm người dùng và tối ưu hóa
việc cung cấp nội dung.
Chiến lược tiếp thị và quảng cáo: Xây dựng chiến lược tiếp thị để thu hút người
dùng, đồng thời tạo ra các cơ hội quảng cáo để hỗ trợ việc tài trợ nội dung và tăng
doanh thu.
Những hoạt động này thường được thực hiện nhằm đáp ứng nhu cầu ngày
càng tăng của người tiêu dùng về việc tiêu thụ nội dung truyền hình theo cách linh
hoạt và thuận tiện nhất.
1.3. Sứ mệnh
Sứ mệnh của Công ty Phát triển Dịch vụ Truyền hình là doanh nghiệp thành
viên, góp sức cùng đưa Tập đoàn Bưu chính Viễn thông Việt Nam trở thành Tập
đoàn số 1 Việt Nam về truyền thông, truyền hình, dịch vụ giá trị gia tăng và công
nghiệp nội dung số.
1.4. Giá trị cốt lõi
Con người là tài sản cùng với công nghệ tiên tiến tạo ra sự khác biệt
Sử dụng và kết hợp sức mạnh của Tập đoàn VNPT, các đối tác để tạo thế và lực
cho việc sáng tạo các giá trị mới cho khách hàng.
MyTV luôn lấy khách hàng làm trung tâm trong mọi hoạt động sản xuất kinh
doanh của mình, trên cơ sở đảm bảo lợi ích và chia sẻ những khó khăn cùng với đối
tác nhằm mang đến cho khách hàng các sản phẩm, dịch vụ chất lượng và ngày càng
phong phú đáp ứng nhu cầu ngày càng gia tăng của khách hàng. MyTV luôn xác
định đi tiên phong về công nghệ trên cơ sở hợp tác với các đối tác công nghệ nguồn
hàng đầu thế giới nhằm cải thiện quản lý nội dung, phân phối và trải nghiệm người
ET-LUH K66
Project I
dùng.
Cơ cấu tổ chức của Công ty MyTV chia làm hai khối chính: khối chức năng và
khối sản xuất.
ET-LUH K66
Project I
This chapter aims to analyze the needs of businesses and the currently available
vibration detection products in the market, while also constructing a model for a
vibration detection system.
ET-LUH K66 10
Project I
Mô tả công việc
Kỹ sư phát triển phần mềm được tham gia phát triển những sản phẩm quy
mô lớn như nền tảng ứng dụng chuyển đổi số doanh nghiệp, sàn thương mại
điện tử B2B Marketplace.
Yêu cầu kinh nghiệm
- Tốt nghiệp ĐH chuyên ngành CNTT và ĐTVT hoặc tương đương.
- Chấp nhận đào tạo ứng viên vừa tốt nghiệp ra trường đại học chuyên
ngành CNTT và Điện tử viễn thông.
- Có khả năng lập trình một trong các ngôn ngữ Java, Python, PHP, C# ..
- Quen thuộc với các framework lập trình backend phổ biến ( như
Spring, .Net, Django, Laravel, NodeJs …)
- Từng làm việc với các Persistence Database (MySQL, PostgreSql …)
hoặc NoSQL
- Kỹ năng làm việc độc lập, tự quản lý thời gian và công việc
- Kỹ năng làm việc nhóm
- Kỹ năng tìm kiếm thông tin và tìm hiểu những kiến thức mới
- Tinh thần cầu tiến, đương đầu với những thách thức, dự án lớn
- Ưu tiên: Ít nhất 1 năm kinh nghiệm lập trình Java, Python, PHP, C# ..
Đãi ngộ
- Xét lương 2 lần/năm, 16 tháng lương/1 năm
- Tiếp cận CN mới nhất IoT, 5G, Cloud, Big Data
- Môi trường trẻ trung, chuyên nghiệp, ăn trưa free
2.2.3 Fresher
Giới thiệu
Là chương trình tuyển dụng Fresher lớn nhất tại VNPT Technology được tổ chức
thường niên dành cho các bạn sinh viên khối ngành CNTT và ĐTVT trên toàn
Quốc. VNPT FRESHER 2023 mong muốn sẽ đem đến cho các bạn cơ hội “khám
phá” và “phát triển” trong môi trường năng động và đầy thử thách.
Quyền lợi
- Nhận lương lên đến 15tr/tháng tùy vị trí công việc ngay từ thời gian đào tạo.
- Tham gia miễn phí các khóa đào tạo chuyên môn & kỹ năng mềm.
- Tham gia hỗ trợ phát triển các sản phẩm với hàng chục triệu người dùng.
ET-LUH K66 11
Project I
- Được tư vấn & định hướng nghề nghiệp từ các Mentors - những chuyên gia
hàng đầu trong lĩnh vực CNTT.
- Cơ hội được tuyển dụng chính thức tại VNPT Technology sau thời gian đào
tạo với mức thu nhập năm hấp dẫn.
Yêu cầu
- Không yêu cầu kinh nghiệm
- Là sinh viên đã/sắp tốt nghiệp chuyên ngàn Công nghê thông tin, Điện tử
viễn thông, Toán tin, Khoa học máy tính, Kỹ thuật phần mềm, Ứng dụng di
động,... hoặc các chuyên ngành có liên quan.
- Có thể tham gia đào tạo/làm việc Full-time từ thứ 2 - thứ 6.
- GPA tích lũy từ khá trở lên
- Đặc biệt ưu tiên và xem xét tuyển thẳng đối với các ứng viên có điểm trung
bình (GPA/CPA) đạt 3.0/4.0 trở lên hoặc tham gia và đạt giải trong các cuộc
thi học thuật về lập trình, toán học, công nghệ, Olympic Tin học, ACM/ICPC
hoặc tham gia đề tài nghiên cứu khoa học đạt giải từ cấp trường trở lên.
- Ham học hỏi, máu lửa, nhiệt huyết, sẵn sàng chinh chiến đối đầu với thử
thách khó khăn tại các dự án phần mềm lớn. Tuân thủ kỷ luật & có trách
nhiệm với công việc.
- Ưu tiên ứng viên có khả năng đọc hiểu tiếng Anh tốt.
ET-LUH K66 12
Project I
Đối tượng hướng tới: Gia đình, hộ kinh doanh, cửa hàng
ET-LUH K66 13
Project I
IP Camera hoạt động bằng cách truyền tải video trực tiếp, cung cấp khả năng
theo dõi thời gian thực. Hệ thống này được trang bị khả năng phát hiện xâm nhập, tự
động nhận biết sự di chuyển hoặc hoạt động không bình thường trong khung hình.
Khi phát hiện có kẻ xâm nhập, hệ thống sẽ kích hoạt chuông cảnh báo để cảnh báo
người dùng hoặc gửi thông báo tới ứng dụng trên thiết bị di động. Những đoạn
video đặc biệt, như khi xảy ra sự xâm nhập hoặc vật thể di chuyển, sẽ được lưu trữ
một cách an toàn vào thẻ nhớ SD Card hoặc đồng bộ lên dịch vụ đám mây. Qua ứng
dụng trên hệ điều hành Android hoặc iOS, người dùng có thể xem video trực tiếp từ
camera, nhận thông báo cảnh báo khi có kẻ xâm nhập, và thậm chí điều khiển các
chức năng như bật/tắt cảnh báo. Điều này mang lại khả năng theo dõi và quản lý an
ninh một cách tiện lợi và hiệu quả.
Tuy nhiên, vì thời gian của kỳ thực tập có hạn, chúng em đã tập trung vào phần
tìm hiểu, thử nghiệm và phát triển các model và thử nghiệm trên một máy tính
nhúng bất kỳ,
ET-LUH K66 14
Project I
Machine Learning và Deep Learning là hai lĩnh vực quan trọng trong lĩnh vực Trí
tuệ Nhân tạo. Machine Learning là phương pháp giúp máy tính học từ dữ liệu và cải
thiện hiệu suất theo thời gian. Deep Learning là một phân nhánh của Machine
Learning, tập trung vào việc xây dựng các mạng neuron nhân tạo sâu có khả năng
học thông qua việc tự điều chỉnh trọng số của chúng. [1]
Sự khác nhau chính giữa hai khái niệm này nằm ở mức độ phức tạp và khả năng tự
động hóa. Trong Machine Learning, các thuật toán có thể hoạt động tốt với dữ liệu
đối kháng nhưng cần nhiều sự can thiệp từ con người để chọn và tinh chỉnh các đặc
trưng quan trọng. Trong khi đó, Deep Learning có khả năng tự động hóa việc trích
ET-LUH K66 15
Project I
xuất đặc trưng, cho phép học từ dữ liệu phức tạp hơn và tạo ra các mô hình có hiệu
suất tốt hơn trong nhiều tình huống. Điểm mạnh của Machine Learning nằm ở tính
linh hoạt và khả năng áp dụng rộng rãi cho nhiều ngành công nghiệp. Nó có thể
được sử dụng để giải quyết các vấn đề từ dự đoán tín dụng đến nhận dạng ảnh. Tuy
nhiên, điểm yếu của Machine Learning là cần nhiều sự can thiệp và kinh nghiệm để
chọn và tinh chỉnh các thuật toán và đặc trưng một cách hiệu quả.
Dựa trên những sự so sánh trên, em nhận thấy việc sử dụng Deep Learning cho
dự án nhận diện người là một quyết định có lợi. Khả năng tự động hóa quá trình học
đặc trưng giúp mô hình tự tìm hiểu và ứng dụng kiến thức từ dữ liệu huấn luyện
phức tạp. Điều này dẫn đến việc tạo ra các mô hình nhận diện người chính xác và
đáng tin cậy, thậm chí trong những tình huống khó khăn như ánh sáng yếu, góc nhìn
khác nhau, hoặc biến đổi về vẻ ngoại hình.
ET-LUH K66 16
Project I
Hình 3.3.2. So sánh các model Deep Learning sử dụng imageNet dataset [3]
Dựa vào bảng so sánh trên, ta có thể thấy MobileNetV2 và MobileNetV3 là 2
mô hình Deep Learning có tốc độ xử lý nhanh và độ chính xác cao và khá tương
đồng với nhau, phù hợp với một hệ thống đòi hỏi cả về độ chính xác và tốc độ xử lý
như dự án IP Camera nhận dạng người.
Edge AI là việc triển khai các ứng dụng AI trong các thiết bị trên toàn thế giới
vật lý. Nó được gọi là “Edge AI” bởi vì tính toán AI được thực hiện gần người dùng
tại rìa mạng, gần nơi đặt dữ liệu, thay vì tập trung trong cơ sở điện toán đám mây
hoặc trung tâm dữ liệu riêng [4]. Ở dự án lần này, IP Camera là địa diện cho Edge
Device, đặt tại các cửa hàng, nhà của các gia đình để phục vụ tính năng cảnh báo kẻ
xâm nhập.
ET-LUH K66 17
Project I
Hình 3.3.3.2 So sánh TinyML và các thuật toán Machine Learning truyền
thống
Tiny Machine Learning (TinyML) là việc triển khai các mô hình Machine
Learning trực tiếp trên các thiết bị nhỏ và tính toán hạn chế. Điều này mang lại khả
năng học máy và dự đoán thông minh cho cảm biến, thiết bị y tế, và đồng hồ thông
minh. TinyML tối ưu hóa hiệu suất trong tài nguyên nhỏ và tiết kiệm năng lượng.
Tuy nhiên, nó đòi hỏi tối ưu hóa phần cứng và đảm bảo an toàn thông tin [5].
Ở dự án lần này, yêu cầu đặt ra là model phải chạy được trên các CPU yếu hoặc
thậm chí là các vi điều khiển, vậy nên, em đã quyết định sử dụng các model Tiny
ML để phục vụ cho bài toán của mình.
Vì thời gian không cho phép, trong kỳ thực tập lần này, chúng em đã tìm hiểu
và chọn lọc một số thuật toán TinyML, trong đó FOMO là một thuật toán TinyML
nổi trội với các đặc điểm như đếm đối tượng, tìm vị trí của đối tượng trong hình ảnh
và theo dõi nhiều đối tượng trong thời gian thực bằng cách sử dụng bộ nhớ và sức
mạnh xử lý ít hơn tới 30 lần so với MobileNet SSD hoặc YOLOv5. Ngoài ra, thuật
toán FOMO hiện nay đã được hỗ trợ tích hợp với một số Deep Learning model nổi
tiếng như Yolov5, SSD-MobileNetV2 và SSD-MobileNetV3 để tạo ra những model
TinyML hoàn chỉnh đáp ứng nhu cầu sử dụng của các nhà phát triển phần mềm.
Ngoài ra, model FOMO phiên bản nhỏ nhất có thể chạy với bộ nhớ nhỏ hơn 100Kb
RAM.
ET-LUH K66 18
Project I
ET-LUH K66 19
Project I
Một điểm khác biệt giữa FOMO và các thuật toán phát hiện đối tượng khác là
FOMO không đưa ra các hộp giới hạn (bounding boxes), nhưng việc chuyển từ bản
đồ nhiệt (heat map) sang hộp giới hạn vô cùng đơn giản. Chỉ cần vẽ một khung
xung quanh khu vực được làm nổi bật. [6]
Tuy nhiên, khi thử nghiệm với một số bộ dataset do em tự thu thập, em nhận thấy
rằng việc định rõ hộp giới hạn chỉ là một chi tiết thực thi của các mạng phát hiện đối
tượng khác, và không phải là yêu cầu phổ biến. Thường thì, kích thước của đối
tượng không quan trọng do camera được đặt ở vị trí cố định (và vì thế, kích thước
đối tượng cũng cố định). Thay vào đó, chúng ta chỉ cần biết vị trí và số lượng của
các đối tượng.
Bởi vậy, hiện nay chúng tôi huấn luyện dựa trên tâm của các đối tượng. Điều này
giúp việc đếm các đối tượng gần nhau trở nên đơn giản hơn (mỗi hoạt động trong
bản đồ nhiệt tương ứng với một đối tượng), và kiến trúc tích chập của mạng neuron
đảm bảo rằng chúng ta vẫn quan sát xung quanh tâm để tìm đối tượng.
Edge Impulse là một nền tảng cho phép xây dựng các dự án liên quan đến
học máy trên vi điều khiển [6]
Có tutorial cho phép lựa chọn thiết bị, vi điều khiển sử dụng, lựa chọn các
model TinyML cho dự án để tiến hành quá trình training và thử nghiệm ngay
trên platform
ET-LUH K66 20
Project I
Đặc biệt nền tảng này hỗ trợ dùng FOMO tương thích với Mobilenet V2
Dựa trên các đặc điểm trên, em quyết định sử dụng Platform Edge Impulse vì nền
tảng này vừa hỗ trợ sử dụng model FOMO với MobileNetv2, vừa cho các ví dụ,
hướng dẫn rất cụ thể, phù hợp với nhu cầu bài toán.
Hình 3.3.5 Hình ảnh minh họa trích từ Human Detection Dataset
Dataset gồm hình ảnh cảnh quay CCTV trong nhà cũng như ngoài trời, trong
nhiều điều kiện thời tiết và ánh sáng
Gồm 559 ảnh có người và 362 ảnh không có người
Lí do em chọn bộ dataset này là vì nó bao gồm một số lượng ảnh vừa đủ cho
một bản sản phẩm thử nghiệm với các trường hợp có người và không có người, phù
hợp với nhu cầu của bài toán
ET-LUH K66 21
Project I
Vì thời gian có hạn, em chỉ có đủ thời gian để gán nhãn 225 ảnh (76%
Training, 24% Test) tập trung vào các ảnh đông người và ảnh có nhiều người
chồng chéo lên nhau.
4.1.2 Kết quả
ET-LUH K66 22
Project I
bảo nhu cầu tiết kiệm năng lượng hệ thống và xử lý với tốc độ cao.
Dựa vào ví dụ thử nghiệm trên, ta có thể thấy model có thể phát hiện được
người ở trong các tư thế khác nhau như cúi, ngồi, hoặc phân biệt được trẻ con và
người lớn. Các ưu điểm này sẽ góp phần rất lớn cho việc phát triển model cho hệ
thống IP Camera phát hiện người sau này.
Hình 4.1.2.d Minh họa một số trường hợp nhận diện không đủ
Dựa vào ví dụ trên, ta có thể thấy model đã gặp một chút vấn đề trong việc nhận
dạng ảnh người bị chồng chéo lên nhau. Đây vốn là một vấn đề khó của các model
AI, trong thời gian tới, em sẽ tìm cách để cải thiện và tối ưu hóa model để khắc phục
được vấn đề này.
ET-LUH K66 23
Project I
Hình 4.1.2c Kết quả chạy thử nghiệm trên Jetson Nano
Dựa vào kết quả trên, ta có thể thấy thời gian để Jetson Nano xử lý 1 bức ảnh
với model được triển khai khá giống với dự đoán của Edge Impulse sau khi training
trên platform. Tuy nhiên, FPS của hệ thống này khi livestream còn rất thấp, ảnh
hưởng tới kết quả nhận dạng, em sẽ tìm cách để khắc phục tình trạng này trong thời
gian tới.
ET-LUH K66 24
Project I
5.3 Đề xuất
Em hi vọng trường học và doanh nghiệp có thể tạo điều kiện để sinh viên có
thời gian thực tập kéo dài hơn, từ đó nâng cao kỹ năng, kinh nghiệm và cơ hội tham
gia vào các dự án thực tế.
ET-LUH K66 25
Project I
ET-LUH K66 26
Project I
ET-LUH K66 27