Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 13

ĐỀ THI MÔN CÔNG NGHỆ 4.

0 trg LVCK

1. Trí tuệ nhân tạo là gì? Giải thích sự khác biệt giữa AI và các phương pháp
toán học khác trong nhận dạng.
- Trí tuệ nhân tạo hay trí thông minh nhân tạo (Artificial
intelligence  – viết tắt là AI) là một ngành thuộc lĩnh vực khoa học
máy tính (Computer science). Là trí tuệ do con người lập trình
tạo nên với mục tiêu giúp máy tính có thể tự động hóa các hành
vi thông minh như con người.
- Khái niệm
AI là sự mô phỏng quá trình trí tuệ của con người bằng máy móc, đặc
biệt là các hệ thống hệ máy tính.

AI giúp máy móc có thể học hỏi kinh nghiệm, điều chỉnh các đầu vào
mới và thực hiện các nhiệm vụ giống con người.

AI là một lĩnh vực của khoa khọc máy tính, nhấn mạnh việc tạo ra
các máy móc thông minh, hoạt động và phản ứng như con người.

Các ứng dụng cụ thể của AI bao gồm xử lý các ngôn ngữ tự nhiên,
nhận dạng giọng nói và thị giác, quản lý hệ thống, …
2. Giải thích một số phương pháp học máy sử dụng phân loại (Giải thích bằng
hình và chữ)

Hồi quy logistic: Hồi quy logistic là một phương pháp đơn giản và dễ hiểu được
sử dụng cho các nhiệm vụ phân loại nhị phân, trong đó mục tiêu là dự đoán một
trong hai lớp có thể. Nó mô hình hóa mối quan hệ giữa các tính năng đầu vào và
kết quả nhị phân bằng cách sử dụng hàm logistic, ánh xạ các giá trị dự đoán thành
xác suất. Xác suất dự đoán sau đó được ngưỡng để có được nhãn lớp cuối cùng.

Cây quyết định: Cây quyết định là mô hình dựa trên cây có thể được sử dụng cho
cả nhiệm vụ phân loại nhị phân và đa lớp. Chúng hoạt động bằng cách phân tách
đệ quy dữ liệu dựa trên các giá trị tính năng để tạo cấu trúc dạng cây. Mỗi nút bên
trong cây đại diện cho một quyết định dựa trên giá trị tính năng và mỗi nút lá đại
diện cho một nhãn lớp. Cây quyết định có thể hiểu được và có thể xử lý cả các tính
năng số và phân loại.

Rừng ngẫu nhiên: Rừng ngẫu nhiên là một phần mở rộng của cây quyết định giúp
xây dựng nhiều cây và kết hợp các dự đoán của chúng để cải thiện độ chính xác và
mạnh mẽ của mô hình. Mỗi cây được đào tạo trên một tập hợp con ngẫu nhiên của
dữ liệu có thay thế và dự đoán cuối cùng thu được bằng cách lấy trung bình hoặc
lấy đa số phiếu dự đoán từ các cây riêng lẻ. Rừng ngẫu nhiên được biết đến với
khả năng xử lý dữ liệu ồn ào và tránh trang bị quá mức.

Support Vector Machines (SVM): SVM là một phương pháp mạnh mẽ được sử
dụng cho các tác vụ phân loại nhị phân và đa lớp. SVM tìm một siêu phẳng phân
tách tốt nhất các điểm dữ liệu của các lớp khác nhau trong một không gian đặc
trưng nhiều chiều. Nó nhằm mục đích tối đa hóa lề giữa các lớp và cũng có thể sử
dụng các hàm nhân khác nhau để chuyển đổi các tính năng đầu vào thành không
gian nhiều chiều hơn để cải thiện khả năng phân tách.
K-Hàng xóm gần nhất (KNN): KNN là một phương pháp dựa trên cá thể đơn giản
có thể được sử dụng cho cả nhiệm vụ phân loại nhị phân và đa lớp. Nó phân loại
các điểm dữ liệu mới dựa trên lớp đa số của k hàng xóm gần nhất của chúng trong
dữ liệu huấn luyện, trong đó k là siêu tham số do người dùng xác định. KNN dễ
triển khai và có thể hoạt động tốt đối với các tập dữ liệu nhỏ.

Mạng nơ-ron: Mạng nơ-ron, đặc biệt là các mô hình học sâu, đã trở nên phổ biến
đáng kể trong những năm gần đây cho các nhiệm vụ phân loại. Chúng có khả năng
học các biểu diễn phức tạp từ lượng lớn dữ liệu và có thể đạt được hiệu suất cao
nhất trong nhiều ứng dụng. Mạng thần kinh chuyển đổi (CNN) thường được sử
dụng để phân loại hình ảnh, trong khi Mạng thần kinh tái phát (RNN) hoặc
Transformers được sử dụng để phân loại chuỗi hoặc văn bản.

3. Giải thích một số phương pháp không giám sát bằng hình và từ ngữ.

Học không có giám sát (tiếng Anh: unsupervised learning) là một phương pháp


của ngành học máy nhằm tìm ra một mô hình mà phù hợp với các quan sát.  Nó [1]

khác biệt với học có giám sát ở chỗ là đầu ra đúng tương ứng cho mỗi đầu vào là
không biết trước. Trong học không có giám sát, một tập dữ liệu đầu vào được thu
thập. Học không có giám sát thường đối xử với các đối tượng đầu vào như là một
tập các biến ngẫu nhiên. Sau đó, một mô hình mật độ kết hợp sẽ được xây dựng cho
tập dữ liệu đó.

Học không có giám sát có thể được dùng kết hợp với suy luận Bayes để cho ra xác
suất có điều kiện (nghĩa là học có giám sát) cho bất kì biến ngẫu nhiên nào khi biết
trước các biến khác.

Học không có giám sát cũng hữu ích cho việc nén dữ liệu: về cơ bản, mọi giải thuật
nén dữ liệu hoặc là dựa vào một phân bố xác suất trên một tập đầu vào một cách
tường minh hay không tường minh.

Một dạng khác của học không có giám sát là phân nhóm dữ liệu, nó đôi khi không
mang tính xác suất.

Ví dụ:
4. Hãy trình bày các loại hình cơ bản trong phân tích dữ liệu (Data Analytics), mỗi
loại hình cho một ví dụ cụ thể

Phân tích dữ liệu là quá trình làm việc với dữ liệu để thu thập các thông tin hữu
ích, từ đó sử dụng kết quả phân tích để đưa ra các quyết định sáng suốt liên quan
đến các kế hoạch chiến lược của công ty. Nói cách khác, khi chúng ta dựa vào kết
quả phân tích và ý nghĩa từ dữ liệu, chúng ta sẽ đưa ra quyết định tốt hơn việc đưa
ra quyết định mà không dựa trên bất kỳ cơ sở nào.

Các loại phân tích dữ liệu (có ví dụ)

Dữ liệu có thể được sử dụng để trả lời các câu hỏi và hỗ trợ các quyết định theo nhiều
cách khác nhau. Chúng ta có thể chia các loại phân tích này thành bốn nhóm thường được
sử dụng. Cụ thể:

2.1 Phân tích mô tả (Descriptive analysis)

Phân tích mô tả cho chúng ta biết điều gì đã xảy ra. Loại phân tích
này giúp mô tả hoặc tóm tắt dữ liệu định lượng bằng cách trình bày các số liệu thống kê.
Ví dụ: phân tích thống kê có thể cho thấy sự phân bổ doanh số bán hàng trong một nhóm
nhân viên và số liệu bán hàng trung bình trên mỗi nhân viên.

2.2 Phân tích chẩn đoán (Diagnostic analysis)

Phân tích chẩn đoán giúp xác định “tại sao lại xảy ra”. Giả sử một
phân tích mô tả cho thấy một lượng bệnh nhân bất thường trong bệnh viện. Đi sâu vào dữ
liệu có thể phát hiện rằng nhiều bệnh nhân trong số những bệnh nhân này có chung các
triệu chứng của một loại virus cụ thể. Từ phân tích chẩn đoán này, bạn có thể xác định
đang có một tác nhân lây nhiễm, cũng là lý do tại sao - dẫn đến dòng bệnh nhân này.

2.3 Phân tích dự đoán (Predictive analysis)

Phân tích dự đoán sử dụng dữ liệu để hình thành các dự báo về


tương lai. Bằng cách sử dụng phân tích dự đoán, bạn có thể nhận thấy rằng một sản
phẩm nhất định đã có doanh số bán hàng tốt nhất trong các tháng 9 và 10 hàng năm, dẫn
đến việc bạn có thể dự đoán một mức cao tương tự trong năm sắp tới.

2.4 Phân tích đề xuất (Prescriptive analysis)

Phân tích đề xuất tổng hợp tất cả những dữ liệu quan trọng thu
thập được từ ba loại phân tích đầu tiên. Từ đó, hình thành các
đề xuất cho chiến lược hành động của công ty. Ví dụ, đề xuất một kế
hoạch thị trường để xây dựng dựa trên sự thành công của những tháng doanh thu cao và
khai thác các cơ hội tăng trưởng mới trong những tháng chậm hơn.

Tóm lại:

Phân tích mô tả trả lời câu hỏi: "Điều gì đã xảy ra?"

Phân tích chẩn đoán trả lời câu hỏi: "Tại sao nó lại xảy ra?"

Phân tích dự đoán trả lời câu hỏi: "Điều gì có thể xảy ra trong tương lai?"

Phân tích đề xuất trả lời câu hỏi: "Chúng ta nên làm gì với nó?"

5. Hãy trình bày các bước chính trong phân tích dữ liệu

Tùy vào loại dữ liệu và phong cách của các nhà phân tích mà họ có thể thực hiện
quy trình theo nhiều cách khác nhau. Tuy nhiên, có một quy trình cơ bản mà bạn
có thể áp dụng cho hầu hết mọi lĩnh vực và tùy biến theo từng nhu cầu.

Bước 1: Tìm ra mục tiêu bằng cách trả lời câu hỏi "bạn muốn khám phá điều gì?".
Thu thập tất cả những thông tin, dữ liệu cần thiết hoặc có liên quan đến câu hỏi
này.

Bước 2: Sàn lọc thông tin, chắt lọc các nội dung quan trọng, cần thiết và loại bỏ
các dữ liệu kém chất lượng. Đưa dữ liệu về đúng định dạng, sắp xếp theo thứ tự
phù hợp với mục tiêu phân tích đã đề ra.

Bước 3: Xử lý dữ liệu bằng các công cụ như Excel, Google Sheets. Kết hợp nhiều
thao tác bao gồm vẽ sơ đồ, lập bảng biểu…
Bước 4: Sử dụng các công cụ thống kê để phân tích và lý giải bằng cách tìm ra các
mối tương quan hoặc xu hướng bên trong dữ liệu.

Bước 5: Trình bày, không chỉ phân tích mà quy trình chỉ kết thúc khi dữ liệu được
xuất ra báo cáo cho người dùng cuối (ban quản lý, người phụ trách, người đưa ra
quyết định…). Bạn có thể hiểu một cách đơn giản là dữ liệu sau phân tích vẫn là
những con số. Nếu khối lượng thông tin ở quy mô lớn người dùng cuối sẽ mất rất
nhiều thời gian để đọc, hiểu.

Chính vì vậy, các dữ liệu sau khi phân tích cần được trực quan, bằng cách biểu
diễn dưới định dạng biểu đồ, đồ thị… Hình ảnh giúp tăng khả năng liên tưởng,
truyền đạt thông tin giúp người dùng cuối có thể nhanh chóng nắm bắt thông tin và
đưa ra quyết định chính xác. Công việc này được gọi là trực quan dữ liệu, nó được
xem là một phần quan trọng trong những năm gần đây.

6. Một trang trại trồng hoa thông minh (smart farm) ứng dụng công nghệ 4.0 từ khâu
gieo hạt đến khâu thu hoạch. Hình bên dưới là 03 quy trình nhỏ trong cả quy trình công
nghệ, đó là quy trình của công đoạn tưới nước, bón phân và điều chỉnh ánh sáng. Các
thông tin đầu vào như sau:

- Loại hoa: có nhiều loại hoa khác nhau, mỗi loại thích ứng với một chế độ dinh
dưỡng và chăm sóc khác nhau
- Mỗi loại hoa, mỗi giai đoạn phát triển của từng loại hoa sẽ phụ thuộc vào các yếu
tố sau:
o Độ ẩm của đất
o Phân bón (loại phân bón, hàm lượng, thời gian bón,…)
o Ánh sáng
o Nhiệt độ môi trường
o V.v…
- Các cơ cấu chấp hành như sau:
o Tưới nước: được thực hiện bằng bơm nước
o Bón phân: được thực hiện bởi các động cơ đóng/mở van (có nhiều thành
phần trong phân bón, mỗi thành phần được điều khiển bởi một cửa van
(động cơ))
o Ánh sáng: được điều chỉnh bằng cách mở/khép cửa lấy ánh sáng mặt trời
(động cơ sẽ dẫn động cánh cửa lấy sáng), nếu ánh sáng mặt trời không đáp
ứng (sau 30 phút nếu không đáp ứng) thì sẽ chuyển sang sử dụng đèn chiếu
sáng.
- Giải thích các chữ viết tắt trong hình vẽ:
o ω đ là độ ẩm của đất tại thời điểm đo đạt
o ω o là độ ẩm tối ưu của đất để hoa phát triển tương ứng với từng loại hoa và
từng giai đoạn
o T là thời gian phát triển của cây hoa tính từ lúc gieo hạt
o Toi là những mốc thời gian cần phải bón phân tưng ứng với từng loại hoa
(tính từ lúc gieo hạt)
o IMT là cường độ ánh sáng của môi trường
o Io là cường độ ánh sáng tối ưu để hoa phát triển tốt nhất ứng với từng loại
hoa

Hãy nêu các loại cảm biến được dùng trong 03 quy trình: tưới nước, bón phân và
điều chỉnh ánh sáng (như hình vẽ). Giải thích rõ công dụng từng cảm biến và sự
tương tác của dữ liệu mà cảm biến thu thập được với các dữ liệu trên hệ thống.

7.Hãy định nghĩa CPS? Cho vài ví dụ về CPS?


CPS (Cyber Physiscal System) là "sự tích hợp của quá trình điện toán vào quá
trình vật lý và hoạt động của hệ thống này phải được xác định bởi cả phần thực
(các chi tiết vật lý) và phần ảo (phần cứng và phần mềm)".

8.Nêu những đặc tính của CPS?

Có nhiều cách tiếp cận để phân tích các đặc trưng của một hệ thống thực ảo. Theo [5],
nếu trích xuất các đặc trưng cơ bản nhất của một hệ thống thực ảo về mặt kỹ thuật -
kinh tế thì CPS có các đặc trưng cơ bản sau:

Kỹ thuật: Hệ thống nhúng và các cảm biến được tích hợp sâu vào hệ thống vật lý và
môi trường vật lý. Vì vậy, hệ thống thực ảo nhấn mạnh vào việc giao tiếp
(communication) và xử lí thông tin (information processing) giữa phần thực và phần
ảo. Tập trung vào kỹ thuật ở đây được hiểu là việc tập trung vào mảng giao tiếp hay
mảng xử lí thông tin. Khi thiết kế hệ thống CPS, cần chú ý vào việc thiết kế đồng thời
các chi tiết vật lý và các chi tiết nhúng để đảm bảo sự hoạt động ổn định và giao tiếp
hiệu quả của cả hai thành phần này; Ngoài ra, khả năng xử lí dữ liệu cũng phải có
hiệu suất cao để giảm tải cho hệ thống nhằm mục đích giảm chi phí và tối ưu nguyên
công.

Liên kết: phải có sự liên kết chặt chẽ giữa ba khía cạnh tính chất của hệ thống +
quyền hạn + quản lý hành chính.

- Tính chất của hệ thống: Khi xây dựng hệ thống thực ảo, phải nêu được các tính
chất quan trọng nhất của hệ thống. Đó có thể là sự an toàn trong vận hành, bảo mật
thông tin, hoặc thân thiện với môi trường. Vì các hệ thống thực ảo đều có sự giao tiếp
với các thiết bị IoT nên vấn đề bảo mật trên không gian mạng (Cyber Security) phải
được chú trọng
- Quyền hạn: Ở đây chỉ sự thống nhất trong sử dụng các tiêu chuẩn công nghiệp và
thượng tôn pháp luật. Ví dụ, hệ thống thực ảo sử dụng rất nhiều các cảm biến không
dây để truyền tải dữ liệu và giao tiếp với hệ thống nhúng, thì các giao tiếp không dây
này phải sử dụng các băng tần tiêu chuẩn và được sự cho phép của pháp luật. Ngoài
ra, các hệ thống thực ảo thu thập rất nhiều dữ liệu từ môi trường vật lý bên ngoài, việc
thu thập này phải được sự cho phép của pháp luật.

- Cuối cùng, quản lý hành chính: Chỉ việc thực hiện các quy tắc, quy định, và luật
trong quyền hạn được cho phép để đảm bảo các tính chất của hệ thống như an toàn lao
động, hiệu suất công việc và bảo mật thông tin của hệ thống.

Mức độ tự động hóa: Khi thiết kế CPS, mục tiêu của chúng ta luôn là giảm tải khối
lượng công việc cho con người cũng như tăng khả năng hoạt động độc lập của máy
móc. Tuy nhiên, nhiều quá trình thì sự có mặt của con người là bắt buộc để đảm bảo
an toàn lao động. Vì vậy không nên lạm dụng tự động hóa cho toàn bộ quy trình sản
xuất.

Vòng đời hệ thống: Trước khi hệ thống thực ảo ra đời, vòng đời của một hệ thống,
một sản phẩm thường được khuyến cáo sử dụng trong một khoảng thời gian đặt trước.
Với CPS, nhờ các cảm biến tinh vi, ta có thể biết tình trạng sức khỏe của từng chi tiết
trong hệ thống để có lịch trình làm việc và thay thế cụ thể cho từng phần. Việc này
giúp việc bảo trì hệ thống dễ dàng hơn và giúp giảm chi phí đầu tư. Theo [1], nếu tập
trung vào khía cạnh kỹ thuật thì trong cả vòng đời hoạt động của một hệ thống thực
ảo, nó phải đáp ứng các tính chất sau:

Có tính phụ thuộc: Vì hệ thống thực ảo luôn phải tiếp nhận dữ liệu từ môi trường
bên ngoài để phục vụ cho việc điều khiển hệ thống vật lý và hệ thống vật lý cũng có
những tác động ngược lại với môi trường bên ngoài nên các phần tử (vật lý và ảo)
phải có tính phụ thuộc để đưa ra các tín hiệu điều khiển phù hợp với môi trường vật lý
bao quanh nó.
Có khả năng kiểm soát nguồn lực: Các nguồn lực ở đây bao gồm năng lượng sử
dụng của hệ thống, thời gian thực thi, độ dài của chương trình, khối lượng (vật lý) của
hệ thống và chi phí sản xuất/ hoạt động của hệ thống.

Có khả năng sử dụng và tận dụng dữ liệu lớn (big data): Vì hệ thống thực ảo thu
thập một lượng lớn dữ liệu từ môi trường vật lý nên hệ thống phải có khả năng xử lí
dữ liệu hiệu quả. Khi kết nối giữa các hệ thống thực ảo với nhau, thì hệ thống được
liên kết này phải có khả năng tận dụng dữ liệu lớn do các các hệ thống con cung cấp.

Có tác động tích cực đến các mặt của đời sống: Hệ thống thực ảo ra đời nhằm giúp
giảm tải công việc cho con người, tạo ra các hệ thống máy móc thân thiện với con
người và môi trường.

CPS cung cấp giải pháp có tính bền vững: Công nghệ CPS cung cấp các giải pháp
có thể hỗ trợ trong việc xử lý với tính bền vững, chẳng hạn như thiết kế kiến trúc mô-
đun để tạo điều kiện tái sử dụng và tái chế. Việc quản lý hệ thống như vậy, đối phó
với các rủi ro an ninh và an toàn, cung cấp khả năng tương tác hiệu quả, đặt ra các rào
cản trong công cuộc công nghiệp hóa. Thiếu các giải pháp mới cần thiết, có thể ngăn
cản thành công sự tiến hóa công nghiệp.

CPS có khả năng gây ảnh hưởng - thay đổi đáng kể bản chất của thị trường:
Điều này có thể là thông qua việc tạo ra các thị trường mới hoặc thông qua những
thay đổi đáng kể của hệ sinh thái. CyPhERS devel đã chọn một phương pháp phân
tích thị trường để cố gắng xác định tiềm năng của CPS để định hình thị trường.
Phương pháp, bổ sung cho các đặc điểm được mô tả, bao gồm phân tích các cơ hội và
hạn chế ở mỗi "lớp": Xã hội, Quy trình, Thông tin và Công nghệ.

9.Lập bảng so sánh sự khác nhau giữa CPS và hệ thống nhúng?

10.

Các băng tải vận chuyển hành khách đến các nhà ga trong các sân bay thường phải
hoạt động liên tục 24/7. Tuy nhiên, nó có một vấn đề thường xuyên sảy ra là lưu
lượng hành khách di chuyển trên bang tải nó thay đổi liên tục, không cố định dẫn đến
tình trạng là có những thời điểm không có hành khách sử dụng mà băng tải vẫn hoạt
động nên gây lãng phí. Để khắc phục tình trạng đó người ta nghiên cứu ứng dụng hệ
thống mạng vật lý (CPS) để hệ thống có thể tự động ra quyết định điều chỉnh vận tốc
và công suất động của động cơ băng tải tùy theo lưu lượng hành khách có mặt trên
băng tải trong từng thời điểm khác nhau. Hình vẽ bên dưới là mô hình mô phỏng của
hệ thống mạng vật lý này, người ta sẽ khảo sát lưu lượng hành khách trong 900 giây
liên tục từ kết quả khảo sát sẽ cung cấp cho mô hình động lực học của băng tải để
tính ra chế độ làm việc của băng tải sao cho tiết kiệm được điện năng tiêu thụ mà vẫn
phải đảm bảo di chuyển hết lượng hành khách trong từng thời điểm khác nhau.

Cấu trúc mô hình mô phỏng:

Kết quả mô phỏng:


Hãy cho biết dữ liệu đầu vào cần phải cung cấp cho hệ thống là gì và cho biết dạng dữ
liệu thuộc phân nhóm nào? Phân tích các kết quả đầu ra của quá trình mô hình phỏng?

11.Trình bày những điểm tương đồng và khác biệt của ba khái niệm sau. Cho ví dụ
minh họa cụ thể. “Digital Twin Prototype (DTP)”, “ Digital Twin Instance (DTI)” ,
“Digital Twin Aggregate (DTA)”.

12.Trình bày nguồn dữ liệu và mô hình cho dữ liệu số trong việc tạo bản sao số.

13.Vui lòng trình bày chi tiết từng bước để tạo bộ song hành kỹ thuật số cho xy
lanh sau:

-Đường kính lồng xy lanh (bore size) :16


-Hành trình làm việc ( standard stroke): 100
Ghi chú:
+ Vẽ sơ đồ bố trí các cảm biến để theo dõi và thu thập dữ liệu và minh họa các
luận điểm của bạn.
+Đầu vào: áp suất
+ Đầu ra: vận tốc, Lực, lưu lượng thể tích.
+ Giám sát: Nhiệt độ, độ rung, vận tốc, lực, lưu lượng thể tích.
+ Có thể trình bày các bước chi tiết một cách tổng quan.

You might also like