baocaomonAI

BỘ GIÁO DỤC & ĐÀO TẠO
TRƯỜNG ĐẠI HỌC KINH TẾ TP.HCM

Viện 3I
----
BÁO CÁO
MÔN HỌC: TRÍ TUỆ NHÂN TẠO
Giảng viên hướng dẫn: PGSTS - Nguyễn Trường Thịnh

Sinh viên thực hiện: Đinh Văn Quảng
Lớp: RA0001
MSSV:31231027412
TP.HCM, ngày 12 tháng 04 năm 2024

Tóm tắt:
Bài báo cáo này trình bày về việc xây dựng và huấn luyện một mạng nơ-ron tích chập
(CNN) để phân loại 5 loại hoa: hoa cúc, bồ công anh, hoa hồng, hoa hướng dương và
tulip. Mô hình được huấn luyện trên tập dữ liệu gồm 150 ảnh mỗi loại, với các kỹ
thuật tăng cường dữ liệu. Sau khi huấn luyện, mô hình đạt độ chính xác 95% trên tập
dữ liệu xác thực.
Mô hình:
Mô hình CNN được sử dụng trong bài báo cáo này có kiến trúc sau:
Lớp 1: Tích chập với 32 bộ lọc kích thước 3x3, kích hoạt ReLU.
Lớp 2: Max pooling 2x2.
Lớp 3: Dropout 0.2.
Lớp 7: Làm phẳng.
Lớp 8: Mật độ 224, kích hoạt ReLU.
Lớp 9: Mật độ 5, kích hoạt softmax.
Huấn luyện:
Mô hình được huấn luyện trên tập dữ liệu gồm 150 ảnh mỗi loại hoa, chia thành 80%
huấn luyện và 20% xác thực. Kỹ thuật tăng cường dữ liệu được sử dụng để tăng kích
thước tập dữ liệu và cải thiện khả năng khái quát của mô hình. Các kỹ thuật tăng
cường dữ liệu bao gồm:
Xoay ảnh ngẫu nhiên trong khoảng ±20 độ.
Cắt xéo ảnh theo tỷ lệ ngẫu nhiên trong khoảng ±0.2.
Phóng to hoặc thu nhỏ ảnh ngẫu nhiên trong khoảng ±0.2.
Lật ảnh theo chiều ngang với xác suất 50%.
Dịch chuyển kích thước ảnh gốc theo chiều ngang và dọc trong khoảng ±0.1 lần.
Mô hình được huấn luyện trong 15 epochs với optimizer Adam và loss function
categorical crossentropy.
Kết quả:
Sau khi huấn luyện, mô hình đạt độ chính xác khoảng 60% trên tập dữ liệu xác thực.
Mô hình có thể phân loại chính xác các loại hoa trong các điều kiện ánh sáng và góc
chụp khác nhau.
Kết luận:
Mô hình CNN được trình bày trong bài báo cáo này có thể phân loại 5 loại hoa với độ
chính xác không cao lắm. Mô hình có thể được sử dụng để phân loại những hình ảnh
đơn giản nổi bật dễ nhận dạng của các loài hoa.
Phần code:
import tensorflow as tf
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten,
Dense, Dropout
from tensorflow.keras.optimizers import Adam
# Tăng cường dữ liệu

train_datagen = ImageDataGenerator(
rescale=1./255, # Chuẩn hóa pixel của ảnh để có giá trị trong
khoảng [0, 1]
rotation_range=20, # Xoay ảnh ngẫu nhiên trong khoảng ±20 độ
shear_range=0.2, # Cắt xéo ảnh theo tỷ lệ ngẫu nhiên trong khoảng
±0.2
zoom_range=0.2, # Phóng to hoặc thu nhỏ ảnh ngẫu nhiên trong khoảng
±0.2
horizontal_flip=True, # Lật ảnh theo chiều ngang với xác suất 50%
width_shift_range=0.1, # Dịch chuyển kích thước ảnh gốc theo chiều
ngang trong khoảng ±0.1 lần
height_shift_range=0.1) # Dịch chuyển kích thước ảnh gốc theo chiều
dọc trong khoảng ±0.1 lần
test_datagen = ImageDataGenerator(rescale=1./255)
# Tạo trình tạo dữ liệu huấn luyện và xác thực

train_generator = train_datagen.flow_from_directory(
'/content/drive/MyDrive/5loaihoa-train',
target_size=(224, 224),
batch_size=32,
class_mode='categorical',)
validation_generator = test_datagen.flow_from_directory(
'/content/drive/MyDrive/5loaihoa-test',
batch_size=32,
# Kiến trúc mạng được cải thiện

model = Sequential()
model.add(Conv2D(32, (3, 3), activation='relu', input_shape=(224, 224,
3)))
model.add(MaxPooling2D((2, 2)))
model.add(Dropout(0.2))
model.add(Conv2D(64, (3, 3), activation='relu'))
model.add(Flatten())
model.add(Dense(224, activation='relu'))
model.add(Dense(5, activation='softmax'))
# Huấn luyện mô hình

model.compile(loss='categorical_crossentropy', optimizer=Adam(),
metrics=['accuracy'])
model.fit_generator(train_generator,
epochs=15,
validation_data=validation_generator,)
# Lưu mô hình
model.save('nhandang5loaihoa.h5')
Kết quả huấn luyện:
Epoch 1/15
24/24 [==============================] - 107s 4s/step - loss: 4.4846 -
accuracy: 0.2213 - val_loss: 1.6082 - val_accuracy: 0.2333
Epoch 2/15
24/24 [==============================] - 108s 4s/step - loss: 1.4716 -
Epoch 3/15
24/24 [==============================] - 102s 4s/step - loss: 1.2641 -
Epoch 4/15
24/24 [==============================] - 102s 4s/step - loss: 1.1811 -
Epoch 5/15
24/24 [==============================] - 103s 4s/step - loss: 1.1138 -
Epoch 6/15
24/24 [==============================] - 102s 4s/step - loss: 1.1087 -
Epoch 7/15
24/24 [==============================] - 102s 4s/step - loss: 1.0438 -
Epoch 8/15
24/24 [==============================] - 108s 4s/step - loss: 0.9447 -
Epoch 9/15
24/24 [==============================] - 103s 4s/step - loss: 0.8784 -
Epoch 10/15
24/24 [==============================] - 101s 4s/step - loss: 0.8678 -
Epoch 11/15
24/24 [==============================] - 101s 4s/step - loss: 0.8358 -
Epoch 12/15
24/24 [==============================] - 100s 4s/step - loss: 0.7792 -
Epoch 13/15
24/24 [==============================] - 109s 5s/step - loss: 0.7858 -
Epoch 14/15
24/24 [==============================] - 106s 4s/step - loss: 0.7153 -
Epoch 15/15
24/24 [==============================] - 107s 5s/step - loss: 0.6702 -
Kết quả test:
Tóm tắt:
(CNN) để phân loại 5 món ăn: bún bò, xôi, bánh xeo, bánh lọc và bánh mì. Mô hình
được huấn luyện trên tập dữ liệu gồm 70 ảnh mỗi loại, với các kỹ thuật tăng cường dữ
liệu. Sau khi huấn luyện, mô hình đạt độ chính xác khoảng 50% trên tập dữ liệu xác
thực.
Mô hình:
Mô hình CNN được sử dụng trong bài báo cáo này có kiến trúc sau:
Lớp 7: Làm phẳng.
Lớp 8: Mật độ 224, kích hoạt ReLU.
Lớp 9: Mật độ 5, kích hoạt softmax.
Huấn luyện:
Mô hình được huấn luyện trên tập dữ liệu gồm 70 ảnh mỗi món ăn, chia thành 50 ảnh
để huấn luyện và 20 ảnh xác thực. Kỹ thuật tăng cường dữ liệu được sử dụng để tăng
kích thước tập dữ liệu và cải thiện khả năng khái quát của mô hình. Các kỹ thuật tăng
cường dữ liệu bao gồm:
Xoay ảnh ngẫu nhiên trong khoảng ±20 độ.
Cắt xéo ảnh theo tỷ lệ ngẫu nhiên trong khoảng ±0.2.
Phóng to hoặc thu nhỏ ảnh ngẫu nhiên trong khoảng ±0.2.
Lật ảnh theo chiều ngang với xác suất 50%.
Dịch chuyển kích thước ảnh gốc theo chiều ngang và dọc trong khoảng ±0.1 lần.
Kết quả:
Mô hình có thể phân loại chính xác các món ăn trong các điều kiện ánh sáng và góc
chụp khác nhau.
Kết luận:
Mô hình CNN được trình bày trong bài báo cáo này có thể phân loại 5 món ăn với độ
chính xác không cao lắm. Mô hình có thể được sử dụng để phân loại những hình ảnh
đơn giản nổi bật dễ nhận dạng của các món ăn.
Phần code:
import tensorflow as tf
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten,
Dense, Dropout
from tensorflow.keras.optimizers import Adam
# Tăng cường dữ liệu

train_datagen = ImageDataGenerator(
rescale=1./255, # Chuẩn hóa pixel của ảnh để có giá trị trong
khoảng [0, 1]
rotation_range=20, # Xoay ảnh ngẫu nhiên trong khoảng ±20 độ
shear_range=0.2, # Cắt xéo ảnh theo tỷ lệ ngẫu nhiên trong khoảng
±0.2
zoom_range=0.2, # Phóng to hoặc thu nhỏ ảnh ngẫu nhiên trong khoảng
±0.2
horizontal_flip=True, # Lật ảnh theo chiều ngang với xác suất 50%
width_shift_range=0.1, # Dịch chuyển kích thước ảnh gốc theo chiều
ngang trong khoảng ±0.1 lần
height_shift_range=0.1) # Dịch chuyển kích thước ảnh gốc theo chiều
dọc trong khoảng ±0.1 lần
test_datagen = ImageDataGenerator(rescale=1./255)
# Tạo trình tạo dữ liệu huấn luyện và xác thực

train_generator = train_datagen.flow_from_directory(
'/content/drive/MyDrive/5 món ăn/train',
batch_size=32,
validation_generator = test_datagen.flow_from_directory(
'/content/drive/MyDrive/5 món ăn/test',
batch_size=32,
# Kiến trúc mạng được cải thiện

model = Sequential()
model.add(Conv2D(32, (3, 3), activation='relu', input_shape=(224, 224,
3)))
model.add(Conv2D(64, (3, 3), activation='relu'))
model.add(Flatten())
model.add(Dense(224, activation='relu'))
model.add(Dense(5, activation='softmax'))
# Huấn luyện mô hình

model.compile(loss='categorical_crossentropy', optimizer=Adam(),
metrics=['accuracy'])
model.fit_generator(train_generator,
epochs=30,
validation_data=validation_generator,)
# Lưu mô hình
model.save('nhandang5monan.h5')
Epoch 1/30
8/8 [==============================] - 33s 4s/step - loss: 14.4343 -
Epoch 2/30
8/8 [==============================] - 31s 4s/step - loss: 2.0405 -
Epoch 3/30
8/8 [==============================] - 31s 4s/step - loss: 1.6108 -
Epoch 4/30
8/8 [==============================] - 33s 4s/step - loss: 1.6087 -
Epoch 5/30
8/8 [==============================] - 31s 4s/step - loss: 1.6041 -
Epoch 6/30
8/8 [==============================] - 31s 4s/step - loss: 1.6006 -
Epoch 7/30
8/8 [==============================] - 31s 4s/step - loss: 1.5686 -
Epoch 8/30
8/8 [==============================] - 31s 4s/step - loss: 1.4192 -
Epoch 9/30
8/8 [==============================] - 31s 4s/step - loss: 1.4639 -
Epoch 10/30
8/8 [==============================] - 31s 4s/step - loss: 1.3991 -
Epoch 11/30
8/8 [==============================] - 30s 4s/step - loss: 1.3630 -
Epoch 12/30
8/8 [==============================] - 31s 4s/step - loss: 1.3237 -
Epoch 13/30
8/8 [==============================] - 32s 4s/step - loss: 1.2530 -
Epoch 14/30
8/8 [==============================] - 34s 4s/step - loss: 1.2039 -
Epoch 15/30
8/8 [==============================] - 31s 4s/step - loss: 1.1679 -
Epoch 16/30
8/8 [==============================] - 31s 4s/step - loss: 1.2174 -
Epoch 17/30
8/8 [==============================] - 31s 4s/step - loss: 1.2085 -
Epoch 18/30
8/8 [==============================] - 31s 4s/step - loss: 1.1483 -
Epoch 19/30
8/8 [==============================] - 31s 4s/step - loss: 1.1854 -
Epoch 20/30
8/8 [==============================] - 31s 4s/step - loss: 1.1144 -
Epoch 21/30
8/8 [==============================] - 31s 4s/step - loss: 1.1417 -
Epoch 22/30
8/8 [==============================] - 31s 4s/step - loss: 1.0640 -
Epoch 23/30
8/8 [==============================] - 33s 4s/step - loss: 1.0879 -
Epoch 24/30
8/8 [==============================] - 31s 4s/step - loss: 1.0060 -
Epoch 25/30
8/8 [==============================] - 31s 4s/step - loss: 1.0074 -
Epoch 26/30
8/8 [==============================] - 32s 4s/step - loss: 0.9486 -
Epoch 27/30
8/8 [==============================] - 31s 4s/step - loss: 0.8312 -
Epoch 28/30
8/8 [==============================] - 31s 4s/step - loss: 1.0551 -
Epoch 29/30
8/8 [==============================] - 34s 4s/step - loss: 0.9473 -
Epoch 30/30
8/8 [==============================] - 31s 4s/step - loss: 0.8895 -
Kết quả test:
Tóm tắt:
(CNN) để phân loại 5 mệnh giá tiền Việt Nam: 5 nghìn đồng, 10 nghìn đồng, 50 nghìn
đồng, 100 nghìn đồng và 200 nghìn đồng. Mô hình được huấn luyện trên tập dữ liệu
gồm 10 ảnh mỗi loại, với các kỹ thuật tăng cường dữ liệu. Sau khi huấn luyện, mô
hình đạt độ chính xác khoảng 50% trên tập dữ liệu xác thực.
Mô hình: ( Tương tự như trên )
Huấn luyện:
Kết quả:
Kết luận:
Mô hình CNN được trình bày trong bài báo cáo này có thể phân loại 5 mệnh giá tiền
với độ chính xác khá thấp.
Phần code: ( Tương tự như trên )
Epoch 1/15
2/2 [==============================] - 14s 10s/step - loss: 29.2038 -
Epoch 2/15
2/2 [==============================] - 6s 3s/step - loss: 61.7114 -
Epoch 3/15
2/2 [==============================] - 5s 2s/step - loss: 38.3014 -
Epoch 4/15
2/2 [==============================] - 7s 2s/step - loss: 15.4688 -
Epoch 5/15
2/2 [==============================] - 5s 3s/step - loss: 2.8107 -
Epoch 6/15
2/2 [==============================] - 7s 4s/step - loss: 2.6029 -
Epoch 7/15
2/2 [==============================] - 5s 3s/step - loss: 1.7788 -
Epoch 8/15
2/2 [==============================] - 6s 2s/step - loss: 1.6080 -
Epoch 9/15
2/2 [==============================] - 7s 4s/step - loss: 1.5892 -
Epoch 10/15
2/2 [==============================] - 5s 2s/step - loss: 1.5854 -
Epoch 11/15
2/2 [==============================] - 7s 2s/step - loss: 1.5799 -
Epoch 12/15
2/2 [==============================] - 5s 3s/step - loss: 1.5540 -
Epoch 13/15
2/2 [==============================] - 7s 5s/step - loss: 1.5510 -
Epoch 14/15
2/2 [==============================] - 6s 2s/step - loss: 1.5350 -
Epoch 15/15
2/2 [==============================] - 5s 2s/step - loss: 1.5041 -
Kết quả test:

baocaomonAI

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

baocaomonAI

Uploaded by

Copyright:

Available Formats

BỘ GIÁO DỤC & ĐÀO TẠO

TRƯỜNG ĐẠI HỌC KINH TẾ TP.HCM

Giảng viên hướng dẫn: PGSTS - Nguyễn Trường Thịnh

TP.HCM, ngày 12 tháng 04 năm 2024

# Tăng cường dữ liệu

# Tạo trình tạo dữ liệu huấn luyện và xác thực

# Kiến trúc mạng được cải thiện

# Huấn luyện mô hình

# Tăng cường dữ liệu

# Tạo trình tạo dữ liệu huấn luyện và xác thực

# Kiến trúc mạng được cải thiện

# Huấn luyện mô hình

You might also like