Professional Documents
Culture Documents
(Lah) SD ebookseriesbylahPt2Plus VIE Dark - Edit - 2
(Lah) SD ebookseriesbylahPt2Plus VIE Dark - Edit - 2
(Lah) SD ebookseriesbylahPt2Plus VIE Dark - Edit - 2
Mọi hình thức ủng hộ vui lòng gửi về các địa chỉ dưới đây
2. Segmentation
•
3. Reference
•
4. Line-art
5. Scribble
• 6. Inpaint
• 7. Tile
Controlnet Plus
IP - Adapter & T2I Adapter
Controlnet - Plus
IP - Adapter & T2I Adapter
- Stable Diffusion e-book series by LaH -
Controlnet Plus
Tất nhiên IP - Adapter không thể thay thế hoàn toàn 1 LoRA, nó có sự cứng ngắc nhất định bởi vì nó chỉ giống như
LoRA được đào tạo từ 1 hình ảnh duy nhất. Ví dụ như với các model IP - Adapter về face thì biểu cảm rất tệ, dù có
thể sao chép 1 phần khuôn mặt nhưng trạng thái biểu cảm bị cứng do được sao chép từ ảnh gốc sang. Tuy thiếu
đi sự linh hoạt nhưng với những dự án đơn giản hoặc bạn không có thời gian đào tạo 1 LoRA thì IP - Adapter là 1
cứu cánh hữu hiệu, thậm chí còn tốt hơn so với những LoRA được đào tạo không tốt rất nhiều lần.
Cùng với IP - Adapter thì chúng ta có T2I Adapter, tuy nhiên thì mình sẽ không giải thích về cái này. Vì bản chất nó
không khác gì với các model controlnet khác, chỉ khác nhà sản xuất. Kiểu như với Model T2I Adapter Canny thì nó
vẫn là Canny, chỉ khác cái là do Tencent sản xuất. Tính năng thì vẫn thế, còn có gì vượt trội hơn hay không thì các
bạn có thể tự trải nghiệm và đánh giá.
Controlnet Plus
Segmentation
Controlnet
Segmentation
- Plus - Stable Diffusion e-book series by LaH -
Controlnet Plus
Có thể bạn sẽ thấy cái cụm từ này quen quen, chúng ta có thể bắt gặp ở 1 vài trang công nghệ nào đó, hoặc ở in-
paint anything trong SD, và có thể bạn cũng chủ động bỏ qua vì lười. Thực ra Segment được ứng dụng rất nhiều
trong lĩnh vực AI thời điểm hiện tại, mô hình ban đầu của Segment là Segment Anything Model (SAM) được phát
triển bởi Meta - 1 mô hình thị giác máy tính với sự kết hợp của cả 2 bài toán phân loại (classification) và phát hiện
(object detection) - 2 bài toán phổ biến nhất trong lĩnh vực thị giác máy tính.
Nếu bạn từng tiếp xúc với các phần mềm đồ họa như
photoshop, after effect... sẽ biết về kỹ thuật tạo mặt nạ
(masking). Về bản chất thì Segment sẽ tạo ra các lớp mặt
nạ phủ lên từng đối tượng, điều này giúp chúng ta phân
vùng hình ảnh đầu vào thành các khu vực khác nhau.
Nếu bạn muốn tìm hiểu sâu hơn và hàn lâm hơn về data-
set đào tạo segment có thể thử tìm kiếm ADE20K.
Controlnet
Segmentation
- Plus - Stable Diffusion e-book series by LaH -
Controlnet Plus
Với segmentation chúng ta có các module khác nhau, mỗi module sẽ có 1 cách tạo mask khác nhau tùy thuộc
mục đích sử dụng. Mỗi màu sắc sẽ đại diện cho 1 loại vật thể và điều này được quy định trong bảng màu ADE20k.
Nếu bạn muốn chỉnh sửa các đối tượng trong hình ảnh với edit của controlnet thì nhớ tra
lại bảng màu, bởi vì như đã nói ở slide trước: mỗi màu sắc đại diện cho 1 đối tượng và điều
này đã được quy định trước, không thể thay đổi.
Controlnet Plus
Reference
Controlnet
Reference
- Plus - Stable Diffusion e-book series by LaH -
Controlnet Plus
Vẫn công thức cũ, weight càng cao thì sức ảnh hưởng càng lớn, chúng ta sẽ nhận được output sát với input đưa
vào controlnet hơn.
Source
Kết quả sử dụng controlnet reference từ input là hình ảnh ở slide trước
Controlnet
Reference
- Plus - Stable Diffusion e-book series by LaH -
Controlnet Plus
Các module của Reference Controlnet
Đơn giản là chúng ta có input Cái này thì giống như chỉ lấy Cái này thì kết hợp của 2
là mẫu, và các sampler cố nhân vật, bối cảnh, và giữ lại dạng trước đó và tạo ra hình
gắng tạo ra output theo mẫu nét vẽ của checkpoint ảnh gần với input nhất
có sẵn.
Controlnet Plus
Lineart
Controlnet
Lineart
- Plus - Stable Diffusion e-book series by LaH -
Controlnet Plus
Lineart hay line-art, cơ bản thì nó hoạt động tương tự với canny. Nếu
bạn chưa biết canny hoạt động như thế nào thì có thể xem lại ebook
phần 2 của mình. Tuy nhiên thì Line art mềm hơn so với canny và
cũng bỏ qua nhiều chi tiết hơn canny.
Controlnet
Lineart
- Plus - Stable Diffusion e-book series by LaH -
Controlnet Plus
Với resize and fill khung hình của bạn sẽ được mở rộng, và mặc
dù chúng ta không tô vào bất cứ thứ gì để inpaint nhưng phần
được mở rộng sẽ tự động vẽ thêm các chi tiết cho phù hợp với
ảnh gốc. Ở đây chúng ta có 1 kỹ thuật gọi là Outpaint.
Công thức của tile là phân tích các chi tiết có trong hình ảnh đầu vào và nhân bản, xếp chồng những chi tiết
này để tạo ra 1 hình ảnh mới.
Ví dụ: như hình cô gái đang cầm một bông hoa, AI dựa theo bông hoa đó gen lại ảnh cô gái đứng trong một
cánh đồng hoa từ cái hoa cô gái đó cầm; thêm dàn bong bóng bay đầy trời vào ảnh đứa trẻ cầm bong bóng;
thêm nhiều đom đóm vào ảnh chụp trên ngọn đồi, vẽ lại cây cối cho mọc ra trái hay trổ hoa
1 phương án khác để sử dụng tile là upscale chúng ta có 1 hình ảnh với độ phân giải kém mà muốn phóng
to thì dựa vào đặc tính của tile là nhân bản và xếp chồng, nó sẽ tăng số lượng chi tiết trong ảnh gốc để tạo
ra 1 hình ảnh kích thước lớn hơn và có nhiều chi tiết hơn. Nhưng mà tất nhiên nó sẽ theo dữ liệu của model
chứ nếu thực sự phóng to được nguyên bản thì mấy công ty máy ảnh sập tiệm hết.
Controlnet
Tile
- Plus - Stable Diffusion e-book series by LaH -
Controlnet Plus