Rodrigues 2020

Machine Translated by Google
Hệ thống hóa học và phòng thí nghiệm thông minh 206 (2020) 104168
Danh sách nội dung có sẵn tại ScienceDirect
Hệ thống hóa học và phòng thí nghiệm thông minh
trang chủ tạp chí: www.elsevier.com/locate/chemometrics
Khám phá các phương pháp hồi quy tuyến tính đa biến để dự đoán tổng
hàm lượng phenolic trong bia lager tiêu chuẩn của Mỹ bằng phương pháp đồng bộ
dữ liệu hợp nhất quang phổ huỳnh quang
, Camila S. da Silva ,
Một Một Một Một
,
Alexander de P. Rodrigues Jefferson S. de Gois b , Bến du thuyền AJL Costa
Một,*
Vinicius L. Xavier Aderval
, S. Luna
Một
~
Đại học bang Rio de Janeiro, Chương trình sau đại học Kỹ thuật hóa học, Rua Sao Francisco Xavier, 524, Maracan a~ – Rio de Janeiro, RJ, 20550-013, Brazil b
~
Đại học Bang Rio de Janeiro, Viện Toán học và Thống kê, Rua Sao Francisco Xavier, 524, Maracan a~ – Rio de Janeiro, RJ, 20550-013, Brazil
THÔNG TIN BÀI VIẾT TRỪU TƯỢNG
Từ khóa: Công việc này nhằm mục đích khám phá các phương pháp hóa học để xác định hàm lượng phenolic tổng số theo tiêu chuẩn Brazil
Bia Bia lager của Mỹ sử dụng dữ liệu hợp nhất quang phổ huỳnh quang đồng bộ. Hai trăm mười sáu (216)
Tổng hàm lượng phenolic mẫu bia được pha loãng theo tỷ lệ 1:5 (v/v), siêu âm trong 15 phút trong nồi cách thủy và đệm bằng dung dịch acetic.
Quang phổ huỳnh quang đồng bộ
đệm axit/axetat có pH 4,5. Phổ huỳnh quang đồng bộ thu được từ 200 đến 600 nm với
Mô hình hồi quy đa biến
độ phân giải 1nm Tuy nhiên, các độ lệch khác nhau đã được thử nghiệm cho huỳnh quang đồng bộ (Δλ = 20, 50 và 80). Tất cả
các phép đo được thực hiện ba lần và phương pháp Folin-Ciocalteu được sử dụng làm phương pháp tham chiếu cho
tổng hàm lượng phenolic. Tất cả các phương pháp hóa học được khám phá bằng phần mềm R và giao diện đồ họa của nó,
RStudio. Đầu tiên, dữ liệu quang phổ với các độ lệch khác nhau được chuẩn hóa và hợp nhất. Sau đó, dữ liệu hợp nhất được
được làm mịn bằng thuật toán Savitzky-Golay với cửa sổ có độ dài 11 và đa thức bậc hai, theo sau là
dữ liệu có nghĩa là tập trung. Phân tích thành phần chính mạnh mẽ (ROBPCA) đã được sử dụng để xác định dữ liệu bất thường. Các
Thuật toán Kennard-Stone được sử dụng để chia tập dữ liệu thành 75% cho tập huấn luyện và 25% cho tập kiểm tra. Các
các mô hình dự đoán được sử dụng là bình phương nhỏ nhất từng phần (PLS), bình phương nhỏ nhất từng phần trực giao (O-PLS) và mạng đàn hồi
hồi quy với xác nhận chéo (CV). Tập hợp PLS và tập hợp PLS thưa thớt với việc lấy mẫu lại bootstrap là
cũng được dùng. Các phương pháp hồi quy PLS khác dựa trên việc lựa chọn các biến đã được thử nghiệm, chẳng hạn như mức ý nghĩa
hồi quy đa biến (sMC – PLS), loại bỏ biến không chính xác (UVE – PLS) và khoảng PLS (iPLS)
các mô hình toàn cầu và được tối ưu hóa với xác nhận chéo. Tất cả các mô hình hồi quy đều được xây dựng bằng tập huấn luyện. Các
việc xác nhận được thực hiện bằng cách áp dụng các mô hình hồi quy cho tập kiểm tra. Trong bối cảnh này, hai
hồi quy đa biến đã được làm nổi bật, mạng đàn hồi CV và các mô hình được tối ưu hóa iPLS, với giá trị trung bình gốc
sai số dự đoán bình phương (RMSEP) bằng 1,0 và 1,1 mg GAE L1 , tương ứng.
1. Giới thiệu các hợp chất có nguồn gốc từ mạch nha lúa mạch, hoa bia và các loại ngũ cốc bổ sung. Một số
các bài báo đã liên kết việc tiêu thụ polyphenol với việc ngăn ngừa các bệnh tim
Bia là loại đồ uống thu được bằng quá trình lên men rượu của mạch nha mạch, ung thư và các bệnh khác liên quan đến
dịch nha ngũ cốc với việc bổ sung một nguồn carbohydrate khác, chẳng hạn như lão hóa, chủ yếu là do đặc tính chống oxy hóa của chúng. Vì vậy, việc xác định các
ngô, gạo hoặc lúa mì [1,2]. Bia có thể mang lại lợi ích cho sức khỏe người lớn hợp chất phenolic là rất thú vị và phù hợp.
tiêu dùng vừa phải. Tuy nhiên, việc lạm dụng sử dụng nó có thể gây bất lợi [2,5,6].
[3,4]. Việc xác định phenol có thể được thực hiện bằng cách sử dụng màu xanh Phổ
Các hợp chất phenolic có ý nghĩa quan trọng trong thực phẩm và đồ uống có nguồn gốc từ [7,8] và phương pháp Folin-Ciocalteu [9]. Phương pháp Folin-Ciocalteu là
từ thực vật và chúng chịu trách nhiệm về các đặc tính vật lý và giác quan độc đáo ổn định hơn và có thể tái sản xuất hơn so với việc áp dụng màu xanh Phổ và
các đặc tính như mùi, vị, màu sắc. Trong bia, phenolic do đó phương pháp được sử dụng nhiều nhất để xác định tổng hàm lượng phenolic
* Đồng tác giả. Đại học Bang, Chương trình sau đại học về Kỹ thuật Hóa học, Rua S~ao Francisco Xavier, 524, Maracan~a – Rio de Janeiro, RJ, 20550-013,
Brazil.
Địa chỉ email: asluna@uerj.br (NHƯ Luna).
https://doi.org/10.1016/j.chemolab.2020.104168
Nhận được ngày 5 tháng 6 năm 2020; Nhận ở dạng sửa đổi ngày 31 tháng 8 năm 2020; Được chấp nhận ngày 18 tháng 9 năm 2020
Có sẵn trực tuyến vào ngày 22 tháng 9 năm 2020
0169-7439/© 2020 Elsevier BV Mọi quyền được bảo lưu.

AP Rodrigues và cộng sự. Hệ thống hóa học và phòng thí nghiệm thông minh 206 (2020) 104168
ffiffiffiffiffiffiffiffiffiffiffiffi ffiffiffiffiffiffiffiffiffiffiffiffi
trong thực phẩm và đồ uống. Do đó, đây là phương pháp phân tích chính thức của
χ2 χ2
k;0:975 q khi k > 1 và 1;0:975 q khi k ¼ 1 (vì bình phương
Hiệp hội các nhà hóa học phân tích chính thức (AOAC) [10].
Khoảng cách Mahalanobis của điểm số được phân phối bình thường có phân bố xấp xỉ χ2 ,
Mặc dù là phương pháp tiêu chuẩn nhưng kỹ thuật Folin-Ciocalteu có một số
trong đó k k
là số thành phần). Giá trị ngưỡng trên trục tung khó xác định hơn vì
nhược điểm như năng suất mẫu thấp (do cần thực hiện một số bước phản ứng) và
đòi hỏi thuốc thử và tiêu chuẩn cụ thể để phân tích. Theo nghĩa này, việc áp dụng
các phương pháp xác định trực tiếp thân thiện với môi trường, chi phí thấp và sự phân bố khoảng cách trực giao không được biết chính xác. Trong trường hợp
cho năng suất mẫu cao đặc biệt thú vị trong hóa học phân tích. này, giá trị ngưỡng sử dụng phép tính gần đúng Wilson–Hilferty cho phân bố chi
bình phương. Do đó, giá trị ngưỡng trên trục tung 3=2 với z0:975 ¼ φ1ð0:975Þ
Kỹ thuật quang phổ có thể tạo ra dữ liệu chứa lượng lớn thông tin liên quan, bố Gaussian [18]. là 97,5% thì bằng ðbμ þ bσz0:975Þ lượng tử của phân
có thể được khám phá một cách thuận lợi thông qua việc sử dụng các phương pháp
hóa học. Các hợp chất phenolic hấp thụ bức xạ và phát huỳnh quang do sự hiện
diện của fluorophores thường có một số nhóm tuần hoàn, phẳng hoặc thơm kết hợp 2.3. Phương pháp hiệu chuẩn đa biến
với một số liên kết π [11]. Kết quả là việc sử dụng phương pháp quang phổ huỳnh
quang đồng bộ có thể là một công cụ mạnh mẽ để xác định phenolic. Kỹ thuật phân Các phương pháp hồi quy tuyến tính đa biến đã được sử dụng để dự đoán nồng
tích này không phá hủy và có khả năng dự đoán tổng hàm lượng phenolic khi áp độ các thành phần phenolic trong bia bao gồm: bình phương nhỏ nhất một phần
dụng với các phương pháp đo hóa học, đáp ứng các ưu điểm là kỹ thuật thân thiện (PLS), PLS trực giao, PLS với lựa chọn thay đổi, lưới đàn hồi, PLS tập hợp (enPLS)
với môi trường, cho năng suất mẫu cao và chi phí tương đối thấp. và PLS thưa thớt tập thể (enSPLS) [19–24].
Việc ước tính nồng độ của các hợp chất phenolic bằng quang phổ thu được trong 2.3.1. Lựa chọn biến
kỹ thuật này có thể được thực hiện bằng phương pháp hồi quy tuyến tính đa biến. Lựa chọn biến có thể là một kỹ thuật đáng tin cậy để tạo ra các mô hình
Những phương pháp này đã được áp dụng để dự đoán sự pha trộn của dầu ô liu mạnh mẽ và dễ diễn giải vì việc lựa chọn các biến quan trọng cụ thể có thể làm
nguyên chất với dầu hướng dương, sự dư thừa chất đối quang trong các dẫn xuất giảm sai sót của mô hình đa biến. Trong bài báo này, các phương pháp sau đã
amin có khả năng tự lắp ráp phân tử và nồng độ glucose dưới da ở bệnh tiểu đường được áp dụng: tương quan đa biến có ý nghĩa (sMC - PLS), bình phương nhỏ
loại 1 [12–14]. nhất từng phần (iPLS) và loại bỏ biến không chính xác (UVE-PLS). Thông tin chi
tiết hơn về các phương pháp lựa chọn biến này có thể được tìm thấy trong
Do đó, công việc này nhằm mục đích khám phá các mô hình dự đoán về tổng hàm tài liệu [25,26].
lượng phenolic trong các loại bia lager tiêu chuẩn của Brazil bằng cách sử dụng
dữ liệu hợp nhất của phép đo quang phổ huỳnh quang đồng thời kết hợp với mô hình 2.4. Kỹ thuật xác nhận đa biến
hồi quy tuyến tính đa biến.
Xác thực mô hình là một quá trình được áp dụng để xác minh xem các giá trị
2. Cơ sở lý luận do mô hình tạo ra có phù hợp với các giá trị thực hay không. Trước đây, tập dữ
liệu được chia thành tập huấn luyện và tập kiểm tra; trên bộ thử nghiệm, hai
2.1. Sơ chế phương pháp xác thực đã được áp dụng, xác thực chéo và lấy mẫu lại bootstrap.
Xác thực chéo là phương pháp phân tích các mô hình dự đoán bằng cách chia
Mục tiêu của quá trình tiền xử lý quang phổ là giảm các biến đổi hệ thống ngẫu nhiên dữ liệu gốc thành k nhóm nhỏ có cùng kích thước, lấy một trong các
không được giải thích bằng nồng độ của chất phân tích. Chúng không bị loại bỏ mẫu con này làm tập hợp con xác thực. Đồng thời, phần dữ liệu còn lại được sử
một cách tự nhiên trong quá trình phân tích và có thể gây ra những ảnh hưởng bất dụng để tạo mô hình. Quá trình này được lặp lại k lần với mỗi k mẫu con. Các kết
lợi đến kết quả. Do đó, tiền xử lý dữ liệu giúp giảm độ phức tạp của mô hình, cải quả được tính trung bình hoặc kết hợp để tạo ra một ước tính duy nhất [27,28].
thiện khả năng giải thích với độ tin cậy và độ tin cậy cao [15–17].
Bootstrapping là một phương pháp thống kê được phát triển bởi Efron [29] để
có được ước tính chính xác đúng lúc. Hơn nữa, việc sử dụng nó đã được mở rộng
2.2. Phân tích thành phần chính mạnh mẽ để kiểm tra giả thuyết, tính toán khoảng tin cậy cũng như lựa chọn và xác nhận
các mô hình dự đoán cũng như các chủ đề thống kê khác.
Phân tích thành phần chính mạnh mẽ (ROBPCA) là một phương pháp học không Mẫu bootstrap thường có nghĩa là một mẫu ngẫu nhiên được lấy ra để thay thế từ
giám sát được sử dụng để chiếu dữ liệu đa biến lên một chiều không gian nhỏ hơn, mẫu đó. Mẫu bootstrap này bao gồm cùng số lượng mẫu (n) như trong mẫu ban đầu,
giảm tính chiều của nó mà không ảnh hưởng đến mối quan hệ giữa các mẫu. Do đó, nhưng một số mẫu bị loại trừ, trong khi những mẫu khác có thể được đưa vào
các thông tin liên quan được tách biệt và khuếch đại, trở nên rõ ràng hơn khi nhiều lần. Mô hình được phát triển trong mẫu bootstrap và được xác thực trong
kiểm tra trực quan. mẫu ban đầu và sự khác biệt cho thấy mức độ tin cậy về hiệu suất của mô hình.
Phương pháp này cho phép khám phá, trực quan hóa và giải thích sự khác biệt giữa Quy trình này hiệu quả vì n mẫu được sử dụng để điều chỉnh mô hình và n mẫu để
các biến và mối quan hệ giữa các mẫu. xác nhận [27]. Số lượng mô hình cần xây dựng bằng cách lấy mẫu lại bootstrap
ROBPCA cũng cho phép phát hiện các mẫu có hành vi bất thường, được gọi là các được duy trì bằng 100.
ngoại lệ [15]. ROBPCA sử dụng công cụ ước tính hiệp phương sai mạnh mẽ và kỹ
thuật theo đuổi phép chiếu nhằm tối đa hóa thước đo mức độ lan truyền mạnh mẽ
nhằm đạt được các hướng liên tiếp mà các điểm dữ liệu được chiếu trên đó [18]. 2.5. Những con số xứng đáng
ROBPCA được sử dụng để phát hiện các ngoại lệ cho đến khi áp dụng mô hình Sai số bình phương trung bình gốc của dự đoán (RMSEP) được sử dụng để
thứ hai, theo tiêu chuẩn ASTM E1655 [19]. Mô hình ROBPCA được xây dựng bằng cách đánh giá khả năng bên ngoài của mô hình bằng cách so sánh các giá trị quan sát
sử dụng bộ dữ liệu huỳnh quang và mô hình này cho thấy sự hiện diện của các ngoại lệ. được (yi) và dự đoán mô hình (byi ). Đơn vị của nó bằng đơn vị của các biến
Các mẫu được phân loại là ngoại lệ khỏi tập dữ liệu huỳnh quang đã bị loại bỏ, trả lời [30–32].
cũng như mẫu tương ứng của vectơ nồng độ.
Là sản phẩm phụ, ROBPCA tạo ra một sơ đồ chẩn đoán hiển thị và phân loại Kế tiếp 2
i¼1ðbyi yiÞ
RMSEP ¼
Pffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
các giá trị ngoại lệ. Biểu đồ chẩn đoán thường trình bày khoảng cách điểm (1)
giây tiếp theo
mạnh (SD) trên trục ngang của mỗi quan sát và khoảng cách trực giao (ODi) trên
trục tung. Hai đường cắt được vẽ để phân loại các quan sát. Giá trị ngưỡng Q2 F3 là biểu thức tương tự R2 (hệ số xác định) và thể hiện khả năng dự
trên trục ngang là đoán bên ngoài. Nó dựa trên
2
chênh lệch giữa TSS trung bình và PRESS trung bình của tập kiểm tra chia cho TSS trung bình Sau đó, dung dịch được đưa vào nồi cách thủy ở nhiệt độ 40 C trong 30 phút. Dung
của tập huấn luyện [33], trong đó next và ntr tương ứng là số lượng mẫu trong tập kiểm dịch trắng cũng như dung dịch mẫu được chuẩn bị đồng thời như mô tả ở trên.
tra và tập huấn luyện.
ðbyiyiÞ 2 ½
3.4. Quy trình xử lý hóa học
Pnext tôi¼1
NHẤN=tiếp theo
Kế tiếp
Q2 F3 ¼ 1 2 ¼ 1 (2)
½ Pntr ðyiytrÞ
tôi¼1
TSS=ntr Tất cả các phổ được sắp xếp theo bốn bộ dữ liệu sau: a) Bộ dữ liệu huỳnh quang
ntr
đồng bộ bù 20nm (SF 20), b) Bộ dữ liệu huỳnh quang đồng bộ bù 50nm (SF 50), c) Bộ
Sai số chuẩn tương đối của dự đoán (RSEP, %) là tham số thống kê để đánh giá dữ liệu huỳnh quang đồng bộ bù 80nm (SF 80) và d) hợp nhất huỳnh quang đồng bộ
hiệu quả dự đoán của bộ kiểm tra [31,32] và được biểu thị bằng phương trình
tập dữ liệu.
Trước khi tạo tập dữ liệu hợp nhất, tất cả các tập dữ liệu có độ lệch khác
N 2
nhau đã được chuẩn hóa và quang phổ hợp nhất huỳnh quang được hiển thị trong Hình 1.
X 100
Pffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi i¼1ðyi byiÞ
RSEP; % ¼ 2 (3)
Một số mẫu bia thu được bằng cách lên men các loại ngũ cốc khác nhau và do
S Pn i¼1ðyiÞ
đó tạo ra quang phổ huỳnh quang khác nhau. Tuy nhiên, ngay cả khi sử dụng phương
Một tài liệu IUPAC định nghĩa độ lệch là thước đo độ chính xác được biểu thị pháp quang phổ huỳnh quang đồng bộ, mang lại lợi ích khi sử dụng các độ lệch khác
bằng chênh lệch giữa giá trị trung bình tổng thể và giá trị thực, chú ý đến dấu nhau khi so sánh với quang phổ huỳnh quang cổ điển, vẫn không thể quan sát thấy sự
hiệu [34]. Do đó, độ lệch có thể được biểu thị bằng phương trình cải thiện trong phổ phát xạ, ít nhất là trong ba độ lệch đã chọn.
Trong công việc này, chỉ các kết quả thu được từ mô hình hồi quy tuyến tính đa biến
1
được trình bày khi sử dụng tập dữ liệu hợp nhất. So sánh, các kết quả thu được bằng
Xu hướng ¼ tiếp theo
tạm biệt (4)
tiếp theo
tôi¼1 cách sử dụng các phương pháp hồi quy tương tự cho các tập dữ liệu có độ lệch duy nhất
cho kết quả không đạt yêu cầu. Phần mềm R [37] và giao diện đồ họa của nó, RStudio [38],
Sai số tuyệt đối trung bình của dự đoán (MAE) là thước đo của
đã được sử dụng trong công việc này. Bảng 1 cho thấy tất cả các gói được sử dụng trong
khả năng dự đoán [35] và được biểu thị bằng phương trình
công việc này và chức năng của chúng.
1
MAE ¼ tiếp tiếp theo
tạm biệt (5) Dữ liệu phổ hợp nhất được làm mịn bằng thuật toán Savitzky-Golay với cửa sổ
theo tôi¼1
11 điểm và đa thức bậc hai, sau đó là định tâm trung bình dữ liệu. ROBPCA đã được
sử dụng để xác định các ngoại lệ có thể xảy ra. Các mô hình dự đoán được sử dụng
3. Vật liệu và phương pháp
là PLS, PLS trực giao, lưới đàn hồi, PLS tổng hợp, PLS thưa thớt tổng hợp và PLS
dựa trên việc lựa chọn các mô hình hồi quy biến đổi. Việc xác thực mô hình được
3.1. Chuẩn bị mẫu
thực hiện dựa trên hai phương pháp xác thực nội bộ sau đây cho tất cả các mô
hình: xác thực chéo và khởi động.

Hai trăm mười sáu mẫu bia thông thường từ các lô khác nhau và ba nhãn hiệu khác
nhau của cùng một nhà sản xuất được lấy từ
F3, RMSEP, RSEP (%), độ lệch và MAE được trích
Những con số khen thưởng, Q2
thị trường địa phương ở Rio de Janeiro, Brazil. Trong các loại bia đó, một phần
xuất và so sánh, đồng thời các mô hình tốt nhất được chọn với chỉ số cao hơn
mạch nha lúa mạch có thể được thay thế bằng các chất hỗ trợ ủ bia, chẳng hạn như
Q2F3 và RSMEP thấp hơn.
gạo và ngô, việc sử dụng chúng không được vượt quá 45% (w/w) chiết xuất ban đầu
và nồng độ cồn theo thể tích thay đổi từ 4,5 đến 5,0% v/ v [36]. Mẫu được bảo
4. Kết quả và thảo luận
quản trong tủ đông ở nhiệt độ 10 C để ngăn chặn sự phát triển của vi sinh vật hoặc
phân hủy. Các mẫu được đưa đi khử khí trong bể siêu âm (100 W ở tần số 50 Hz –
4.1. Hàm lượng phenolic tổng số theo phương pháp Folin-Ciocalteu
Nova Instruments, Brazil) trong 15 phút, pha loãng thành 1:5 (% v/v) trong nước
siêu tinh khiết và được đệm bằng acetic. đệm axit/axetat có độ pH 4,5 trước khi
Hàm lượng phenolic được xác định bằng phương pháp Folin-Ciocalteu dao động
đo.
từ 23,8 đến 68,6 mg GAE L1 trong bia pha loãng 20% (v/v), nghĩa là trong các mẫu
bia không pha loãng, nồng độ tổng hợp chất phenolic dao động từ 119,0 đến 343,0
3.2. Đo huỳnh quang đồng bộ
mg GAE L1 với
Tất cả các quang phổ thu được bằng máy đo quang phổ Lumex (FLUO-RAT-02-
PANORAMA, Nga) trong khoảng bước sóng từ 200 đến 600nm với độ phân giải 1 nm và
tốc độ quét xấp xỉ 1 nm . Dải quang phổ được thu hẹp và thu được các đỉnh sắc
1
S nét hơn bằng cách áp dụng độ lệch bước sóng tối ưu (Δλ) giữa kích thích và
phát xạ bằng kỹ thuật này. Phổ cường độ huỳnh quang đồng bộ được đo với độ lệch
bước sóng (Δλ) là 20, 50 và 80
nm.
3.3. Xác định hàm lượng phenolic tổng số
Tổng hàm lượng phenolic được xác định bằng xét nghiệm Folin-Ciocalteu sử dụng
máy quang phổ UV-Vis ở bước sóng 765 nm (Agilent Technologies CARY 60, USA) [9].
Axit gallic được sử dụng làm dung dịch chuẩn có nồng độ tương đương từ 5 đến
70 mg axit gallic (GAE) L1 trong đường cong hiệu chuẩn phân tích. Đầu tiên, 200
μL dung dịch chuẩn được thêm vào ống nghiệm, tiếp theo là 1400 μL nước siêu tinh
khiết. Sau đó, 100 μL thuốc thử Folin-Ciocalteu được thêm vào và khuấy trong xoáy
trong 30 giây; sau đó thêm 300 µL dung dịch Na2CO3 vào và khuấy lại. Các Hình 1. Phổ huỳnh quang của tập dữ liệu hợp nhất (Δλ = 20, 50 và 80 nm tương
ứng).
3
Bảng 1 ban 2
gói R. Phần trăm phương sai được mô hình ROBPCA ghi lại.
Gói Chức năng Thẩm quyền giải quyết máy tính

Giá trị riêng của % phương sai được nắm bắt bởi % phương sai được ghi lại
Con số Cov(X) chiếc máy tính này tổng cộng

Readxl Nhập tệp Ms Excel [39]
Người thăm dò Thuật toán Kennard-Stone [40] 1 0,502 70,21 70,21
Làm mịn Savitzky-Golay 2 0,213 29,79 100,00
Mdatools Định tâm trung bình [40]

Các mô hình PLS có xác thực chéo
Lựa chọn biến với khoảng PLS
xin vui lòngVarSel Mối tương quan đa biến có ý nghĩa đối với việc lựa chọn biến [25]
Loại bỏ biến không chính xác để lựa chọn biến
xin vui lòng

Hòa tấu PLS [41]
Tập hợp PLS thưa thớt

Rrcov PCA mạnh mẽ [42]
mvdalab Mô hình PLS với bootstrap [43]
doParallel Tính toán song song [44]
glmnet Lưới đàn hồi [45]
RMSE là 0,5 mg GAE L1 , và RSEP bằng 0,22%. Những nồng độ này chứng tỏ sự
hiện diện của hàm lượng phenolic tương đối cao trong
các mẫu, có thể được so sánh với đồ uống như rượu vang và
nước ép lựu và là nguồn cung cấp phenol cho chế độ ăn uống của con người [46,
47]. Các hợp chất phenolic được tìm thấy có thể có nguồn gốc từ hoa bia,
mạch nha lúa mạch và các loại ngũ cốc khác dùng để sản xuất bia [1–4,48,49].
4.2. Quang phổ huỳnh quang của bia Hình 2. Điểm PC1 so với PC2 cho thấy không có mẫu nào trong tập dữ liệu sử dụng ba
nhãn hiệu sản xuất khác nhau.
Phổ huỳnh quang của các mẫu bia bao gồm các amino
axit, vitamin B và các hợp chất phenolic. Đỉnh đầu tiên chủ yếu là khả năng tối đa (glmnet) và mô hình tuyến tính tổng quát (glm),
liên quan đến axit amin, một số hợp chất phenolic và một số loài đề cập đến một loại mô hình lớn hơn được phổ biến rộng rãi bởi McCullagh và
vitamin B (từ 250 đến 310 nm). Các đỉnh khác (từ 310 đến Nelder [50], đã được thử nghiệm bằng cách sử dụng bộ dữ liệu huỳnh quang hợp nhất. Kết quả
520 nm) chủ yếu liên quan đến phenol và một số vitamin nhóm B khác. thu được cho RMSEP thay đổi từ 22,6 đến 52,7 mg GAE L1 , mà là một
phức tạp [3], như trong Hình 1. Tuy nhiên, trong nghiên cứu này, chỉ có phenolic dấu hiệu rõ ràng về sự không phù hợp của loại phương pháp hồi quy đa biến này
nội dung đã được khám phá. đối với tập dữ liệu này. Vì vậy, chỉ có kết quả thu được với
hồi quy tuyến tính đa biến sẽ được hiển thị.
4.3. Phát hiện ngoại lệ bằng ROBPCA Bảng 3 cho thấy tất cả các mô hình hồi quy tuyến tính đa biến được thử nghiệm với
tập dữ liệu hợp nhất hiển thị số liệu về thành tích, RMSEP, xác nhận
phương pháp và số lượng các biến tiềm ẩn. Số lượng các biến tiềm ẩn được xác
ROBPCA đã được áp dụng để phát hiện các ngoại lệ. Trong PCA cổ điển, lần đầu tiên
thành phần có liên quan đến hướng trong đó các quan sát dự kiến định bởi RMSE thấp nhất để xác thực chéo và
xác thực bootstrap.

có sự khác biệt đáng kể nhất. Trực giao với thành phần đầu tiên,
thành phần thứ hai một lần nữa tối đa hóa phương sai của những dự kiến Một loạt các mô hình dựa trên PLS, chẳng hạn như PLS xác thực chéo, PLS trực
quan sát. Cả phương sai cổ điển và ma trận hiệp phương sai cổ điển giao (OPLS), tập hợp bootstrap PLS (enPLS), tập hợp bootstrap
rất nhạy cảm với những quan sát bất thường, và do đó, các mô hình PLS thưa thớt (enSPLS) và PLS dựa trên các biến được chọn như
việc giảm kích thước dựa trên PCA cổ điển trở nên không đáng tin cậy mối tương quan đa biến có ý nghĩa (sMC-PLS) và sự loại trừ có thể thay đổi không
khi các ngoại lệ tồn tại trong tập dữ liệu [18]. xác định (UVE-PLS) cho thấy giá trị cao của RMSEP (> 20 mg GAE
Sử dụng ROBPCA, các giá trị riêng xác định số lượng tiền gốc L1 ). Kết quả không đạt yêu cầu và đôi khi tương tự với kết quả
các thành phần. Về bộ dữ liệu hợp nhất huỳnh quang đồng bộ, của các phương pháp khác đã được thử nghiệm trước đó. Tuy nhiên, khi xác thực chéo
phương pháp mạng đàn hồi và PLS khoảng đã được sử dụng, RMSEP đã được cải thiện đáng kể
số thành phần chính (PC) là hai, có nghĩa là những thành phần này
giảm xuống 1,5 mg GAE L1 , có thể được coi là phù hợp cho
PC giải thích 100% sự khác biệt của dữ liệu. Các giá trị riêng đo lường
lượng biến thể được giữ lại bởi mỗi thành phần chính. Vì thế,
PC đầu tiên tương ứng với hướng có số lượng tối đa
sự biến đổi trong tập dữ liệu. PC thứ hai trực giao với PC thứ nhất và
nắm bắt phương sai còn lại. Trong ví dụ này, hai hiệu trưởng đầu tiên
các thành phần giải thích 100% biến thể (Bảng 2).
Tuy nhiên, không thể xác định được mẫu trong tập dữ liệu, như đã thấy
trong Hình 2, và hình này chỉ ra rằng một số mẫu có thể
được coi là ngoại lệ. Dựa trên điều này, cần thiết phải xây dựng một ngoại lệ
bản đồ để xác định những ngoại lệ có thể. Sau khi loại bỏ các giá trị ngoại lệ,
mô hình ROBPCA thứ hai đã được xây dựng và bản đồ chỉ ra một ngoại lệ, như
thấy trong Hình 3 (mẫu 72).
4.4. Lập mô hình sử dụng hồi quy đa biến tuyến tính
Ban đầu, các phương pháp hồi quy phi tuyến tính như tăng cường độ dốc
mô hình (GBM), rừng ngẫu nhiên (RF), treebag, phân loại và hồi quy
cây (CART), k-hàng xóm gần nhất (k-NN), máy vectơ hỗ trợ (SVM) Hình 3. ROBPCA cho thấy sự hiện diện của một ngoại lệ, được xác định là mẫu 72,
với hàm cơ sở xuyên tâm, mô hình tuyến tính tổng quát thông qua hình phạt đã bị xóa khỏi tập dữ liệu.
4
bàn số 3
Số liệu xứng đáng liên quan đến bước xác thực liên quan đến đồng bộ
Phổ huỳnh quang hợp nhất dữ liệu bằng thuật toán Kennard-Stone để phân chia
tập dữ liệu (75% cho tập huấn luyện và 25% cho tập kiểm tra).
Mô hình hồi quy Những con số xứng đáng
RMSEP Q2 Độ lệch RSEP MAE

F3
CV PLS, 1 LV 24,5 0,5058 0,66 1,5 20,0
PLS trực giao, 3 LV 24,6 0,5007 0,67 1,5 19.9
Bộ đồng phục Bootstrap PLS 23,0 0,5628 0,68 1,5 19,4
Bộ đồng phục Bootstrap PLS thưa thớt 23.1 0,5604 0,86 1.9 19,5
Mô hình hồi quy với việc lựa chọn các biến

sMC – PLS, 3 LV 20.8 0,6449 0,28 0,6 17.1
UVE – PLS, 1 LV 34,5 0,0197 0,88 2.0 25.1

CV Elastic Net 1.0 0,5699 0,45 1.0 18.0
iPLS Global Model, 1 LV 1,5 0,5058 0,66 1,5 20,0
iPLS Optimized Model, 4 LV 1.1 0,6515 0,50 1.1 17.2
Quan sát. Tương quan đa biến có ý nghĩa sMC; Loại bỏ biến thể không chính xác của UVE;
Xác thực chéo CV; Bình phương tối thiểu một phần khoảng thời gian iPLS.
Hình 4. Thu được sai số bình phương trung bình gốc của biểu đồ xác thực chéo (RMSECV)
từ iPLS. Thanh dọc là RMSECV cho từng model cục bộ. Hình trong
Mục đích này.
Lý do bị chỉ trích là số lượng nhỏ các biến tiềm ẩn trong mỗi thanh là số lượng biến tiềm ẩn tối ưu cho từng mô hình cục bộ.
Các mẫu PLS, ít nhất là trong ba mẫu PLS. Kết quả cho những PLS này
phân tích thành phần có khả năng phát hiện và loại bỏ các mẫu bất thường, chuẩn
các mô hình thu được chỉ với một biến tiềm ẩn duy nhất. Khi mà
bị dữ liệu cho mô hình hồi quy.
số biến tiềm ẩn tăng lên, kết quả trở nên tồi tệ hơn khi sử dụng
Cuối cùng, bằng cách phân tích kết quả, phương pháp được phát triển dựa trên
các tiêu chí khác nhau để chọn số lượng biến tiềm ẩn. Vì thế,
về hồi quy tuyến tính đa biến có thể dự đoán tổng hàm lượng phenolic
các kết quả được trình bày phản ánh những kết quả thu được tốt nhất bởi các PLS khác nhau
phương pháp. hàm lượng trong mẫu bia. Trong bối cảnh này, hai hồi quy đa biến
các mô hình được làm nổi bật, mô hình lưới đàn hồi CV và mô hình được tối ưu hóa iPLS,
Người ta biết rằng mô hình hồi quy PLS kết hợp thông tin từ các biến đo lường
không có nhiều thông tin, và do đó, điều cần thiết là phải với RMSEP bằng 1,0 và 1,1 mg GAE L1 , tương ứng. Cả hai phương pháp
cung cấp sai số chuẩn tương đối của dự đoán cao hơn một chút so với
chọn các biến trước khi thực hiện hồi quy PLS. Lưới đàn hồi
phương pháp tham khảo, như mong đợi. Tuy nhiên, kết quả ít hơn hoặc
hồi quy có thể được sử dụng để thực hiện lựa chọn biến một cách tự động
bằng 0,5% khi dự đoán tổng hàm lượng phenolic trong các loại bia nhẹ tiêu chuẩn
bởi vì mô hình hồi quy phạt các hệ số của nó với L1 và L2
của Mỹ ở Brazil và chúng có cùng mức độ sai số
hình phạt. Hậu quả của việc này là việc giảm hiệu quả các hệ số (chẳng hạn như
làm phương pháp tham khảo. Ưu điểm của phương pháp đề xuất dựa vào
trong LASSO và hồi quy sườn) để một số hệ số giả định giá trị bằng 0 [51].
tính đơn giản, chi phí thấp và khái niệm hóa học phân tích xanh.
Ngoài ra, dự kiến rằng phương pháp tiếp cận phương pháp được trình bày
Về phương pháp được sử dụng khác để chọn các biến, chẳng hạn như
có thể hữu ích trong các ứng dụng hóa học khác.
phương pháp hồi quy iPLS, tất cả các bước sóng được chia thành một số bước sóng nhỏ hơn
các khoảng con cách đều nhau và phát triển mô hình PLS trên mỗi khoảng con.
Tuyên bố của tác giả
Sau đó, các khoảng con tốt nhất được xác định dựa trên giá trị trung bình gốc
sai số bình phương của các giá trị xác thực chéo (RMSECV), như trong Hình 4.
Mô hình iPLS được tối ưu hóa bao gồm dải bước sóng từ 240 Alexander de P. Rodrigues: Tiến hành nghiên cứu và điều tra
đến 360 nm, bao phủ các đỉnh được đề cập và đặc trưng ở quá trình và thu thập dữ liệu.
Mục 4.2 khi sử dụng độ lệch bằng 80 nm. Nhờ phương pháp này, iPLS đã cho kết quả Marina AJL da Costa: Thực hiện các thí nghiệm với quang phổ huỳnh quang đồng
tương tự như kết quả thu được từ lưới đàn hồi bộ và xác định tổng số hợp chất phenolic bằng phương pháp quang phổ UV-Vis.
hồi quy khi so sánh các giá trị RMSEP [52].
Tuy nhiên, khi khả năng dự báo bên ngoài biểu thị bằng Q2 của Camila S. da Silva: Thực hiện xác định hàm lượng phenolic tổng số
F3
so sánh giữa mô hình lưới đàn hồi và mô hình tối ưu hóa iPLS, mô hình sau hợp chất bằng phương pháp quang phổ UV-Vis.
đã được chứng minh là mô hình hoạt động tốt nhất. Thực tế là kết quả tốt nhất để Jefferson S. de Gois: Cố vấn, rà soát và biên tập.
Vinicius L. Xavier: Triển khai mã máy tính và các thuật toán hỗ trợ.
Q2F3 chỉ cao hơn một chút (>0,65) vì trong những loại bia đó, một phần
mạch nha lúa mạch có thể được thay thế bằng các chất hỗ trợ sản xuất bia, chẳng hạn như gạo và ngô,
Aderval S. Luna: Khái niệm hóa và giám sát.
ảnh hưởng trực tiếp đến khả năng dự đoán bên ngoài của tối ưu hóa
mô hình đã đề cập ở trên. Về những nhân vật có công đức khác, chẳng hạn như
RSEP (%), độ lệch và MAE, cả hai mô hình đều cho kết quả tương tự nhau. Nó nên như vậy
Tuyên bố về lợi ích cạnh tranh
lưu ý rằng RSEP (%) thu được cho tất cả các mô hình hồi quy đa biến
là ít hơn 1%. Đồng thời, giá trị MAE nhỏ hơn hoặc
Các tác giả tuyên bố rằng họ không có bất kỳ thông tin tài chính cạnh tranh nào được biết đến
bằng 18 mg GAE L1 đối với hai mẫu tốt nhất, có thể coi là
lợi ích hoặc các mối quan hệ cá nhân có thể ảnh hưởng đến
đủ cho phạm vi nồng độ được sử dụng trong công việc này khác nhau
công việc được báo cáo trong bài báo này.
từ 119 đến 343 mg GAE L1 .
Sự nhìn nhận
5. Kết Luận
Các tác giả xin cảm ơn Conselho Nacional de Desenvolvimento

Trong bài viết này đã trình bày các công cụ ứng dụng hóa học cho
Khoa học và Công nghệ (CNPq), Coordenaç ~ao de Aperfeiçoamento de
dự đoán hàm lượng phenolic tổng số trong bia Mỹ tiêu chuẩn Brazil
Pessoal de Nível Superior - Brazil (CAPES) – Mã tài chính 001, Fundaç~ao
bia sử dụng bộ dữ liệu hợp nhất quang phổ huỳnh quang đồng bộ. Với
de Amparo a Pesquisa no Rio de Janeiro (FAPERJ) và Đại học do
tiền xử lý và chuyển đổi dữ liệu, các biến thể mang tính hệ thống được
Estado do Rio de Janeiro (Programa Pro-Ci ^encia) vì tài chính của họ
giảm và không có ảnh hưởng xấu đến kết quả. Hiệu trưởng mạnh mẽ
ủng hộ. ASL và JSG có học bổng nghiên cứu từ UERJ (Programa
5
Pro-Ci ^encia) và CNPq. [25] T. Mehmood, KH Liland, L. Snipen, S. Sæbø, Đánh giá về lựa chọn biến
các phương pháp hồi quy bình phương nhỏ nhất từng phần, Chemometr. Trí tuệ. Phòng thí
nghiệm. Hệ thống. 118 (2012) 62–69, https://doi.org/10.1016/j.chemolab.2012.07.010.

Phụ lục A. Dữ liệu bổ sung [26] L. Nørgaard, A. Saudland, J. Wagner, JP Nielsen, L. Munck, SB Engelsen, Hồi quy bình phương nhỏ
nhất từng phần (iPLS): một nghiên cứu hóa học so sánh với một ví dụ từ quang phổ cận hồng ngoại,
Appl. Quang phổ. 54 (2000) 413–419, https://doi.org/10.1366/0003702001949500.

Dữ liệu bổ sung cho bài viết này có thể được tìm thấy trực tuyến tại https:// doi.org/10.1016/
j.chemolab.2020.104168.
[27] A. Lendasse, V. Wertz, M. Verleysen, Lựa chọn mô hình với xác nhận chéo và
bootstraps - ứng dụng dự đoán chuỗi thời gian với các mô hình RBFN, trong: O. Kaynak, E. Alpaydin,
Người giới thiệu E. Oja, L. Xu (Eds.), Artif. Mạng lưới thần kinh Thông tin thần kinh. Quá trình. - ICANN/
ICONIP 2003, Springer Berlin Heidelberg, Berlin, Heidelberg, 2003, trang 573–580.
[1] S. Buiatti, F. Khoa học, Thành phần bia: tổng quan, Bia chữa bệnh. Dis. Trước. (2009)
[28] Q.-S. Xu, Y.-Z. Liang, Monte Carlo xác nhận chéo, Chemometer. Trí tuệ. Phòng thí nghiệm. Hệ thống.
213–225.
56 (2001) 1–11, https://doi.org/10.1016/S0169-7439(00)00122-2.
[2] A. Gresser, Thuộc tính và chất lượng, trong: HM Eßlinger (Ed.), Handb. Pha. Quá trình.
[29] B. Efron, The jackknife, bootstrap và các kế hoạch lấy mẫu lại khác, Hiệp hội Toán học Công
Technol. Mark., ấn bản đầu tiên, Wiley-VCH Verlag GmbH & Co. KGaA, Weinheim, Đức, 2009,
nghiệp và Ứng dụng, 1982, https://doi.org/10.1137/
trang 359–397, https://doi.org/10.1002/9783527623488.ch15. 1.9781611970319.
[3] VR Preedy, Bia trong phòng chống bệnh tật và sức khỏe, Nhà xuất bản Học thuật, Cambridge,
[30] SM Short, RP Cogdill, CA Anderson, Xác định số liệu khen thưởng cho phép đo quang phổ cận hồng
2009, 978-0-12-373891-2.
ngoại và Raman bằng phân tích tín hiệu chất phân tích ròng cho hệ thống định lượng rắn 4 thành
[4] CW Bamforth, Bia, Sức khỏe và Dinh dưỡng, ấn bản đầu tiên, Nhà xuất bản Wiley-Blackwell,
phần, AAPS PharmSciTech 8 (2007), https://doi .org/10.1208/ pt0804096.
Hoboken, NJ, Mỹ, 2004.
[5] M. Dvorkova, LF Guido, P. Dostalek, Z. Skulilova, MM Moreira, AA Barros, Đặc tính chống oxy hóa
[31] C. Stillhart, M. Kuentz, So sánh bộ cộng hưởng siêu âm độ phân giải cao
của este tự do, hòa tan và các hợp chất phenolic liên kết không hòa tan trong các loại
công nghệ và quang phổ Raman như những công cụ phân tích quy trình mới để định lượng thuốc
lúa mạch khác nhau và mạch nha tương ứng, J. Inst. Pha. 114 (2008) 27–33, https://doi.org/10.1002/
trong hệ thống phân phối thuốc tự nhũ hóa, J. Pharmaceut. Sinh học.
j.2050-0416.2008.tb00302.x.
Hậu môn. 59 (2012) 29–37, https://doi.org/10.1016/j.jpba.2011.10.018.
[6] M. Walzl, Sinh lý học và độc chất học, trong: DHM Eßlinger (Ed.), Handb. Bia.,
[32] H. Tran, P. Salgado, E. Tillard, P. Dardenne, XT Nguyen, P. Lecomte, dự đoán “Toàn cầu” và “cục bộ”
Wiley-VCH Verlag GmbH & Co. KGaA, Weinheim, Đức, 2009, trang 515–529, https://doi.org/
về chất lượng dinh dưỡng của chế độ ăn sữa bằng phương pháp quang phổ phản xạ cận hồng ngoại,
10.1002/9783527623488.ch21.
J. Dairy Sci . 93 (2010) 4961–4975, https://doi.org/10.3168/jds.2008-1893 .
[7] T. Margraf, AR Karnopp, ND Rosso, D. Granato, So sánh giữa folin-
xét nghiệm ciocalteu và prussian blue để ước tính tổng hàm lượng phenolic trong nước trái cây
[33] V. Consonni, D. Ballabio, R. Todeschini, Đánh giá khả năng dự đoán của mô hình bằng các kỹ thuật
và trà bằng cách sử dụng đĩa vi mạch 96 giếng, J. Food Sci. 80 (2015) C2397–C2403, https:// doi.org/
xác nhận bên ngoài, J. Chemom. 24 (2010) 194–201, https://doi.org/ 10.1002/cem.1290.
10.1111/1750-3841.13077.
[8] R. Budini, D. Tonelli, S. Girotti, Phân tích tổng số phenol bằng phương pháp Phổ xanh, J. Agric.
[34] Iupac, Danh pháp, ký hiệu, đơn vị và cách sử dụng chúng trong phân tích quang phổ, Pure Appl.
Hóa chất thực phẩm. 28 (1980) 1236–1238, https://doi.org/10.1021/jf60232a056 .
Chem. 45 (1976) 99–103, https://doi.org/10.1351/pac197645020099.
[35] D. Büchele, M. Chao, M. Ostermann, M. Leenen, I. Bald, Hóa học đa biến như một công cụ chính để dự đoán K và Fe
[9] VL Singleton, JA Rossi, J. Jr, Đo màu của phenolic tổng số bằng
trong bộ đất nông nghiệp đa dạng của Đức sử dụng EDXRF, Sci. Dân biểu 9 (2019) 17588, https://doi.org/10.1038/
thuốc thử axit phosphomolybdic-phosphotungstic, Am. J. Enol. Vitic. 16 (1965) 144–158.
s41598-019-53426-5 .
[10] Aoac, Phương pháp phân tích chính thức, tái bản lần thứ 20, 2015. Rockville.
[36] Cộng hòa Liên bang Brazil, Legislaç~ao de Bebidas (luật về đồ uống),
[11] E. Sikorska, I. Khmelinskii, M. Sikorski, Phương pháp huỳnh quang để phân tích bia, trong: Beer Heal. Dis. Trước
Ministryio DA AGRICULTURA, PECUARIA E ABASTECIMENTO - MAPA, Brazil, 2009. http://
đó, Elsevier, 2009, trang 963–976, https://doi.org/10.1016/ B978-0-12-373891-2.00095-X.
www.planalto.gov.br/ccivil_03/_Ato2007-2010/2009/Decreto/ D6871.htm.
[12] KI Poulli, GA Mousdis, CA Georgiou, Quang phổ huỳnh quang đồng bộ để xác định định lượng dầu ô liu
[37] Nhóm R Core, R: ngôn ngữ và môi trường cho tính toán thống kê. https://
nguyên chất pha trộn với dầu hướng dương, Hậu môn.
www.r-project.org/, 2019.
Sinh học. Chem. 386 (2006) 1571–1575, https://doi.org/10.1007/s00216-006-0729-2 .
[38] RStudio Team, RStudio: môi trường phát triển tích hợp cho R. http://www.rstudio.com/ ,
2018.
[13] EG Shcherbakova, T. Minami, V. Brega, TD James, P. Anzenbacher,
[39] H. Wickham, J. Bryan, Readxl: đọc file excel. https://cran.r-project.org/packa ge¼readxl, 2019.
Xác định lượng dư đối quang trong các dẫn xuất amin có khả năng tự lắp ráp phân tử, Angew. Chem.
Int. Ed. 54 (2015) 7130–7133, https://doi.org/10.1002/

[40] A. Stevens, L. Ramirez-Lopez, Giới thiệu về Gói Người tìm kiếm, 2013.
anie.201501736.
[41] N. Xiao, D.-S. Cao, M.-Z. Lý, Q.-S. Xu, Enpls: tập hợp hồi quy bình phương nhỏ nhất từng
[14] EI Georga, VC Protopappas, D. Polyzos, DI Fotiadis, Một mô hình dự đoán về
phần. https://cran.r-project.org/package¼enpls, 2019.
nồng độ glucose dưới da ở bệnh tiểu đường loại 1 dựa trên Random Forests, trong: 2012 Annu.
[42] V. Todorov, P. Filzmoser, Khung hướng đối tượng để phân tích đa biến mạnh mẽ, J. Stat. Phần
Int. Conf. IEEE Eng. Med. Biol. Soc., IEEE, 2012, trang 2889–2892, https://doi.org/10.1109/
mềm 32 (2009) 1–47. http://www.jstatsoft.org/v32/i03/.
EMBC.2012.6346567.
~ [43] NL Afanador, T. Tran, L. Blanchet, R. Baumgartner, Mvdalab: phòng thí nghiệm phân tích dữ liệu đa
[15] MMC Ferreira, Quimiometria: tự phụ, phương pháp và ứng dụng, Editora da Unicamp, 2015,
biến. https://cran.r-project.org/package¼mvdalab, 2017.
https://doi.org/10.7476/9788526814714.
[44] MC, S. Weston, doParallel: foreach bộ điều hợp song song cho gói “song song”. htt ps://cran.r-
[16] R. Kramer, Kỹ thuật hóa học để phân tích định lượng, CRC Press, 1998,
project.org/package¼doParallel, 2019.
https://doi.org/10.1201/9780203909805.
[45] J. Friedman, T. Hastie, R. Tibshirani, Đường dẫn chính quy hóa cho các mô hình tuyến tính tổng
[17] A. Savitzky, MJE Golay, Làm mịn và phân biệt dữ liệu bằng các thủ tục bình phương tối thiểu đơn giản hóa, Anal.
quát thông qua gốc tọa độ, J. Stat. Phần mềm 33 (2010) 1–22.
Chem. 36 (1964) 1627–1639, https://doi.org/10.1021/ac60214a047 .
[46] CP Panceri, TM Gomes, JS De Gois, DLG Borges, MT Bordignon-Luiz, Ảnh hưởng của quá trình khử nước
đến hàm lượng khoáng chất, hợp chất phenolic và hoạt động chống oxy hóa của nho Cabernet
[18] M. Hubert, PJ Rousseeuw, K. Vanden Branden, ROBPCA: một cách tiếp cận mới để phân tích thành phần chính
Sauvignon và Merlot, Food Res. Int. 54 (2013) 1343–1350, https://doi.org/10.1016/
mạnh mẽ, Technometrics 47 (2005) 64–79, https://doi.org/ 10.1198/004017004000000563.
j.foodres.2013.10.016.
€ €
[47] H. Akhavan, M. Barzegar, H. Weidlich, BF Zimmermann, Các hợp chất phenolic và hoạt tính chống oxy
[19] S. Wold, M. Sjostr om, L. Eriksson, hồi quy PLS: một công cụ cơ bản của hóa học, Chemometr. Trí
hóa của nước ép từ mười giống lựu Iran phụ thuộc vào quá trình chiết xuất, J. Chem. 2015
tuệ. Phòng thí nghiệm. Hệ thống. 58 (2001) 109–130, https://doi.org/10.1016/S0169-7439(01)00155-1 .
(2015) 1–7, https://doi.org/10.1155/2015/907101.
[48] J. Wannenmacher, M. Gastl, T. Becker, Chất phenolic trong bia: cấu trúc
[20] BH Mevik, VH Segtnan, T. Næs, Phương pháp tập hợp và hồi quy bình phương nhỏ nhất một phần,
tính đa dạng, khả năng phản ứng và mức độ phù hợp đối với quy trình sản xuất bia và chất lượng bia, Compr.
J. Chemom. 18 (2004) 498–507, https://doi.org/10.1002/cem.895.
Rev. Khoa học thực phẩm. Thực phẩm an toàn. 17 (2018) 953–988, https://doi.org/10.1111/ 1541-4337.12352.
[21] DS Cao, ZK Deng, MF Zhu, ZJ Yao, J. Dong, RG Zhao, Hồi quy bình phương nhỏ nhất một phần của
Ensemble để lựa chọn bộ mô tả, phát hiện ngoại lệ, đánh giá miền ứng dụng và mô hình hóa tập hợp
[49] W. Wunderlich, trong: S. And Back, Các khía cạnh chung của bia và các thành phần - Bia
trong mô hình QSAR/QSPR, J. Chemom . 31 (2017) 1–17, https://doi.org/10.1002/cem.2922.
Chế tạo, Elsevier, 2009. Hoa bia và men.
[50] P. McCullagh, JA Nelder, Mô hình tuyến tính tổng quát, tái bản lần thứ hai, Chapman và Hall,
[22] H. Zou, T. Hastie, Chính quy hóa và lựa chọn biến thông qua lưới đàn hồi, JR
London, 1989 https://doi.org/10.1007/978-1-4899-3242-6.
Thống kê. Sóc. Ser. B (Phương pháp thống kê.) 67 (2005) 301–320, https://doi.org/ 10.1111/
[51] C. Giglio, SD Brown, Sử dụng hồi quy mạng đàn hồi để thực hiện lựa chọn biến có liên quan về mặt phổ, J. Chemom.
j.1467-9868.2005.00503.x.
32 (2018), e3034, https://doi.org/10.1002/ cem.3034.
[23] J. Trygg, S. Wold, Các phép chiếu trực giao cho các cấu trúc tiềm ẩn (O-PLS), J. Chemom.
16 (2002) 119–128, https://doi.org/10.1002/cem.695.

[52] MH Islam, N. Kondo, Y. Ogawa, T. Fujiura, T. Suzuki, S. Fujitani, Phương pháp hồi quy bình phương
[24] UG Indahl, Phương pháp O-PLS để hiệu chỉnh tín hiệu trực giao—phải không?
nhỏ nhất từng phần (iPLS) để dự đoán thời gian nở của gà con, Int. J.
sửa chữa hoặc gây nhầm lẫn? J. Hóa học. 34 (2020) 1–14, https://doi.org/10.1002/ cem.2884.
Exp. Quang phổ. Công nghệ. 3 (2018) 1–9, https://doi.org/10.35840/2631-505X/8514.

Rodrigues 2020

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Rodrigues 2020

Uploaded by

Copyright:

Available Formats

Machine Translated by Google

Danh sách nội dung có sẵn tại ScienceDirect

Hệ thống hóa học và phòng thí nghiệm thông minh

trang chủ tạp chí: www.elsevier.com/locate/chemometrics

THÔNG TIN BÀI VIẾT TRỪU TƯỢNG

Địa chỉ email: asluna@uerj.br (NHƯ Luna).

Có sẵn trực tuyến vào ngày 22 tháng 9 năm 2020

0169-7439/© 2020 Elsevier BV Mọi quyền được bảo lưu.

các mô hình dự đoán cũng như các chủ đề thống kê khác.

tra và tập huấn luyện.

hình: xác thực chéo và khởi động.

bước sóng (Δλ) là 20, 50 và 80

3.3. Xác định hàm lượng phenolic tổng số

Gói Chức năng Thẩm quyền giải quyết máy tính

Con số Cov(X) chiếc máy tính này tổng cộng

Người thăm dò Thuật toán Kennard-Stone [40] 1 0,502 70,21 70,21

Làm mịn Savitzky-Golay 2 0,213 29,79 100,00

Mdatools Định tâm trung bình [40]

xin vui lòng

Tập hợp PLS thưa thớt

glmnet Lưới đàn hồi [45]

hồi quy tuyến tính đa biến sẽ được hiển thị.

xác thực bootstrap.

PC đầu tiên tương ứng với hướng có số lượng tối đa

trong Hình 2, và hình này chỉ ra rằng một số mẫu có thể

thấy trong Hình 3 (mẫu 72).

4.4. Lập mô hình sử dụng hồi quy đa biến tuyến tính

Mô hình hồi quy Những con số xứng đáng

RMSEP Q2 Độ lệch RSEP MAE

CV PLS, 1 LV 24,5 0,5058 0,66 1,5 20,0

PLS trực giao, 3 LV 24,6 0,5007 0,67 1,5 19.9

Bộ đồng phục Bootstrap PLS 23,0 0,5628 0,68 1,5 19,4

Mô hình hồi quy với việc lựa chọn các biến

UVE – PLS, 1 LV 34,5 0,0197 0,88 2.0 25.1

iPLS Global Model, 1 LV 1,5 0,5058 0,66 1,5 20,0

iPLS Optimized Model, 4 LV 1.1 0,6515 0,50 1.1 17.2

hồi quy khi so sánh các giá trị RMSEP [52].

Các tác giả xin cảm ơn Conselho Nacional de Desenvolvimento

nghiệm. Hệ thống. 118 (2012) 62–69, https://doi.org/10.1016/j.chemolab.2012.07.010.

Appl. Quang phổ. 54 (2000) 413–419, https://doi.org/10.1366/0003702001949500.

Int. Ed. 54 (2015) 7130–7133, https://doi.org/10.1002/

16 (2002) 119–128, https://doi.org/10.1002/cem.695.

You might also like