Classification of Amazonian fast-growing tree species and wood chemical determination by FTIR and multivariate analysis (PLS-DA, PLS)

0
112

Chemische Zusammensetzung von Holz

Tabelle 1 zeigt die chemische Zusammensetzung von Capirona-, Bolaina- und Pashaco-Holz. Bei den drei Arten lag der Zelluloseanteil zwischen 16,5 und 51,8 %, der Hemizelluloseanteil zwischen 5,5 und 35,3 % und der Ligninanteil zwischen 5,1 und 15,6 %. Die zweithäufigste Verbindung war Hemizellulose bei drei Arten und der Anteil an Zellulose war in Pashaco (44 %) höher als in Capirona und Bolaina. Tabelle 1 fasst auch die Datenvariation nach Standardabweichung zusammen. Der Zellulosegehalt zeigte bei allen Arten eine hohe Standardabweichung, insbesondere bei Bolaina (SD = 11,2). Darüber hinaus schwankte der Hemizellulose- und Ligningehalt in Bolaina stärker als in Pashaco und Capirona.

Tabelle 1 Chemische Holzzusammensetzung in jungen Bäumen.

FTIR-Spektren

Abbildung 1a zeigt die durchschnittlichen rohen FTIR-Spektren aller drei Arten. Diese FTIR-Spektren zeigten das Vorhandensein der Hauptholzbestandteile mit einigen Variationen in ihrem Gehalt zwischen den drei Arten. Obwohl alle drei Arten ein ähnliches Spektralmuster aufwiesen, wiesen sie unterschiedliche Absorptionsintensitäten auf und einige Peaks mussten einbezogen, überlappt oder schlecht definiert (Schultern) werden. Daher wurde die zweite Ableitung der FTIR-Spektren angewendet, um die Peakauflösung zu verbessern, die Identifizierung überlappender Peaks zu erleichtern und geringfügige Unterschiede in den Spektren zu verstärken26,33. Abbildung 1b zeigt die zweite Ableitung im Fingerabdruckbereich; Die fett gedruckten Zahlen geben Peaks an, die in den Rohspektren nicht zu sehen sind.

Abbildung 1

Durchschnitt der rohen FTIR-Spektren (a) und der zweiten Ableitung der FTIR-Spektren (b) junger Holzproben.

Peakzuordnung und Position (Wellenzahl) aus Abb. 1a, b sind in Tabelle 2 aufgeführt. In Abb. 1a entsprechen die ersten drei Peaks O-H- und CH-Schwingungen, die in Lignin, Cellulose und Hemicellulose vorhanden sind33. Peak 4 entspricht der Schwingung von C=O und Carbonylgruppen von Hemicellulose24. Die Peaks 6, 7 und 9 (beobachtet bei 1605/1598, 1504/15.016 bzw. 1418/1422 cm−1) sind aromatische Ringschwingungen in Lignin24,34. Die Peaks 10, 12, 13 und 14 bestätigten das Vorhandensein funktioneller Gruppen, die mit Cellulose und Hemicellulose assoziiert sind26,34. Die Peaks 11, 16 und 18 stehen im Zusammenhang mit molekularen Bindungen von Cellulose24,26,34. In Abb. 1b zeigt die zweite Ableitung im Fingerabdruckbereich Peaks, die in den Rohspektren nicht zu sehen sind (fette Zahlen). Diese Abbildung zeigt drei typische Peaks bei Pashaco (1466, 1054 und 987 cm−1), Capirona (1465, 1057 und 989 cm−1) und Bolaina (1466, 1054 und 987 cm−1). Der erste Peak bei 1466 cm−1 (Peak 8) ist eine CH2-Deformationsstreckung in Lignin und Hemizellulose24 und wird als Schulter zwischen den Peaks 7 und 9 in den Rohspektren beobachtet (Abb. 1a). Der zweite Peak bei 1054 cm−1 (Peak 15) steht im Zusammenhang mit der CO-Streckung in Cellulose und Hemicellulose24, während der dritte der CO-Streckung26 in Cellulose bei 987 cm−1 (Peak 17) zugeordnet wird. In Capirona zeigte das zweite Derivat das Vorhandensein eines Peaks bei 1592 cm-1 (Lignin zugeordnet), der in den Rohdurchschnittsspektren aufgrund der Überlappung mit Peak 5 (1622 cm-1), der Flavonen und anderen zugeschrieben wird, nicht auftrat Calciumoxalat24. In Bolaina bestätigte die zweite Ableitung (Abb. 1b) das Fehlen eines 1620 cm-1-Peaks, der keinen Flavon- und Calciumoxalatgehalt aufwies. In den Rohspektren sind Peaks bei 1420 cm−1 (Lignin zugeordnet) und 1160 cm−1 (Cellulose und Hemicellulose zugeordnet) nicht genau definiert; Daher wurden die Wellenzahlen in Abb. 1a nicht angegeben, sie wurden jedoch in den Spektren der zweiten Ableitung korrekt zugeordnet (Abb. 1b).

Tabelle 2 Peaks von Holzproben und ihre Zuordnung in FTIR-Spektren.

PLS-DA-Modelle

PLS-DA ist ein überwachter Algorithmus, der eine Dimensionsreduzierung unter voller Kenntnis der Klassenbezeichnungen (Y-Variablen) erreicht, die zur Unterscheidung der Variablenauswahl und zur Vorhersagemodellierung35,36 zur Klassifizierung von Holzarten verwendet werden. Die Klassifizierungsmodelle verwendeten den PLS1-DA-Algorithmus, der jeweils eine Klasse modelliert35. In einer PLS1-DA-Regression besteht die Y-Antwort aus einer einzelnen Variablen, der ein Wert von 1,0 oder 0,0 zugewiesen ist, der jeweils die In-Class- und Out-Class-Werte angibt. Die externe Validierung wurde unter Verwendung der vollständigen Spektren mit MSC (multiplikative Streukorrektur) – 2°-Ableitung als Vorbehandlung und vier latenten Variablen durchgeführt, die zuvor durch vollständige Kreuzvalidierung bestimmt wurden (Ergänzungstabelle S1). Die Modellleistung wurde anhand von R2, RMSEP, Sensitivität, Spezifität und Genauigkeit bewertet37,38.

PLS1-DA hat die Korrelation zwischen Holzarten und FTIR-Spektraldaten erfolgreich erreicht, siehe Tabelle 3. Eine gute Modellleistung weist einen R2 nahe 1 und einen RMSEP nahe Null30 auf. PLS-DA-Modelle zeigten aufgrund der hohen Parameter eine gute Vorhersagefähigkeit auf der Grundlage dieser Parameter ({R}_{p}^{2}) Werte (0,92–0,95) und niedriger RMSEP (0,14–0,18). Ähnliche Vorhersagefähigkeiten wurden bei der Unterscheidung von Kern-Übergang-Außenholz von Pinus nigra29, Walnussholzarten28 und infiziertem und normalem Aquilaria microcarpa39 mit Werten von 0,87–0,99 für R2 und 0,049–0,12 für RMSEP berichtet.

Tabelle 3 Parameter von PLS-DA-Modellen.

Die Modellleistungen wurden durch Genauigkeit, Sensitivität und Spezifität bestätigt40, und diese Werte wurden aus dem Diskriminanzdiagramm berechnet (Abb. 2). Der Diskriminanzschwellenwert lag bei 0,50 (rote Linie) und stellt die Grenze zwischen Y-Vorhersagewerten für Stichproben innerhalb der Klasse (1,0) und außerhalb der Klasse (0,0) dar. Im Pashaco-Modell werden alle Stichproben korrekt vorhergesagt (Abb. 2a); Daher wurde eine vollständige Identifizierung der Klassen im Validierungssatz hinsichtlich Spezifität und Sensitivität erreicht (100 % für beide). Für Bolaina wurde eine Sensibilität von 95,8 % aufgrund von zwei falsch-negativen Ergebnissen erreicht (Abb. 2b) und eine Spezifität von 100 %, da keine falsch-positiven Ergebnisse erzielt wurden. Im Gegensatz dazu wurden Capirona-Proben korrekt vorhergesagt (100 % der Sensibilität), es gab jedoch drei falsch klassifizierte Proben (falsch positiv), sodass die erhaltene Spezifität 95,2 % betrug. Laut Alaoui Mansori et al.37 und Grasel und Ferrão41 wurden Werte von 100 % für Sensibilität und Spezifität berichtet, da PLS1-DA-Modelle gekoppelt mit FTIR eine gute Trennung zwischen den Klassen ermöglichen.

Figur 2Figur 2

X-Beladungsgewichte des ersten und des zweiten Faktors wurden analysiert (ergänzende Abbildung S1), um wesentliche IR-Peaks zur Trennung von Holzarten zu identifizieren. Peaks bei 994 und 1319 cm−1 werden der CO-Streckung und dem CH2-Wechseln in Cellulose zugeschrieben26,34, während der Peak bei 1033 cm−1 mit der CO-Streckung24 in Holocellulose und Lignin zusammenhängt. Peaks bei 1164 cm−1 und 1077 cm−1 stehen im Zusammenhang mit der CO-C-Streckung von Pyranose25 bzw. der CO-Deformation in sekundären Alkoholen bzw. aliphatischen Ethern34. Die Unterscheidung zwischen Capirona, Bolaina und Pashaco basiert auf IR-Peaks im Zusammenhang mit Cellulose, Lignin und Hemicellulose.

PLS-Modelle

Für andere Arten wurde bereits über universelle Modelle berichtet. Daher ist ein universelles Modell zur Vorhersage der wichtigsten Holzbestandteile für schnell wachsende Bäume erforderlich, um die Auswahl von Bäumen in Zuchtprogrammen zu beschleunigen. Die FTIR-Spektraldaten und die chemische Zusammensetzung wurden mithilfe eines universellen PLS-Modells für Capirona, Bolaina und Pashaco korreliert. Die Proben wurden durch die blockweise Auswahlmethode in Modellierungs- (2/3 der Proben) und Validierungssätze (1/3 der Proben) unterteilt. Die Modelle wurden unter Verwendung des Fingerabdrucks (1800–850 cm−1) und der vollständigen Spektren (3700–850 cm−1) erstellt. Vor der PLS-Analyse wurden die Spektraldaten vorverarbeitet und die beste Vorbehandlung für jedes Modell ausgewählt (Ergänzungstabelle S2). Tabelle 4 fasst Cellulose-, Hemicellulose- und Ligninmodelle mit multiplikativer Streukorrektur, jeweils erster und zweiter Ableitung als Vorbehandlung, zusammen. Die Vorhersagefähigkeit von Modellen wurde anhand der folgenden statischen Parameter bewertet: RMSEC, RMSEP, RPD, ({R}_{c}^{2})Und ({R}_{p}^{2}).

Tabelle 4 Universelle PLS-Modelle für Capirona, Bolaina und Pashaco.

Diese Studie berichtete über ein universelles PLS-Modell mit drei Arten zur Vorhersage der Hauptholzbestandteile. Cellulose-, Lignin- und Hemicellulosemodelle, die die vollständigen Spektren verwendeten, zeigten eine höhere Genauigkeit (niedriger RMSEP) und eine bessere Datenanpassung (R2) als der Fingerabdruckbereich (Tabelle 4). Für den gesamten Spektrenbereich stieg der RPD-Wert für Lignin von 1,91 auf 2,27 und für Hemicellulose von 2,16 auf 2,46. Darüber hinaus zeigten beide Modelle leichte Unterschiede zwischen dem Kalibrierungs- und Validierungssatz (Verhältnis von ({R}_{c}^{2})/({R}_{p}^{2}) und RMSEC/RMSEP nahe 1), was auf eine gute Anpassung hinweist. Für Cellulose verringerte der gesamte Spektrenbereich nicht den Vorhersagefehler, sondern erhöhte die Vorhersagekraft (RPD) von 3,13 auf 3,43 und verbesserte die Datenanpassung (Werte von ({R}_{c}^{2})/({R}_{p}^{2}) = 0,99 und RMSEC/RMSEP = 1,007 liegen näher bei 1).

Der gesamte Spektrenbereich erzielte im Allgemeinen die beste Leistung für Zellulose-, Lignin- und Hemizellulosemodelle (Abb. 3). Dieser Trend wurde auch von Acquah et al.22 in Proben von Waldbiomasse berichtet. Obwohl der Fingerabdruckbereich (1800–850 cm−1) die meisten molekularen Informationen zur Erstellung chemometrischer Modelle enthält, verbesserte der Bereich 3700 bis 2700 cm−1 (anscheinend irrelevant) die Modelleffizienz. Im Gegensatz zum Lignin-Modell von Zhou et al.42 erhöhte der Ausschluss von Wellenzahlen, die nichts mit Lignin zu tun hatten, die Vorhersagekraft.

Figur 3Figur 3

Mit der Methode von Van Soest und Robertson gemessene Hauptbestandteile des Holzes im Vergleich zu den vorhergesagten Werten (a) des Fingerabdruckbereichs und (b) des gesamten Spektrenbereichs.

Nachdem die vollständigen Spektren als optimale Region für PLS-Modelle ermittelt wurden, wurde die Leistung von Lignin-, Cellulose- und Hemicellulosemodellen analysiert. FTIR in Verbindung mit PLS sagt den Ligningehalt mit höherer Genauigkeit (RMSEP = 0,81) voraus als der Zellulose- (RMSEP = 2,73) und Hemizellulosegehalt (RMSEP = 1,89). Dieses Muster wurde auch von Funda et al.20, Zhou et al.43 und Acquah et al.22 berichtet. Funktionelle Gruppen und molekulare Bindungen sind zwischen Cellulose und Hemicellulose ähnlich, während die chemische Struktur von Lignin unterschiedlich ist22. Daher erhöht die einzigartige molekulare Struktur von Lignin die Genauigkeit des Ligninmodells.

Andererseits war die Vorhersagegenauigkeit bei Zellulose-, Hemizellulose- und Ligninmodellen, die auf drei Arten basierten, etwas höher als bei Modellen, die mit einer einzigen Art erstellt wurden30. Die Variabilität der chemischen Holzzusammensetzung kann die Vorhersagekraft (RPD) und die Datenanpassung (R2) in Modellen verbessern, die mit mehr als einer Holzart erstellt wurden.

Aufgrund leicht hoher RMSEP-Werte wurden auch die Datenkorrelation (R2) und die Vorhersagekraft (RPD) der Modelle einbezogen, um die Modellleistung zu bewerten20,44. Laut Karlinasari et al.44 weist ein RPD von 2,0 bis 2,5 auf eine gute Vorhersage hin, und ein RPD über 3 weist auf eine effiziente Vorhersage hin. Ein R2 von 0,81 bis 0,90 weist auf eine gute Vorhersage hin, und ein R2 über 0,91 weist auf hervorragende Modelle hin45. Der ({R}_{c}^{2}) der Wert für Zellulose war höher als 0,91 mit einem RPD von 3,43; Beide Werte klassifizieren dieses Modell als hervorragendes Modell mit effizienter Vorhersage. Hemizellulose- und Ligninmodelle wiesen einen Bestimmtheitskoeffizienten auf ({R}_{c}^{2}) zwischen 0,82 und 0,90 und RPD-Werten von 2,27 bzw. 2,46, sodass sie als Modelle mit guten Vorhersagen klassifiziert wurden. Darüber hinaus zeigten unsere Modelle eine höhere Vorhersagekraft (2,2 < RPD < 3,4) und eine bessere Datenanpassung (0,80 ≤ R2 ≥ 0,92) als Modelle, die auf einer Art basierten, wie von Acquah et al.22 für Loblolly Pine (0,80) berichtet< RPD >2,06 und 0,74 ≤ R2 ≥ 0,86) und Karlinasari et al.44 für Acacia mangium Willd (1,7).< RPD >2,3 und 0,41< R2 >0,81). Dieses Muster wurde von Jian et al.46 teilweise in Zellulose und Hemizellulose für Pinus-Schnittholz (0,93 < RPD < 2,2 und 0,90 ≤ R2 ≥ 0,96) beobachtet, nicht jedoch für Lignin (RPD = 5,53 und R2 = 0,90). Andererseits zeigten unsere universellen PLS-Modelle für drei Arten Werte von R2 (0,83–0,91), die denen von Modellen ähnelten, die auf einer Art basierten, wie von Funda et al.20 und Acquah et al.22 berichtet. Schließlich erwiesen sich unsere universellen PLS-Modelle als effizient, wie He und Hu45 für 116 Holzbaumarten, Chen et al.25 für Hart- und Weichhölzer und Zhou et al.43 für Hartholz von Espe, Eukalyptus, Pappel und Pappel .

www.nature.com

https://www.nature.com/articles/s41598-023-35107-6