Abstract | Biomass as a renewable energy source is becoming increasingly important due to rising
prices and the environmental incompatibility of conventional energy sources. The most
important parameter in assessing fuel quality is the higher heating value (HHV), which
represents the amount of energy released per unit area. Existing linear mathematical models
have a higher error in HHV prediction than nonlinear models, indicating the need to develop
new nonlinear mathematical models for HHV biomass prediction. In this study, new nonlinear
mathematical models in the form of higher-order polynomials (HOP), artificial neural
networks (ANN), random regression forests (RFR) and support vector models (SVM) will be
developed for HHV biomass modelling in agriculture and wood. In addition, the research will
compare the developed nonlinear models to determine the smallest HHV modelling error for
different sets of input variables. The data used to develop the model will be taken from the
available literature and the non-linear models will be based on characteristic sets of variables
from ultimate, proximate, and structural analysis. For all models developed, a data split of
70% for training and 30% for model testing is used. A statistical analysis of “goodness of fit"
is performed to identify the model with the lowest error and to select the most appropriate
model for modelling HHV biomass. The results obtained from the nonlinear regression
models are compared with the experimentally obtained data from the literature to investigate
the performance and effectiveness of the developed models for HHV modelling. After testing
the reliability and performance of the model, a sensitivity analysis is performed to optimise
the models and find the optimal sample and the relationship between the input variables and
the output variable (HHV). For this purpose, Yoon's method is used, which is based on the
sensitivity analysis of the neurons in the hidden layer of the ANN. Yoon's method makes it
possible to evaluate the importance of individual input variables about the HHV output values
and to determine the most important variables for accurate and reliable modelling of the HHV
biomass. The sensitivity analysis will help to identify the most important parameters affecting
HHV, optimise the model and reduce the prediction error. The results of this research will
provide insight into different nonlinear mathematical models for modelling HHV biomass,
such as HOP, ANN, RFR and SVM, and their success in predicting HHV based on different
sets of input variables. The comparison of the developed models will allow the selection of
the most appropriate model for reliable prediction of HHV biomass, which would reduce the
time required for HHV determination and improve the use of biomass as a renewable energy
source. |
Abstract (croatian) | Biomasa kao obnovljivi izvor energije sve više dobiva na važnosti zbog porasta cijene i
ekološke neprihvatljivosti konvencionalnih izvora energije. Glavni parametar u procjeni
kvalitete goriva je ogrjevna vrijednost (HHV), koja predstavlja količinu energije koja se
oslobađa po jedinici površine. Postojeći linearni matematički modeli (sa jednim ili dva
parametra) imaju veću grešku u predviđanju HHV od nelinearnih modela, što ukazuje na
potrebu za razvojem novih nelinearnih matematičkih modela koji nude veći stupanj
nelinearnosti za predviđanje HHV biomase.
U ovom istraživanju, cilj je razviti nove nelinearne matematičke modele u obliku polinoma
višeg stupnja (HOP), umjetnih neuronskih mreža (ANN), slučajnih šuma za regresiju (RFR) i
modela potpornih vektora (SVM) za modeliranje HHV poljoprivredne i šumske biomase.
Također, istraživanje će usporediti razvijene nelinearne modele kako bi se utvrdila najmanja
pogreška modeliranja HHV s obzirom na različite setove ulaznih varijabli. Javno dostupni
podaci korišteni za razvoj modela bit će prikupljeni iz raspoložive literature, a nelinearni
modeli temeljit će se na karakterističnim setovima varijabli elementarne, fizikalno-kemijske i
strukturalne analize. Za sve razvijene modele koristit će se podjela podataka od 70% za
učenje i 30% za testiranje modela. Provest će se statistička analiza prikladnosti (eng.
"Goodness of fit") kako bi se odredio model s najmanjom pogreškom za modeliranje HHV
biomase. Rezultati dobiveni nelinearnim modelima usporedit će se s literaturno prikupljenim
podacima kako bi se ispitale performanse i učinkovitost razvijenih modela za modeliranje
HHV. Nakon ispitivanja pouzdanosti i performansi modela, bit će provedena analiza
osjetljivosti kako bi se ispitao utjecaj ulaznih podataka na izlazne vrijednosti modela. U tu
svrhu koristit će se Yoon-ova metoda, koja se temelji na analizi osjetljivosti neurona u
skrivenom sloju ANN-a. Yoon-ova metoda omogućuje procjenu važnosti pojedinih ulaznih
varijabli u odnosu na izlazne vrijednosti HHV, te utvrđivanje najvažnijih varijabli za točno i
pouzdano modeliranje HHV biomase. Analiza osjetljivosti pomoći će u identificiranju
najvažnijih parametara koji utječu na HHV te u optimizaciji modela i smanjenju pogreške u
predviđanju. Rezultati ovog istraživanja pružit će uvid u različite nelinearne matematičke
modele za modeliranje HHV biomase, kao što su HOP, ANN, RFR i SVM, te njihovu
uspješnost u predviđanju HHV na temelju različitih setova ulaznih varijabli. Usporedba
razvijenih modela omogućit će odabir najprikladnijeg modela za pouzdano predviđanje HHV
biomase, čime bi se smanjilo vrijeme potrebno za utvrđivanje HHV i poboljšala upotreba
biomase kao obnovljivog izvora energije.
Fokus provedenog istraživanja bio je na razvoju novih nelinearnih modela za modeliranje
HHV biomase. Ispitani su novorazvijeni nelinearni modeli, a nakon međusobne usporedbe,
odabran je model s najmanjom pogreškom u odnosu na setove ulaznih varijabli elementarne,
fizikalno-kemijske i strukturalne analize. Podaci koji su korišteni za razvijanje modela
prikupljeni su iz raspoložive literature prethodnih znanstvenih istraživanja, konkretno iz
znanstvenih publikacija koji su citirani u bazama "Web of Science" i " ScienceDirect".
Prikupljeni podaci su zatim podijeljeni na poljoprivrednu i šumsku biomasu. Nelinearni modeli
temeljili su se na setovima podataka elementarne (eng. ultimate), fizikalno-kemijske (eng.
proximate), strukturalne (eng. structural) i kalorimetrijske (eng. calorimetric) analize. Nakon
što je prikupljen dovoljan broj podataka, proveden je postupak "čišćenja" podataka s obzirom
na kompletnost prikupljene baze podataka. Završetkom postupka čišćenja, podaci su
podijeljeni na dio za učenje i testiranje modela u omjeru 70% i 30%. Za kreiranje nelinearnih
modela koristili su se softverski alati za matematičko modeliranje i statističku analizu.
Razvijeni su različiti modeli, uključujući modele HOP, ANN, RFR i SVM. Svaki model testiran
je na pouzdanost i performanse. Analiza osjetljivosti provedena je Yoon-ovom metodom. Po
završetku analiza, rezultati su interpretirani kako bi se mogli usporediti svi novorazvijeni
modeli u smislu modeliranju HHV biomase.
Statističkom analizom strukturalnog sastava biomase utvrđeno je da razlika u udjelu celuloze
nije statistički značajna dok udio lignina, hemiceluloze i HHV je bio statistički značajno viši
kod šumske biomase. Analizirajući razlike u fizikalno-kemijskom sastavu poljoprivredne i
šumske biomase nisu utvrđene statistički značajne razlike u udjelu fiksiranog ugljika, hlapivih
tvari i pepela, dok je kod varijabli elementarne analize utvrđen statistički značajno manji udio
dušika (N) kod šumske biomase. Nakon kreiranja nelinearnih modela u svrhu modeliranja
HHV biomase utvrđeno je da je ANN model imao manju razinu greške kod svih setova
podataka (karakterističnih analiza) koji su korišteni kao setovi ulaznih podataka. Navedeno je
dokazano pomoću statističke analize prikladnosti (“Goodness of fit”) modela gdje je ANN
model za set ulaznih podataka elementarne analize (sa svim varijablama seta podataka) ima
iduće rezultate: Hi-kvadrat test (χ2) = 1,02, korijen iz prosječne kvadratne pogreške
(RMSE)=1,01, prosječne pogreške pristranosti (MBE) = 0,06, prosječne postotne pogreške
(MPE) = 4,21, sumu kvadrata pogreške (SSE) = 251,19), prosječno apsolutno odstupanje
(AARD) = 196,44, koeficijent determinacije (R²) = 0,90, mjere asimetrije podataka (Skew) = -
0,46, mjere spljoštenosti podataka (Kurt) = 1,23, standardna devijacija (SD) = 1,01 i varijanca
= 1.01. Kod ulaznog seta fizikalno-kemijske analize (fiksirani ugljik i hlapive tvari) za ANN
model izračunati su idući pokazatelji prikladnosti modela: χ2 (0,41), RMSE (0,64), MBE
(0,03), MPE (2,65), SSE (118,33), AARD (240,27), R² (0,96), Skew (-0,48), Kurt (1,53),
standardna devijacija (0,64), varijanca (0,41). Kod ulaznog seta podataka sturkturalne
analize statistički paramteri za model ANN pokazali su iduće vrijednosti: χ2 (0,26), RMSE
(0,51), MBE (0,00), MPE (2,30), SSE (74,81), AARD (193,72), R² (0,91), Skew (-1,09),
Kurt (3,34), standardna devijacija (0,51), varijanca (0,26). Također za sve razvijene modele
najmanju pogrešku u modeliranju su dobiveni kod ulaznog seta podataka fizikalno kemijske
analize, gdje je kao glavni pokazatelj reprezentativnosti regresije uzet koeficijent
determinacije (R2). Yoonova metoda globalne osjetljivosti koristila se za optimizaciju ANN
modela (najpogodnijeg modela) kako bi se pronašla relativna važnost ulaznih varijabli (%) na
izlaznu vrijednost HHV. Kod ulaznog seta podataka elementarne analize na HHV najviše
utječe povećanje C, N i S kao i smanjenje H i O. Model sa najmanje pogreške u modeliranju
uključivao je kao prediktorske varijable fiksirani ugljik i hlapive tvari, Yoonovom metodom je
utvrđeno da smanjenjem navedenih varijabli dolazi do povećanja HHV biomase, dok kod
varijabli stukturalne analize kao ulaznih podataka povećanje udjela celuloze, lignina kao I
smanjenje hemiceluloze utječe na ukupno veći HHV. |