Deze functie berekent de RMSE door cross-validatie op basis van 6 subsets.
Deze functie kan ook gebruikt worden voor het lokaal model (ze bepaalt het
verschil tussen de datasets op basis van het al dan niet aanwezig zijn van
een veld DOMEIN_ID in de dataset). Opgelet! In tegenstelling tot de
meeste functies van dit package werkt deze functie op basis van de
meetgegevens van 1 model.
Zie voorbeelden voor een methode om deze functie te kunnen
toepassen vertrekkend van meetgegevens (bv. Data.lokaal) of vertrekkend van
een model waar de meetgegevens uit gehaald kunnen worden (bv. Basismodel).
Deze functie berekent de RMSE op basis van testgroepen en omvat de volgende deelstappen:
metingen opdelen in 6 testgroepen (veld testgroep)
modellen fitten voor testgroepen, waarbij ze de functie
fit.basis()6 keer oproeptRMSE berekenen voor domeinmodellen en Vlaams model op basis van de gemeten waarden en schattingen voor de testgroepen
Arguments
- Data
Meetgegevens van één boomsoort-domeincombinatie (dataframe zoals de dataframes die in de list teruggegeven worden door de functie
initiatie())- Typemodel
"Basis" of "Lokaal"?
- BMS
Boomsoort
Examples
library(dplyr)
#Dataset inladen voor het basismodel
Data <- testdataset()
Datalijst <- initiatie(Data)
Data.basis <- Datalijst[["Basis"]]
#De RMSE berekenen voor een basismodel op basis van de dataset
Data.basis %>%
group_by(
BMS
) %>%
do(
rmse.basis(., "Basis", .data$BMS)
) %>%
ungroup()
#> # A tibble: 6 × 11
#> BMS DOMEIN_ID nBomen nBomenOmtrek05 nBomenInterval nBomenIntervalOmtrek05
#> <chr> <chr> <int> <int> <int> <int>
#> 1 testboom A 200 176 200 176
#> 2 testboom B 100 90 100 90
#> 3 testboom C 500 436 500 436
#> 4 testboom D 100 89 100 89
#> 5 testboom E 100 95 96 95
#> 6 testboom F 100 84 100 84
#> # ℹ 5 more variables: Q5k <dbl>, Q95k <dbl>, rmseD <dbl>, rmseVL <dbl>,
#> # maxResid <dbl>
#Dataset inladen voor het lokaal model
Data.lokaal <- Data.basis %>%
filter(DOMEIN_ID == "A")
#De rmse berekenen voor een lokaal model
Data.lokaal %>%
group_by(
BMS,
DOMEIN_ID
) %>%
do(
rmse.basis(., "Lokaal", .data$BMS)
) %>%
ungroup()
#> # A tibble: 1 × 10
#> BMS DOMEIN_ID nBomen nBomenOmtrek05 nBomenInterval nBomenIntervalOmtrek05
#> <chr> <chr> <int> <int> <int> <int>
#> 1 testboom A 200 176 200 176
#> # ℹ 4 more variables: Q5k <dbl>, Q95k <dbl>, rmseD <dbl>, maxResid <dbl>
