3.3 Selectie van relevante landschapsvariabelen

Op basis van de figuren in hoofdstuk 8 hebben we een eerste selectie gemaakt van de landschapskenmerken. Dit is hoofdzakelijk een negatieve selectie: we verwijderen de landschapskenmerken die weinig tot geen verband lijken te hebben met het aantal waarnemingen per rastercel (bijv. fig. 8.16. Volgende landschapskenmerken overleven deze selectie: akker (fig. 8.2), boomgaard_min (fig. 8.14), boomgaard_plus (fig. 8.18), bos (fig. 8.30), bos_plus (fig. 8.32), bos_tot (fig. 8.26), gras (fig. 8.8), gras_min (fig. 8.6), gras_tot (fig. 8.4), gras_rand (fig. 8.50), kle (fig. 8.38), kle_tot (fig. 8.36), laag (fig. 8.40), opgaand (fig. 8.42), ruigte_plus (fig. 8.24), ruigte_tot (fig. 8.20), ruigte_rand (fig. 8.52), tot_rand (fig. 8.44), urbaan (fig. 8.34).

De correlatiematrix van deze variabelen (fig. 2.7) geeft aan dat sommige van deze variabelen zeer sterk gecorreleerd zijn. Dit is deels te wijten aan het feit dat sommige variabelen een samenstelling zijn van andere variabelen. Zo is bijvoorbeeld ruigte_tot de samenstelling van ruigte en ruigte_plus. Bovendien bestaat ruigte_tot grotendeels uit ruigte_plus, met een zeer sterke correlatie tot gevolg (\(r=0.999\)). Een ander voorbeeld zijn akker en gras_tot, welke negatief gecorreleerd zijn (\(r=-0.448\)). Een hoog aandeel akker impliceert weinig ruimte voor gras_tot en omgekeerd.

Correlatiematrix van potentieel relevante landschapskenmerken

Figuur 2.7: Correlatiematrix van potentieel relevante landschapskenmerken

Sterk gecorreleerde variabelen geven problemen bij de modelbouw, vandaar dat we in deze fase er naar kijken. Met behulp van ‘Variance Inflation Factors’ (VIF) gaan we na welke variabelen het meest gelijkaardige informatie bevatten. Vervolgens behouden we de variabele waarvan we, op basis van expert judgement, inschatten dat die de sterkste link heeft met de aanwezigheid van Steenuil. We blijven dit herhalen zolang de VIF scores aangeven dat er problemen zijn. Op deze manier bekomen we volgende paren van variabelen. We geven eerst de variabele die we verwijderen. Tussen haakjes staat de variabele die we voorlopig behouden. In volgorde zijn de paren: ruigte_plus (ruigte_tot), bos_plus (bos_tot), akker (gras_tot), kle_tot (gras_rand) en gras_rand (tot_rand). Na het verwijderen van deze variabelen daalt de sterkste correlatie tot \(r=0.472\) (fig. 2.8).

Correlatiematrix van potentieel relevante landschapskenmerken na verwijderen van sterk gecorreleerde variabelen op basis van VIF scores.

Figuur 2.8: Correlatiematrix van potentieel relevante landschapskenmerken na verwijderen van sterk gecorreleerde variabelen op basis van VIF scores.