Statistische grondparameter bepaling in een deelgebied
Van elk deelgebied moeten de gemiddelde laagopbouw en de relevante zettingsparameters worden bepaald. Voor het schatten van de stochastische parameters (type kansverdeling, gemiddelde en standaarddeviatie) binnen deelgebieden is in eerste instantie de steekproef voldoende. Om verkeerde schattingen te voorkomen, is hierbij ook een analyse op uitbijters en ‘fouten’ in de beschikbare data belangrijk. Onder uitbijter of uitschieter verstaat men in de statistiek en data-analyse een waarneming of meetwaarde die niet bij de overige lijkt te passen. Uitbijters bij waarnemingen of meetwaarden die als normaal verdeeld beschouwd kunnen worden, kunnen op de volgende wijze worden gedetecteerd:
- Bepaal het gemiddelde (μ) van alle meetwaarden.
- Zoek de meetwaarde (x) die het verst van dit gemiddelde af ligt (het minimum of het maximum van de meetwaarden).
- Bepaal het gemiddelde (μ) en de standaarddeviatie (σ) van de overige meetwaarden.
- Beschouw (x) als uitbijter wanneer x > μ + 3σ of x < μ – 3σ.
- Verwijder (x) uit de oorspronkelijke dataset en herhaal de procedure met de resterende gegevens.
- Deel de verwijderde meetwaarde (x) in bij een andere grondsoort. Wanneer het verwijderen van de meetwaarde gebeurt op basis van één parameter, dan moeten de andere parameters ook toegekend worden aan de andere grondsoort.
- Als blijkt dat de verwijderde meetwaarde (zie onder 6) bij geen enkele grondsoort hoort, laat de meetwaarde dan buiten beschouwing.
De twee meest voorkomende verdelingen om grondparameters te beschrijven zijn de normale verdeling en de log-normale verdeling. Het gemiddelde en de standaardafwijking van een normaal verdeelde parameter worden veelal geschat op basis van de steekproef en beschreven met de formules 3 en 4:
[3]
[4]
Dezelfde formules zijn bruikbaar voor het schatten van de parameters van een log-normale verdeling, waarbij waarneming (x) wordt getransformeerd tot y = ln(x). Immers, (x) heeft een log-normale verdeling als y = ln(x) een normale verdeling heeft. De parameters van beide verdelingstypen kunnen naar elkaar worden omgerekend met de formules 5 en 6.
μx = exp (μγ + 0.5σ2γ)
[5]
[5]
[6]
Om te beoordelen of een geschatte verdeling een goede beschrijving geeft van de werkelijke verdeling, zijn verschillende statistische testen te gebruiken. Bijvoorbeeld de χ2-toets, die het histogram van de steekproef vergelijkt met het histogram van de verdelingsfunctie. Of de Kolmogorov-Smirnov-toets, die de gekozen verdelingsfunctie vergelijkt met de steekproef.
In figuur 19 is voor de dataset uit het onderzoek bij de A2, met metingen van de volumieke massa van veen [5], de geschatte verdeling weergegeven op basis van een analyse met en een analyse zonder uitbijters (in het histogram aangegeven in de rode staafjes).
[ link ]
Figuur 19. Histogram van een dataset met metingen van de volumieke massa van veen (uitbijters in het rood) en de kansdichtheidsfuncties op basis van een analytische benadering met en zonder rekening te houden met uitbijters
Uit de Kolmogorov-Smirnov-toets in [5] blijkt dat de log-normale kansverdeling zonder de uitbijters de beste beschrijving van de dataset geeft. Het grafisch weergeven van de resultaten van de data-analyse helpt bij het opsporen van uitbijters en het kwalitatief beoordelen van de gevonden kansverdeling.
In de dagelijkse ingenieurspraktijk zal het aantal meetgegevens per relevante parameter vaak gering zijn. Hierdoor zal, om het gemiddelde en de standaarddeviatie voor elke parameter goed te kunnen schatten, ook gebruik moeten worden gemaakt van gegevens uit de literatuur, normen en/of de lokale ervaring van de geotechnisch adviseur (Bayesiaanse updatemethode [11]). Als de beschikbare informatie te gering blijkt voor een betrouwbare statistische analyse, zal aanvullend grondonderzoek noodzakelijk zijn.
Let op: als het aantal waarnemingen waarop de variantie van de restzetting var(ΔZrest ) klein is (<30), moet nog worden gecorrigeerd voor de omvang van de steekproef die is gebruikt voor het schatten van de parameters in het deelgebied. Dit zijn het aantal boringen/sonderingen die zijn gebruikt voor het vast- stellen van de laaggrenzen en het aantal proeven dat is gebruikt voor het bepalen van de materiaaleigenschappen. Hierbij is het kleinste aantal maatgevend: n. In plaats van de kans af te lezen uit de standaard normale verdeling, moet de kans nu worden afgelezen uit de Student t-verdeling met n-1 vrijheidsgraden.