Gjennomsnittets tyranni

Tall som i mange situasjoner gir oss verdifull informasjon, kan i andre sammenhenger misbrukes til kyniske formål, skriver professor Jan Ubøe i Bergens Tidende.

I gjennomsnitt har vi det godt her i landet.» Et flertall vil svelge dette rått, og å mene noe annet vil åpenbart være urimelig. Problemet er at utsagnet dypest sett er mer eller mindre tomt og sier lite eller ingenting om hvordan vi har det. Generaliseringer av denne typen kan være helt misvisende og gi absurde utslag.

I en artikkel i The American Statistician gir Appelton, French og Vanderpump (1996) et briljant eksempel på hvor galt det kan gå. 1314 kvinner ble intervjuet om deres røykevaner, og deltakerne i undersøkelsen ble fulgt opp over en periode på 20 år.

I løpet av denne perioden døde 23,9 prosent av røykerne, mens dødeligheten blant ikke-røykere var 31,4 prosent. I gjennomsnitt var altså dødeligheten langt høyere blant ikke-røykerne, noe som virker helt feil. Nå kunne en jo tro det var noe galt med undersøkelsen, men det er ikke forklaringen. En tilsvarende undersøkelse her til lands ville trolig gitt omtrent samme resultat.

I vår søken etter enkle beslutningsregler leter vi etter tall som kan måle prestasjoner og atferd. Alle mulige og umulige sammenhenger skal måles og rangeres. At statistisk teori sier at vi ikke uten videre kan vekte sammen likt og ulikt gir vi blankt blaffen i.

Det er så mye enklere med tall, vi slipper å forholde oss til individer og se enkeltmennesker i sin unike hverdag. Som matematiker er jeg naturligvis opptatt av tall, men ser samtidig at tall har klare begrensninger. Tall som i mange situasjoner gir oss verdifull informasjon, kan i andre sammenhenger misbrukes til mer eller mindre kyniske formål.

Når politikere snakker om mer helse for hver krone, nikker vi samtykkende. Det samme skjer når det kuttes bevilgninger til forskning som ikke er nyttig. Hvem kan vel være uenig i det? Bak begge disse prinsippene ligger imidlertid en implisitt vekting som utgir seg for langt mer enn det er grunnlag for.

Jeg mener sunt bondevett trumfer matematikk i slike sammenhenger, og når vi må prioritere mellom knappe ressurser bør vi stå oppreist og ikke gjemme oss bak tall som ikke er mer verdt enn tåkelagte halvsannheter.

Hva var galt med undersøkelsen av røykerne? Svaret er at det ikke var noe galt. Går vi nærmere inn på tallene, var dødeligheten for nesten alle aldersgrupper langt høyere for røykerne. Når utvalget ble trukket, var mange av røykerne dessverre allerede døde.

De var derfor sterkt underrepresentert i de eldre aldersgruppene hvor dødeligheten, av naturlige årsaker, var størst. Utvalget ble dermed dominert av livskraftige eldre ikke-røykere, og det er denne effekten som skaper et tilsynelatende paradoks.

For å forstå denne sammenhengen må vi forholde oss til mange tall samtidig, og innse at gjennomsnittet over hele utvalget ikke kan brukes til beslutninger.

Eksempelet til Appelton, French og Vanderpump er interessant på flere måter. Hadde tema for undersøkelsen vært mindre gjennomsiktig, tror jeg de fleste eksperter, meg selv inkludert, ville feiltolket informasjonen. Det viser at oss at statistisk analyse iblant er så vanskelig at selv eksperter trår feil.

Eksempelet viser også at det er mulig å fatte vedtak som virker å være til gunst for alle, men som faktisk er til ugunst for alle enkeltgrupperinger.

Det er ikke interessant at vi i gjennomsnitt har det godt her i landet, og gjennomsnittet er ikke et egnet verdikriterium for et samfunn. Samfunnet er ikke godt så lenge det finnes enkeltgrupper som sliter.

I Norge fins for eksempel en raskt voksende gruppe av unge, nyfattige gutter, som ikke har klart seg gjennom den gjennomsnittlige skolen. Vi må forstå at gjennomsnittet ikke gjelder alle, at vi alle er unike individer og at vi må behandles deretter.

Slutt å lete etter sannheten i ett eneste tall, eller lett omskrevet fra Tolkien: «One mean to rule them all and in the darkness bind them.»