Forræderiske tall 1: Gjennomsnitt

| March 2008

De fleste tallstørrelser er forræderiske. Som regel sier de noe, men ikke alt. Noen ganger legger de rett og slett et slør over realitetene. De kan forvirre mer enn forklar og gi innsikt. Som regel skyldes det at vi, gjennomsnitts-journalisten, Stortings-politikeren eller hvem det måtte være, ikke har et klart forhold til hva det er tallet forteller oss. Vi har ikke spurt oss hva det er vi lurer på. Da er vi fort ille ute og kjøre, når vi bruker og misbruker tall til å begrunne vårt syn, vinkle våre saker og i noen tilfeller fatte beslutninger og lage politikk.

Gjennomsnitt er intet unntak.

Et gjennomsnitt er summen av noe, delt på antall.

For eksempel at nordmenn (3.647.395 med inntekt) i 2006 i gjennomsnitt hadde en inntekt på 293.000, at nordmennene (4.737.171) i gjennomsnitt er 39 år gamle, og at de i gjennomsnitt brukte 191.250 kroner hver på kjøp av varer og tjenester i 2007.

Og hva sier så det? Tjente du 293.000 i 2006 og er du 39 år? Hvordan er det med naboen? Gjennomsnittsmennesket finnes bare i statistikken, pleier jeg å si.

Det viktigste gjennomsnittet ikke sier noe om, med mindre du finner frem tall for det, er variasjonen tallet har til høyre og venstre. Hvorfor det er viktig å se på variasjonen kan enkelt belyses ved å studere tallet for gjennomsnittsinntekt på 293.000 kroner. Da viser det seg fort at nesten 2/3 tjener mindre enn gjennomsnittet. Det kommer av at noen tjener veldig mye mer enn gjennomsnittet, og dermed drar det opp.

inntektsfordeling.jpg

Gruppen som tjener over 2 millioner, tjener i gjennomsnitt 14 ganger gjennomsnittslønnen. Gruppen som tjener under 100 tusen, tjener 12% av gjennomsnittslønnen. Nå er det færre av de som tjener mye enn av de som tjener lite, men de monner når det gjelder å dra opp gjennomsnittet, siden de tjener 109 ganger så mye som de som tjener minst.

Når jeg jobber med risiko, ser jeg på forventninger om en gjennomsnittlig fremtid. Ett tall kan ikke beskrive virkeligheten en gang i fremtiden på en god måte. Så i tillegg til det tallet, ser jeg på hvor mye jeg tror fremtiden vil kunne avvike fra gjennomsnittsanslag. Hvor galt og hvor bra kan det gå?, spør jeg meg selv. Og dermed har jeg laget en sannsynlighetskurve for det forventede gjennomsnittet. Den kan selvsagt også bomme formidabelt, men definitivt ikke like mye som det ene tallet kan.

Om gjennomsnitt kan det humoristisk sies at om du står men en hånd på kokeplata og en hånd i fryseren, så har du det i gjennomsnitt akkurat passe.

Det er også slik, faktisk, at omtrent 99+ prosent av befolkningen har flere enn gjennomsnittlig antall ben. Siden det nok er flere med ett ben enn med tre, blir gjennomsnittet uvergelig lavere enn to ben.

Jeg tror den nye templaten er beroligende. I fremtiden blir det nok mer nerding, mindre opphetede diskusjoner og mindre humor. I gjennomsnitt. Men for all del, det kan bli stor variasjon. Det er jeg helt sikker på.

;o)

Tags:

Category: Statistikk og analyse

Comments (15)

Trackback URL | Comments RSS Feed

  1. Anne says:

    Statistikk utgjør en veldig liten del av mine vekttall, allikevel føler jeg meg mye mer kunnskapsrik enn den gjennomsnittlige journalist eller stortingsrepresentant. Slikt føles alltid godt 🙂

  2. Goodwill says:

    Nå fikk du meg til å begynne å grave i langtidsminnet om varians og standardavvik. Det jeg husker er at det ene er kvadratroten av det andre. Eller motsatt.

    Han østerrikske alpinisten som falt så stygt i Kvitfjell har vel nå omtrent gjennomsnittlig antall bein. Et eksempel på at det ikke alltid er noe bra å være en gjennomsnittsmann…

  3. Iskwew says:

    Du har nok alle grunn til å føle deg mer kunnskapsrik enn gjennomsnitts-journalisten og stortingsrepresentanten, Anne!

    Goodwill, standardavviket er roten av variansen.

    Den stakkars alpinisten har godt under snittet, er jeg redd :o/ En utrolig tragisk sak.

  4. HvaHunSa says:

    Mindre opphetede diskusjoner? Betyr det at jeg har fått din del av gjennomsnittet? Hæ? HÆ?

  5. Iskwew says:

    Ja, jeg sendte dem til deg, HvaHunSa. Er ikke det greit gjort?

    :o)

  6. HvaHunSa says:

    SlemPåWew!

  7. Iskwew says:

    *smiler veldig uskyldig*

  8. Weinberg says:

    Men formelen er skikkelig fin. Du trenger en brøk, ett summetegn og en x med fotskrift. Mye enklere enn alskens hyoteser, variansanalyser, t- og F-tester som ikke er signifikante og derfor ikke sier noen verdens ting.

    Jeg er svak for sannsynlighetsvifter, men det er kanskje noe det er greiest å holde for seg selv.

  9. Håkon says:

    Da viser det seg fort at nesten 2/3 tjener mindre enn gjennomsnittet.

    Det er litt dumt at en tallmessig middelmådighet som gjennomsnitt får nesten all oppmerksomhet, og at vi glemmer enkle og robuste begrep som median (og den store søskenflokken med persentiler).

    Samme gjelder vel for standardavviket, som totalt oveskygger interkvartil avstand. Det får meg til å lure på om det finnes noen sosial rettferdighet i tallenes verden, egentlig.

    :o)

  10. Iskwew says:

    Ja, det er en veldig kjekk formel, Weinberg :o) Jeg er svak for hele sannsynlighetskurver – og ikke av den normale type. De finnes sjelden.

    Medianen er ikke så mye mer robust, egentlig, selv om den er mer robust, Håkon. Nå har jeg ikke detaljerte nok tall fra SSB til å regne det ut, men den så skjev ut den også.

    Standardavvik liker jeg derimot. Og skewness. Skewness sier mer enn tusen ord :o)

  11. Iskwew says:

    Når det gjelder tidsserier overser folk gjerne forøvrig en veldig viktig ting når de taster i vei i Excel og tror de finner svaret. Autokorrelasjon. Den kan få de høyeste forklaringsverdier til å vise seg helt uten verdi.

  12. Håkon says:

    Ok, det blir selvsagt galt å overvurdere medianen. På den annen side er nok persentiler oftere brukt i beskrivelser av lønnsfordeling enn standardavvik. Lettere å forholde seg til for de mindre tallvante. Når hverdagen stort sett er tall kan nok begreper som skewness og kortosis være mer presise og kompakte beskrivelser. 😉

  13. Håkon says:

    kurtosis (når skal jeg lære å skrive?)

  14. Iskwew says:

    Persentiler fungerer utmerket. Det aller viktigste er jo å vite at et gjennomsnitt eller en median sier veldig lite. Du må si noe om hvor skjeve fordelingene er. Men det gidder vel ikke gjennomsnitts-journalisten? :o)

  15. Håkon says:

    *drømmer om å si “interkvartilavstand” til en journalist*