Kredibilitetsteori

369 NFT 4/1994 Kredibilitetsteorien har sitt utspring i individuell erfa- ringstariffering i Workers’ Compensation Insurance, en slags yrkesskadeforsikring, i USA. Erfaringstariffering er fortsatt et viktig anvendelsesområde for kredibilitetsteo- rien, men den kan også benyttes til andre formål både innenfor og utenfor forsikring. I denne artikkelen skal vi illustrere grunnprinsippene i kredibilitetsteorien med utgangspunkt i et eksempel fra bilforsikring. Vi vil fortrinnsvis holde oss innenfor den frekventistiske kredibilitetsteorien hvor det forutsettes at vi har en del sammenlignbare poliser. Vi skal imidlertid også berøre den Bayesianske kredibilitetsteorien som gir oss mulighet til å kombinere subjektive vurderinger og objektive erfaringer på en systematisk måte. Kredibilitetsteori av Bjørn Sundt, The Wyatt Company, Oslo 1. Innledning I denne artikkelen vil jeg forsøke å gi en ele- mentær beskrivelse av hovedtrekkene i kredibi- litetsteorien. Jeg vil først gi en motivasjon gjennom et sterkt forenklet eksempel med erfa- ringstariffering i motorvognforsikring. Når vi har fått dette grunnlaget, vil jeg gi noen gene- relle betraktninger over kredibilitetsteori. Der- etter skal vi se på filosofien bak den såkalte Bayesianske kredibilitetsteorien. Denne teori- en gir mulighet til å kombinere objektive obser- vasjoner med subjektive oppfatninger på en systematisk måte. Når vi har sett på den Bay- esianske filosofien, vil jeg skissere et par gene- raliseringer av den teorien vi har gjennomgått. Til slutt vil jeg gi noen litteraturreferanser. For enkelte vil det kanskje virke uvant at jeg benytter terminologien krav, kravbeløp, osv. i stedet for skader, skadebeløp osv. Bakgrun- nen for at jeg benytter denne terminologien, er at en bileier kan ha en skade uten at han melder et krav til forsikringsselskapet, og selv hvis han melder et krav, kan det godt tenkes at kravbeløpet er mindre enn skadebeløpet pga. egenandeler og avkortning. 2. Et enkelt eksempel Kredibilitetsteorien ble opprinnelig utviklet for individuell erfaringstariffering. Den ame- rikanske skadeaktuarforeningen Casualty Actuarial Society nedsatte et utvalg som skul- Denne artikkelen er basert på et foredrag på et seminar i Oslo 14. juni 1994 i anledning at det var fem år siden The Wyatt Company startet sin virksomhet i Oslo. Bjørn Sundt 370 le foreslå erfaringstarifferingsordninger for Workers’ Compensation Insurance, en slags yrkesskadeforsikring. Utvalgets forslag ble i 1918 presentert i to artikler i foreningens tids- skrift. Erfaringstariffering er fortsatt det viktigste anvendelsesområdet for kredibilitetsteori. Innenfor dette rammeverket er formålet med erfaringstariffering å utnytte skadeerfarings- materialet fra den enkelte polise til å anslå den risiko som polisen representerer. I den grad høye kravbeløp i fortiden vil kunne indikere høye kravbeløp i fremtiden, bør dette medføre høyere premier i fremtiden. Grovt sagt kan vi altså si at vi ønsker å skille flaks og uflaks fra informasjon om polisens risikonivå. I den følgende motivering av kredibilitetste- ori skal vi ta utgangspunkt i bilforsikring. Dette er en bransje hvor erfaringstariffering er van- lig, som de fleste har en viss kjennskap til, og hvor det er lett å illustrere diverse fenomener vi skal berøre. La oss betrakte en bilforsikringspolise. Vi vet at antall krav fra en polise avhenger av flere faktorer. En del av disse blir benyttet i tariffe- ringen, f.eks. kjørelengde, distrikt, biltype. La oss foreløpig konsentrere oss om biltype. Vi vet at enkelte biltyper er mer utsatt for skader enn andre, og dette vil vanligvis reflekteres i tarifferingen; en VW Golf GTI får en høyere premie enn en Lada. La oss se på en forenklet situasjon hvor en polise kan ha høyst ett krav pr. år. For å slippe å tenke på antagelser om sannsynlighetsfor- delingen til kravbeløpet når skaden inntreffer, vil vi for enkelhets skyld inntil videre forutset- te at alle krav har kravbeløp én. Vi antar at sannsynligheten for krav er den samme i hvert år. Denne sannsynligheten vil avhenge av biltype; en VW Golf GTI vil ha en høyere sannsynlighet enn en Lada, og premien bør følgelig settes tilsvarende høyere. La oss nå imidlertid gjøre våre antagelser enda mer urealistiske og anta at vi ikke vet hva slags bil det er. Da vil vi vel antagelig basere premien på et observert gjennomsnitt over hele forsikringsbestanden uten hensyn til bil- type. Dette vil si at GTI-eieren vil gjøre en god handel, mens Lada-eieren vil komme dårligere ut. Så går tiden. Vi får etterhvert inn mange krav på GTI-polisen, og vi begynner å misten- ke at denne polisen er en dårligere risiko enn gjennomsnittet i bestanden. Hva gjør vi så? Én mulighet er å ikke gjøre noe i det hele tatt. Vi ganske enkelt lar premien være som før. En annen mulighet vil være å multiplisere premien med forholdet mellom gjennomsnittlig antall krav pr. år for denne polisen og gjennomsnitt- lig antall krav pr. poliseår i hele bestanden. Dette vil være den motsatte ytterlighet. Vi baserer den kravsannsynlighet som ligger til grunn for premien, utelukkende på de erfaring- er vi har med polisen. Dette er åpenbart svært ekstremt. Dersom vi har observert polisen i bare ett år, og den har hatt et krav i dette året, skal vi da anslå kravsannsynligheten for den- ne polisen med én, dvs. at vi forutsetter at polisen vil ha et krav i hvert år fremover? De fleste vil vel innvende at ett år er et altfor lite observasjonsmateriale for en slik løsning. Men kanskje vi kunne gjøre det etter ti år? Da ville jeg spørre: Hva med ni? Da ville kanskje selskapet bli mer usikkert og si: tja, jo, kanskje. Hva med åtte år? Hva jeg vil frem til, er at det virker nokså vilkårlig hvor man setter grensen for å utnytte erfaringene for den enkelte polise. Og er det i det hele tatt rimelig å ha en slik grense? Er det slik at det finnes et antall år som er slik at dersom polisen er observert i minst så mange år, kan vi basere premien helt og hol- dent på erfaringene fra polisen, men hvis den er observert kortere, kan vi ikke utnytte indivi- duelle erfaringer i det hele tatt? Når vi stiller spørsmålet på denne måten, må vel svaret bli nei. Hva vi trenger, er en gradvis overgang. En slik overgang kan vi få gjennom kredibilitets- teorien. Kredibilitetsteorien ligger innenfor rammen av sannsynlighetsteori og matematisk statis- tikk. Innenfor dette rammeverket må vi først ha 371 en sannsynlighetsteoretisk modell. En slik modell skal være en beskrivelse av den del av virkeligheten vi er interessert i, uttrykt i sann- synlighetsteoretisk terminologi. Som vi alle vet, er virkeligheten gjerne svært komplisert, og skulle vår modell gi en perfekt beskrivelse av virkeligheten, ville den bli vanskelig å hånd- tere matematisk. Videre ville den måtte inne- holde mange parametre, og jo flere parametre vi må anslå utfra et, ofte nokså begrenset, datamateriale, dess større usikkerhet vil det bli i anslagene. En sannsynlighetsteoretisk mo- dell vil altså alltid måtte bli et kompromiss mellom realisme og matematisk håndterbarhet. En modell vil i seg selv ikke være tilstrekkelig til å kunne anslå en størrelse innenfor model- len, f.eks. risikonivået for en polise som grunn- lag for å fastsette en premie. Et slikt anslag vil være basert på en metode. Det finnes åpenbart utallige metoder, men vi føler vel umiddelbart at ikke alle metoder er like gode. Men hva mener vi når vi sier at én metode er bedre enn en annen? For å kunne gjøre et slikt utsagn trenger vi et optimalitetskriterium, dvs. et mål for hvor god en metode er innenfor vår modell. For å oppsummere, for å kunne utlede en premie innenfor vårt rammeverk vil vi trenge tre ingredienser: En modell, et optimalitetskriteri- um og en metode. La oss nå gå tilbake til vårt eksempel og forsøke å modellere situasjonen. Vi antok altså at en polise kan ha høyst ett krav pr. år og at alle krav har kravbeløp lik én. Som vi har nevnt tidligere, vil kravsannsyn- ligheten være forskjellig for forskjellige bilty- per. La oss derfor anta at sannsynligheten for krav for biltype i er ? i. Vi antar at for en polise med denne biltypen er kravsannsynligheten hvert år lik ?i uansett hvor mange krav polisen har hatt tidligere. Dette vil altså si at dersom biltype er kjent, vil ikke antall krav i fortiden inneholde noe mer informasjon om antall krav i fremtiden enn den informasjon som ligger i biltype, og det vil derfor ikke være grunnlag for individuell erfaringstariffering. La oss nå imidlertid, som ovenfor, anta at biltype er ukjent. Da blir situasjonen straks annerledes. Nå vil et høyt antall krav kunne tyde på at bilen er av en type med høy krav- sannsynlighet. Nå vil altså de observerte kravtall gi oss informasjon om antall krav i fremtiden utover den informasjon vi hadde i de andre tarifferingskriteriene. Jo lenger vi obser- verer polisen, dess større grunnlag vil de ob- serverte kravtallene gi for å kunne si noe om kravsannsynligheten for denne polisen. Det er altså nå grunnlag for å benytte individuell erfaringstariffering; de individuelle kravtall- ene inneholder mer informasjon enn det vi hadde fra før. Figur 1. Illustrasjon av urners urne modell 372 Figur 2. Simulasjonseksempel Situasjonen kan beskrives ved hjelp av en urners urne modell, eller om man vil, ved dob- belt trekning. En slik modell er illustrert i Figur 1. Vi har en bestand av forskjellige biler med forskjellige kravsannsynligheter. Utfra denne bestanden trekker vi en bil. La oss kalle krav- sannsynligheten for denne bilen ?. For oss er ? ukjent, men vi vet kanskje, eller kan anslå utfra statistiske data, noe om fordelingen til ? i bestanden; vi kan f.eks. vite at for 10 % av bilene er ? mindre enn 5 %, for 20 % av bilene er ? mindre enn 12 % osv. Vi betrakter altså ? som en stokastisk variabel, dvs. en tilfeldig størrelse som har en sannsynlighetsfordeling. Når vi har trukket ut ? (eller bilen), trekker vi med sannsynlighet ? om polisen skal ha krav i et gitt år, og disse trekningene gjøres uav- hengig for forskjellige år. I et Lotus regneark har vi simulert situa- sjonen beskrevet ovenfor. Vi trekker først en verdi av ? utfra en gitt sannsynlighetsfor- deling. Denne fordelingen er valgt slik at de beregninger vi etterhvert skal gjøre, ikke blir for kompliserte, kfr. diskusjonen om kompro- miss mellom realisme og matematisk håndter- barhet. Deretter trekker vi ut krav for tyve år med kravsannsynlighet lik den uttrukne ver- dien av ?. Resultatet kan vises grafisk. I diagrammet i Figur 2 viser vi de observerte kravtall, gjennomsnittlig antall krav pr. år opp til og med det observerte år, ? og forventet verdi av ? dvs. gjennomsnittlig verdi i den sannsynlighetsfordelingen vi har trukket ? fra. Ikke uventet ser vi at når tiden går, blir det observerte gjennomsnittet stadig mer stabilt, og det vil etterhvert nærme seg den uttrukne verdi av ?. Det vi ønsker å benytte vår statistiske mo- dell til, er å anslå en premie for vår polise. Vi har funnet ut at forventet verdi av ? tar for lite 373 hensyn til de individuelle erfaringer, mens det observerte gjennomsnitt tar for mye hensyn til slike erfaringer. For å kunne diskutere valg av metode, må vi først bestemme oss for et optimalitetskriterium, dvs. hvilke egenskaper vi vil at premien skal tilfredsstille. Hvis vi ser bort fra eventuelle omkostningstillegg og sik- kerhetstillegg, vil vi vel at premien skal ligge så nær som mulig risikonivået for polisen. Vi må altså bestemme oss for et avstandsmål mellom premien og risikonivået representert ved ?. Det vanligste avstandsmålet som benyttes i denne sammenheng, er forventet kvadratisk tap; jeg vil ikke her gå nærmere inn på en eksakt definisjon av dette begrepet. Også her er det et kompromiss mellom rimelig- het og matematisk håndterbarhet. En muli- gens uheldig egenskap ved forventet kvadra- tisk tap er at virkningen på dette optimalitets- kriteriet av å legge premien la oss si hundre kroner under det optimale vil være den samme som om vi legger premien hundre kroner over det optimale; for forsikringsselskapet vil det vel virke mer betenkelig å legge premien hund- re kroner for lavt enn hundre kroner for høyt. På den annen side kan det vel virke tillitvek- kende at ved å minimere forventet kvadratisk tap vil den forventede verdi av premien være lik den forventede verdi av kravene; en får altså en likevekt over bestanden. Vi har nå valgt en modell og et optimalitets- kriterium, og vi kan da i prinsippet utlede en optimal metode. Uten noen flere restriksjoner vil imidlertid den optimale metoden kunne virke nokså komplisert. For å få til en enklere metode kan en eventuelt forenkle modellen. Vi skal imidlertid i stedet innskrenke klassen av mulige metoder; vi begrenser oss til å se på klassen av linære estimatorer, dvs. klassen av metoder som er lineære i de kravtall vi har observert. På grunn av symmetri vil denne klassen avhenge av de observerte kravtall bare gjennom deres gjennomsnitt. Den opti- male formel for premien i forsikringsår n+1, dvs. basert på erfaringer fra de n første fors- ikringsårene, er Vi kaller premien : ?n+1 kredibilitetspremien for år n+1. Vi ser at denne premien blir et veiet gjennomsnitt mellom det observerte gjennom- snittlige antall krav pr. år for polisen _ Xn og forventet antall krav pr. poliseår i hele for- sikringsbestanden (dvs. forventningen til ?), µ. Den vekten vi gir til erfaringene, ?n , kan skrives på formen Vi ser at denne vekten vokser når antall observerte år (n) vokser. Dess mer erfaringer vi får, jo mer pålitelig informasjon inneholder de, og jo mer vekt kan vi derfor legge på dem. Når n=0, dvs. at polisen er ny og vi ikke har noen observasjoner fra den ennå, blir ?n lik null, dvs. vi legger all vekt på de kollektive erfaringene fra bestanden, representert ved forventningen µ. Når antall observasjonsår vokser mot uende- lig, vil ?n vokse mot 1, dvs. at observasjonsma- terialet fra polisen blir så informativt at vi legger all vekt på det og ingen vekt på de kollektive erfaringer. Vi ser også at ?n avtar når parameteren ? vokser. La oss derfor se litt nærmere på hva ? er. Vi kan skrive ? som hvor ? er et mål på variasjonene fra år til år i observasjonene fra en fast polise mens ? er et mål på variasjonene i risikonivået (representert ved ?) fra polise til polise. Vekten ?n avtar når ? vokser; når det er store variasjoner fra år til år innen polisen, vil ikke erfaringene inneholde pålitelig informasjon om risikonivået for poli- sen, og vi vil derfor tillegge dem liten vekt og legge desto større vekt på de kollektive erfa- ringer fra bestanden. På den annen side ser vi at ?n vokser når ? vokser; når det er storevariasjoner i risikonivå mellom polisene, kan vi ikke legge stor vekt på de kollektive erfaringene, og vi legger derfor desto større vekt på de individuelle erfaringene fra polisen. 374 La oss nå gå tilbake til regnearket vårt. I Figur 3 har vi plottet kredibilitetsvekten ?n somfunksjon av antall observasjonsår n. Figur 4 viser et tilsvarende diagram til diagrammet i Figur 2, men vi har nå i tillegg til de størrelsene som var vist i Figur 2, også tegnet inn kredibi- litetspremien. Ikke uventet ser vi at kredibili- tetspremien ligger mellom det observerte gjen- nomsnitt _ Xn og forventningen µ, og desslenger tiden går, jo nærmere det observerte gjennomsnitt kommer kredibilitetspremien. Vi ser også at det observerte gjennomsnitt svin- ger voldsomt i de første årene hvis det da er variasjon i antall krav fra år til år. I og med at vekten som gis til erfaringene, er liten til å begynne med, blir disse svingningene mye mindre for kredibilitetspremien, noe som også er en attraktiv egenskap ved denne premien. I praksis kan det ofte være hensiktsmessig å beregne kredibilititetspremien : ?n rekursivt. Figur 3. Kredibilitetsvekten ?n i simulationseksempelet Figur 4. Simulasjonseksempelet med kredibilitetsestimator Vi ser altså at kredibilitetspremien : ?n har en del attraktive egenskaper, egenskaper som det også burde kunne gå an å forklare forsik- ringstagerne. 375 La Xn betegne antall krav inntruffet i år n. Utfra de uttrykk vi har stilt opp ovenfor, kan vi lett utlede at Kredibilitetspremien kan altså uttrykkes som et veiet gjennomsnitt mellom det observerte kravbeløpet og kredibilitetspremien for siste år. Vekten til kravbeløpet vil selvfølgelig avta når tiden går; dess flere observasjonsår vi får, jo mindre ny informasjon om risikonivået til polisen vil et nytt observasjonsår gi. Vi har til nå konsentrert oss om å betrakte en enkelt polise. Vi fortolket verdien til kravsann- synligheten ? som om vi foretok en trekning av bilmodell utfra bestanden av alle biler. Sann- synlighetsfordelingen for ? er bestemt av fordelingen av bilmodeller i forsikringsbestan- den. Dersom vi nå betrakter flere poliser simul- tant, er det vel naturlig å anta at resultater fra forskjellige poliser er uavhengig av hverandre. Videre kan vi anta at ?-er fra forskjellige poliser er trukket fra samme fordeling; ?-ene er altså uavhengige og identisk fordelte. Den felles sannsynlighetsfordelingen til ?-ene beskri- ver risikostrukturen i forsikringsbestanden, og den kalles derfor strukturfordelingen. I de formlene vi har satt opp for kredibilitets- premien, inngår ikke data fra andre poliser enn den ene vi betrakter. Det følger av at polisene er uavhengige, at andre poliser ikke inneholder noen informasjon om ?-en for den polisen vi betrakter. En kan derfor stille spørsmål om hvorfor vi i det hele tatt poengterer at ?-er fra forskjellige poliser er identisk fordelte, når disse polisene ikke i noe tilfelle inneholder noen ny informasjon. Grunnen har sammen- heng med at formlene for kredibilitetspremien avhenger av parametrene ?, ? og µ. Påstanden om at andre poliser ikke inneholder noen rele- vant informasjon, gjelder hvis vi forutsetter at verdien av disse parametrene er kjent. Dette er vanligvis ikke tilfelle. Antagelsen om at ?-er fra forskjellige poliser er uavhengige og iden- tisk fordelte, medfører at alle polisene har sam- me verdi av disse parametrene, og dette gjør at vi utfra data fra vår forsikringsbestand kan estimere parametrene. De estimatene vi får, kan benyttes for alle poliser i bestanden og nye poliser som går inn i bestanden. Som vi har sett, avhenger de estimerte parametrene av strukturfordelingen, og de blir defor kalt struk- turparametre. Vår situasjon kan beskrives ved en avled- ning av et sitat fra George Orwell: ”Alle poliser er like, men noen poliser er likere enn andre.” I utgangspunktet er alle polisene like; vi antar at ?-er fra forskjellige poliser er identisk for- delt. Imidlertid, polisene er allikevel forskjelli- ge; forskjellene fremkommer ved at ?-er fra forskjellige poliser har forskjellige verdier. 3. Generelle betraktninger I vårt enkle eksempel antok vi at hver polise hadde en ukjent risikoparameter som repre- senterte bilmodell. Denne risikoparameteren kunne betraktes som en stokastisk variabel med en sannsynlighetsfordeling som repre- senterte fordelingen av risiko i forsikrings- bestanden ved at forskjellige bilmodeller har forskjellig risiko. Riskoparametre fra forskjellige poliser var uavhengige av hverandre, men hadde samme sannsynlighetsfordeling. Vårt eksempel var av flere grunner svært urealistisk. For det første vil vel vanligvis bilmodell være kjent og benyttes som tariffe- ringskriterium. For det andre var selve model- leringen av situasjonen sterkt forenklet, kan- skje særlig forutsetningen om at polisen kan ha høyst ett krav pr. år og at alle krav har krav- beløp lik én. Imidlertid gjorde dette forenklede rammeverket det mulig for oss å beskrive grunn- tankene i kredibilitetsteorien på en mer over- siktlig måte: Modell. Vi antok at risikonivået ved den enkelte polise var karakterisert ved en stokas- 376 tisk variabel ?. Når vi holdt denne variabelen fast, var fremtiden uavhengig av fortiden. Imidlertid, ved at ? er en stokastisk variabel, vil fortiden si noe om risikonivået utover det vi vet fra før og derved noe om fremtiden. For å kunne benytte kolaterale data (data fra andre poliser) til å estimere ukjente parametre i modellen, antok vi at ?-er fra forskjellige poliser var uavhengige og identisk fordelte. Optimalitetskriterium. Vi benytter minime- ring av forventet kvadratisk tap. Som vi har sett, har dette optimalitetskriteriet både forde- ler og ulemper. Metode. Når vi skal finne en optimal metode i forhold til dette optimalitetskriteriet, begren- ser vi oss til klassen av metoder som er lineære i en gitt mengde av observasjoner. Denne innskrenkningen gjør vi av flere grunner: a) Metodene blir enklere og kan lettere for- tolkes. b) Estimering av ukjente parametre blir enk- lere. c) Dersom vi hadde sett på hele klassen av metoder, ville den optimale metoden ha forut- satt en mer detaljert spesifikasjon av modellen. La oss se litt nærmere på forutsetningen om at risikoen ved polisen er karakterisert ved en stokastisk variabel ?. I vårt eksempel antok ? verdier mellom null og en; vanligvis er den av mer generell og abstrakt karakter. I motorvogntariffering benytter man vanlig- vis flere objektive tariffkriterier i premiefastset- telsen: distrikt, kjørelengde, biltype, osv. I tillegg blir det imidlertid alltid noe igjen. Det er fortsatt individuelle forskjeller som de objekti- ve tarifferingskriteriene ikke i tilstrekkelig grad tar hensyn til. Dette kan ha flere grunner: 1. Ikke alle risikokriterier er direkte observer- bare og objektivt kvantifiserbare. Noen er gode bilførere og andre dårlige. Vi har den middelaldrende mannen med hatt, som i og for seg kjører forsiktig, men ikke alltid legger merke til at det blir rødt lys eller at en tannlege er i ferd med å krysse gaten. 2. Enkelte risikokriterier ville være politisk uakseptable eller ikke bli forstått av kundene. Et godt eksempel på politisk uakseptable krite- rier, er en undersøkelse fra Belgia som indikerte at fransktalende bilførere var dårligere risiki en flamsktalende. 3. Enkelte risikokriterier ville kunne bli mani- pulert av forsikringstageren. Et godt eksempel er forsikringstagerens kjønn. Dersom det var billigere for kvinner å få forsikring, ville vel mange menn overføre familiebilen på sin kone. 4. For mange tarifferingskriterier ville gjøre tariffen for komplisert og gjøre parameter- estimering usikker. 4. Bayesiansk kredibilitetsteori Vi har til nå antatt at hver polise i forsikrings- bestanden har en stokastisk risikoparameter som karakteriserer polisen. Vi antok at for- skjellige poliser var uavhengige og at deres risikoparametre hadde samme sannsynlighets- fordeling. Denne fordelingen kalte vi struktur- fordelingen. Strukturfordelingen represente- rer fordelingen av risikoegenskaper i bestan- den, og den har altså en frekvensfortolkning. Når sannsynlighetsfordelingen til risikopara- meteren har en slik frekvensfortolkning, er vi innenfor den frekventistiske kredibilitetsteo- rien. Det finnes imidlertid også en kredibilitetste- ori hvor sannsynlighetsfordelingen til risiko- parameteren ikke har en frekvensfortolkning, nemlig Bayesiansk kredibilitetsteori. I denne teorien representerer sannsynlighetsfordelin- gen til risikoparameteren statistikerens a priori oppfatning av usikkerhet om hvor den virkeli- ge verdien av risikoparameteren ligger, og denne sannsynlighetsfordelingen kalles der- for gjerne a priori-fordelingen. Hvis det ifølge a priori-fordelingen er 10 % sannsynlighet for at risikoparameteren er mindre enn 5 %, vil dette si at på bakgrunn av statistikerens intu- isjon og de opplysninger han sitter inne med om den aktuelle problemstillingen, mener han 377 at det er 10 % sannsynlighet for at risikopara- meteren er mindre enn 5 %. Når den Bayesianske statistikeren gjør ob- servasjoner, oppdaterer han sin a priori-forde- ling på grunnlag av observasjonene. A priori- fordelingen erstattes altså med en a posteriori- fordeling, og denne a posteriori-fordelingen blir a priori-fordeling i forhold til observasjo- ner som foretas etter oppdateringen av forde- lingen. Mens statistikeren til å begynne med kanskje har en nokså vag oppfatning om hvil- ken verdi risikoparameteren har, vil han etter- hvert bli sikrere jo mer informasjon han får. Bayesianeren lærer av sine erfaringer. I et Lotus regneark har vi laget et enkelt eksempel. Med risikoparameter ?=0,18 foretar vi uavhengige trekninger av tall som er lik 1 med sannsynlighet ? og 0 ellers. Vi antar at en Figur 5. A priori-fordelingen og a posteriori-fordelingene etter 1, 2, 5, 10 og 20 observasjoner. statistiker ikke kjenner verdien av ?. Utfra sin a priori kunnskap har han ikke noen oppfat- ning av om det er mer sannsynlig at ? ligger innenfor et område enn et annet av samme størrelse. Han har da en uniform a priori- fordeling, som er den minst informative a pri- ori-fordeling man kan ha i denne situasjonen. Diagrammet i Figur 5 viser a priori-fordelingen samt a posteriori-fordelingene etter 1, 2, 5, 10 og 20 observasjoner. Vi ser at mens a priori- fordelingen er helt flat, vil a posteriori-fordelin- gen etterhvert konsentrere seg omkring ver- dien til ?. Som vi har sett, ligger det en stor grad av subjektivitet i Bayesiansk statistikk. Dette er blitt en del kritisert av frekventistiske statisti- kere. Imidlertid, ligger ikke den Bayesianske statistikerens oppdatering av a priori-fordelin- 378 gen veldig nær opptil den måten vi tenker på? Er det ikke slik at vi endrer våre vurderinger på bakgrunn av ny informasjon? Bayesiansk statistikk er blitt kritisert for at våre slutninger vil avhenge av den subjektive a priori-fordelin- gen. Forskjellige statistikere med forskjellige a priori-fordelinger vil altså kunne komme til forskjellige konklusjoner. Imidlertid er det slik at ved rimelige valg av a priori-fordelinger vil a posteriori-fordelingene nærme seg hveran- dre mer og mer når antall observasjoner øker. Selv om forskjellige statistikere i utgangspunk- tet er uenige, vil de altså bli mer enige ved å betrakte det samme observasjonsmaterialet, noe som også er i overensstemmelse med den måten vi tenker på. Er så Bayesiansk statistikk anvendelig i fors- ikring? Jeg mener ubetinget ja. I massebran- sjer som f.eks. bilforsikring kan man tillate seg å være frekventist. Her har en et stort obser- vasjonsmateriale av sammenlignbare poliser. Dette er ikke tilfelle ved forsikring av oljeplatt- former. Her må man i mye større grad basere seg på kvalifisert skjønn med utgangspunkt i tekniske vurderinger. Bayesiansk statistikk gir en mulighet til å systematisere og kvantifi- sere dette skjønnet. Langt på vei er det stor likhet mellom metod- ene i frekventistisk og Bayesiansk kredibili- tetsteori. I begge tilfeller ønsker man å estimere en ukjent stokastisk størrelse med en estimator som er lineær i et sett av observasjoner. Den størrelsen vi er interessert i å estimere, esti- manden, avhenger av en ukjent stokastisk risikoparameter ?, og koeffisientene i den optimale lineære estimatoren, kredibilitetsesti- matoren, vil avhenge av sannsynlighetsforde- lingen til ?. I frekventistisk kredibilitetsteori vil denne fordelingen vanligvis være ukjent, og vi estimerer parametre i den ved hjelp av data fra en bestand av sammenlignbare poli- ser. I Bayesiansk kredibilitetsteori har det ingen mening å estimere disse parametrene. Sannsynlighetsfordelingen til ? represente- rer jo statistikerens subjektive oppfatning, og følgelig er denne fordelingen og dens parame- tre kjente for ham. Siden man i frekventistisk kredibilitetsteori ved hjelp av empiriske data estimerer parametre som for Bayesianeren er kjente, blir den frekventistiske kredibilitetste- orien også ofte kalt empirisk Bayesiansk. 5. Noen generaliseringer I de eksemplene vi har sett på til nå, har vi arbeidet innenfor svært enkle og urealistiske modeller. I praktiske anvendelser vil disse modellene vanligvis i for liten grad gjenspeile virkeligheten. Jeg vil derfor i det følgende skissere enkelte måter å generalisere modellen på. I presentasjonen skal vi for enkelhets skyld se på forskjellige muligheter for generalise- ringer separat, men det er også mulig å kombi- nere dem. 5.1. Bühlmanns modell Dette er en av de enkleste kredibilitetsmodel- lene. Vi antar at når risikoparameteren er gitt, er de samlede kravbeløp fra forskjellige skade- år uavhengige og har samme sannsynlighets- fordeling. Kredibilitetspremien blir på samme form som i det enkle tilfellet vi tidligere studer- te. 5.2. Bühlmann-Straubs modell I Bühlmanns modell antar man at alle poliser og alle skadeår har samme risikovolum. I praksis kan imidlertid i enkelte bransjer forskjellige poliser ha forskjellig størrelse, og størrelsen på den enkelte polise kan variere fra år til år. Et godt eksempel er obligatorisk reassuranse, hvor man kan betrakte cedentens brutto opp- tjente premie som et mål på risikoeksponering- en i den reassurerte portefølje. Bühlmann og Straub beskrev sin modell ved hjelp av ska- dekvoter definert som det totale kravbeløp for inntrufne skader dividert med risikoekspone- 379 ringsvolumet. Analogt med Bühlmanns mo- dell antas det at for gitt risikoparameter er skadekvotene fra forskjellige år uavhengige, og de har samme forventning. Imidlertid har de ikke samme sannsynlighetsfordeling. Varian- sen blir mindre jo større risikoeksponerings- volumet er. Dette vil si at jo større risikoekspo- neringsvolumet er, desto mindre varierer ska- dekvotene for en gitt reassurert portefølje fra år til år. Ikke uventet er vi villige til å gi mer vekt til de individuelle erfaringer, jo større eksponeringsvolumer vi har observert. Bühlmanns modell fremkommer som et spesialtilfelle av Bühlmann- Straubs modell ved å sette risikoeksponerings- volumet lik 1 for alle skadeår. Forskjellige varianter av Bühlmann- Straubs modell er blitt anvendt ved erfarings- tariffering i gruppelivsforsikring. 5.3. Regresjonsmodeller Ved generaliseringen av Bühlmanns modell til Bühlmann-Straubs modell forlot vi antagelsen om at vi for forskjellige skadeår har samme sannsynlighetsfordeling for våre observasjo- ner gitt risikoparameteren. Imidlertid antok vi fortsatt at forventningen til våre observasjo- ner var uavhengig av tiden. Det finnes også regresjonsmodeller hvor den betingede for- ventningen vil avhenge av tiden eller andre kriterier. En kan for eksempel tenke seg en trend som kan være forskjellig for forskjellige poliser. En annen anvendelse er å betrakte tiden som polisens alder i stedet for kalender- tid. Da vil avhengigheten av tid kunne fortol- kes som en læringseffekt. Jo lenger polisen har vært i kraft, dess mer erfaring har forsikring- stageren oppnådd. Regresjonsmodeller av denne typen er fore- slått for IBNR-reservering (IBNR = Incurred But Not Reported), dvs, avsetning av reserver for krav som er inntruffet, men ikke meldt til forsikringsselskapet. Her antas det at hvert skadeår har en stokastisk risikoparameter som karakteriserer det enkelte skadeår. Våre observasjoner blir her kravbeløpene meldt i forskjellige år for dette skadeåret, og vi ønsker å estimere hvor mye som fortsatt ikke er meldt. En regresjonsmodell av en litt annen type er blitt anvendt ved merketariffering i bilforsikring. Her antar vi at de individuelle risikoegenska- pene til hver bilmodell er karakterisert ved en ukjent stokastisk risikoparameter. Den ube- tingede forventning, dvs. forventning også over variasjonen i risikoparameteren, til den størrelsen vi ønsker å estimere, avhenger av enkelte tekniske data som antall hestekrefter, pris, vekt, osv. Dette blir vårt forslag til bilmer- kefaktor for en ny bilmodell hvor vi ikke har data. Når vi får data for bilmodellen, blir vårt nye anslag et veiet gjennomsnitt av vårt opp- rinnelige anslag og våre erfaringer. Den vek- ten vi gir til erfaringene, blir større jo større erfaringsmateriale vi har. 5.4. Rekursiv kredibilitet I de modellene vi har omtalt til nå, har vi antatt at risikoparameteren for en polise er den sam- me hele tiden. Den utvikler seg ikke over tid. I praksis kunne man godt tenke seg situasjoner hvor det kunne være ønskelig å anta at risiko- parameteren kan endre seg over tid. Et godt eksempel er obligatorisk reassuranse, hvor sammensetningen av den reassurerte porte- følje kan endre seg over tid. I de modeller som er utviklet for slike situasjoner, har man forsøkt å modellere utviklingen i risikoparameteren på en slik måte at kredibilitetsestimatoren kan beregnes på en ikke for komplisert måte. Selv i disse modellene er det imidlertid vanligvis ikke mulig å finne pene eksplisitte uttrykk for kredibilitetsestimatorene. Man kan derimot finne enklere rekursive metoder. I en modell som ofte blir benyttet, vil kredibilitetsestima- toren avhenge av observasjonsmaterialet bare gjennom siste års observasjon og kredibili- tetsestimatoren fra året før. I en enkel modell av denne typen uten varie- 380 rende risikoeksponeringsvolum vil nyere data få større vekt enn eldre. Dette er ikke tilfelle i Bühlmanns modell som vi så på tidligere. Av og til blir Bühlmanns metode kritisert for dette. Dette er imidlertid å rette baker for smed. Hvis vi betrakter de modellforutsetningene som lig- ger til grunn for Bühlmanns metode, ser vi at det ikke er noe i modellforutsetningene som skulle tilsi at nyere data er mer relevante enn eldre data. Er det noe som skal kritiseres, er det altså Bühlmanns modell, ikke Bühlmanns me- tode. Når vi åpner for at risikoparameteren kan utvikle seg over tid, er det naturlig at eldre data får mindre vekt. Jo eldre observasjonene er, dess mindre vil daværende risikoparameter si om risikoparameteren i dag. Dette peker på en mer generell problemstilling: Er det noe som virker urimelig ved en metode, bør en vurdere om det er metoden i seg selv det er noe galt med, eller om det er en konsekvens av at modellfo- rutsetningene ikke er tilstrekkelig realistiske. Rekursive metoder for kredibilitetsestima- torer er nært beslektet med Kalman-filtre som blir benyttet av bl.a. fysikere, ingeniører og økonomer. 5.5. Kredibilitetsmodeller med trunkering La oss for enkelhets skyld gå tilbake til den enkle Bühlmann-modellen igjen. Et problem ved praktisk anvendelse av denne modellen kan være at dersom en polise har et veldig stort krav, vil premien neste år bli urimelig høy. Én måte å unngå dette på er å trunkere observasjo- nene. Dersom det totale kravbeløp for en polise i et år overstiger en viss grense, er det bare denne grensen som skal inngå i kredibili- tetsestimatoren, ikke hele kravbeløpet. I og med at man her begrenser de tilfeldige varias- jonene fra år til år, vil man ved en slik estimator i enkelte tilfeller kunne legge større vekt på de individuelle erfaringer enn ved utrunkerte observasjoner. Dessverre vil det i praksis kunne være vanskelig å bestemme et optimalt trunkeringspunkt, og bestemmelse av dette vil kreve mer informasjon om sannsynlighetsfor- delingene i modellen enn ved utrunkerte ob- servasjoner. Kredibilitetsestimatorer med trunkerte ob- servasjoner blir benyttet i kollektiv sykeforsik- ring i Sveits. 5.6. Hierarkisk kredibilitets- modell I vår motivering av frekventistisk kredibilitets- teori tok vi utgangspunkt i en forsikringsbest- and hvor hver polise var karakterisert ved en ukjent stokastisk risikoparameter ?. Gitt ver- dien av ? var de totale kravbeløp fra forskjel- lige år uavhengige av hverandre. Vi antok at resultatene fra forskjellige poliser var uav- hengige av hverandre, og at risikoparametrene fra forskjellige poliser hadde samme sannsyn- lighetsfordeling. En interessant generalise- ring er å se på en hierarkisk kredibilitetsmodell, dvs. en kredibilitetsmodell med stokastiske risikoparametre på flere nivåer. La oss anta at vår forsikringsbestand kan inndeles i forskjel- lige distrikter Vi mistenker at disse kan ha forskjellige risikoegenskaper. Helt tilsvarende antagelsen om stokastiske risikoparametre for polisene kan vi anta at hvert distrikt er karak- terisert ved en stokastisk risikoparameter H (gresk eta!). Vi antar at risikoparametrene for forskjellige distrikter er uavhengige og har samme sannsynlighetsfordeling. Innenfor hvert distrikt erstatter vi den gamle antagelsen om at risikoparametrene for forskjellige poliser er uavhengige, med den svakere antagelsen om at de er betinget uavhengige for gitt verdi av risikoparameteren for distriktet. En slik hierarkisk modell er illustrert i Figur 6. Som vi ser, er det en svært lik struktur på de to nivåene i en hierarkisk kredibilitetsmodell. Dette medfører at det faktisk ikke er så vanske- lig å konstruere kredibilitetsestimatorene i sli- ke modeller. Det finnes resultater som gjør det relativt enkelt å konstruere kredibilitets- 381 estimatorer i en hierarkisk modell utfra de tilsva- rende kredibilitetsestimatorer i en analog ikke- hierarkisk modell. Denne teorien kan også benyttes på modeller med risikoparametre på mer enn to nivåer, f.eks. polise - kommune - fylke. Som motivasjon for hierarkiske modeller så vi på tilfellet med distrikter. En annen anven- delse er i gruppelivsforsikring av bedrifter. Her kan man tenke seg ett nivå av risikopara- metre for polise og ett for type bedrift. En hierarkisk modell kan også benyttes av en Bayesianer til å modellere en forsikringspor- tefølje. Han vil kunne la ?-ene representere risikoegenskaper ved forskjellige poliser. Den felles sannsynlighetsfordelingen til ?-ene avhenger av en ukjent parameter H, og Baye- sianeren modellerer sin oppfatning av dennne parameteren i en a priori-fordeling. 6. Supplerende litteratur Det eksisterer en omfattende litteratur om kredibilitetsteori. De fleste arbeidene er imid- lertid skrevet for aktuarer og statistikere og vil kunne være vanskelig tilgjengelig hvis man ikke har denne bakgrunn. For å antyde hvilken gruppe lesere de følgende referansene kan egne seg for, har jeg i litteraturlisten markert lett tilgjengelige arbeider med (*), middels til- gjengelige arbeider med (**) og tyngre arbei- der med (***). For å antyde hvor i området arbeidet ligger, har jeg i enkelte tilfeller lagt inn et pluss eller minus. Norberg (1979) er et oversiktsforedrag om kredibilitetsteori. Hossack, Pollard & Zehn- wirth (1983), Straub (1987), Casualty Actuarial Society (1990) og Sundt (1993) er, nevnt etter stigende vanskelighetsgrad, lærebøker om skadeforsikringsmatematikk med kapitler om kredibilitetsteori. Anvendelse av Bühlmann-Straub-modellen for erfaringstariffering i gruppelivsforsikring diskuteres av Norberg (1989) og anvendelse av regresjonsmodeller i IBNR-reservering av Norberg (1986). Sundt (1987) ser på regres- jonsmodeller for merketariffering i motorvogn- forsikring. Gisler (1980) behandler kredibili- Figur 6 Hierarkisk kredibilitetsmodell 382 tetsestimering ved trunkering. De Jong & Zehnwirth (1984) diskuterer sam- menhengen mellom kredibilitetsteori og Kal- man-filter-teori. Casualty Actuarial Society (1990) (**-). Foun- dations of casualty actuarial science. Casual- ty Actuarial Society, New York. De Jong, P. & Zehnwirth, B. (1984) (***-). Credibility theory and the Kalman filter. Insurance: Mathematics & Economics 2, 281- 286. Gisler, A. (1981) (***). Optimum trimming of data in the credibility model. Bulletin of the Association of Swiss Actuaries, 313-325. Hossack, I.B., Pollard, J.H. & Zehnwirth, B. (1983) (*+). Introductory statistics with applications in general insurance. Cambridge University Press, Cambridge. Norberg, R. (1979) (**). The credibility ap- proach to experience rating. Scandinavian Actuarial Journal, 181-221. Norberg, R. (1986) (***). A contribution to modelling of IBNR claims. Scandinavian Actuarial Journal, 155-203. Norberg, R. (1989) (***). Experience rating in group life insurance. Scandinavian Actuarial Journal, 194-224. Litteratur Straub, E. (1987) (**-). Non-life insurance mathematics. Springer-Verlag, New York. Sundt, B. (1987). (***). Two credibility regres- sion approaches for the classification of passenger cars in a multiplicative tariff. ASTIN Bulletin 17, 41-70. Sundt, B. (1993). (**). An introduction to non- life insurance mathematics. (3. utg.) Verlag Versicherungsmathematik e.V., Karlsruhe.

Bilaga

1994409.pdf