Saba raskuse hindamine Ris: pakett fExtremes

Paketis fExtremes on defineeritud palju erinevaid funktsioone, millest mõnede tulemite analoogidega oleme kokku puutunud loengus. Keskendume siinkohal esmalt graafilistele tehnikatele.

Funktsioon qqparetoPlot võimaldab joonistada kvantiil-kvantiilgraafikut, kus kasutatakse etteantud kujuparameetriga üldistatud Pareto jaotuse jaotusfunktsiooni.

Funktsioonid mePlot, mrlPlot ja mxfPlot joonistavad erinevat tüüpi keskmise jääkeluafunktsiooni graafikuid. Neist esimene leiab hinnangu keskmisele jääkelueale igas valimi punktis. Teine leiab sääraseid hinnanguid kogu etteantud vahemikus (vaikimisi valimi keskmise ja maksimaalse elemendi vaheline lõik) ning lisab usaldusintervallid. Viimane võimaldab vahemiku ette anda valimi kvantiili abil (ehk lävend defineeritakse kui punkt, millest paremale jääb teatud osakaal valimist).

Funktsioonid msratioPlot joonistab maksimumi ja summa suhte graafikud (vaikimisi p=1,2,3,4  jaoks).

Funktsioon recordsPlot võimaldab analüüsida sõltumatu ja sama jaotuse eelduse täidetust. Nimelt peaks eelduste täidetuse korral rekordite arv valimimahu kasvamisel keskmiselt kasvama umbes nagu log(n)  .

Lisaks rekordite analüüsimisele, mida saab teha ka funktsiooniga ssrecordsPlot osavalimite kaupa on aga paketis veel mõningaid graafilise analüüsi vahendeid, mille teoreetilise põhjendusega me seni tutvunud ei ole. Funktsioon emdPlot kujutab empiirilise ťjaotusfunktsiooni täiendfunktsiooni graafikul, kusjuures mõlemal teljel kasutatakse logaritmilist skaalat. Sirgjooneliselt paiknevad punktid sellisel graafikul viitavad sellele, et tegu on Pareto jaotusega. Põhjendus on siin lihtne – kuivõrd Pareto jaotuse korral

--      (   h  ) α

			F (x) =   ------   ,

			x - r

siis x  kasvatamine k  korda põhjustab --

F (x)  kahanemise ligikaudu kα  korda, sest suuremate x  väärtuste korral on parameetri r  mõju tühine.

Funktsioon xacfPlot võimaldab nelja erineva graafiku joonistamist. Neist esimene on lävendit ületavate väärtuste kujutamine (need peaksid suure lävendi korral pärinema ligikaudu üldistatud Pareto jaotusest), teine kujutab graafikul järjestikuste lävendit ületavate väärtuste vahele jäävate valimi elementide arvu (sõltumatute ja sama jaotusega valimi elementide korral peaks tegu olema realisatsioonidega geomeetrilisest jaotusest). Viimased kaks graafikut kujutavad eelnevalt nimetatud suuruste autokorrelatsioonifunktsioone. Sõltumatu valimi korral ei tohiks lävendit ületavad väärtused üksteist mõjutada ja seetõttu peaks autokorrelatsioon olema nullilähedane kui nihe ei võrdu nulliga. Sama kehtib nende vahele mahtuva väärtuste arvu kohta – see, et kahe lävendit ületava väärtuse vahe oli pikk (või lühike) ei tohiks anda mingisugust infot selle kohta, millal saabub järgmine lävendit ületav väärtus.