Histogramm

Olgu meil valim x1, ...,xn  . Tavalist joonistatakse graafik järgmise lähenemise abil. Esmalt leitakse valimi minimaalne ja maksimaalne element. Seejärel jagatakse nendevaheline vahemik võrdse pikkusega poollõikudeks (vähimate otspunktide väärtustega on tavaliselt lõik). Loetakse kokku, mitu valimi väärtust igasse poollõiku kuulub ja kujutatakse sagedustele vastava kõrgusega tulbad. Kui valimimaht on suur ja poollõike palju, siis meenutab selline graafik, mida üldiselt nimetatakse histogrammiks, tihedusfunktsiooni, mis oleks otsekui tulpadeks jagatud. Vastav empiiriline tõenäosustihedus on kujutatud järgnevalt.

PIC

Tegelikult selline graafik tihedusfunktsiooni ei lähenda, sest graafikualune pindala ei ole võrdne ühega. Samas kui poollõikude arvu piisavalt kasvatada, siis näevad mõlemad ühtemoodi välja (välja arvatud skaala).

PIC

Seega on tarvis vaid skaalat teisendada. Histogrammi eesmärk on aga pigem teistsugune ja kindlasti ei ole praktikas mõttekas histogramm, kus igas vahemikus on maksimaalselt üks vaatlus. Tihti võib olla otstarbekas konstrueerida selline histogramm, mille poollõikude pikkused ei ole võrdsed. Kui laiused on vastavalt w1, ...,wk  ja poollõikudesse sattunud tõenäousesed vastavalt p1,...,pk  . Siis tuleb postid joonistada kõrgustega p1∕w1, ...,pk∕wk  ja siis on joonealune pindala tõepoolest üks.

PIC