Bakom bostadsvärderingars statistik: Normalfördelningen som spegel av hängkedjan

Efter förra inlägget tar vi nu ett steg djupare. Vi lämnar tillfälligt bostadsstatistiken och ser på den struktur som gör normalformen möjlig över huvud taget. Frågan är inte hur vi beräknar spridning, utan varför just denna form uppstår när avvikelser summeras. Frågan gäller alltså inte en statistisk metod, utan vilken form som nödvändigtvis uppstår när lokala bidrag ackumuleras under symmetri.

Normalfördelningen som spegel av hängkedjan

Hängkedjan är inte i första hand en “form”. Den är lösningen på ett extremalproblem: den kurva som uppstår när en ackumulerad storhet minimeras under lokala begränsningar. Det avgörande i Bernoulli–Leibniz-traditionen är därför inte själva kedjan, utan mallen:

en process byggs av lokala bidrag,
helheten uppstår genom summering,
den stabila formen är den som extremiserar en total storhet,
formen är inte vald utan framtvingad.

Den s k normalfördelningskurvan kan förstås genom samma mall. Den är inte i första hand ett statistiskt faktum, utan den stabila projektionen av additiva lokala bidrag under symmetri och kompositionskrav.


Fenomeniskt axiom: lokala bidrag och ackumulerad kostnad

Antag endast detta:

Processer kan delas i delprocesser.
Det finns en ackumulerbar storhet C som summeras över delprocesser.

I Leibniz språk kan detta skrivas som

dC = (dC/dy) dy

och den totala storheten fås genom att summera eller integrera längs processen.

Detta är inget påstående om fysikens detaljer. Det är endast antagandet att världen tillåter ackumulation.


Lokal stabilitet: kvadraten som första överlevande term

Betrakta en avvikelse x från ett typiskt läge. Antag att den totala kostnaden C(x):

är noll vid x = 0,
är symmetrisk: C(x) = C(-x),
är stabil under små störningar.

Utvecklad kring noll får man en serie där den första icke-triviala termen är kvadratisk. Lokalt gäller därför

C(x) = k x².

När lokal stabilitet och symmetri krävs återstår en unik lägsta ordningens struktur.


Projektion: från kostnad till spridning

Det observerade är inte kostnaden C(x), utan hur ofta olika avvikelser uppträder. Antag därför:

större kostnad ger lägre frekvens,
lika kostnad ger lika frekvens.

Frekvensen p(x) är då en funktion av C(x):

p(x) = F(C(x)).

Om två oberoende delprocesser kombineras adderas kostnaderna:

C_total = C1 + C2.

Samtidigt ska frekvenser kombineras konsekvent. Detta ger funktionskravet

F(C1 + C2) = F(C1) F(C2).

Den stabila kontinuerliga lösningen är en exponentiell funktion. Uttryckt i cosh-form kan spridningen skrivas som

p(x) = 1 / cosh( a x² ).

För små och måttliga avvikelser är denna form strukturellt ekvivalent med den vanliga normalformen. Kvadraten är den lokala stabila strukturen; den globala kompositionsformen ger den s k normalfördelningskurvan.


Leibniz hyperbelkonstruktion och Eulers cirkelrotation

Det exponentiella språket i analysen uppträder historiskt i två olika geometriska konstruktioner som ofta blandas samman.

Den ena går tillbaka till Leibniz och Bernoulli och utgår från hyperbeln.
Den andra systematiserades av Euler och utgår från cirkeln.

Båda kan beskrivas i samma komplexa plan, men de motsvarar olika rotationsriktningar.

Leibniz konstruktion utgår från hyperbeln

x² − y² = 1.

Den naturliga parametrisering som bevarar denna kurva är

x = cosh t
y = sinh t

vilket ger identiteten

cosh² t − sinh² t = 1.

Transformationen

(x,y) → (x cosh t + y sinh t, x sinh t + y cosh t)

kan förstås som en rörelse längs hyperbeln. I exponentiell form motsvarar detta en hyperbolisk rotation.

Denna konstruktion ger funktionerna

cosh t
sinh t.

Euler studerade i stället cirkeln

x² + y² = 1

med parametrisering

x = cos t
y = sin t

och identiteten

cos² t + sin² t = 1.

I det komplexa planet kan denna rotation skrivas

e^(it) = cos t + i sin t.

Detta är Eulers cirkelrotation.

Denna konstruktion förutsätter i praktiken att cirkelns lösning redan är känd; den kan inte byggas fram utan att man redan vet svaret, vilket innebär att det finns en naturlig artikulationsordning mellan de två konstruktionerna.

De två konstruktionerna ligger i samma algebraiska plan men bevarar olika geometrier:

Leibniz: hyperbel → cosh/sinh → hyperbolisk rotation
Euler: cirkel → cos/sin → cirkulär rotation

Den spridningsprofil som uppträder ovan

p(x) = 1 / cosh(a x²)

hör därför till hyperbelns geometri. Den ligger i Leibniz konstruktion och inte i Eulers cirkelrotation.

Detta är också skälet till att samma hyperboliska funktion uppträder i hängkedjans form.

Struktur snarare än statistik

Den s k normalfördelningskurvan framstår ofta som en statistisk approximation. I denna läsning är den snarare:

  • den stabila projektionen av additiva lokala bidrag,
  • under symmetri,
  • med en global kompositionsform som inte inför ytterligare struktur.

Att formen återkommer i data beror inte på att naturen “är normalfördelad”, utan på att stabilitet under additiv ackumulation framtvingar en profil av denna typ när avvikelser betraktas kring ett typiskt värde.


Verkan och upplösning

Om den ackumulerade kostnaden mäts i en storhet S (till exempel verkan) fås motsvarande form:

p(S) = 1 / cosh( b (S – S0)^2 ).

Här krävs en skala med dimension S. Om ingen ytterligare skala införs återstår en universell skala kappa som bestämmer bredden i profilen.

Detta är inte en mekanisk teori, utan en strukturell gräns: infinitesimalen kan fortsatt användas i språket dS/dy, men fysisk separerbarhet kan inte förfinas obegränsat om en universell skala föreligger.


Klassisk gräns och överlappning

När typiska skillnader i S är stora relativt kappa blir profilen starkt koncentrerad och alternativa utvecklingar separerbara.

När skillnaderna är jämförbara med kappa uppstår överlappning mellan möjliga utvecklingar. Detta är en fenomenologisk gräns för separerbar beskrivning.


Slutsats

Hängkedjan visar hur en form kan vara en nödvändig extremal av en ackumulerad kostnad. Den s k normalfördelningskurvan kan förstås som samma mall projicerad till spridning: lokal stabilitet utan privilegierad riktning ger kvadratisk kostnad, och additiv komposition ger exponent i kostnadsfunktionen.

Resultatet är normalfördelningskurvan. Den är inte en statistisk approximation och inte en skugga av hängkedjan; den är den primära struktur som också framträder invariant i hängkedjans hyperboliska form.

Formen är inte vald; den är framtvingad av nödvändighet.