correlatie

Continue & discrete verdelingen, toevalsveranderlijken, betrouwbaarheidsintervallen, correlaties.
Plaats reactie
HansK
Nieuw lid
Nieuw lid
Berichten: 14
Lid geworden op: 05 sep 2009, 12:00

correlatie

Bericht door HansK » 08 jul 2012, 12:13

Het gaat om een berekening in het volgende artikel: http://www.isb.edu/EMFConference/File/S ... hfunds.pdf

Hierin wordt op pagina 16 onderste alinea (en stukje pagina 17) een redenatie gegeven met 2 vectoren en correlatie. Ik snap het niet, maar wellicht kan een van jullie er wat zinnigs over zeggen?

Alvast bedankt!

arie
Moderator
Moderator
Berichten: 3917
Lid geworden op: 09 mei 2008, 09:19

Re: correlatie

Bericht door arie » 08 jul 2012, 23:51

Voorbeeld:
Stel je hebt de talen L:
1 = Nederlands
2 = Frans
3 = Duits

Stel je hebt ook 2 landen die je wilt vergelijken:
i = Belgie, waarbij van de bevolking (fictief) 0.5 deel Nederlands spreekt, 0.4 deel Frans en 0.1 deel Duits, dan is de vector
Si = (0.5, 0.4, 0.1).
j = Luxemburg, waarbij van de bevolking (fictief) 0.0 deel Nederlands spreekt, 0.4 deel Frans en 0.6 deel Duits, dan is de vector
Sj = (0.0, 0.4, 0.6).

Voor de inproducten van deze vectoren neem je steeds de som van de producten van elk corresponderend tweetal waarden in de betreffende twee vectoren:







In dit geval is je correlatie gelijk aan:





Merk op dat als alle fracties in beide landen gelijk zouden zijn, dus vector Si = vector Sj, geldt dat:



Si en Sj hebben dan maximale closeness = maximale correlatie = 1


Terwijl als
i=Nederland met vector Si = (1.0, 0.0, 0.0) en
j=Luxemburg met vector Sj = (0.0, 0.4, 0.6)
dan is



en is



Si en Sj hebben in dit geval minimale (=geen) correlatie ofwel de correlatie = 0

Kom je hiermee verder?

HansK
Nieuw lid
Nieuw lid
Berichten: 14
Lid geworden op: 05 sep 2009, 12:00

Re: correlatie

Bericht door HansK » 09 jul 2012, 05:45

Ja, is helemaal wat ik bedoel. bedankt!

Nu nog 198 keer uitvoeren voor mijn data... Is vast ook een makkelijke manier voor, maar die ken ik niet...

arie
Moderator
Moderator
Berichten: 3917
Lid geworden op: 09 mei 2008, 09:19

Re: correlatie

Bericht door arie » 09 jul 2012, 10:11

198 keer dezelfde berekening uitvoeren zou ik niet met de hand doen (nogal foutgevoelig).

Er bestaan diverse alternatieven:
- automatiseren (= programmeren)
- via een rekenblad zoals Excel: hierin kan je bovenstaande formule direct vertalen in bv:
=SUMPRODUCT(A1:A3;B1:B3)/SQRT(SUMPRODUCT(A1:A3;A1:A3)*SUMPRODUCT(B1:B3;B1:B3))
waarbij in A1 t/m A3 je eerste vector staat (Belgie in ons voorbeeld) en in B1 t/m B3 je tweede vector (Luxemburg)

Ben je bekend met Excel?

HansK
Nieuw lid
Nieuw lid
Berichten: 14
Lid geworden op: 05 sep 2009, 12:00

Re: correlatie

Bericht door HansK » 09 jul 2012, 12:13

Met de hand bedoel ik inderdaag via een rekenblad. Die laatste berekening lukt me wel. Al is dit nog beter dan mijn berekeningen, want ik had het opgedeeld in 3 stappen (teller noemer).

Programeren van macro's heb weinig tot geen kaas van gegeten.

Plaats reactie