Het gaat om een berekening in het volgende artikel: http://www.isb.edu/EMFConference/File/S ... hfunds.pdf
Hierin wordt op pagina 16 onderste alinea (en stukje pagina 17) een redenatie gegeven met 2 vectoren en correlatie. Ik snap het niet, maar wellicht kan een van jullie er wat zinnigs over zeggen?
Alvast bedankt!
correlatie
Re: correlatie
Voorbeeld:
Stel je hebt de talen L:
1 = Nederlands
2 = Frans
3 = Duits
Stel je hebt ook 2 landen die je wilt vergelijken:
i = Belgie, waarbij van de bevolking (fictief) 0.5 deel Nederlands spreekt, 0.4 deel Frans en 0.1 deel Duits, dan is de vector
Si = (0.5, 0.4, 0.1).
j = Luxemburg, waarbij van de bevolking (fictief) 0.0 deel Nederlands spreekt, 0.4 deel Frans en 0.6 deel Duits, dan is de vector
Sj = (0.0, 0.4, 0.6).
Voor de inproducten van deze vectoren neem je steeds de som van de producten van elk corresponderend tweetal waarden in de betreffende twee vectoren:
In dit geval is je correlatie gelijk aan:
Merk op dat als alle fracties in beide landen gelijk zouden zijn, dus vector Si = vector Sj, geldt dat:
Si en Sj hebben dan maximale closeness = maximale correlatie = 1
Terwijl als
i=Nederland met vector Si = (1.0, 0.0, 0.0) en
j=Luxemburg met vector Sj = (0.0, 0.4, 0.6)
dan is
en is
Si en Sj hebben in dit geval minimale (=geen) correlatie ofwel de correlatie = 0
Kom je hiermee verder?
Stel je hebt de talen L:
1 = Nederlands
2 = Frans
3 = Duits
Stel je hebt ook 2 landen die je wilt vergelijken:
i = Belgie, waarbij van de bevolking (fictief) 0.5 deel Nederlands spreekt, 0.4 deel Frans en 0.1 deel Duits, dan is de vector
Si = (0.5, 0.4, 0.1).
j = Luxemburg, waarbij van de bevolking (fictief) 0.0 deel Nederlands spreekt, 0.4 deel Frans en 0.6 deel Duits, dan is de vector
Sj = (0.0, 0.4, 0.6).
Voor de inproducten van deze vectoren neem je steeds de som van de producten van elk corresponderend tweetal waarden in de betreffende twee vectoren:
In dit geval is je correlatie gelijk aan:
Merk op dat als alle fracties in beide landen gelijk zouden zijn, dus vector Si = vector Sj, geldt dat:
Si en Sj hebben dan maximale closeness = maximale correlatie = 1
Terwijl als
i=Nederland met vector Si = (1.0, 0.0, 0.0) en
j=Luxemburg met vector Sj = (0.0, 0.4, 0.6)
dan is
en is
Si en Sj hebben in dit geval minimale (=geen) correlatie ofwel de correlatie = 0
Kom je hiermee verder?
Re: correlatie
Ja, is helemaal wat ik bedoel. bedankt!
Nu nog 198 keer uitvoeren voor mijn data... Is vast ook een makkelijke manier voor, maar die ken ik niet...
Nu nog 198 keer uitvoeren voor mijn data... Is vast ook een makkelijke manier voor, maar die ken ik niet...
Re: correlatie
198 keer dezelfde berekening uitvoeren zou ik niet met de hand doen (nogal foutgevoelig).
Er bestaan diverse alternatieven:
- automatiseren (= programmeren)
- via een rekenblad zoals Excel: hierin kan je bovenstaande formule direct vertalen in bv:
=SUMPRODUCT(A1:A3;B1:B3)/SQRT(SUMPRODUCT(A1:A3;A1:A3)*SUMPRODUCT(B1:B3;B1:B3))
waarbij in A1 t/m A3 je eerste vector staat (Belgie in ons voorbeeld) en in B1 t/m B3 je tweede vector (Luxemburg)
Ben je bekend met Excel?
Er bestaan diverse alternatieven:
- automatiseren (= programmeren)
- via een rekenblad zoals Excel: hierin kan je bovenstaande formule direct vertalen in bv:
=SUMPRODUCT(A1:A3;B1:B3)/SQRT(SUMPRODUCT(A1:A3;A1:A3)*SUMPRODUCT(B1:B3;B1:B3))
waarbij in A1 t/m A3 je eerste vector staat (Belgie in ons voorbeeld) en in B1 t/m B3 je tweede vector (Luxemburg)
Ben je bekend met Excel?
Re: correlatie
Met de hand bedoel ik inderdaag via een rekenblad. Die laatste berekening lukt me wel. Al is dit nog beter dan mijn berekeningen, want ik had het opgedeeld in 3 stappen (teller noemer).
Programeren van macro's heb weinig tot geen kaas van gegeten.
Programeren van macro's heb weinig tot geen kaas van gegeten.