統計相關粵拼tung2 gai3 soeng1 gwaan1英文statistical correlation)喺統計學上嘅定義如下:

  • 如果話 呢兩個變數正相關,即係話 數值高嗰陣 數值都傾向高,而 數值低嗰陣 數值都傾向低;
  • 如果話 呢兩個變數成負相關,即係話 數值高嗰陣 數值傾向低,而 數值低嗰陣 數值就會傾向高;
  • 如果話 呢兩個變數冇明顯相關,即係話 嘅數值唔會點預測得到 嘅數值。

統計相關呢個概念,喺經濟學語言學等各種社科上都會用到。

常用計法

皮亞遜積差相關係數(Pearson correlation coefficient)係統計學成日用嘅一個指標,「兩個變數 之間嘅皮亞遜積差相關係數」()係噉樣定義嘅:

  • 係第 個個案嘅 數值;
  • 係第 個個案嘅 數值;
  • 係啲個案喺 上嘅平均值(mean);
  • 係啲個案喺 上嘅平均值;
  • 係啲個案喺 上嘅標準差(SD);
  • 係啲個案喺 上嘅標準差。

呢條式會得出一個相關值,個數值會喺 -1 同 1 之間,

  • 負數表示兩個變數成反比(一個數值高嗰陣另一個傾向數值低),
  • 正數就表示兩個變數成正比(兩個數值傾向一齊高或者一齊低),
  • 個相關值愈接近零表示兩個變數之間嘅關係愈弱,
  • 而如果個相關值等於零就表示兩個變數根本唔啦更。

喺做相關性研究嗰陣科學家會先收集一啲數據,再用好似上面呢條式等嘅方法計出變數之間嘅相關值,搵出研究緊嘅變數之間有乜嘢啦掕,而呢個過程俾出嚟嘅資訊喺將來有得攞嚟預測某啲現象[1]

Thumb
圖嘅 X 軸Y 軸代表變數 ,每個有色圓點代表一個個案,每個個案都喺 上各有數值,而每幅圖表示唔同 值下啲數據會係點嘅樣。

常犯錯誤

應用

統計相關有好多用途。

多角投資投資上嘅一種做法,講到一位投資者要同時揸多種唔同嘅資產,即係例如同時又揸股票又揸黃金呀噉。多角投資相關嘅研究又提到,自己手上嘅唔同資產之間喺價格上唔應該有太強嘅正相關,即係呢啲資產嘅價唔可以傾向一齊升或者一齊跌,否則就好易出現「手上啲資產嘅價全部一齊下跌」嘅困境[2]

實際行因素分析之前,研究者可以先睇吓啲變數之間嘅統計相關。有統計學專家主張,啲變數之間嘅統計相關最少要係 .30,先至有可能表示佢哋反映緊某啲潛在變數。

文獻

睇埋

引咗

Wikiwand in your browser!

Seamless Wikipedia browsing. On steroids.

Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.

Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.