度分佈 是圖論 和網絡理論 中的概念。一個圖(或網絡)由一些頂點(節點)和連接它們的邊(連結)構成。每個頂點(節點)連出的所有邊(連結)的數量就是這個頂點(節點)的度 。度分佈指的是對一個圖(網絡)中頂點(節點)度數的總體描述。對於隨機圖 ,度分佈指的是圖中頂點度數的概率分佈 。
英文維基條目網絡的度分佈。將每個條目看成頂點,超連結看成邊,則對應的出度/入度的分佈如圖所示。
度分佈是圖論和(複雜 )網絡理論中都存在的概念。首先介紹圖的概念。一個圖
G
=
G
(
V
,
E
)
{\displaystyle G=G(V,E)}
是一個由兩個集合
V
{\displaystyle V}
和
E
{\displaystyle E}
構成的二元組。集合
V
{\displaystyle V}
一般由有限個元素構成:
V
=
{
v
1
,
v
2
,
⋯
,
v
n
}
{\displaystyle V=\{v_{1},v_{2},\cdots ,v_{n}\}}
,其中的元素
v
i
,
i
=
1
,
2
,
⋯
,
n
{\displaystyle v_{i},\,i=1,2,\cdots ,n}
被稱為圖的頂點。集合
E
{\displaystyle E}
是由
n
2
{\displaystyle n^{2}}
個元素構成的集合:
E
=
{
e
i
,
j
|
i
=
1
,
2
,
⋯
,
n
,
j
=
1
,
2
,
⋯
,
n
}
{\displaystyle E=\{e_{i,j}\,\,|\,\,i=1,2,\cdots ,n,\,j=1,2,\cdots ,n\}}
。
E
{\displaystyle E}
中的每個元素都是一個非負整數。無向圖中,
E
{\displaystyle E}
的一個元素
e
i
,
j
=
k
{\displaystyle e_{i,j}=k}
,表示
V
{\displaystyle V}
中的兩個頂點
i
{\displaystyle i}
和
j
{\displaystyle j}
連有
k
{\displaystyle k}
條邊,並且規定
e
i
,
j
=
e
j
,
i
{\displaystyle e_{i,j}=e_{j,i}}
。有向圖中,
E
{\displaystyle E}
的一個元素
e
i
,
j
=
k
{\displaystyle e_{i,j}=k}
,表示
V
{\displaystyle V}
中的頂點
i
{\displaystyle i}
有
k
{\displaystyle k}
條連向頂點
j
{\displaystyle j}
的邊。如果一個圖
G
{\displaystyle G}
中所有的
e
i
,
j
{\displaystyle e_{i,j}}
都不超過1,並且
∀
i
=
1
,
2
,
⋯
,
n
,
e
i
,
i
=
0
{\displaystyle \forall i=1,2,\cdots ,n,\,\,e_{i,i}=0}
,那麼稱圖
G
{\displaystyle G}
是簡單圖。
網絡理論的數學框架建立在圖論上。網絡理論中的網絡其實就是圖論中的圖,但在網絡理論中稱之為網絡,圖的頂點在網絡理論中稱為節點,邊被稱為連結。以下仍舊以圖論中的術語定義度分佈。
一個無向圖
G
=
G
(
V
,
E
)
{\displaystyle G=G(V,E)}
中某個頂點
v
i
0
{\displaystyle v_{i_{0}}}
的度,是指所有與它相連的邊的數目。
d
(
v
i
0
)
=
∑
i
=
i
0
e
i
,
j
{\displaystyle d(v_{i_{0}})=\sum _{i=i_{0}}e_{i,j}}
有向圖中,根據連出邊的數目和連入邊的數目,分為出度
d
o
u
t
{\displaystyle d_{out}}
和入度
d
i
n
{\displaystyle d_{in}}
。
d
o
u
t
(
v
i
0
)
=
∑
i
=
i
0
e
i
,
j
{\displaystyle d_{out}(v_{i_{0}})=\sum _{i=i_{0}}e_{i,j}}
d
i
n
(
v
i
0
)
=
∑
j
=
i
0
e
i
,
j
{\displaystyle d_{in}(v_{i_{0}})=\sum _{j=i_{0}}e_{i,j}}
因此,一個無向圖
G
=
G
(
V
,
E
)
{\displaystyle G=G(V,E)}
中,
d
{\displaystyle d}
可以看成將每個頂點映射到一個非負整數的函數 :
d
:
v
i
↦
d
(
v
i
)
i
=
1
,
2
,
⋯
,
n
.
{\displaystyle d:\,v_{i}\mapsto d(v_{i})\quad i=1,2,\cdots ,n.}
而度分佈則是對每個非負整數
m
{\displaystyle m}
,考察度數是
m
{\displaystyle m}
的頂點在所有頂點中占的比例:
∀
m
∈
N
,
P
:
m
↦
P
(
m
)
=
Card
{
v
i
|
d
(
v
i
)
=
m
}
n
,
{\displaystyle \forall m\in \mathbb {N} ,\,\,P:m\mapsto P(m)={\frac {\operatorname {Card} \{v_{i}\,|\,d(v_{i})=m\}}{n}},}
[ 1]
因此滿足:
∑
m
∈
N
P
(
m
)
=
1.
{\displaystyle \sum _{m\in \mathbb {N} }P(m)=1.}
從頂點中等概率地隨機抽取一個頂點,那麼這個頂點度數為
k
{\displaystyle k}
的概率就是
P
(
k
)
{\displaystyle P(k)}
。
由十個頂點構成的圖
以下給出一些度分佈的例子。右圖是由十個頂點構成的無向圖。其中度數是4的頂點有3個,度數是3的頂點有6個,度數是6的頂點有1個,所以度分佈是:
P
(
m
)
=
{
0.3
,
m
=
4
0.6
,
m
=
3
0.1
,
m
=
6
0
,
m
≠
3
,
4
,
6
{\displaystyle P(m)={\begin{cases}0.3,&m=4\\0.6,&m=3\\0.1,&m=6\\0,&m\neq 3,4,6\end{cases}}}
對於
n
{\displaystyle n}
階完全圖,所有的頂點的度數都是
n
−
1
{\displaystyle n-1}
,所以度分佈是:
P
(
m
)
=
{
1
,
m
=
n
−
1
0
,
m
≠
n
−
1
{\displaystyle P(m)={\begin{cases}1,&m=n-1\\0,&m\neq n-1\end{cases}}}
圖3.隨機網絡的度(a)集中在某個特定值
d
c
{\displaystyle d_{c}}
附近,而無尺度網絡的度分佈(b)則遵守冪律分佈
如果圖
G
{\displaystyle G}
是任意兩頂點之間以概率
0
<
p
<
1
{\displaystyle 0<p<1}
連邊的隨機圖,那麼每個頂點都有相同的度分佈。
P
(
m
)
=
(
n
−
1
m
)
p
m
(
1
−
p
)
n
−
1
−
m
.
{\displaystyle P(m)={\binom {n-1}{m}}p^{m}(1-p)^{n-1-m}.}
[ 2]
這個分佈是泊松分佈 。我們可以構造每個頂點的度數都是這樣的概率分佈的隨機圖模型。這樣當頂點數很大的時候,度數是
k
{\displaystyle k}
的頂點的個數占的比例大致是
P
(
k
)
{\displaystyle P(k)}
。這個分佈的特點是當k很小或很大的時候,
P
(
k
)
{\displaystyle P(k)}
都近似於0,
P
(
k
)
{\displaystyle P(k)}
的值在一個特定的值處達到高峰,然後回落。也就是說,大多數的頂點的度數在這個特定值左右。然而在真實的複雜網絡中,人們觀察到,度分佈並不像這種隨機圖模型顯示的,聚集在某個特定值周圍,而是隨着k增大而以多項式速度遞減,也就是遵從所謂的冪律分佈:
P
(
k
)
∝
1
k
γ
{\displaystyle P(k)\propto {\frac {1}{k^{\gamma }}}}
也就是說
P
(
k
)
{\displaystyle P(k)}
的概率反比於
k
{\displaystyle k}
的某個冪次,其中
γ
{\displaystyle \gamma }
是某個正實數。這種網絡特性被稱為無尺度特性 [ 3] [ 4] 。