數學和多元變量統計中,中心化矩陣[1]指對稱冪等矩陣,且當其與向量相乘時,效果等用於從向量的每個分量中減去分量的平均值。
大小為n的中心化矩陣是n×n的
![{\displaystyle C_{n}=I_{n}-{\tfrac {1}{n}}J_{n}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/bbb03ad63e536cfd637cf7f8c6f966f61b199194)
其中
是單位矩陣,
是n×n一矩陣。例如
,
,
![{\displaystyle C_{3}=\left[{\begin{array}{rrr}1&0&0\\0&1&0\\0&0&1\end{array}}\right]-{\frac {1}{3}}\left[{\begin{array}{rrr}1&1&1\\1&1&1\\1&1&1\end{array}}\right]=\left[{\begin{array}{rrr}{\frac {2}{3}}&-{\frac {1}{3}}&-{\frac {1}{3}}\\-{\frac {1}{3}}&{\frac {2}{3}}&-{\frac {1}{3}}\\-{\frac {1}{3}}&-{\frac {1}{3}}&{\frac {2}{3}}\end{array}}\right]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/a280df1cf0b14b46e0f24b487f0c0f0dc22269a3)
給定長為n的列向量
,
的中心性可表為
![{\displaystyle C_{n}\,\mathbf {v} =\mathbf {v} -({\tfrac {1}{n}}J_{n,1}^{\textrm {T}}\mathbf {v} )J_{n,1}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c16ea55745fb01fb2ede7f6098a1caf0c11af37f)
其中
是值全為1的列向量,
是
的分量的平均值。
是正半定對稱陣。
是冪等矩陣,所以
。均值被移除的話它就是零,再次移除也沒有任何影響。
是奇異矩陣/不可逆矩陣。應用
變換的效果無法逆轉。
具有重數為n-1的特徵值1與重數為1的特徵值0
沿向量
有維度為1的零空間。
是正交投影矩陣。也就是說
是
在n-1維線性子空間上的投影,其與零空間
正交(這是所有分量和為0的n向量構成的子空間)。
的跡是
。
雖然與中心化矩陣相乘並不是去除向量均值的有效計算方法,但卻是一種方便的分析工具。它不僅可用來去除單個向量的均值,還可去除存儲在m×n矩陣
的行或列中多個向量的均值。
左乘
將從n列的每一列減去相應的均值,這樣積
的每列的均值都是0。相似地,右乘
會從每行減去相應的均值,這樣積
的每行均值都為0。兩側均乘:
將產生行列均值均為0的矩陣。
中心化矩陣提供了一種表示散布矩陣的方法:對數據樣本
,有
,其中
是樣本均值。有了中心化矩陣,可以將散布矩陣更簡潔地表示為
![{\displaystyle S=X\,C_{n}(X\,C_{n})^{\mathrm {T} }=X\,C_{n}\,C_{n}\,X\,^{\mathrm {T} }=X\,C_{n}\,X\,^{\mathrm {T} }.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f48540634556e73366fd755b57d98e926e164d5b)
是多項分布的協方差矩陣,在特殊情況下分布參數為
,
。
參考文獻[編輯]
- ^ John I. Marden, Analyzing and Modeling Rank Data, Chapman & Hall, 1995, ISBN 0-412-99521-2, page 59.