Excel STANDARDIZE 函數教學
STANDARDIZE 函數的用途
STANDARDIZE 函數用來將數值轉換為 標準分數(Z-score),也稱為 z 值,表示該數值與數據集的平均值相比,偏離了多少個標準差。這有助於將不同單位和尺度的數據進行比較,並標準化它們。
標準分數(Z-score)計算公式為:
其中:
- 是待標準化的數值
- 是數據集的平均值
- 是數據集的標準差
語法
STANDARDIZE(x, mean, standard_dev)
| 參數 | 說明 |
|---|---|
| x | 必需,表示待標準化的數值。 |
| mean | 必需,表示數據集的平均值。 |
| standard_dev | 必需,表示數據集的標準差。 |
範例 1:計算標準分數
假設你有以下數據,並希望將某一數值標準化:
| 數據 |
|---|
| 50 |
| 60 |
| 55 |
| 70 |
| 65 |
我們的目標是計算 60 這個數值的標準分數。
首先計算數據集的平均值和標準差:
- 平均值(mean):
(50 + 60 + 55 + 70 + 65) / 5 = 60 - 標準差(standard deviation):
7.071(可以使用 Excel 的STDEV函數計算)
然後使用 STANDARDIZE 函數:
=STANDARDIZE(60, 60, 7.071)
? 結果:這個公式返回 0,表示 60 正好等於數據集的平均值,與平均值的偏差為零。
範例 2:將數值標準化
假設你有以下數據,並想標準化數值 75。
| 數據 |
|---|
| 40 |
| 50 |
| 60 |
| 70 |
| 80 |
同樣,我們計算數據集的平均值和標準差:
- 平均值:
(40 + 50 + 60 + 70 + 80) / 5 = 60 - 標準差:
15.811(可以使用 Excel 的STDEV函數計算)
使用以下公式計算標準分數:
=STANDARDIZE(75, 60, 15.811)
? 結果:這個公式返回 0.948,表示 75 比平均值高出 0.948 個標準差。
STANDARDIZE 函數的應用場景
- 比較不同數據集:
- 當你需要比較不同尺度的數據時,可以使用
STANDARDIZE函數來將它們標準化,使它們具有相同的尺度。這樣,你可以比較來自不同來源的數據,即使它們的單位不同。
- 當你需要比較不同尺度的數據時,可以使用
- 統計分析:
STANDARDIZE函數常用於統計學中,幫助分析數據分佈情況。標準分數可以幫助你確定某個數據點是否在正常範圍內,或者它是否是極端值(例如,超過 2 或 3 個標準差的數據點通常被視為異常值)。
- 風險評估與金融分析:
- 在金融領域,
STANDARDIZE函數用於將不同的投資回報標準化,這樣就可以將回報率進行比較,即使它們來自不同的資產或市場。
- 在金融領域,
- 機器學習和數據挖掘:
- 在機器學習中,數據標準化是常見的預處理步驟。這有助於算法更好地處理數據,特別是對於距離度量敏感的算法(如 K-means 聚類或支持向量機)。
注意事項
- 標準差不能為零:
- 當數據集的標準差為零(即所有數值相同時),
STANDARDIZE函數會返回錯誤 (#DIV/0!),因為不能除以零。
- 當數據集的標準差為零(即所有數值相同時),
- 數據的分佈:
STANDARDIZE函數假設數據遵循正態分佈。對於非正態分佈的數據,標準化可能會導致誤導性結果。
- 異常值的影響:
- 標準分數會受到異常值的影響。極端數據點可能會使平均值和標準差偏離實際情況,進而影響標準分數的計算。
- 公式結果的解釋:
- 標準分數為正值意味著數值高於平均值,為負值則意味著數值低於平均值。如果標準分數大於 2 或小於 -2,則該數據點可能被視為異常值。
總結
STANDARDIZE 函數是一個非常有用的工具,特別是當你需要將數據轉換為標準分數時。它可以幫助你比較來自不同來源或具有不同尺度的數據,並理解數據的分佈特徵。