從預測到風險：時間序列分析在量化交易中的實戰演練——從ARIMA的平穩預測到GARCH的波動率捕獲

前言：金融市場的「記憶」與「脈搏」

在華爾街的交易大廳與量化對沖基金的機房裡，我們處理的核心對象從來不是孤立的價格點，而是一連串隨時間演進、彼此相關的序列——時間序列。成功的量化策略，往往始於對這些序列深刻的統計理解。我們不僅想知道「明天價格大概是多少」（條件均值預測），更迫切想知道「明天價格的不確定性有多大」（條件變異數預測）。前者關乎報酬，後者則直接關乎生存：風險。本文將系統性介紹兩大基石模型：ARIMA（自迴歸整合移動平均）與GARCH（廣義自迴歸條件異質變異數），它們分別掌管了時間序列的均值與波動率建模，是任何量化交易員武器庫中的必備工具。

第一部分：駕馭趨勢與週期——ARIMA模型深度解析

1.1 核心思想與數學框架

ARIMA模型的核心前提是「平穩性」。一個平穩的時間序列，其統計特性（如均值、變異數）不隨時間改變，這使得歷史模式有可能延續到未來。金融價格序列（如股價）通常非平穩，但其報酬率序列往往近似平穩，這是建模的起點。

ARIMA(p, d, q) 模型由三部分構成：

AR(p) - 自迴歸部分：當前值由過去p期的值線性解釋。公式為：
X_t = c + Σ(φ_i * X_{t-i}) + ε_t, for i=1 to p
其中φ是自迴歸係數，ε是白噪音。
I(d) - 差分部分：通過d階差分將非平穩序列轉化為平穩序列。這是處理趨勢的關鍵。
MA(q) - 移動平均部分：當前值由過去q期的白噪音誤差項線性解釋。公式為：
X_t = μ + ε_t + Σ(θ_i * ε_{t-i}), for i=1 to q
其中θ是移動平均係數。

完整的ARIMA模型即為差分後序列的ARMA模型：Φ(L)(1-L)^d X_t = c + Θ(L)ε_t，其中L為滯後算子。

1.2 實戰建模五部曲與Python示例

建立一個ARIMA模型遵循Box-Jenkins方法論：

平穩化：透過觀察時間序列圖、ACF（自相關函數）圖，並使用ADF檢定，決定差分階數d。
模型識別：根據平穩序列的ACF和PACF（偏自相關函數）圖，初步判斷p和q的階數。
參數估計：使用最大概似估計法（MLE）估計係數。
模型診斷：檢驗殘差是否為白噪音（無自相關）。
預測：進行樣本外預測。

import pandas as pd
import numpy as np
import yfinance as yf
from statsmodels.tsa.stattools import adfuller, acf, pacf
from statsmodels.tsa.arima.model import ARIMA
import matplotlib.pyplot as plt

# 1. 獲取數據（以標普500指數ETF為例）
spy = yf.download('SPY', start='2018-01-01', end='2023-12-31')
returns = spy['Adj Close'].pct_change().dropna() * 100  # 日報酬率（百分比）

# 2. 平穩性檢定 (ADF Test)
adf_result = adfuller(returns)
print(f'ADF Statistic: {adf_result[0]:.4f}')
print(f'p-value: {adf_result[1]:.4f}')
# p-value通常遠小於0.05，拒絕非平穩的原假設，報酬率序列平穩。

# 3. 識別p, q (觀察ACF/PACF)
fig, axes = plt.subplots(1, 2, figsize=(12,4))
pd.plotting.autocorrelation_plot(returns, ax=axes[0])
axes[0].set_title('ACF of Returns')
# PACF繪圖
from statsmodels.graphics.tsaplots import plot_pacf
plot_pacf(returns, lags=30, ax=axes[1], method='ywm')
axes[1].set_title('PACF of Returns')
plt.show()
# 通常金融報酬率的ACF/PACF無顯著截尾或拖尾，暗示簡單ARIMA可能不是最佳，但我們繼續示範。

# 4. 擬合ARIMA(1,0,1)模型（假設d=0，因報酬率已平穩）
model = ARIMA(returns, order=(1,0,1))
model_fit = model.fit()
print(model_fit.summary())

# 5. 診斷殘差
residuals = model_fit.resid
# 檢定殘差是否為白噪音（Ljung-Box檢定）
from statsmodels.stats.diagnostic import acorr_ljungbox
lb_test = acorr_ljungbox(residuals, lags=[10], return_df=True)
print(f"Ljung-Box test p-value: {lb_test['lb_pvalue'].iloc[0]:.4f}")
# p-value > 0.05 表示殘差無自相關，模型可接受。

# 6. 樣本外預測（未來5天）
forecast = model_fit.forecast(steps=5)
print(f"5-Day Return Forecast (%): {forecast}")

1.3 案例啟示：ARIMA在趨勢跟蹤策略中的局限性

案例：2004-2007年美股牛市中的簡單ARIMA策略
在平穩上升的牛市中，一個基於ARIMA預測明日報酬方向（正/負）的簡單策略，可能表現尚可。然而，其致命弱點在於無法捕捉波動率的突變。ARIMA假設殘差的變異數是恆定的（同質變異數），但金融市場的現實是「波動叢聚」——大漲大跌往往接踵而至。這意味著ARIMA模型會嚴重低估極端事件發生時的風險，導致風險調整後報酬（如夏普比率）在實戰中大打折扣。2007年次貸危機爆發初期，許多僅依賴均值預測的模型瞬間失效，正是因為波動率結構發生了根本性改變。

第二部分：直面風險的核心——GARCH模型家族

2.1 為何需要GARCH？波動叢聚的啟示

金融時間序列最顯著的特徵之一，就是「波動叢聚性」，由諾貝爾獎得主Robert Engle於1982年提出的ARCH模型首次正式刻畫。隨後，Bollerslev於1986年提出其廣義版本——GARCH。其核心思想是：條件變異數（即我們感知的「今日風險」）依賴於過去的殘差平方（驚奇）和過去的條件變異數本身。這完美描述了市場「壞消息帶來恐慌，恐慌引發更多賣壓」的自我實現式波動。

GARCH(1,1)模型公式（最常用）：
均值方程：r_t = μ + ε_t
變異數方程：σ_t² = ω + α * ε_{t-1}² + β * σ_{t-1}²
其中：ε_t = σ_t * z_t, z_t ~ i.i.d. N(0,1)
約束條件：ω > 0, α ≥ 0, β ≥ 0, α + β < 1（確保平穩）。
α（ARCH項）捕捉新衝擊的影響，β（GARCH項）捕捉波動的持久性。α+β接近1，表示波動衝擊消散得很慢。

2.2 GARCH家族演進與Python實戰

為捕捉更複雜的市場現象，GARCH家族不斷擴充：

EGARCH：由Nelson提出，引入槓桿效應（負面消息對波動的影響大於正面消息）。
GJR-GARCH：同樣捕捉槓桿效應，使用指示函數。
FIGARCH：描述波動率長記憶性，即衝擊影響超長期持續。

import arch.univariate as arch

# 使用arch套件擬合GARCH(1,1)模型
# 假設我們已經有報酬率序列 `returns`
am = arch.arch_model(returns, mean='Constant', vol='GARCH', p=1, q=1)
res = am.fit(update_freq=5, disp='off')
print(res.summary())

# 分析參數：alpha（衝擊係數）， beta（持續性係數）
print(f"\nAlpha (衝擊影響): {res.params['alpha[1]']:.4f}")
print(f"Beta (持續性): {res.params['beta[1]']:.4f}")
print(f"Alpha+Beta: {res.params['alpha[1]'] + res.params['beta[1]']:.4f}")
# 通常Alpha+Beta在0.95以上，說明金融市場波動有高度持續性。

# 提取條件波動率（即預測的日波動率）
cond_vol = res.conditional_volatility
# 繪製波動率
plt.figure(figsize=(10,6))
plt.plot(returns.index, cond_vol)
plt.title('Conditional Volatility (GARCH(1,1)) for SPY Returns')
plt.ylabel('Daily Volatility (%)')
plt.xlabel('Date')
plt.show()

# 預測未來5天的條件波動率
forecast = res.forecast(horizon=5)
future_vol = forecast.variance.iloc[-1].pow(0.5)  # 開根號得到標準差
print(f"5-Day Ahead Volatility Forecast (%): \n{future_vol}")

2.3 歷史案例透視：GARCH如何預警風險

案例一：1997年亞洲金融風暴
在風暴前夕，泰銖、韓元等貨幣的匯率報酬率序列若以GARCH模型擬合，會發現α和β係數顯著，且α+β值極高（如>0.99）。這表明市場處於「高壓狀態」，任何單一衝擊都可能引發長期、劇烈的波動。一個監控GARCH條件的風險管理系統，會在波動率持續上升並突破歷史閾值時發出警報，促使基金降低風險暴露或增加避險部位。

案例二：2020年3月新冠疫情市場崩盤
2020年2月底至3月，VIX恐慌指數飆升。事後用GARCH模型回顧標普500指數的日內高頻數據，會發現條件波動率σ_t在數日內急遽上升數倍。EGARCH或GJR-GARCH模型會進一步顯示，下跌日的殘差對波動率提升的貢獻（槓桿效應）遠大於上漲日。這解釋了為何暴跌往往伴隨著流動性枯竭和更極端的後續波動。那些使用動態GARCH模型來調整部位大小（如波動率目標策略）的基金，相比使用固定歷史波動率的基金，在這次危機中表現出了更優的下行風險控制。

第三部分：從理論到實戰——整合ARIMA與GARCH的行動框架

3.1 ARIMA-GARCH整合模型

實戰中，我們常將兩者結合：用ARIMA類模型擬合條件均值，用GARCH類模型擬合條件變異數。即：
r_t = ARIMA Process + ε_t
ε_t = σ_t * z_t
σ_t² = GARCH Process
這允許我們同時對報酬的方向和不确定性進行動態預測。

3.2 量化交易中的具體應用場景

動態風險管理與VaR計算：使用GARCH預測的條件波動率，計算動態條件風險值（Conditional VaR），比靜態歷史模擬法更敏感。

# 計算基於GARCH的1天95% Conditional VaR (百分比)
z_score = 1.645  # 正態分佈95%分位數
conditional_var = - (res.params['mu'] - z_score * cond_vol)  # 注意符號

波動率目標策略：根據預測波動率動態調整投資組合槓桿，維持目標年化波動率（如12%）。當預測波動率高時降槓桿，低時加槓桿。
選擇權定價與交易：BS模型假設波動率恆定，而實際隱含波動率會變動。使用GARCH預測的未來波動率路徑，可以改進選擇權定價，並識別定價錯誤的機會（波動率套利）。
趨勢跟蹤濾波：在ARIMA產生交易訊號的同時，參考GARCH的條件波動率。當波動率過高時，即使有趨勢訊號，也降低部位或暫停交易，以避開「假突破」和極端回撤。

3.3 給量化交易者的行動建議

起步務實：先從GARCH(1,1)和EGARCH(1,1)開始，在單一流動性高的資產（如SPY、QQQ）上實踐整個建模流程。
診斷至上：永遠檢驗標準化殘差z_t = ε_t / σ_t是否獨立同分布。如果仍有自相關或厚尾，考慮更複雜的模型（如t分佈GARCH）。
樣本外驗證：使用滾動窗口（Rolling Window）或擴展窗口（Expanding Window）進行樣本外預測，並評估波動率預測的準確性（例如使用MSE或QLIKE損失函數）。
避免過度擬合：金融數據噪音極大。更高的模型複雜度（如ARIMA(5,1,5)-GARCH(2,2)）在樣本內擬合更好，但樣本外預測能力往往下降。堅持簡潔原則。
融入多因子框架：將GARCH預測的波動率作為一個風險因子，納入多因子模型（如Fama-French擴展模型），以解釋資產橫斷面報酬的差異。

風險警示與免責聲明

重要風險提示：

模型風險：所有統計模型都是對現實的簡化。ARIMA-GARCH模型無法預測從未發生過的「黑天鵝」事件結構性轉變（如監管巨變、主權違約）。
參數不穩定性：模型的參數（α, β）可能隨市場制度變化而漂移。需要定期重新估計。
預測局限：對條件均值的預測能力在短期內非常微弱，不應作為單一交易依據。對條件波動率的預測相對更可靠，但長時段預測誤差會迅速放大。
交易成本與流動性：本文未考慮交易成本、滑價和流動性枯竭的影響，這些在實戰中可能完全侵蝕模型產生的理論超額報酬。

免責聲明：本文內容僅供教育與學術討論之用，不構成任何形式的投資建議或交易邀約。金融市場交易存在本金損失的風險，讀者應根據自身情況尋求獨立的專業財務意見。過往表現不預示未來結果。

結論

時間序列分析是量化交易的語言，ARIMA與GARCH是這門語言中最基礎也最強大的文法。掌握它們，意味著你能夠更科學地解讀市場的「記憶」（趨勢與自相關）與「脈搏」（波動叢聚與風險）。然而，真正的藝術不在於複雜的數學，而在於理解模型的假設何時會破裂，並將這些工具與市場微結構、宏觀邏輯以及其他因子相結合。從今天開始，嘗試用GARCH的眼光重新審視你的投資組合波動，這或許是邁向更專業、更紀律化的風險調整後報酬追求之路的第一步。

參考文獻與延伸閱讀

Engle, R. F. (1982). Autoregressive Conditional Heteroscedasticity with Estimates of the Variance of United Kingdom Inflation. Econometrica, 50(4), 987-1007. （ARCH模型的開山之作）
Bollerslev, T. (1986). Generalized Autoregressive Conditional Heteroskedasticity. Journal of Econometrics, 31(3), 307-327. （GARCH模型的奠基論文）
Tsay, R. S. (2010). Analysis of Financial Time Series (3rd ed.). Wiley. （業界標準教科書，理論與應用並重）
Brooks, C. (2019). Introductory Econometrics for Finance (4th ed.). Cambridge University Press. （優秀的入門與實戰指南）
《寬客人生》（My Life as a Quant）by Emanuel Derman。雖非技術手冊，但提供了模型在華爾街實踐中的哲學與局限性的深刻反思。