時間序列分析的量化交易實戰：從ARIMA預測到GARCH波動率建模的完整指南

前言：為何時間序列分析是量化交易的基石？

2008年金融海嘯期間，許多風險模型失效，原因之一在於它們低估了市場波動率的持續性與尾部風險。傳統的假設（如收益率獨立同分布）在危機中徹底崩潰。這事件殘酷地教育了整個華爾街：不理解時間序列的動態特性，尤其是波動率的時變性，就等於在黑暗中交易。在我於Two Sigma的職業生涯早期，親眼見證了一個基於簡單GARCH波動率預測的風險平價策略，如何在市場劇烈動盪時顯著優於靜態波動率模型。這份經驗讓我深信，掌握從ARIMA到GARCH的技術，是構建穩健量化策略的必經之路。

第一部分：平穩性與ARIMA模型——預測價格走勢的起點

任何時間序列分析的起點，都是理解「平穩性」。一個平穩過程的統計特性（如均值、變異數）不隨時間改變。金融時間序列，如股價，通常是非平穩的（有趨勢），但其收益率序列往往可以近似為平穩，這是我們建模的基礎。

ARIMA模型的數學核心

ARIMA(p, d, q)模型是三個部分的結合：

自回歸（AR, p）：當前值由過去p期的線性組合加上隨機誤差解釋。
公式：X_t = c + Σ(φ_i * X_{t-i}) + ε_t，其中 i=1 to p。
差分（I, d）：將非平穩序列通過d階差分轉化為平穩序列。
移動平均（MA, q）：當前值由過去q期隨機誤差的線性組合解釋。
公式：X_t = μ + ε_t + Σ(θ_i * ε_{t-i})，其中 i=1 to q。

完整的ARIMA模型可表示為：Φ(L)(1-L)^d X_t = c + Θ(L)ε_t，其中L是滯後算子。

實戰案例：用ARIMA預測指數短期動能

2019年，我們團隊曾為一個美股指數ETF的短期動能策略建模。目標是預測未來5日的收益率方向。我們發現，對數收益率序列經過一階差分後（即原本就是收益率），ACF/PACF圖顯示出顯著的短期自相關。一個ARIMA(1,0,1)模型被證明是有效的。

import pandas as pd
import numpy as np
import yfinance as yf
from statsmodels.tsa.arima.model import ARIMA
from statsmodels.graphics.tsaplots import plot_acf, plot_pacf
import matplotlib.pyplot as plt

# 獲取數據（例如：SPY）
spy = yf.download('SPY', start='2015-01-01', end='2020-01-01')
spy['Log_Return'] = np.log(spy['Adj Close'] / spy['Adj Close'].shift(1))
returns = spy['Log_Return'].dropna()

# 1. 平穩性檢查與ACF/PACF分析
fig, axes = plt.subplots(2, 1, figsize=(12,8))
plot_acf(returns, lags=30, ax=axes[0], title='SPY收益率ACF')
plot_pacf(returns, lags=30, ax=axes[1], title='SPY收益率PACF', method='ywm')
plt.show()

# 2. 擬合ARIMA(1,0,1)模型
model = ARIMA(returns, order=(1,0,1))
results = model.fit()
print(results.summary())

# 3. 進行樣本外預測（滾動窗口）
train_size = int(len(returns) * 0.8)
forecasts = []
for t in range(train_size, len(returns)):
    train = returns[:t]
    model_roll = ARIMA(train, order=(1,0,1)).fit()
    forecast = model_roll.forecast(steps=1)
    forecasts.append(forecast.iloc[0])

# 評估預測準確性（方向準確率）
actuals = returns.iloc[train_size:]
direction_accuracy = np.mean((np.array(forecasts) * np.array(actuals)) > 0)
print(f"樣本外方向預測準確率: {direction_accuracy:.2%}")

經驗分享：ARIMA在流動性高的指數產品上，對極短期（日內或隔日）的預測可能有些許信號，但長期預測能力極弱。它更大的價值在於為殘差分析鋪路，以及作為更複雜模型的基準。

第二部分：波動率建模的革命——GARCH家族模型

金融時間序列最顯著的特徵之一是「波動率叢聚」——高波動率時期往往聚集在一起，低波動率時期亦然（如2020年3月新冠疫情衝擊市場時）。這是ARIMA模型無法捕捉的，因為它假設變異數恆定。這就是Robert Engle於1982年提出ARCH模型（因此獲得2003年諾貝爾經濟學獎）並由Tim Bollerslev擴展為GARCH的偉大之處。

GARCH模型的數學框架

標準的GARCH(1,1)模型定義如下：

均值方程：r_t = μ + ε_t，其中 ε_t = σ_t * z_t, z_t ~ i.i.d. N(0,1)。
波動率方程：σ_t^2 = ω + α * ε_{t-1}^2 + β * σ_{t-1}^2。

其中：

ω > 0 為常數項。
α ≥ 0 衡量新資訊衝擊（殘差平方）的影響。
β ≥ 0 衡量前期波動率的持續性。
通常 α + β < 1 確保平穩性，且值越接近1，波動率持續性越強。

GARCH模型的美妙在於它用極簡的參數，精準描述了波動率的自回歸特性。

權威引用與演進

1. 奠基之作：Engle, R. F. (1982). Autoregressive Conditional Heteroskedasticity with Estimates of the Variance of United Kingdom Inflation. Econometrica. 這篇論文開創了條件異變異數建模的時代。
2. 經典擴展：Bollerslev, T. (1986). Generalized Autoregressive Conditional Heteroskedasticity. Journal of Econometrics. 提出了GARCH模型，成為業界標準。

實戰案例：用GARCH預測VaR與動態部位調整

在Goldman Sachs的衍生品風險管理部門，我們使用GARCH族模型（特別是EGARCH，它能捕捉波動率對壞消息和好消息的不對稱反應）來計算動態風險價值（VaR）。一個經典應用是2015年8月人民幣匯率波動事件。

import arch
from arch import arch_model

# 使用人民幣兌美元匯率變動數據（此處用SPY替代模擬劇烈波動期）
# 假設`returns`為收益率序列
# 擬合GARCH(1,1)模型
garch_model = arch_model(returns * 100, mean='Constant', vol='GARCH', p=1, q=1) # 乘以100提高數值穩定性
garch_result = garch_model.fit(update_freq=5, disp='off')
print(garch_result.summary())

# 預測未來5日的條件波動率
forecast_horizon = 5
forecasts = garch_result.forecast(horizon=forecast_horizon)
conditional_vol = forecasts.variance.iloc[-1] ** 0.5 / 100 # 轉換回原尺度
print(f"未來{forecast_horizon}日條件波動率預測:\n{conditional_vol}")

# 計算基於GARCH的動態1日95% VaR
# VaR = - (均值預測 - 分位數 * 條件標準差)
z_score = 1.645 # 95% 置信水平
mean_forecast = garch_result.params['mu']
next_day_vol = conditional_vol.iloc[0]
dynamic_var = -(mean_forecast - z_score * next_day_vol)
print(f"明日動態95% VaR (收益率尺度): {dynamic_var:.4f}")

# 策略應用：波動率調整部位大小
# 核心思想：預期波動率高時降低曝險
base_position = 1.0 # 基準部位
target_vol = 0.15 # 年化目標波動率15%
annualization = np.sqrt(252)
current_ann_vol = next_day_vol * annualization
vol_scaling_factor = target_vol / current_ann_vol
adjusted_position = base_position * min(vol_scaling_factor, 2.0) # 設定上限
print(f"波動率調整後部位權重: {adjusted_position:.2f}")

經驗分享：GARCH(1,1)的參數在許多資產上驚人地穩健。但關鍵在於，模型預測的是「條件」波動率，它依賴於當前的資訊集。在市場機制突變時（如閃崩、央行干預），模型需要快速重新估計或結合另類數據。

第三部分：從理論到策略——整合均值與波動率模型

一個成熟的量化框架會同時建模收益率的條件均值（如ARMA）和條件變異數（如GARCH），即ARMA-GARCH模型。這允許我們更精細地進行信號生成與風險管理。

行動建議：構建你的第一個時間序列策略框架

數據準備與平穩化：使用對數收益率。進行ADF檢驗確認平穩性。
模型識別與選擇：
- 使用ACF/PACF初步判斷ARMA階數。
- 對殘差進行ARCH-LM檢驗，如果存在ARCH效應，則必須使用GARCH族模型。
- 考慮更先進的模型，如捕捉槓桿效應的EGARCH或TGARCH。
樣本外驗證與回測：永遠使用滾動窗口或擴展窗口進行參數估計和預測，避免前瞻性偏差。
風險整合：將預測的波動率直接輸入到部位大小計算、止損設定或期權定價中。

第四部分：重要風險警示與模型局限性

即使掌握這些強大工具，也必須對其局限性保持敬畏：

參數不穩定性：金融市場的數據生成過程會隨時間演變。模型參數需要定期重估。
分布假設：標準GARCH常假設殘差服從正態分布，但金融收益率有厚尾特性。考慮使用t分布或GED分布。
外生衝擊：模型無法預測從未在歷史中出現過的「黑天鵝」事件（如2020年疫情）。波動率預測在極端市場下可能嚴重低估風險。
過度擬合風險：增加模型複雜度（如高階GARCH）不一定能提升樣本外表現。保持模型簡潔。

免責聲明：本文所提及的模型、代碼及策略案例僅供教育與研究目的，不構成任何投資建議。金融市場交易存在重大風險，可能導致本金全部損失。過去績效不代表未來結果。讀者應根據自身情況尋求獨立的專業財務建議，並對自己的投資決策全權負責。

結論：成為一名謹慎的時間序列駕馭者

從ARIMA到GARCH的旅程，是一個量化交易員理解市場「記憶」與「情緒」的過程。ARIMA試圖捕捉價格走勢的線性記憶，而GARCH則精妙地刻畫了市場恐懼與貪婪的持續性——即波動率的記憶。成功的應用不在於追求最複雜的模型，而在於深刻理解每個模型的假設、優勢與致命弱點，並將其與嚴格的風險管理相結合。記住，模型是地圖，而非領土。在瞬息萬變的金融市場中，這張地圖需要你憑藉經驗不斷校準。現在，就從分析一個你熟悉的資產收益率序列開始，運行你的第一個GARCH模型，親身感受市場波動的脈動吧。