再談統計套利
發表於 : 週五 9月 19, 2025 7:04 am
再「統計套利」一文中,提到《專業股票交易》用2支股票的相關性,做Spread的Pair Trading。
我把必要的相關性條件視為這個策略的瑕疵,現在來談談理由。
作者用R30代表過去30天2支股票的相關性,天數是可以依照使用者定義的參數。R就是統計上的相關係數(Correlation Coefficient),Excel與程式交易軟體應該都有這個公式或函數可以直接計算出值。
現在的問題是相關性評估的期間應該用幾天?
理論上,天數越多,相關性的結論越穩健,但是變異會很大,均值回歸需要的時間可能會很長,持倉就存在風險,30天似乎是很適當的。
但若用前30天的相關係數值,來估計今天的波動區間,若30天的樣本剛好存在大的偏差,今天就不會有好的交易;又若這個月的樣本的偏差,都持續發散中,不好的交易就會持續1個月。
這樣的問題,應該可以用數理統計的模型來評估,但我的數學已經剩下加減乘除的能力了,回測變成我的簡單工具,以這本書的模型公式中,有2個需要決策的參數:SD與Rx,使用MultiCharts或TradeStation做參數最佳化,可以觀察有沒有參數高原的參數可以使用,更積極的,可以使用Walk-Forward,對樣本外做驗證。
我把必要的相關性條件視為這個策略的瑕疵,現在來談談理由。
作者用R30代表過去30天2支股票的相關性,天數是可以依照使用者定義的參數。R就是統計上的相關係數(Correlation Coefficient),Excel與程式交易軟體應該都有這個公式或函數可以直接計算出值。
現在的問題是相關性評估的期間應該用幾天?
理論上,天數越多,相關性的結論越穩健,但是變異會很大,均值回歸需要的時間可能會很長,持倉就存在風險,30天似乎是很適當的。
但若用前30天的相關係數值,來估計今天的波動區間,若30天的樣本剛好存在大的偏差,今天就不會有好的交易;又若這個月的樣本的偏差,都持續發散中,不好的交易就會持續1個月。
這樣的問題,應該可以用數理統計的模型來評估,但我的數學已經剩下加減乘除的能力了,回測變成我的簡單工具,以這本書的模型公式中,有2個需要決策的參數:SD與Rx,使用MultiCharts或TradeStation做參數最佳化,可以觀察有沒有參數高原的參數可以使用,更積極的,可以使用Walk-Forward,對樣本外做驗證。