import finlab
from finlab import backtest
from finlab import data
import scipy.stats as stats
import numpy as np


with data.universe(market='TSE_OTC',category='金融'): # 上市+上櫃
    financialColumns =data.get('price:收盤價').columns
with data.universe(market='TSE_OTC'):
    allColumns =data.get('price:收盤價').columns

with data.universe(market='TSE',category='金融'): # 上市 (ETF母體)
    financialTseColumns =data.get('price:收盤價').columns
with data.universe(market='TSE'):
    allTseColumns =data.get('price:收盤價').columns

# 上櫃
with data.universe(market='OTC',category='金融'):
    financialOtcColumns =data.get('price:收盤價').columns
with data.universe(market='OTC'):
    allOtcColumns =data.get('price:收盤價').columns

data.set_universe(market='TSE_OTC') #設定母體為TSE+OTC，為下一章的策略優化作準備

def Z(df):
    df= df.apply(stats.zscore,axis=1,nan_policy='omit') # zscore, 忽略nan
    cond = (df>3) | (df<-3) # 只留下3個std以內的資料,離群值不採納
    df[cond] = np.nan
    return df

def diffList(a,b): #在A裡面不在B裡面的元素
    return [i for i in a if i not in b]

計算價值因子

分別計算各個單因子
通過常態標準化函數
根據股票類別採取不同的單因子加權方式

# 營業現金流量對股價比
收盤價 = data.get("price:收盤價")
營業現金流量 = data.get('financial_statement:營業活動之淨現金流入_流出')
股本 = data.get('financial_statement:股本')
每股營業現金流量 = 營業現金流量 / (股本/10)
營業現金流量對股價比 = 每股營業現金流量 / 收盤價

# EBITDA對企業價值比
稅前息前折舊前淨利率 = data.get('fundamental_features:稅前息前折舊前淨利率')
營業收入淨額 = data.get("financial_statement:營業收入淨額")
EBITDA = 稅前息前折舊前淨利率*營業收入淨額/100
負債總額 = data.get('financial_statement:負債總額') 
現金及約當現金 = data.get('financial_statement:期末現金及約當現金餘額')
市值 = 股本/10*收盤價
企業價值 = 市值 + 負債總額 - 現金及約當現金
EBITDA對企業價值比 = EBITDA /企業價值

# 益本比
每股盈餘 = data.get('financial_statement:每股盈餘')
益本比 = 每股盈餘 / 收盤價

# 股東收益率
股息殖利率 = data.get('price_earning_ratio:殖利率(%)')
發行股數 = data.get('internal_equity_changes:發行股數') #改股本
前一年發行股數 = data.get('internal_equity_changes:發行股數').shift(12)  # 一年12個月
庫藏股回購率 = (發行股數 - 前一年發行股數) * (收盤價 / 市值)
股東收益率 = 股息殖利率 + 庫藏股回購率


# 計算價值因子分數

價值因子分數 = 0.4 * Z(營業現金流量對股價比) + 0.4* Z(益本比) + 0.2 * Z(股東收益率) #用非金融股算法計算全部
價值因子分數_金融 = 0.3 * Z(營業現金流量對股價比) +0.3 * Z(EBITDA對企業價值比) + 0.3 * Z(益本比) + 0.1 * Z(股東收益率) #用金融股算法計算全部
finCol = 價值因子分數_金融.columns.intersection(financialColumns) # 取交集過濾掉已經下市的股票
價值因子分數[finCol] = 價值因子分數_金融[finCol] # 再用金融股的值代入金融股的值
價值因子分數 # 所有TSE & OTC 的股票價值因子分數

計算多因子權重

給予三種因子不同的權重算出多因子分數
透過公式轉換成多因子權重

多因子分數 = 0.4 * 品質因子分數 + 0.3 * 價值因子分數 + 0.3 * 動能因子分數
多因子權重係數 = 多因子分數.applymap(lambda z: 1+z if(z>=0) else (1-z)**-1)

回測

選取多因子權重係數大於等於75分位數者為成分股
resample頻率設定為每日
不考慮交易稅和手續費

# 選取多因子權重係數大於等於75分位數者為成分股
col = 多因子權重係數.columns.intersection(allTseColumns)
多因子權重係數_TSE = 多因子權重係數[col]
cond = 多因子權重係數_TSE < 多因子權重係數_TSE.quantile_row(0.75) #計算多因子權重係數小於75分位數的股票
多因子權重係數_TSE[cond] = 0 # 設權重為0
position = 多因子權重係數_TSE.loc["2020-08-10":] #指數從此時編纂
report = backtest.sim(position, resample=None,fee_ratio=0,tax_ratio=0)

Smart多因子回測結果

訓練集(training set)表現

大部分時間都勝過大盤，但在下跌的時候比大盤還要兇，品質因子並沒有發揮所宣稱的強健抗震效果，總結起來是個尚可的選股策略。

測試集(testing set)表現

測試集的結果令人驚豔！報酬率一路遙遙領先，MDD相對大盤來說也小上許多。即便在最近的熊市，最終的報酬率高達加權指數的兩倍之多，年化報酬高達24%！

單因子回測結果

特選Smart多因子在不同資料集中的表現時好時壞，沒有一致的績效表現通常代表組成的單因子好壞參半。

因此我們將特選Smart多因子進一步拆分成一個個單因子，來檢視那些單因子能產生超額報酬，哪些則只是拿來濫竽充數。

回測將使用訓練集資料，並分為報酬率和相關性。報酬率回測將使用單項因子取代原先的Smart多因子，其餘完全相同；相關性回測則會用單因子排序，將所有股票分為五份（每20%一個組別），依序計算其報酬率後做線性回歸，目的是觀察單因子與股票報酬率之間是否有明顯的正負相關性。

價值、品質、動能因子回測

首先回測三大主要因子，分別驗證各因子的報酬率與相關性表現。

報酬率回測

三大因子的報酬率相差不大，動能、品質、價值因子在測試集的總報酬分別為46%、43%、39%。

細項單因子回測

大致了解三大因子的效度之後，將進一步作更深入的解析，這次將目標轉移到了三大因子裡面的每一項單因子。

報酬率回測

整體來說報酬率呈現平滑的下降趨勢，彼此間的數值差異並不大，名列前三的單因子分別是益本比、股價動能、營利動能。令人驚奇的是，第一名竟然來自先前表現較差的價值因子類別，原因來自價值因子的好壞參差不齊。4種價值因子，分別位居報酬率的第1、4、8、11名。這也凸顯了逐一檢查因子的重要性，若是我們沒做細項的單因子檢驗，很有可能錯過益本比這樣優秀的feature！

回測分析統整

三大因子中，動能因子的總報酬較高，但整體差異並不大，相關性則是動能、品質因子勝過價值因子。

若進一步比較細項的單因子，彼此間的報酬率差異依舊不算大，只是隨著排名緩慢的下滑；相關性的話，來自價值因子的益本比是其中最強力的單因子，第二三名則都是動能因子。

結論

整體而言，回測結果比預期要來的好！雖說00905本身因為流動性的考量和參考市值的設計導致績效與Smart特選多因子脫鉤，但多因子本身包含了許多優秀的features，也帶給我許多不同的思考方向和啟發。

以本益比為例，過往最常見選股策略就是設定本益比低於某數值時買入，但該策略也許多缺點：本益比會出現負數、不同本益比之間的持股權重難以定義等等，因此單純的本益比策略效果並不好。

00905則提出了更好的方法，首先將本益比改成益本比，並透過常規化、權重轉換的方式，同時解決了負數、權重分配的問題。讓我們以不同的角度去理解本益比，在與本益比一樣只使用EPS和收盤價的狀況下，大幅度提高了策略報酬。

形形色色的ETF就像是一個個盲盒，要靠大家自己去實際閱讀、理解、實測，在其中尋找feature的靈感來源，構建出專屬於自己的ETF。

建構出自己的 Smart ETF 00905 2.0 ! Part2 – 12 個獲利因子程式碼懶人包大公開

前情提要

簡介

ETF 00905 Smart多因子

流動性檢驗

指標篩選

價值因子指標

多因子分數

多因子權重係數

排序方式

候選名單

成分股集合一

成分股集合二

權重計算

程式實作

實作微調部分

定義訓練集、測試集

引入套件、定義需要的函數

計算價值因子

計算多因子權重

回測

Smart多因子回測結果

訓練集(training set)表現

測試集(testing set)表現

單因子回測結果

價值、品質、動能因子回測

報酬率回測

相關性回測

細項單因子回測

報酬率回測

相關性回測

回測分析統整

結論

阿榤

前情提要

簡介

ETF 00905 Smart多因子

流動性檢驗

指標篩選

價值因子指標

多因子分數

多因子權重係數

排序方式

候選名單

成分股集合一

成分股集合二

權重計算

程式實作

實作微調部分

定義訓練集、測試集

引入套件、定義需要的函數

計算價值因子

計算多因子權重

回測

Smart多因子回測結果

訓練集(training set)表現

測試集(testing set)表現

單因子回測結果

價值、品質、動能因子回測

報酬率回測

相關性回測

細項單因子回測

報酬率回測

相關性回測

回測分析統整

結論

You Might Also Like