由于投資者的注意力偏差,經濟上相互關聯的公司發布的消息不會立即反應在股票上,這就產生了收益可預測性。通過已經抽取的實體結合業務邏輯確定實體間的關系,同時已經完成了知識圖譜存儲的工作。其中實體主要包括上市公司上下游原材料、主營產品、主營業務、所屬行業、所屬板塊等十余種實體。
基于此理論構建模型,利用產業鏈知識圖譜尋找相關聯公司,驗證了收益的可預測性。
知識圖譜構建數據:招股說明書、財務報表等上市公司公開文檔。
所用其他數據:
1)資產價格時間序列數據
2)價格、金額、指數、銷量、出貨量等五個指標所代表的宏觀指數