資源描述:
《新聞選股策略回測(cè)與展望》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。
1、新聞選股策略回測(cè)與展望21世紀(jì)是互聯(lián)網(wǎng)的時(shí)代,互聯(lián)網(wǎng)對(duì)人們生活方方面面的影響已經(jīng)有目共睹,股票市場也不例外。中國股市是名副其實(shí)的“政策市”,也就是說個(gè)股和指數(shù)的上漲與下跌主要受到國家政策的影響,而個(gè)股對(duì)應(yīng)公司的經(jīng)營狀況可能還不如政策有效。什么是政策?政策就是新聞。對(duì)于股指,政策是政府對(duì)金融市場、宏觀經(jīng)濟(jì)、利率的調(diào)控;對(duì)于個(gè)股「政策”就是公司新聞或者事件。盡管事件驅(qū)動(dòng)就是研究股票價(jià)格隨著一些特定上市公司事件的變動(dòng),而公司新聞的研究就要比事件驅(qū)動(dòng)更廣,比如說事件驅(qū)動(dòng)只是涉及像定向增發(fā)、高管增持、收購等,而公司新聞則可能是
2、A公司與B公司合作、遭監(jiān)管部門調(diào)查、高管進(jìn)軍某一領(lǐng)域等等。因此,我們需要實(shí)證地檢驗(yàn)新聞選股的有效性,也就是個(gè)股新聞對(duì)股票價(jià)格的影響。下面幾個(gè)部分是按照整個(gè)模型搭建的順序依次闡述,分別為:關(guān)鍵詞庫的搭建與利好新聞的篩選、關(guān)鍵詞的重新篩選、新聞選股策略的回測(cè)、加入其他篩選條件的對(duì)比、未來可能的改進(jìn)。詳細(xì)內(nèi)容見下文。一、關(guān)鍵詞庫的搭建與利好新聞的篩選為了檢測(cè)公司新聞對(duì)股票價(jià)格的影響,首先需要區(qū)分該新聞是利好、利空還是中性的??紤]到融券成本較大、融券標(biāo)的的局限性,并且為了設(shè)計(jì)投資策略,我只分析利好新聞對(duì)股票價(jià)格的正向促進(jìn)作用
3、。建立詞庫是一個(gè)較大的工程,為了完成這個(gè)工程,我采用Python的結(jié)巴分詞模塊'先對(duì)3000多個(gè)新聞標(biāo)題進(jìn)行分詞,然后把這些詞匯進(jìn)行初步利好利空的標(biāo)注。先對(duì)結(jié)巴分詞做一個(gè)簡單的介紹。結(jié)巴分詞采用的算法有:?基于前綴詞典實(shí)現(xiàn)高效的詞圖掃描,生成句子中漢字所有可能成詞情況所構(gòu)成的有向無環(huán)圖(DAG);?采用了動(dòng)態(tài)規(guī)劃查找最大概率路徑,找出基于詞頻的最大切分組合;?對(duì)于未登陸詞,采用了基于漢字成詞能力的HMM模型,使用了Viterbi算法。例如,“我來到北京大學(xué)光華管理學(xué)院”分詞后變成“我I來到I北京大學(xué)I光華管理學(xué)院”。
4、這樣先人工地把新聞標(biāo)題分詞后的詞庫進(jìn)行標(biāo)注。然而像一些金融詞匯,比如'‘定增”、“漲?!钡仍~匯還需要進(jìn)一步的補(bǔ)充??紤]到財(cái)經(jīng)新聞標(biāo)題的風(fēng)格比較一致,我只對(duì)新浪財(cái)經(jīng)新聞上市公司板塊中2年內(nèi)的新聞標(biāo)題進(jìn)行關(guān)鍵詞的提取,最終得到一個(gè)初始的利好利空關(guān)鍵詞庫,部分詞匯見附錄lo建立好關(guān)鍵詞后就需要對(duì)新聞標(biāo)題進(jìn)行利好利空的判斷,盡管現(xiàn)在NLP(自然語言處理)領(lǐng)域?qū)φZ句極性的分析已經(jīng)較成熟,但是為了提高運(yùn)算效率,我還是釆用最原始的'‘關(guān)鍵詞判定法”一一如果新聞標(biāo)題中包含正面關(guān)鍵詞但不包含負(fù)面關(guān)鍵詞,則判定為利好新聞。按照這個(gè)算法,
5、利好利空關(guān)鍵詞篩選出來利好新聞的準(zhǔn)確率高達(dá)98%。二、關(guān)鍵詞的重新篩選人工對(duì)關(guān)鍵詞極性的判斷還是基于一個(gè)金融上或者心理上感性的認(rèn)識(shí),比如我們認(rèn)為含有“定增”、“合作”、“促進(jìn)”這些關(guān)鍵詞的新聞標(biāo)題是利好新聞,但是事實(shí)是否真是如此還需要實(shí)證地檢驗(yàn)。而且含有"并購”的新聞就比含有“獲得”的新聞更有價(jià)值,也就是說不同關(guān)鍵詞對(duì)股票價(jià)格的影響也是不一樣的;甚至有的關(guān)鍵詞雖然直覺上是利好的,但是實(shí)際對(duì)股價(jià)的刺激是負(fù)面的。因此,對(duì)每個(gè)正面關(guān)鍵詞,提取所有包含它的利好新聞,然后按照利好新聞涉及的股票持有1周,統(tǒng)計(jì)出“關(guān)鍵詞的平均收益
6、率”,表示關(guān)鍵詞的有效性。見附錄2。按照關(guān)鍵詞有效性,剔除掉歷史上關(guān)鍵詞平均收益率為負(fù)的關(guān)鍵詞。三、新聞選股策略的回測(cè)按照以上篩選利好新聞的方式,對(duì)新浪財(cái)經(jīng)上市公司專欄$中過去兩年(從2013年1月到2015年1月)的新聞進(jìn)行回溯測(cè)試?;厮轀y(cè)試流程如下:?對(duì)每條新聞的新聞標(biāo)題進(jìn)行利好利空判斷,保留利好新聞?提取該利好新聞對(duì)應(yīng)的股票,方法是如果標(biāo)題中含有股票簡稱就直接用該股票,如果標(biāo)題中不含就在正文中檢索?每周一按照開盤價(jià)等資金買入上周所有利好新聞對(duì)應(yīng)的股票,剔除開盤漲停的股票,并持有一周,即按照周五收盤價(jià)賣出上述操作
7、方式得到的收益率曲線如下:其中紅實(shí)線表示上述新聞選股策略的收益表現(xiàn),紅虛線表示扣除雙邊0.5%的交易成本(交易傭金+沖擊成本),藍(lán)線代表滬深300指數(shù)??梢娙善钡荣Y金的新聞選股策略能有效的跑贏指數(shù),不論是否考慮交易費(fèi)用。四、加入其他篩選條件的對(duì)比上述的新聞選股策略只是簡單地將上周所有利好新聞的股票等資金地持有,比較nave,可以從股票進(jìn)一步篩選和資金分配兩個(gè)角度再優(yōu)化。股票的篩選條件可以是:ROE、換手率、新聞點(diǎn)擊量等;資金分配我只考慮按照新聞發(fā)布時(shí)間加權(quán)。首先考慮ROE。對(duì)每周利好新聞的股票進(jìn)一步用ROE進(jìn)彳亍篩
8、選,選取ROETTM(trailingtwelvemonths)前100名的股票,若利好新聞的股票不足100只則不篩選,與不篩選股票進(jìn)行比較。卜mimozoz/owoz一swecmoz8175:030Z/9