比特幣價格 比特幣價格
Ctrl+D 比特幣價格
ads

NFT:點寬專欄——教你如何應用樸素貝葉斯分類器進行股價趨勢分類預測_STE

Author:

Time:1900/1/1 0:00:00

樸素貝葉斯分類器進行股價趨勢分類預測

原理

貝葉斯定理

模型思想

1、在風險識別中,貝葉斯模型本質上也是一種已知結果找原因的思維工具。

2、在風險決策中,利用貝葉斯模型的基本思想是充分利用先驗信息,將先驗分布和抽樣分布整合成后驗分布,從而利用后驗分布進行決策。如果有新的信息,則更新后驗分布,實現遞歸決策方案。從而得到最優策略,使得決策風險盡可能低。在概率統計的表述是:應用所觀察到的現象對有關概率分布的主觀判斷進行修正的標準方法。

3、在分類預測中,樸素貝葉斯的思想基礎是這樣的:對于給出的待分類項,求解在此項出現的條件下各個類別出現的概率,哪個最大,就認為此待分類項屬于哪個類別。

概率論基礎

要理解貝葉斯模型,必須先理解貝葉斯定理。貝葉斯定理實際上就是計算“條件概率”的公式。

報告:第二季度前十大DEX現貨交易量環比下降30.8%:7月21日消息,CoinGecko發推稱,今年第二季度,前十大DEX的現貨交易量為1550億美元,相較于第一季度下降30.8%。其中,Uniswap保持了其最大DEX的地位,5月份交易量占比高達70%。

此前消息,CoinGecko報告顯示,2023年第二季度,前十大中心化加密貨幣交易所的現貨交易總額總計1.42萬億美元,比第一季度減少43.2%。幣安因退出部分市場、被SEC起訴以及裁員而受到較大影響,其主導地位在短短三個月內從61%降至52%。

穩定幣市場也受到影響,BUSD市值在4月至6月期間減少45.4%。TUSD成為第二季度市值漲幅最大的穩定幣,其市值增加50%。USDT市值增加4.4%,仍然穩居榜首,占據66%的穩定幣市場份額。[2023/7/21 15:50:23]

條件概率

條件概率,是指在事件B發生的情況下,事件A發生的概率,用P(A|B)來表示。其公式為:

受Azuki、BAYC等藍籌NFT價格下挫影響,BendDAO TVL單日下降43.02%:7月2日消息,據DeFiLlama數據顯示,受Azuki、BAYC等藍籌NFT價格下挫影響,多個NFT借貸協議TVL在一日內出現較大跌幅,其中:·BendDAOLendingTVL單日跌幅達43.02%;ParaSpaceLendingTVL單日跌幅達13.07%;BlurLendingTVL單日跌幅達29.51%。另據NFTGo.io數據顯示:Azuki系列NFT地板價現報6.46ETH,24小時跌幅17.04%;BAYC系列NFT地板價現報31.07ETH,24小時跌幅12.07%;MAYC系列NFT地板價現報5.47ETH,24小時跌幅15.45%。[2023/7/3 22:13:52]

上式可轉化為:

稱為乘法公式。

全概率公式

美國參議院多數黨領袖舒默將于6月21日公布人工智能監管框架:金色財經報道,市場消息:美國參議院多數黨領袖舒默將于6月21日公布人工智能監管框架。[2023/6/17 21:43:24]

設試驗E的樣本空間為S,A為E的事件,B1,B2,…,Bn為S的一個劃分,則全概率公式為:

模型公式

公式

通常,事件A在事件B(發生)的條件下的概率,與事件B在事件A的條件下的概率是不一樣的;然而,這兩者是有確定的關系,貝葉斯法則就是這種關系的陳述。

設試驗E的樣本空間為S,A為E的事件,B1,B2,…,Bn為S的一個完備事件組,則:

其中:P(Bi):Bi的先驗概率或邊緣概率。之所以稱為“先驗”是因為它不考慮A任何因素的影響。P(Bi|A):已知A發生后Bi的條件概率,即由于得知A的取值而被稱作Bi的后驗概率。P(A|Bi):已知Bi發生后A的條件概率,即由于得知Bi的取值而被稱作A的后驗概率。P(A):A的先驗概率或邊緣概率,也作標準化常量

Galaxy Digital財報:一季度凈收入1.34億美元:5月9日消息,專注于數字資產的金融服務和投資管理公司Galaxy Digital公布一季度財報,一季度營收為1.4674億美元,凈收入1.34億美元,收入主要歸因于數字資產收益和未實現的投資收益,相比之下而截至2022年12月31日的季度凈虧損為2.88億美元。一季度Galaxy Digital衍生品收益為5500萬美元。Galaxy Digital流動性包括4億美元的現金和4.14億美元的凈數字資產,其中包括2.09億美元的非算法穩定幣。現金和穩定幣余額比年底減少了2.14億美元,這主要是由于未償還的法定貸款、GK8收購和投資的付款增加。另外,Galaxy Digital與DWS達成戰略聯盟,在歐洲開發數字資產管理解決方案。[2023/5/9 14:52:40]

解析

根據貝葉斯公式:

幣安宣布投資加密風險基金Nomad Capital:3月1日消息,Binance 宣布投資新成立的加密風險基金 Nomad Capital。Nomad 旨在以各種方式為其投資組合項目提供價值,包括產品咨詢、業務開發、代幣學設計、人才收購和代幣發布策略等服務。[2023/3/1 12:35:31]

當A為特征向量,Bi(i=1,2,…,n)為分類標簽時。貝葉斯模型就可以進行分類預測。例如,在對股價進行分類中,特征向量A可以是各種技術指標或K線量價特征。而Bi(i=1,2,3)對應于給定方向上的實際價格變動的事件,其有三個可能的選項:B1=-1“向下”,B2=0“不確定”,B3=1“向上”。我們就可以根據歷史數據來進行分類預測,而預測結果的可能性可以用P(Bi|A)表示,分類級別很簡單:P(Bi|A)越大,則屬于該類別的可能性也越大。該分類方法也被稱為樸素貝葉斯分類器

實踐

樸素貝葉斯模型在股票價格趨勢分類預測的應用

步驟

樸素貝葉斯分類器的具體步驟如下:

step1:設x={a1,a2,…,an}為一個待分類項,而每個a為x的一個特征屬性。

step2:有類別標簽集合C={y1,y2,…,ym}。

step3:根據貝葉斯公式,計算P(y1|x),P(y2|x),…,P(ym|x)。

step4:如果,P(yk|x)=max{P(y1|x),P(y2|x),…,P(ym|x。,則x被分到yk類別。

重點

關鍵就是如何計算第3步中的各個條件概率。

我們可以這么做:

step1:找到一個已知分類的待分類項集合,這個集合叫做訓練樣本集。

step2:統計得到在各類別下各個特征屬性的條件概率估計。即:

step3:如果各個特征屬性是條件獨立的,則根據貝葉斯定理有如下推導:

因為分母對于所有類別為常數,因為我們只要將分子最大化皆可。又因為各特征屬性是條件獨立的,所以有:

其中,1/N為常數。

因此,樸素貝葉斯分類器過程是利用樣本集統計出各特征屬性的條件概率以及分類標簽的概率。然后根據以上步驟對待分類項進行分類預測。

心得

可以看到,整個樸素貝葉斯分類分為三個階段:

第一階段——準備工作階段,這個階段的任務是為樸素貝葉斯分類做必要的準備,主要工作是根據具體情況確定特征屬性,并對每個特征屬性進行適當劃分,然后由人工對一部分待分類項進行分類,形成訓練樣本集合。這一階段的輸入是所有待分類數據,輸出是特征屬性和訓練樣本。這一階段是整個樸素貝葉斯分類中唯一需要人工完成的階段,其質量對整個過程將有重要影響,分類器的質量很大程度上由特征屬性、特征屬性劃分及訓練樣本質量決定。

第二階段——分類器訓練階段,這個階段的任務就是生成分類器,主要工作是計算每個類別在訓練樣本中的出現頻率及每個特征屬性劃分對每個類別的條件概率估計,并將結果記錄。其輸入是特征屬性和訓練樣本,輸出是分類器。這一階段是機械性階段,根據前面討論的公式可以由程序自動計算完成。

第三階段——應用階段。這個階段的任務是使用分類器對待分類項進行分類,其輸入是分類器和待分類項,輸出是待分類項與類別的映射關系。這一階段也是機械性階段,由程序完成。

應用

下面我們利用樸素貝葉斯模型對股票價格趨勢進行分類預測:

屬性劃分

對屬性的確定并對屬性進行適當劃分是非常重要的。這里為了簡單起見,我們利用當日的漲跌狀態、RSI指標、RSRS指標、CCI指標做為特征屬性。而實際價格趨勢為分類標簽。根據指標的常用方法對特征屬性進行劃分,其劃分如下表:

分類訓練

本文利用股市滬深300的所有成分股N天歷史數據作為訓練樣本。以當前天的下一交易日實際價格漲跌狀態為分類標簽進行分類器訓練。訓練樣本量為:3萬。

利用2018年5月1日之前的N天的樣本數據為訓練樣本,訓練結果如下表:

分類預測

預測2018年5月2日-5月15日這10個交易日價格漲跌趨勢。利用該段時間滬深300成分股的實際價格漲跌檢驗分類預測價格漲跌趨勢的準確率,如下表所示:

總結

簡單的利用貝葉斯模型對股價進行分類預測有一定的合理性。如果想要提高貝葉斯模型分類預測的準確性,我們可以從下面兩方面出發:

1、從貝葉斯模型的特征屬性出發,深入研究和挖掘更多有用的特征屬性,并合理地劃分每一個特征屬性的范圍。

2、選擇合適的訓練樣本集進行研究,可以按行業分類選擇具有相同趨勢的股票進行訓練及預測。

拓展

波動率估計

波動率模型,尤其是隨機波動率模型在金融領域有著廣泛的應用,這就使得模型的參數估計成為一個非常重要的問題。貝葉斯估計在隨機波動率模型上是十分普遍并應用廣泛的參數估計方法。

有興趣的同學可以查閱相關資料,利用貝葉斯估計方法對波動率模型進行參數估計。

來源:金色財經

Tags:NFTSTEPTEPSTESNFT幣STEPDDinoStepMonster Valley

中幣交易所
KET:淘金惠神:2.1-2.2比特幣分析 持續獲利 心動不如行動_ETS

繼上周15單,止盈14單之后,我們本周第一天,操作上也是再次拿到開門紅,日內指導操作三單,多空止盈1000個點位利潤,也算是完成了今天的小目標.

1900/1/1 0:00:00
REV:蔣福財:2.2白銀破天荒上漲黃金低調沾光、黃金白銀行情分析_evo幣是什么

   國際黃金白銀行情分析:      現貨黃金分析:這幾天應該都有被白銀刷屏,白銀這一波拉高確實是很強,都要接觸到上一年高點,但是白銀的拉伸并沒有帶動黃金的上升,所以對于白銀拉升.

1900/1/1 0:00:00
FTX:[曝光] 限制提現 回滾交易 虎符交易所再現騷操作 !_NMEEBITS

近段時間,數字貨幣的火爆程度讓人瞠目結舌,當比特幣、以太坊價格暴漲暴跌成為常態后,越來越多的應用場景開始接受數字貨幣的交易,與此同時,交易所的選擇對于投資用戶來說也變得越來越重要.

1900/1/1 0:00:00
區塊鏈:鏈博科技榮獲2020年四川省區塊鏈優秀企業獎_metamask小狐貍

為持續穩定地促進區塊鏈產業的推進,充分展現四川省區塊鏈行業風貌,挖掘省內區塊鏈優秀企業,四川省區塊鏈行業協會在四川省經濟和信息化廳的指導下,聯合社會各界和業內專家、行家.

1900/1/1 0:00:00
比特幣:幣海引路人:BTC陷入震蕩 瀑布會遲到 不會消失_sbtc幣誰開發的

情走勢莫測,就像未卜是人生,總有跌宕起伏的時候,交易如同攀爬,只有登上絕頂,才能享受奇觀勝景;若遇難而退,中途放棄,只會與機會擦肩而過,在交易中,最重要的就是要敢于出手,面對機會,果斷出擊.

1900/1/1 0:00:00
END:LendHub直播 | 如何實現DeFi借貸收益最大化?_LEND

本期直播的特邀主持是幣世界市場&媒介負責人?Nina,邀請到的分享嘉賓是LendHub核心開發者Jason.

1900/1/1 0:00:00
ads