比特幣價格 比特幣價格
Ctrl+D 比特幣價格
ads

GPT:金融圈注意了 BloombergGPT來了_BER

Author:

Time:1900/1/1 0:00:00

ChatGPT引爆的AI熱潮也“燒到了”金融圈,彭博社重磅發布為金融界打造的大型語言模型(LLM)——BloombergGPT。

3月30日,根據彭博社最新發布的報告顯示,其構建迄今為止最大的特定領域數據集,并訓練了專門用于金融領域的LLM,開發了擁有500億參數的語言模型——BloombergGPT。

報告顯示,該模型依托彭博社的大量金融數據源,構建了一個3630億個標簽的數據集,支持金融行業內的各類任務。該模型在金融任務上的表現遠超過現有模型,且在通用場景上的表現與現有模型也能一較高下。

一般來說,在NLP領域,參數數量和復雜程度之間具有正相關性,GPT-3.5模型的參數量為2000億,GPT-3的參數量為1750億。

福布斯公布2023金融科技50強榜單,五家加密公司入選:6月6日消息,福布斯公布 2023 金融科技 50 強榜單,5 家加密公司入選,分別為 Web3 開發者平臺 Alchemy(估值 102 億美元)、區塊鏈數據追蹤平臺 Chainalysis(估值 86 億美元)、加密托管機構 Fireblocks(估值 80 億美元)、區塊鏈基礎設施提供商 Paxos(估值 24 億美元)和稅務軟件公司 TaxBit(估值 13 億美元)。[2023/6/6 21:19:23]

關于BloombergGPT

報告指出,研究人員利用彭博社現有的數據,對資源進行創建、收集和整理,通過構建迄今為止最大的特定領域數據集來完成BloomberGPT,并基于通用和金融業務的場景進行混合模型訓練:

彭博社主要是一家金融數據公司,數據分析師在公司成立的四十年的時間里收集了大量的金融文件,擁有廣泛的金融數據檔案,涵蓋了一系列的主題。

Crypto.com 聘請前美國財政部金融犯罪監管官員為合規負責人:4月12日消息,Crypto.com 周一宣布,Duncan DeVille 被聘為 Crypto.com 的美洲地區合規執行副總裁和全球金融犯罪合規負責人,來監督該平臺不被用于恐怖主義融資和欺詐等犯罪活動。

Duncan DeVille 近期為在西聯匯款公司擔任全球金融犯罪合規負責人,在那里他建立了一個 2,000 人的金融犯罪合規團隊,并幫助該公司通過了兩項法院命令的監管。在加入西聯匯款之前,DeVille 是美國財政部金融犯罪監管機構(即金融犯罪執法網絡)的一名官員,負責該機構的合規和執法辦公室。此前,他還曾是一名洛杉磯聯邦檢察官,負責處理有組織的犯罪案件。[2022/4/12 14:18:53]

我們將這些數據添加到公共數據集中,以創建一個擁有超過7000億個標簽的大型訓練語料庫。

歐洲央行高管:歐洲金融當局或將在2021年就數字歐元制定一項調查計劃:歐洲央行市場創新和整合部門負責人Holger Neuhaus表示,歐洲金融當局或將在2021年就數字歐元制定一項調查計劃,以評估是否在2021年中期之前啟動數字歐元計劃。但要強調的是,這只是調查階段,而不是尚未執行的既定決定。(Cointelegraph)[2020/12/7 14:29:53]

使用這個訓練語料庫的一部分,我們訓練了一個具有彭博風格的,達500億參數的模型,該模型是根據Hoffmann和Le Scao等人的指導方針設計,基于通用和金融業務的場景進行混合模型訓練。

結果表明,我們的混合訓練方法使我們的模型在金融任務上的表現大大超過了現有的模型,而在通用場景上的表現則與之相當甚至優于現有模型。

動態 | 荷蘭金融服務公司ING為Corda區塊鏈推出交易評估服務:據ZDNet報道,荷蘭金融服務公司ING宣布了一項區塊鏈突破:“零知識證明公證員服務(zero knowledge proof notary service)”,稱這將提高在開源區塊鏈平臺Corda上進行交易的隱私和安全性。據悉這項服務可以評估一筆交易的有效性,除了證明它的有效性以外不披露任何其他信息。[2019/10/24]

1.BloombergGPT優勢:特定領域模型仍有其不可替代性且彭博數據來源可靠

在論文中,彭博社指出,現階段,通用的自然語言處理模型可以涵蓋許多領域,但針對特定領域模型仍有其不可替代性,因彭博社的大多數應用均為金融領域,著手構建了一個針對金融領域的模型尤其優勢,同時可以在通用LLM基準測試上保持競爭力:

除了構建金融領域的LLM外,本文的經驗也為其他研究領域的專用模型提供了參考。我們的方法是在特定領域和一般數據源上訓練LLM,以開發在特定領域和通用基準上表現優異的模型。

聲音 | 程雪軍:通過創新區塊鏈等應用 為消費者帶來更普惠的金融服務:中國社會科學院金融法律與金融監管研究基地特邀研究員程雪軍近日在瞭望東方周刊發文指出,通過創新金融科技應用,消費金融為更多的消費者提供普惠金融的服務方式。通過創新基于互聯網、大數據、人工智能、云計算、區塊鏈等金融科技的應用,能夠觸及更多的用戶,輻射更廣泛的區域,提升效率,降低成本,為廣大消費者帶來更普惠的普惠金融服務。[2018/11/5]

此外,我們的訓練數據不同于傳統的網絡爬取數據,網絡上的數據總有重復和錯誤,但我們的數據來源可靠。

2.BloombergGPT的訓練數據集:

BloombergGPT的訓練數據庫名為FINPILE,由一系列英文金融信息組成,包括新聞、文件、新聞稿、網絡爬取的金融文件以及提取到的社交媒體消息。

為了提高數據質量,FINPILE數據集也使用了公共數據集,例如The Pile、C4和Wikipedia。FINPILE的訓練數據集中大約一半是特定領域的文本,一半是通用文本。為了提高數據質量,每個數據集都進行了去重處理。

對金融領域的理解更準

報告指出,在金融領域中的自然語言處理在通用模型中也很常見,但是,針對金融領域,這些任務執行時將面臨挑戰:

以情感分析為例,一個題為“某公司將裁員1萬人”,在一般意義上表達了負面情感,但在金融情感方面,它有時可能被認為是積極的,因為它可能導致公司的股價或投資者信心增加。

報告指出,從測試來看,BloombergGPT在五項任務中的四項(ConvFinQA,FiQA SA,FPB和Headline)表現最佳,在NER(Named Entity Recognition)中排名第二。因此,BloombergGPT有其優勢性。

測試一:ConvFinQA數據集是一個針對金融領域的問答數據集,包括從新聞文章中提取出的問題和答案,旨在測試模型對金融領域相關問題的理解和推理能力。

測試二:FiQA SA,第二個情感分析任務,測試英語金融新聞和社交媒體標題中的情感走向。

測試三:標題,數據集包括關于黃金商品領域的英文新聞標題,標注了不同的子集。任務是判斷新聞標題是否包含特定信息,例如價格上漲或價格下跌等。

測試四:FPB,金融短語庫數據集包括來自金融新聞的句子情緒分類任務。

測試五:NER,命名實體識別任務,針對從提交給SEC的金融協議中收集金融數據,進行信用風險評估。

對于ConvFinQA來說,這個差距尤為顯著,因為它需要使用對話式輸入來對表格進行推理并生成答案,具有一定挑戰性。

ChatGPT為彭博點贊

華爾街見聞就這個問題專門詢問了ChatGPT,ChatGPT認為BloombergGPT是一項很有意義的技術進步:

它是專門為金融領域開發的一種語言模型,可以更好地處理金融領域的數據和任務,并且在金融領域的基準測試中表現出色。

這將有助于金融從業者更好地理解和應用自然語言處理技術,促進金融科技的發展。同時,BloombergGPT還可以為其他領域的語言模型的發展提供參考和借鑒。總的來說,BloombergGPT是一個有益的技術創新。

華爾街見聞

媒體專欄

閱讀更多

金色財經 善歐巴

金色早8點

白話區塊鏈

歐科云鏈

Odaily星球日報

Arcane Labs

MarsBit

深潮TechFlow

BTCStudy

鏈得得

Tags:GPTBLOBERLOOMBGPT幣BLOVELYBER幣loom幣能漲到100嗎

比特幣最新價格
GSR:做市還是做莊?解密項目方與做市商的「秘密交易」_GAT

原文作者:Alex 當今的數字資產市場已經發展成為一個巨大的全球性行業,吸引了越來越多的投資者和機構參與.

1900/1/1 0:00:00
BSP:如何尋找加密 Alpha 機會?可以使用這 15 個免費工具_穩定幣

想找到自己的 Alpha 機會?使用以下 15 種免費工具是發現潛在機會的途徑之一。 1. Arkham 作為 Nansen 的免費替代品,Arkham 是一個令人印象深刻的數據平臺,它允許你創.

1900/1/1 0:00:00
ETH:“上海升級”進入倒計時 解析三個階段的ETH潛在拋壓_PEL

來源:Ebunker 根據以太坊基金會協議支持團隊的博客文章,客戶團隊同意在Goerli 測試網進行平穩過渡之后,激活主網上的Shapella升級(即“上海升級”.

1900/1/1 0:00:00
比特幣:比特幣沖破3萬美元大關 牛市號角吹響?_ETH

原文:《時隔10個月BTC重回3萬美元,牛市要開啟了嗎?》 作者:秦曉峰 自去年 6 月 10 日跌下 3 萬美元關口后,時隔 10 個月,比特幣收復失地.

1900/1/1 0:00:00
比特幣:新聞周刊 | 比特幣超越納斯達克100和標普500成為2023一季度表現最好的資產類別_區塊鏈域名成交

金色周刊是金色財經推出的一檔每周區塊鏈行業總結欄目,內容涵蓋一周重點新聞、礦業信息、項目動態、技術進展等行業動態。本文是其中的新聞周刊,帶您一覽本周區塊鏈行業大事.

1900/1/1 0:00:00
NFT:2023 年 3 月 NFT 月度報告_BLUR

Apr. 2023, Daniel數據來源:NFT Monthly Report(點擊閱讀原文即可查看Dashboard)三月份的 NFT 市場上出現了兩個有趣的趨勢.

1900/1/1 0:00:00
ads