來源:機器之心
純文本大模型方興未艾,多模態領域也開始涌現出多模態大模型工作,地表最強的GPT-4具備讀圖的多模態能力,但是遲遲未向公眾開放體驗,于是乎研究社區開始在這個方向上發力研究并開源。MiniGPT-4和LLaVA問世不久,阿里達摩院便推出mPLUG-Owl,一個基于模塊化實現的多模態大模型。
今天要介紹的是mPLUG-Owl,該工作不僅通過大量cases展示出優秀的多模態能力,還第一次針對視覺相關的指令理解提出一個全?的測試集OwlEval,通過人工評測對比了已有模型,包括LLaVA、MiniGPT-4、BLIP-2以及系統類MM-REACT等工作,實驗結果表明mPLUG-Owl展示出更優的多模態能力,尤其在多模態指令理解能力、多輪對話能力、知識推理能力等方?表現突出
泛歐證券交易平臺已上線Melanion Capital旗下比特幣ETF:金色財經報道,由阿姆斯特丹交易平臺、布魯塞爾交易平臺、巴黎交易平臺合并成立的泛歐證券交易平臺已上線法國投資公司Melanion Capital推出的的Bitcoin Equities ETF。BTC NA旨在追蹤Melanion Bitcoin Exposure Index,與BTC的市場價格緊密相連。[2023/6/22 21:54:46]
論文鏈接:https://arxiv.org/abs/2304.14178
代碼鏈接:https://github.com/X-PLUG/mPLUG-Owl
ModelScope體驗地址:
慢霧:昨日MEV機器人攻擊者惡意構造無效區塊,建議中繼運營者及時升級:金色財經報道,慢霧分析顯示,昨日MEV機器人被攻擊的問題原因在于即使信標區塊不正確,中繼仍將有效載荷(payload)返回給提議者,導致了提議者在另一個區塊被最終確定之前就能訪問區塊內容。攻擊者利用此問題,惡意構造了無效的區塊,使得該區塊無法被驗證,中繼無法進行廣播(狀態碼為202)從而提前獲得交易內容。mev-boost-relay昨日已緊急發布新版本緩解此問題,建議中繼運營者及時升級中繼。
據此前報道,昨日夾擊MEV機器人的惡意驗證者已被Slash懲罰并踢出驗證者隊列。[2023/4/4 13:43:37]
https://modelscope.cn/studios/damo/mPLUG-Owl/summary
HuggingFace體驗地址:
https://huggingface.co/spaces/MAGAer13/mPLUG-Owl
數據:BTC 活躍度達到 2 年低點:金色財經報道,Glassnode數據顯示,BTC 活躍度剛剛達到 2 年低點,數值為0.604。[2023/2/27 12:30:50]
多模態能力展示
我們把mPLUG-Owl與現有工作進行對比來感受一下mPLUG-Owl的多模態效果,值得一提的是,該工作中評比的測試樣例基本上都來自已有工作,避免了cherrypick問題。
下圖6展示了mPLUG-Owl很強的多輪對話能力。
從圖7中可以發現,?mPLUG-Owl具有很強的推理能力。
Celsius索賠人在法律策略上再次產生分歧,扣留賬戶儲戶聯合聘請律師以尋求索賠:8月23日消息,據外媒報道,加密借貸平臺Celsius在法律策略上再次產生分歧,因為Celsius的破產變得越來越混亂和棘手,部分索賠人計劃在破產聽證會上成立一個特設小組,并聘請Troutman Pepper的合伙人Deborah Kovsky-Apap為法律代表,從而收回他們的資產。
所謂的“扣留賬戶”小組是由美國一些州的客戶組成的,由于監管機構的停止令,Celsius無法為他們提供可用的托管賬戶。 這些人可以選擇將資金轉移到扣留賬戶,而這些資金仍被凍結。數據顯示,在Celsius停止提款時,其管理的大約120億美元資產中,扣留賬戶僅占1450萬美元。
此前8月2日消息,Celsius托管客戶聯合聘請律師委托其向Celsius索賠1.8億美元。(CoinDesk)[2022/8/23 12:42:55]
如圖9展示了一些笑話解釋例?。
報告:由于VC開始等待,加密貨幣的估值可能會在9月前下降:金色財經報道,最近幾個月,整個加密貨幣行業已經籌集了大量資金,但在部署方面出現了明顯的停頓。這種情況在未來幾個月可能會改變。據Arca的風險投資組合經理David Nage說,由于完成加密貨幣風險投資交易需要更長的時間,整個行業的估值已經下降。一些風險投資公司正在利用這段時間,因為市場仍然對投資者友好,而其他風險投資公司只是等待更長的時間來推出資本。
Nage表示:在 9 月左右的某個時候,估值會進一步大幅下降,而且會變得很瘋狂。盡管現在可能會發生等待游戲,但進入加密貨幣的資金總額仍高于去年同期。
根據 PitchBook 匯編的數據,數字資產領域籌集的資金從 2021 年第二季度的 60.8 億美元增長到 2022 年第二季度的 81.3 億美元,增長了近 35%。[2022/7/26 2:37:25]
在該工作中,除了評測對比外,該研究團隊還觀察到mPLUG-Owl初顯一些意想不到的能力,比如多圖關聯、多語?、文字識別和文檔理解等能力。
如圖10所示,雖然在訓練階段并沒有進行多圖關聯數據的訓練,mPLUG-Owl展現出了一定的多圖關聯能力。
如圖11所示,盡管mPLUG-Owl在訓練階段僅使用了英文數據,但其展現出了有趣的多語?能力。這可能是因為mPLUG-Owl中的語?模型使用了LLaMA,從而出現了這一現象。
盡管mPLUG-Owl沒有在帶有標注的文檔數據上進行訓練,但其仍然展現出了一定的文字識別和文檔理解能力,測試結果如圖12所示。
方法介紹
該工作提出的mPLUG-Owl,其整體架構如圖2所示。
模型結構:它由視覺基礎模塊(開源的ViT-L)、視覺抽象模塊以及預訓練語?模型(LLaMA-7B)組成。視覺抽象模塊將較?的、細粒度的圖像特征概括為少量可學習的Token,從而實現對視覺信息的?效建模。?成的視覺Token與文本查詢一起輸?到語?模型中,以?成相應的回復。
模型訓練:采用兩階段的訓練方式
第一階段:主要目的也是先學習視覺和語?模態間的對?。不同于先前的工作,?mPLUG-Owl提出凍住視覺基礎模塊會限制模型關聯視覺知識和文本知識的能力。?因此mPLUG-Owl在第一階段只凍住LLM的參數,采用LAION-400M,?COYO-700M,?CC以及MSCOCO訓練視覺基礎模塊和視覺摘要模塊。
第?階段:延續mPLUG和mPLUG-2中不同模態混合訓練對彼此有收益的發現,Owl在第?階段的指令微調訓練中也同時采用了純文本的指令數據(52kfromAlpaca+90kfromVicuna+50kfromBaize)和多模態的指令數據(150kfromLLaVA)。作者通過詳細的消融實驗驗證了引?純文本指令微調在指令理解等方?帶來的收益。第?階段中視覺基礎模塊、視覺摘要模塊和原始LLM的參數都被凍住,參考LoRA,只在LLM引?少量參數的adapter結構用于指令微調。
實驗結果
SOTA對比
為了比較不同模型的多模態能力,該工作構建一個多模態指令評測集OwlEval。由于?前并沒有合適的自動化指標,參考Self-Intruct對模型的回復進行人工評測,打分規則為:A="正確且令人滿意";B="有一些不完美,但可以接受";C="理解了指令但是回復存在明顯錯誤";D="完全不相關或不正確的回復"。
對比結果如下圖3所示,實驗證明Owl在視覺相關的指令回復任務上優于已有的OpenFlamingo、BLIP-2、LLaVA、MiniGPT-4。
多維度能力對比
多模態指令回復任務中牽扯到多種能力,例如指令理解、視覺理解、圖?上文字理解以及推理等。為了細粒度地探究模型在不同能力上的?平,本文進一步定義了多模態場景中的6種主要的能力,并對OwlEval每個測試指令人工標注了相關的能力要求以及模型的回復中體現了哪些能力。
結果如下表格6所示,在該部分實驗,作者既進行了Owl的消融實驗,驗證了訓練策略和多模態指令微調數據的有效性,也和上一個實驗中表現最佳的baseline—MiniGPT4進行了對比,結果顯示Owl在各個能力方?都優于MiniGPT4。
頭條 ▌Lido社區關于批準授權成立金庫管委會的提案已獲投票通過4月28日消息,Snapshot投票頁面顯示.
1900/1/1 0:00:00隨著經濟發展和社會進步,市場對區塊鏈技術和元宇宙的需求最近一直在上升。企業越來越熱衷于將自己的品牌帶入Web3生態,阿里巴巴云已經開始幫助其客戶進行轉型.
1900/1/1 0:00:00概述互操性的發展趨勢,包括新的互操作性技術、基于樂觀假設的橋及流動性共享層的一些協議等。今天來說互操作性目前的一些趨勢.
1900/1/1 0:00:00驚堂木一拍!書接上文,我們說說現在爆炸全球的OpenAI的傳奇歷程吧。故事的起點是2015年7月在加州門羅帕克的一場晚宴,在場的除了大家熟知的全球頂流大V埃隆?馬斯克,堪稱豪華的飯局參加者還集齊.
1900/1/1 0:00:00原文標題:《AfterShapella,anewdawnforETHyieldproducts》原文作者:CHRISPOWERS原文編譯:Kxp.
1900/1/1 0:00:00如何將傳統游戲開發中的經驗應用到區塊鏈游戲中?由ECS架構所啟發,JumpCrypto提出了一種新框架ARC,為全鏈游戲和資產上鏈的游戲提供了高效、可重用、易擴展和跨鏈互操作的支持.
1900/1/1 0:00:00