機器之心報道
編輯:陳萍
一種新的集成視覺和檢測Transformer的目標檢測器ViDT。
Transformer在NLP任務中取得不錯的發展,許多研究將其引入到計算機視覺任務中。毫不夸張的說,Transformer正在改變計算機視覺的格局,尤其是在識別任務方面。例如Detectiontransformer是第一個用于目標檢測的、端到端的學習系統,而visiontransformer是第一個完全基于transformer的圖像分類架構。在本文中,一篇被ICLR2022接收的匿名論文集成了視覺和檢測Transformer(VisionandDetectionTransformer,ViDT)來構建有效且高效的目標檢測器。
ViDT引入了一個重新配置的注意力模塊,將SwinTransformer擴展為一個獨立的目標檢測器,之后是一個計算高效的Transformer解碼器,該解碼器利用多尺度特征和輔助技術,在不增加計算負載的情況下提高檢測性能。
獨家 | 犇睿資本創始人褚康:對加密貨幣的征稅政策是完全有必要的:近日,犇睿資本創始人褚康在接受金色財經獨家采訪時指出,目前各國稅收政策各有不同,以白俄羅斯等極少數國家為例,對其采取的是完全免征所有稅款的政策;以新加坡等一部分大力支持加密貨幣交易的國家為例,對其采取的是部分納稅政策,即僅對加密貨幣交易所得利潤進行納稅處理;以美國等一部分對其采取嚴密監管態度的國家為例,不僅對加密貨幣交易所得利潤進行納稅處理,加密貨幣的兌換、用加密貨幣購買商品或服務、空投等一系列加密貨幣相關的行為都納入了征稅范圍。
加密貨幣稅收監管是否必要,考慮的不應僅是加密貨幣自身的發展問題。稅收作為國家機關收入的主要組成部分,對每個主權國家的發展和穩定都至關重要。加密貨幣作為一種新型貨幣形態,存在規避稅收征管的可能性,如果對加密貨幣的購買、兌換、交易等一系列行為實行完全的免稅政策,雖然是對加密貨幣交易本身合法性的認可,但也同時承認了境內外企業和自然人可以用加密貨幣進行合理避稅,這對國家整體的稅收征管的可行性和穩定性來說可能是致命的打擊。
因此,對加密貨幣的征稅政策是完全有必要的,即使是以白俄羅斯為例的少數目前實行完全免征所有稅款的國家,其對加密貨幣的免稅政策也不是永久性的。[2020/1/3]
在MicrosoftCOCO基準數據集上的評估表明,ViDT在現有的完全基于transformer的目標檢測器中獲得了最佳的AP和延遲權衡,其對大型模型的高可擴展性,可達49.2AP。
聲音 | 美國CFTC主席:比特幣和Libra是完全不同的產品:據CNBC消息,美國當地時間11月19日,美國商品期貨委員會(CFTC)主席Heath Tarbert在接受采訪時稱,比特幣和Libra是完全不同的產品,比特幣已運行超過10年,大家非常了解它的運行機制,因而它被劃歸商品而非證券;Libra則剛剛發展,還有很多問題等待解答,與一攬子法幣掛鉤的結構意味著它完全是另一種產品。[2019/11/20]
論文地址:https://openreview.net/pdf?id=w4cXZDDib1H
ViDT:視覺與檢測Transformer
ViDT架構如下圖2(c)所示:
首先,ViDT引入了一種改進的注意力機制,名為ReconfiguredAttentionModule(RAM),該模塊有助于ViT變體處理附加的和token以進行目標檢測。因此,ViDT可以將最新的帶有RAM的SwinTransformer主干修改為目標檢測器,并利用其具有線性復雜度的局部注意力機制獲得高可擴展性;
嘉御基金衛哲:資本市場存在兩大泡沫 我完全不看好ICO和比特幣:從2011年嘉御基金成立之后,衛哲一直以投資人的身份出現。在近日的采訪中,衛哲也表達了關于投資和區塊鏈等熱門技術的看法。他表示,商業的本質上是有一個產品/項目給公開市場,國內有專門的監管部門,國外有分析師把控項目質量,ICO不管用什么技術,請問它將用什么技術評估項目質量,所有ICO無法解決項目的質量判斷,這也會造成企業和投資人之間巨大不對稱。在這種情況下,99.99%的ICO項目都是不成立的。我完全不看好。[2018/3/13]
其次,ViDT采用輕量級的無編碼器neck架構來減少計算開銷,同時仍然在neck模塊上啟用額外的優化技術。請注意,neck編碼器是不必要的,因為RAM直接提取用于目標檢測的細粒度表示,即token。結果,ViDT獲得了比neck-free對應物更好的性能;
Koinex CEO:印度政府并沒有完全禁止數字貨幣:Koinex CEO Rahul Raj認為政府在討論的是“非法使用”而不是“破壞整個行業”。[2018/2/19]
最后,該研究引入了用于知識蒸餾的token匹配新概念,它可以在不影響檢測效率的情況下從大型模型到小型模型帶來額外的性能提升。
RAM模塊
該研究引入了RAM模塊,它將與和token相關的單個全局注意力分解為三個不同的注意力,即×、×和×注意力。如圖3所示,通過共享和token的投影層,全部復用SwinTransformer的所有參數,并執行三種不同的注意力操作:
ENCODER-FREEneck結構
為了利用多尺度特征圖,ViDT結合了多層可變形transformer解碼器。在DETR家族中,其neck部分需要一個transformer編碼器,用于將從骨干中提取的用于圖像分類的特征轉換為適合目標檢測的特征;編碼器通常在計算上很昂貴,因為它涉及×注意力。然而,ViDT只保留了一個Transformer解碼器作為其neck,因為帶有RAM的SwinTransformer直接提取適合目標檢測的細粒度特征作為獨立的目標檢測器。因此,ViDT的neck結構在計算上是高效的。
NEO創始人達鴻飛:隱私性與實名制完全的可互換只是理想狀態:針對區塊鏈目前發展的兩個方向強調隱私性和實行實名制,NEO創始人達鴻飛在全球區塊鏈G3峰會上表示,完全的可互換性只是理想狀態,即便強調隱私的Zcash也無法達到,實際應用中還是以KYC(了解你的客戶)為主。[2018/1/4]
解碼器從帶有RAM的SwinTransformer接收兩個輸入:從每個階段生成的token從最后階段生成的token,如圖2(c)的Neck所示。在每個可變形的transformer層中,首先執行×注意力。對于每個token,應用多尺度可變形注意力以生成一個新的token,聚合從多尺度特征圖
中采樣的一小組關鍵內容:
用于目標檢測的token匹配知識蒸餾
雖然大型模型具有實現高性能的高容量,但在實際使用中它的計算成本可能很高。因此,該研究還提出了一種簡單的知識蒸餾方法,可以通過token匹配從大型ViDT模型中遷移知識。
匹配每一層的所有token在訓練中非常低效,因此,該研究只匹配對預測貢獻最大的token。兩組token直接相關:P:用作多尺度特征圖的token集合,由body中的每個階段生成,D:token的集合,它們是從neck的每個解碼層生成的。因此,基于token匹配的蒸餾損失公式為:
評估
表2將ViDT與DETR(ViT)和YOLOS的AP、FPS等進行了比較,其中DETR(ViT)有兩個變體:DETR和DeformableDETR。
實驗結果表明:ViDT實現了AP和FPS之間的最佳權衡。憑借其高可擴展性,其性能優于1億個參數的Swin-base,在相似的AP的下,FPS比DeformableDETR快2倍。此外,ViDT參數為16M,得到40.4AP,比DETR(swin-nano)和DETR(swin-tiny)高分別高6.3AP、12.6AP。
表3對比了不同空間位置編碼與ViDT的結果。結果表明:pre-addition比post-addition帶來的性能提升更高,即sinusoidalencoding優于learnable編碼;因此,正弦空間編碼的2D歸納偏置在目標檢測中更有幫助。特別是,與不使用任何編碼相比,使用正弦編碼的預加法將AP增加了5.0。
表4總結了使用不同選擇策略進行交叉注意力時的AP和FPS,其中SwinTransformer總共包含四個階段。有趣的是,只要在最后階段激活交叉注意力,所有策略都表現出相似的AP。由于在各個階段中以自下而上的方式提取特征,因此在低級別階段很難直接獲得有關目標對象的有用信息。因此,研究者想要獲得較高的AP和FPS,只使用最后階段是最好的設計選擇,因為token的數量最少。
為了徹底驗證輔助解碼損失和迭代框細化的有效性,該研究甚至對YOLOS等neck-free檢測器進行了擴展。表5顯示了兩種neck-free檢測器YOLOS和ViDT(w.o.Neck)性能。實驗結果證明在ViDT中使用Neck解碼器來提高目標檢測性能是合理的。
下圖表明:教師模型的規模越大,學生模型的收益越大。從系數來看,系數值越大,性能越好。模型蒸餾將AP提高了1.0-1.7,而不會影響學生模型的推理速度。
研究者將所有提議的組件結合起來,以實現目標檢測的高精度和速度。如表8所示,有四個組件:(1)RAM將SwinTransformer擴展為獨立的目標檢測器,(2)neck解碼器利用多尺度特征和兩種輔助技術,(3)從大模型中獲益知識蒸餾,(4)解碼層drop進一步加快推理速度。結果表明:當使用Swin-nano作為其主干時,它僅使用13M參數就達到了41.7AP和合理的FPS。此外,當使用Swin-tiny時,它僅損失了2.7FPS而表現出46.4AP。
Billions項目組 臉書老總扎克伯格宣布Facebook更名為Meta,稱新名字更符合對于元宇宙的關注,迄今為止,他在元宇宙賽道上已經投了120個億的美金,國內大廠們也紛紛跑.
1900/1/1 0:00:00牛來,速歸?歸來后該怎樣選擇幣圈交易方式目前這輪周線反彈,已經是要創出新高的節奏。不止大餅以太,很多二線三線的主流幣,目前也都有翻倍甚至四五倍最少也有50%的漲幅,比如waves已經一個月漲了五.
1900/1/1 0:00:00我懂得了感恩初中作文500字我懂得了感恩初中作文500字5篇我懂得了感恩初中作文500字篇1天空中還有幾顆零碎的星辰,一輪紅日已從水天相接的地方升起來,我獨自一人在花園的小徑中游走.
1900/1/1 0:00:00小學星期天日記 小學星期天日記1 今天早晨我早早的就起來了,因為我要去上摩爾國際英語課。起床之后,我便去洗臉刷牙,準備吃早飯,吃完早飯以后,我便騎著我的“風火輪”風風火火的上課去了,到了英語班以.
1900/1/1 0:00:00假的USDT是怎么回事?假USDT指的是USDT交易中的虛假代幣騙局。由于虛擬貨幣的發行和運營依賴于互聯網,只要有一臺上網的電腦設備就可以參與其中,其傳播速度非常廣,違法犯罪的成本非常低,憑借著.
1900/1/1 0:00:00中學生環保演講稿 中學生環保演講稿15篇 中學生環保演講稿1 尊敬的領導老師們,親愛的同學們:大家早上好!今天我演講的題目是:《節能環保,一點一滴》.
1900/1/1 0:00:00