BTC/HKD+0.58%
HK$ 730173
$ 93720

ETH/HKD+0.38%
HK$ 14035
$ 1801.46

LTC/HKD-0.41%
HK$ 648.52
$ 83.24

DOT/HKD+0.64%
HK$ 31.97
$ 4.103

ADA/HKD+0.29%
HK$ 5.45
$ 0.7

SOL/HKD-0.06%
HK$ 1178.2
$ 151.224

XRP/HKD-0.03%
HK$ 17.35
$ 2.227

DOGE/US+0.14%
HK$ 1.39
$ 0.179

比特幣交易所最好的比特幣交易所

幣安

世界排名第一的比特幣交易所

URL：https://www.binance.com

火幣

成立於2013年的比特幣交易所

URL：https://www.huobi.com

歐易OKX

成立於2014年的比特幣交易所

URL：https://www.okx.com

AMPL:探索反饋Ampleforth 與 THORChain 等應用_Pamp Network

Author：

Time：1900/1/1 0:00:00

前言：原文作者是來自Gauntlet的Hsien-TangKao和TarunChitra，在這篇文章中，他們使用Ampleforth的rebase機制、RAI的反射指數、EIP-1559的費用市場提案及THORChain的激勵鐘擺機制來說明反饋控制器在不同機制中的使用，此外，他們還將展示反饋控制如何使鏈上衍生品定價成為可能。

我們已看到了大量新出現的defi協議，它們提供了新的機制來支持交易、借貸以及其他金融活動。盡管這些協議在功能和用途上差異很大，但一些原語已成為了很多新協議的通用組件。其中，常數函數做市商及自動利率曲線，是兩大最受歡迎的DeFi組件，它們出現在眾多DeFi產品中。隨著行業聚集在這些原語周圍，這就引出了一個問題：是否存在更好的選擇？

實際上，反饋控制系統正是一種可能改善協議激勵、效率及彈性的方法。

什么是反饋控制？

「反饋是生命體的核心特征，反饋的過程控制著我們如何成長，如何應對壓力及挑戰，以及負責調節體溫、血壓、膽固醇水平等因素。從細胞中蛋白質的相互作用，到復雜生態系統中有機體的相互作用，這些機制在每一個層面都起著作用。」

——馬倫·霍格蘭(MahlonHoagland)和伯特·竇德生(BertDodson)，《生命的運作方式》，1995年

控制理論在應用數學、電氣工程及機器人學中得到了廣泛的研究。

它在許多行業都有廣泛的應用，包括航空航天系統、自動駕駛車輛及物聯網設備。在經典的「反饋系統」教科書中，KarlJohan?str?m和RichardM.Murray將控制定義為在工程系統中使用算法和反饋。

DeFi下一重要原語：探索反饋控制在Ampleforth與THORChain等應用

開環系統

DeFi下一重要原語：探索反饋控制在Ampleforth與THORChain等應用

閉環系統

圖和說明了開環和閉環控制系統的區別。在開環系統中，控制器輸出與系統輸出無關。與之相反的是，閉環系統的控制器，將系統輸出作為附加輸入。在閉環系統中，系統動力學依賴于控制器動力學，而控制器動力學又依賴于系統動力學，這就產生了系統與控制器動力學的耦合效應。由于循環依賴性，理解反饋系統是非常重要的。

施羅德與新加坡MAS探索代幣化投資工具的功能:金色財經報道，管理9160億美元的英國資管巨頭施羅德投資集團宣布一個代幣化投資工具項目，施羅德正在參與新加坡金融管理局的Project?Guardian?，旨在通過支持全球測試代幣化資產可行性的努力，同時管理金融穩定和誠信的風險，開發負責任和創新的數字資產生態系統。

施羅德將利用其專業知識并與全球基金網絡Calastone合作，探索可變資本公司（VCC）（新加坡的一種常見基金結構）代幣化工具的功能。[2023/6/30 22:09:42]

反饋控制與強化學習簡史

比例-積分-微分控制器是最為常見的反饋控制器。它利用期望系統狀態與觀測狀態之間的差值連續計算控制信號。1922年，俄國人NicolasMinorsky為美國海軍艦艇的自動操舵系統，發表了第一個PID控制器的理論分析。20世紀50年代，商用數字計算機問世，這使得最優控制理論得到迅速發展。最優控制的首要問題，是找到一個能產生最優狀態軌跡，并使動態系統行為的測度最小化或最大化的控制律。RichardE.Bellman的「最優性原理」、動態規劃算法及馬爾可夫決策過程，就是在這一時代發展起來的，它們目的是為解決最優控制問題。20世紀80年代末90年代初，在最優控制和人工智能領域的前期工作，推動了強化學習的發展。強化學習在不完全了解系統狀態的情況下，通過試錯學習或逼近來解決最優控制問題。近二十年來，隨著計算和深度學習算法的發展，出現了新一輪成功的深度強化學習算法。深度強化學習通過使用深度神經網絡，擴展強化學習，而不需要顯式地設計狀態空間。DeepMind利用這些算法來創建可以玩Atari游戲的人造代理，以及比人類做得更好的Go。

PID控制器

了解反饋控制或PID控制器的直觀方法，是通過一個比例控制器

DeFi下一重要原語：探索反饋控制在Ampleforth與THORChain等應用

其中K_p是一個常數，在一個比例控制器中，控制輸入u(t)與觀測輸出和期望系統輸出之間的誤差e(t)成比例。

這里我們將展示一個恒溫器如何使用反饋機制來控制室溫。假設當前溫度為90°F，恒溫器溫度設置為70°F，則誤差為20°F。當K_p=0.1千瓦/°F時，恒溫器控制空調設備，使其使用u(t)=2千瓦來冷卻整個房間。

火幣中國探索“區塊鏈+跨境貿易”:7月20日-21日，旨在以“疫情時代促進成都乃至中國西部地區與阿聯酋更加密切貿易伙伴關系”為主題的“中國－阿聯酋經濟貿易數字展覽會暨成都經貿云洽談會阿聯酋專場”在中國成都閉幕。本次博覽會由成都市貿促會、阿布扎比酋長國工商會、阿聯酋擁抱中國計劃執行委員會主辦。

火幣中國CEO袁煜明作為產業龍頭企業代表受邀出席了成都專場開幕式，進行“新基建區塊鏈賦能跨境貿易引領新時代貿易合作伙伴關系”的主題發言。他介紹火幣中國在“區塊鏈+跨境貿易”領域進行了深入探索，自主研發了“鏈火BaaS”平臺，不僅可以有效降低跨境貿易聯盟鏈應用的開發、部署、運維、互通和監管成本，還以此為載體打造行業應用生態集群，實現了鏈上跨鏈互通的樞紐，鏈下各類應用的支撐。[2020/7/21]

當溫度下降到80°F時，誤差減小到10°F，空調將輸出1千瓦的功率。從這個例子中，我們可以看出，恒溫器輸出一個控制信號來改變空調器的輸出功率，并降低溫度。恒溫器測量溫度誤差，并改變輸出控制信號，這種反饋回路使室溫逐漸收斂到所需溫度。

DeFi下一重要原語：探索反饋控制在Ampleforth與THORChain等應用

PID控制器方塊圖

PID控制器擴展了比例控制器的概念。除了當前誤差e(t)，它還測量累積誤差\inte(t)及誤差變化率\frac來計算控制輸入：

DeFi下一重要原語：探索反饋控制在Ampleforth與THORChain等應用

其中，K_p、K_i以及K_d都為常數。

反饋控制和DeFi

DeFi下一重要原語：探索反饋控制在Ampleforth與THORChain等應用

反饋控制是一種簡單而強大的思想，它在現實世界中已經被廣泛應用。在現有的應用之外，反饋控制也是DeFi應用的重要組成部分。

假設一個協議有一個高層次的目標，該協議測量當前狀態的距離，并使用反饋機制更新協議參數，以激勵市場參與者將系統推向期望狀態。例如，穩定幣協議希望將代幣與1美元錨定，協議根據穩定幣價格不斷調整利率，當穩定幣價格高于1美元時，該協議將降低利率并激勵參與者發行更多的穩定幣。否則，協議將提高利率并激勵參與者償還債務。通過算法調整利率，當穩定幣在1美元左右時，市場就可以達到供需平衡。

李鳴：區塊鏈產業正在從小規模應用探索向大規模應用實踐轉換:7月4日，IEEE計算機協會區塊鏈和分布式記賬標準化委員會（IEEE C/BDL)主席李鳴在演講中表示，從集成的視角來看，區塊鏈技術無法獨立地完成一個閉環的應用，它需要與物聯網、大數據、云計算、人工智能等新一代信息技術，融合應用來最大化數據的價值。在這個過程當中，物聯網做數據采集，云計算做數據的承載和調度，大數據做數據的分析，人工智能做數據的應用，所有這個過程都是對數據價值的最大化，這個里面數據的質量就非常重要。因此區塊鏈通過一系列技術手段，對數據進行封裝以提供可信共識、防篡改的技術體系，其他現代信息技術共同作用來最大化數據的價值。他還指出，，從各國專家開始研究比特幣網絡并從比特幣網絡中提煉出區塊鏈的技術，到建立像Fabric和Bcos等區塊鏈的底層平臺，一直到存證溯源等相關應用的不斷探索，可以總結區塊鏈產業正在從小規模應用探索向大規模應用實踐轉換，需要建立更加完善的技術、應用和服務體系。[2020/7/4]

很多DeFi應用已經在協議設計中隱式或顯式地使用這種模式。這里我們將使用Ampleforth的rebase機制、RAI的反射指數、EIP-1559的費用市場提案及THORChain的激勵鐘擺機制來說明反饋控制器在不同機制中的使用。我們還將展示反饋控制如何使鏈上衍生品定價成為可能。

波動性抑制資產

Ampleforth和RAI開創了不相關和低波動性加密資產的概念。乍一看，這些協議似乎有不同的底層機制。AMPL動態調整供應，以解決不適應性問題，而RAI則使用動態贖回率機制來最小化反射指數波動。然而，這兩個協議本質上都是反饋控制系統，它們旨在創造一個波動性抑制資產。而這些協議的主要區別，在于它們使用了不同的控制輸入。我們將使用反饋控制框架來展示這兩種協議之間的異同。

AmpleforthRebase機制

AMPL是一種根據市場價格動態調整供應的數字資產，當AMPL的價格高于1美元時，其供應量就會擴大，反之則會縮小。代幣供應機制的擴張與收縮，激勵理性的AMPL交易員介入，推動AMPL價格向1美元目標邁進。

為了用公式表示rebase機制，我們首先將誤差定義為目標值與觀測值之間的差：

動態 | 荷蘭海運中心正在使用區塊鏈技術探索物流和能源領域:據Bunkerspot消息，荷蘭鹿特丹港報告表示，荷蘭海運中心的第一個區塊鏈申請“已初具規模”，BlockLab是荷蘭港口管理局與鹿特丹市政府之間的合資企業。在今天4月25日發表的聲明中，鹿特丹港表示，BlockLab團隊目前正專注于物流和能源兩個領域。鹿特丹港認為，物流和能源是區塊鏈有希望加速拓展的領域。BlockLab目前正在開展一些具體區塊鏈項目，包括協調能源供應和需求的區塊鏈平臺。[2019/4/26]

DeFi下一重要原語：探索反饋控制在Ampleforth與THORChain等應用

假設目標值為1美元，觀察值為當前價格，則誤差項為：

DeFi下一重要原語：探索反饋控制在Ampleforth與THORChain等應用

當價格偏差e(t)大于偏差閾值d_t時，AMPL的供應調整為：

DeFi下一重要原語：探索反饋控制在Ampleforth與THORChain等應用

根據上面的方程，我們可以將rebase表示為一個比例控制器，其中：

DeFi下一重要原語：探索反饋控制在Ampleforth與THORChain等應用

控制規則：

DeFi下一重要原語：探索反饋控制在Ampleforth與THORChain等應用

從這個例子中可以看出，rebaselag是決定系統行為的關鍵參數。

選擇適當的rebaselag參數與調節控制器的比例增益是一樣的。比例增益對系統特性的影響在控制系統中得到了廣泛的研究：高比例增益可以減小穩態誤差，加快上升時間，但會增加超調量，使系統更具振蕩性。

DeFi下一重要原語：探索反饋控制在Ampleforth與THORChain等應用

來源：Matlab和Simulink的控制教程

RAI反射指數

反射指數是一種波動性低于其抵押品的資產。該系統使用類似MakerDAO的債務抵押頭寸進行資產發行。當反射指數的贖回價格偏離市場價格時，協議會調整贖回率，以激勵CDP持有人產生更多債務或償還未償債務。

現場 | 元界陳浩：區塊鏈自主數字身份目前正處探索階段:金色財經現場報道，在今日MSUP舉辦的全球區塊鏈技術案例峰會上，開源公鏈元界CTO陳浩在演講中提到，互聯網個人身份存在四個問題：用戶在平臺上傳數據的所有權究竟歸誰；盜竊丟失，托管在中心化系統中的數據安全性不可控；重復不兼容，在不同平臺有不同賬戶；欺詐，比如羊毛黨等。

他認為，區塊鏈能夠登記并統一身份，打通不同平臺的身份賬本。以太坊ERC725標準征求意見稿中，曾講到區塊鏈身份概念。不過，基于區塊鏈的自主數字身份目前仍處于探索階段。[2018/9/8]

RAI反射指數是在協議設計中第一個明確引用PID控制器的協議。這個反射指數中的誤差項是市場價格和贖回價格之間的差額：

DeFi下一重要原語：探索反饋控制在Ampleforth與THORChain等應用

贖回率是控制輸入，并由一個比例控制器修改：

DeFi下一重要原語：探索反饋控制在Ampleforth與THORChain等應用

以及

DeFi下一重要原語：探索反饋控制在Ampleforth與THORChain等應用

在上面提到的兩個例子中，都有一個反饋控制系統。這些協議以特定的參考價格為目標，但使用不同的經濟機制來影響代幣的供應。Ampleforth直接改變了系統的總供應量，以激勵參與者進行「供應發現」或「市值發現」，從而將AMPL價格推向1美元。RAI改變了贖回價格，激勵參與者重新平衡未償債務總額，以減少價格波動。

EIP-1559:以太坊費用市場更改提議

當前的以太坊費用市場使用簡單的第一價格拍賣機制來定價交易費用。這種拍賣機制是次優的，它為競拍人帶來了相當大的開銷，因為每個競拍人都需要根據其他競爭對手的預期出價進行競標。EIP-1559通過一種自適應的收費機制解決了這個問題，這樣收取的總費用可以超過網絡的社會成本。

擬議的交易費用包括動態調整的基礎費用以及給礦工的額外小費。區塊使用量是決定基礎費用的主要因素：

當區塊使用量高于目標使用量時，基礎費用增加，反之則降低。這種費用調整算法尋求博弈論均衡并建立費用下界。這項提議可能是以太坊1.0最重大的變化，它將極大地改變用戶體驗和貨幣政策。

毫不奇怪，EIP-1559可以被描述為一個反饋控制問題，它的基礎費用調整算法為：

DeFi下一重要原語：探索反饋控制在Ampleforth與THORChain等應用

算法中的誤差項為：

DeFi下一重要原語：探索反饋控制在Ampleforth與THORChain等應用

基礎費用調整算法也是一個比例控制器，其中：

DeFi下一重要原語：探索反饋控制在Ampleforth與THORChain等應用

控制輸入為：

DeFi下一重要原語：探索反饋控制在Ampleforth與THORChain等應用

以及

DeFi下一重要原語：探索反饋控制在Ampleforth與THORChain等應用

THORChain的激勵鐘擺機制

THORChain是一個為跨鏈資產交換提供便利的去中心化網絡，該協議要求系統的總池子資本大于擔保資本，以保證其安全。在THORChain中，2:1的資本比例被認為是最優的系統狀態。這種激勵鐘擺機制是為了使系統處于平衡狀態，它將總的通貨膨脹報酬和交易費用重新分配給參與者，使系統逐漸收斂到最優狀態。特別是，分配給流動性提供者的系統收入比例為：

DeFi下一重要原語：探索反饋控制在Ampleforth與THORChain等應用

其中，b和s表示總的擔保資本和總的池子資本，其余部分則給予擔保人。在最優狀態下，激勵鐘擺將33%的系統收益分配給流動性提供者，將66%的系統收益分配給擔保人。如果系統只有擔保資本，激勵鐘擺會將100%的系統收入分配給流動性提供者。

THORChain的激勵鐘擺使用鏈一個確定的公式來計算系統的收入分配。雖然它沒有使用PID控制器的公式，但是激勵鐘擺和PID控制器有一個非常相似的概念：

該機制試圖將誤差隨時間的變化最小化，即使系統狀態收斂到最優狀態；

控制信號是一個誤差函數，其中誤差是測量的bonded-to-pooled資本和最佳bonded-to-pooled資本之間的差；

鏈上衍生品定價

2020年當中最大的驚喜之一是，現貨資產DEX能夠處理和中心化交易所相同數量級的現貨交易。

然而，最活躍的加密交易產品——永續合約，尚未實現去中心化。

盡管目前已經有了一些去中心化期貨產品的嘗試，比如FutureSwap和McDEX，但截至目前，這些協議都沒有實現他們的承諾。其中的一個主要原因是，相比現貨交易，期貨交易對延遲要敏感得多。這是因為預言機價格更新需要非常迅速，以避免搶先交易和延后交易。此外，由于較低的保證金要求允許用戶用較少的抵押品進行大規模押注，因此流動性往往會以更快的速度在衍生品交易場所增加和移除。然而，在不需要高流動性速度的情況下，有許多新的機制可以復制衍生品的結果。這些方法涉及自動做市商，它們具有動態曲線。在這一方向上的一個基本工作是AlexEvans的一個定理，其表明，如果一個Balancer池根據一個修改后的PID控制器調整其權重，那么你可以復制任何無杠桿回報。

DeFi下一重要原語：探索反饋控制在Ampleforth與THORChain等應用

在上面的等式中，Balancer池的權重w*遵從控制方程，作為預期收益g的一個函數。生成任意的衍生品收益是一個增加杠桿作用的問題——如果某人可以針對支付g(x,t)的Balancer池股份進行借貸，并用借入的資金創建新的資金池份額，那他們就可以將自己的敞口杠桿化為g的常數倍數。而像Aave和Compound這樣的鏈上借貸平臺，就非常適合進行這種操作。那這與永續合約交易有什么關系？

我們可以將永續合約產品視為一個將指數價格p映射為正或負回報的函數。例如Balancer這樣的常數函數做市商，允許將p(t)表示為一個數量向量，以及池的權重控制著從數量到價格的映射。因此，我們可以將永續產品的替代結構視為一個CFMM，其形狀正在調整以保持收益。雖然權重更新仍可以前推和后推，但要做到這一點要比操縱價格要困難得多。這是因為你需要操縱做市商持有的數量來調整收益g。與操縱價格不同，你必須調整抵押品數量x。正如我們在Uniswap論文的附錄D中所指出的，隨著鎖定的總值增加，這種操縱會越來越困難。

這個例子說明，當使用適當的比例控制器時，當與動態調整的做市商耦合時，很多衍生品產品可存在于鏈上。雖然設計此類控制器的研究尚處于起步階段，但像Yield、Opyn及其他團隊設計的CFMM，這種流行趨勢已經表明，控制理論使得鏈上衍生品成為可能。

以太坊的計算和存儲容量有限

DeFi下一重要原語：探索反饋控制在Ampleforth與THORChain等應用

在關于反饋控制與強化學習的歷史上，算法的進步可以說是成功的主要因素。然而，人們往往忽視了這樣一個事實：計算和存儲范式的轉變，也導致了這些技術突破。在20世紀50年代沒有商用計算機的情況下，動態規劃是解決最優控制問題的一種方法，如果沒有GPU集群和巨大的存儲空間，Deepmind無法有效地訓練用于玩Atari游戲的深度強化學習模型。

我們知道，以太坊的計算和存儲容量是有限的。目前，大多數的DeFi協議都是通過使用簡單的反饋算法來克服這些限制，這些算法不需要大量的存儲來跟蹤歷史狀態的變化。因此，PID控制器或其他恒定的空間及時間復雜度算法很適合資源受限的計算環境。

關于鏈上杠桿控制理論自然而然的下一步，是制定DeFi協議反饋機制作為一個最佳控制問題。原因有二：關于最優控制，已有大量的理論工作，而且它不依賴于龐大的計算能力。另一個可能的途徑是通過協議的治理過程，在鏈上引入更復雜的算法優化參數。許多中立的第三方可以在鏈外處理區塊鏈數據及外部數據源，運行復雜的算法，并提交優化的治理投票參數，以提高協議效率。

最后的想法

比例控制器是工業中最常見的控制器形式，它以電流誤差為輸入，較好地解決了大部分問題。為了進一步改進現有的反饋系統，協議可以考慮添加「過去誤差」和「預期未來誤差」作為控制器的輸入。

聯合曲線或利率曲線是激勵特定用戶行為的機制。參數化這些曲線是非常重要的，因為設計空間很廣。例如，具有不同形狀的曲線，可能會獲得非常相似的結果，但很難斷言其中一條曲線嚴格優于另一條曲線。基于聯合曲線的方法存在維數災難。參數化三維或更高維曲面，似乎是一項具有挑戰性的任務。協議開發團隊可以考慮使用反饋控制方法來簡化設計及參數化方法。開發人員不需要設計描述一系列參數值之間關系的整個曲線，而只需要關注參數值的「變化率」。

考慮到智能合約通常涉及高風險及反饋系統的動態性，設計一個基于反饋控制的智能合約是一項挑戰。我們知道，模擬在工業中被廣泛應用于參數調試，而Gauntlet可幫助協議設計者通過模擬大量的協議參數及市場環境來對他們的協議進行壓力測試。建立一個安全高效的DeFi生態系統，一直是我們的首要任務。

Tags：AMPL AMP MPL EFI WAMPL Pamp Network AMPLE! Coin DEFILANCER幣