“我們專注一級市場,每天釋出幣圈潛力優勢幣種,歡迎同好關注。”
耶穌羅德里格斯是加密資產市場情報平臺 IntoTheBlock 的執行長。他曾在大型科技公司和對沖基金擔任領導職務。他是紐約哥倫比亞大學的活躍投資者、演講者、作家和客座講師。
術語“加密”和“量化”似乎完美結合。比特幣和加密資產誕生於資本市場最激動人心的時代之一,恰逢量化金融的黃金時代。雲計算、大資料等運動帶來的技術加速與機器學習的復興相碰撞,掀起了有利於量化革命的完美風暴。每年有數十億美元從可自由支配的基金轉移到量化工具,而華爾街無法足夠快地聘請數學家和機器學習專家。
作為一個完全數字資產類別,加密似乎是量化模型的完美目標。然而,量化策略仍然受限於相對簡單的技術,例如統計套利(一種尋求利用一對證券的市場低效率的配對交易策略),我們仍然沒有看到市場上出現大型占主導地位的量化交易臺。儘管加密資產對量化策略具有吸引力,但加密對量化模型提出了獨特的挑戰,現實是加密中的大多數量化策略都失敗了。在本文中,我想探討一些可能導致加密領域大多數量化策略失敗的基本但不明顯的原因。
透過聲稱加密中的大多數量化策略都失敗了,我主要指的是機器學習策略。統計套利已被證明是開發演算法策略的有效機制,但我們應該預計這些機會會隨著市場規模和效率的增加而消失。在傳統的資本市場中,我們看到基於機器學習的量化模型的實施呈爆炸式增長,該領域的研究呈指數級增長。
然而,在傳統資本市場中被證明有效的大多數量化策略在應用於加密資產時可能效果不佳。根據我們最近在 IntoTheBlock 從事預測模型和量化策略的一些經驗,可能導致加密資產量化模型失敗的因素有:
1. 小資料集
在研究論文中發現的許多基於機器學習的量化策略都是在數十年的資本市場資料中訓練的。大多數加密資產的交易歷史可以數月計算,即使對於比特幣和以太坊這樣的工具,資料集仍然相對較小。許多機器學習模型很難從如此小的資料集中概括任何知識。假設您正在嘗試為 ChainLink ( LINK )等資產的價格構建一個預測模型,該模型最近很火。事實證明 LINK 的交易歷史非常少,不足以在量化金融中訓練大多數機器學習模型。
2. 定期“異常”事件
巨大的價格暴跌或突然飆升,在短短几個小時內改變了任何加密資產的勢頭。這些“異常值”事件在許多加密資產中經常發生。
從機器學習的角度來看,大多數模型都會對這些價格變動感到困惑,因為他們在訓練期間沒有看到任何類似的東西。許多機器學習量化模型在 3 月中旬的閃電崩盤期間被淘汰,或者未能利用過去幾周波動性的突然增加,這並不奇怪。在模型訓練過程中,很難捕捉到這些型別事件的知識。
3. 過擬合的傾向
加密資產中小市場資料集的一個副作用是大多數機器學習量化模型傾向於過度擬合或“針對訓練資料集進行最佳化”。我們經常看到量化模型在回測期間表現非常出色,但在應用於實際市場條件時卻失敗了。
4.定期再培訓的困境
想一想這個場景:你已經建立了一個基於幾年比特幣交易歷史訓練的預測模型,然後你經歷了數週幾乎沒有波動的經歷,然後是一些瘋狂的波動日(以前從未發生過)。你想重新訓練模型以捕獲該知識,但是如何訓練?如果只是在最新資料中重新訓練模型,則很可能會過度擬合,而如果等待,則知識可能不再相關。
加密資產中小市場資料集的一個副作用是大多數機器學習量化模型傾向於過度擬合或“針對訓練資料集進行最佳化”。我們經常看到量化模型在回測期間表現非常出色,但在應用於實際市場條件時卻失敗了。
5. 資料質量和可靠性
為加密資產設計機器學習量化模型的最大缺點之一是資料集的質量和可靠性較差。許多交易所訂單簿資料集充滿了表明虛假交易量、洗牌交易或欺騙行為的記錄,這已經不是什麼秘密了。顯然,使用這些資料集訓練機器學習模型不會產生任何相關結果。此外,幾乎每週我們都會聽到交易所 API 出現中斷和關閉數小時的情況。您最後一次聽說納斯達克 API 崩潰是什麼時候?它肯定會發生,但不會那麼頻繁。缺乏可靠性會扼殺最強大的量化模型的準確性。
6. 匿名區塊鏈記錄
區塊鏈資料集仍然是加密空間中量化策略最豐富的 alpha 來源之一。但是區塊鏈記錄的匿名性使得設計有意義的量化模型變得非常具有挑戰性。例如,假設量化策略中的一項功能利用了以太坊區塊鏈中的地址計數。嗯,作為交易所一部分的地址與個人錢包的地址有根本的不同,也不同於礦工的地址。標記區塊鏈記錄對於基於區塊鏈資料集設計有意義的量化模型至關重要,不幸的是,這些努力仍處於早期階段。
7. 窗外的因子策略
在過去的二十年裡,因子模型一直是一些最成功的量化策略的核心。像AQR這樣的大型基金都是建立在因子投資量化策略的承諾之上的。從最初的價值、動量或質量等因素,因子策略已經發展到數百個對金融資產類別中的相關行為進行建模的因子。
至少直到今天,大多數因子策略已被證明在加密資產的背景下是無效的。談到加密,價值和質量等因素沒有明確定義,動量等其他因素的行為違反了傳統模式。這導致許多加密貨幣量化交易臺花費大量時間試圖重新建立在加密領域極不可能執行的基於因子的策略。
8. 簡單模型謬誤
量化金融領域正迅速趨向於大型複雜模型,其表現通常優於更簡單、更專業的模型。這種趨勢反映了整個機器學習領域正在發生的事情。深度學習的出現向我們展示了建立高度複雜的神經網路以最不可思議的方式獲取知識的可能性。
TwoSigma 和 WorldQuant 等基金正在積極推動深度學習研究,並將來自谷歌、微軟或 Facebook 等科技巨頭的人工智慧實驗室的想法融入其中。然而,在加密領域,大多數量化策略仍然依賴於非常基本的機器學習方式,如線性迴歸或決策樹。
更簡單的模型無疑具有吸引力,因為它們易於理解,但它們很難從複雜的環境(例如加密貨幣市場)中概括知識。作為機器學習環境,加密結合了金融市場的複雜性和新資產類別的低效率和不確定性。絕對不是簡單量化策略的最佳選擇。
9.基礎設施方面的基礎
補充上一點,加密領域的大多數量化基礎設施都相對新生。強大的量化基礎架構超越了良好的策略,還包括風險管理、回溯測試、投資組合管理、策略執行、錯誤恢復等元素。在加密領域,大多數對沖基金的量化基礎設施仍然相對簡單,這使得某些型別的策略難以操作。
例如,假設您設計了一個漂亮的深度學習量化策略,可以根據區塊鏈資料集預測比特幣的價格。為了實施該策略,基金需要一個定期收集區塊鏈記錄的基礎設施、執行深度學習模型的計算機基礎設施、適當的再培訓工具等。
今天的技術無疑減少了構建量化基礎設施以執行機器學習模型所需的時間和成本,但與在傳統資本市場中運作的量化櫃檯相比,量化櫃檯仍然相對基本。
10. 人才可用性
我把最有爭議的一點留到了最後。作為一個金融市場,加密仍然無法吸引在傳統資本市場具有相關經驗的頂尖量化人才。我們仍在解決極其複雜的問題,例如使用相對簡單的模型、基本的基礎設施和糟糕的流程來預測資產類別的行為。人才是一個非常重要但經常被忽視的方面,將量化投資發展為加密領域的一門學科。加密領域有非常有才華的量化團隊,但他們是例外,而不是規則。
這些是一些可能使我們反思加密領域量化投資現狀的要點。加密是量化策略的理想資產類別,從長遠來看,量化基金應該是加密領域的主要投資工具。這條道路包括許多挑戰,但也有迷人的機遇。
名川投研致力於發現、投資並孵化更多具有潛力價值的專案,從而推動賦能行業進步和應用落地,進一步建立投資生態,全面聯合各個領域的資源,幫助專案更好地發展,如果您喜歡研究一些暴漲的幣種、潛力的一級市場專案,歡迎您關注我。