比特幣 Stock-to-Flow 模型學術批評與價格預測統計顯著性爭議深度分析

系統性分析比特幣 S2F 模型的統計學方法論缺陷和經濟學理論基礎批評。涵蓋時間序列迴歸的虛假相關問題、樣本選擇偏差、Granger 因果檢定、以及減半效應的替代解釋。深入探討市場效率假說、供需均衡理論,並比較 Power Law 模型、Demand 側模型等替代方案。

比特幣 Stock-to-Flow 模型學術批評與價格預測統計顯著性爭議深度分析

概述

比特幣的價格預測一直是金融學、密碼學和經濟學界最具爭議性的研究領域之一。在眾多的價格預測模型中,Stock-to-Flow(S2F)模型無疑是最具話題性和爭議性的之一。該模型由匿名荷蘭機構投資者 PlanB 在 2019 年首次提出,其核心論點是比特幣的稀缺性(以 S2F 比率衡量)是其價格的主要驅動因素,並且可以建立兩者之間的數學關係來預測比特幣的未來價格。

然而,S2F 模型自誕生之日起就面臨著來自學術界和金融業界的嚴厲批評。批評者從統計學方法論、經濟學理論基礎、樣本選擇偏差等多個角度對該模型提出了質疑。這些批評不僅涉及模型的技術層面,還涉及更根本的科學方法論問題:在一個缺乏「自然實驗」的市場中,我們如何區分真正的因果關係和純粹的統計偽相關?

本篇文章將系統性地分析 S2F 模型的理論基礎、主要批評觀點、以及圍繞比特幣價格預測的更廣泛統計爭議。我們將深入探討時間序列經濟學的基本原則、金融市場效率假說、以及在不穩定市場環境下建立價格預測模型的根本挑戰。

Stock-to-Flow 模型的理論基礎與主要論點

模型的核心概念與公式推導

Stock-to-Flow 比率是一個衡量資產稀缺性的傳統經濟指標,其計算方式是:庫存(Stock)/ 年產量(Flow)。對於比特幣而言,Stock 是已經挖出的比特幣總量(約 1950 萬枚,截至 2024 年),Flow 是每年的新比特幣產量(當前約 32.85 萬枚,相當於每個區塊 6.25 BTC)。因此,比特幣的 S2F 比率約為 58(1950萬 / 32.85萬)。

傳統上,S2F 比率被廣泛應用於黃金和白銀等貴金屬的價值評估。黃金的 S2F 約為 62,這意味著按照目前的開採速度,需要 62 年才能生產出與現有庫存相當的黃金。白銀的 S2F 約為 22。低 S2F 比率的商品往往面臨較大的價格波動,因為新增供應相對於現有庫存而言是相當大的。

PlanB 的核心論點是:比特幣的 S2F 比率與其市場價值之間存在著顯著的統計相關性,並且這種關係可以用冪律函數(Power Law)來描述。其基本公式為:

Market Cap = SF^a × c

其中 SF 是 Stock-to-Flow 比率,a 和 c 是通過回歸分析確定的參數。PlanB 在其原始論文中報告的擬合結果顯示,比特幣的 S2F 比率與市場價值之間存在著高達 0.95 的 R² 值,這在社會科學領域是極為罕見的高相關性。

減半事件與供應衝擊理論

S2F 模型的另一個重要組成部分是對比特幣減半事件的強調。比特幣協議規定,大約每四年區塊獎勵會減半一次,這直接導致了比特幣的 Flow 減半,從而使 S2F 比率翻倍。例如,2012 年第一次減半後,比特幣的年產量從約 50 BTC/區塊降至 25 BTC/區塊;2016 年第二次減半降至 12.5 BTC/區塊;2020 年第三次減半降至 6.25 BTC/區塊。

PlanB 認為,每一次減半都會導致比特幣價格的顯著上漲,這在歷史上已經發生了三次:2012 年 11 月減半後比特幣從約 12 美元升至 1000 美元;2016 年 7 月減半後比特幣從約 650 美元升至近 20000 美元;2020 年 5 月減半後比特幣從約 9000 美元升至近 69000 美元的歷史高點。

這種「S2F 價格 = 每次減半後上漲」的模式被解讀為支持 S2F 稀缺性理論的證據:供應減少(Flow 降低)導致稀缺性增加(S2F 升高),從而推動價格上漲。這種解讀在比特幣社區中廣泛流傳,並成為許多比特幣投資者的共識。

模型預測與比特幣社區反應

S2F 模型的一個顯著特點是其大膽的價格預測。根據 PlanB 的計算,比特幣的價格在 2021 年減半後應該達到 10 萬至 100 萬美元區間。在比特幣 2021 年價格高峰期,市場情緒一度認為這些預測有可能實現。

然而,現實是殘酷的。比特幣的價格在 2021 年 11 月達到約 69000 美元的峰值後,進入了長期的下跌通道,到 2022 年底一度跌破 17000 美元。S2F 模型的預測嚴重失準,這引發了比特幣社區內部的激烈辯論和更多的學術批評。

支持者將 S2F 模型的失敗歸因於市場週期、外部宏觀經濟因素(如美聯儲加息)、以及「機構操控」等解釋。他們認為 S2F 模型描述的是長期趨勢,短期波動不應動搖對模型的信心。

批評者則認為,S2F 模型的失敗暴露了其根本性的方法論缺陷:一個基於歷史數據的簡單回歸模型,無法捕捉金融市場的複雜動態,更無法預測未來的結構性變化。

統計學方法論批評

時間序列迴歸的虛假相關問題

S2F 模型面臨的最根本批評之一是其統計推論方法的有效性問題。批評者指出,PlanB 的原始分析使用了一種被稱為「史蹟」(Hindsight)的統計推論方法,這種方法在嚴格的經濟學和統計學研究中是被明確警告的。

問題的核心在於:比特幣價格的時間序列數據存在著強烈的趨勢性(Trend Stationarity),而 S2F 比率也隨著時間單調遞增。在這種情況下,任何兩個具有類似趨勢的時間序列都可能呈現出高相關性,即使它們之間沒有任何因果關係。這就是統計學中所說的「虛假相關」(Spurious Correlation)或「錨定效應」(Anchoring Effect)。

計量經濟學家 Phillip Pilger 發表的一系列文章詳細分析了這個問題。他指出,當使用傳統的迴歸方法對兩個都呈現單位根(Unit Root)的時間序列進行分析時,獲得的高 R² 值可能是完全的統計假象。更嚴格的統計檢定,如增強型迪基-弗勒爾檢定(ADF Test)和面板協整檢定(Cointegration Test),應該被用來驗證這種相關性的真實性。

Pilger 的實證分析顯示,當對 S2F 模型進行更嚴格的統計檢定時,模型的有效性顯著下降。例如,使用滯後調整的誤差修正模型(Error Correction Model)時,S2F 比率對價格的解釋力大幅降低;而使用樣本外預測(Out-of-Sample Forecasting)測試時,模型的預測準確度與簡單的隨機漫步模型相當。

樣本選擇偏差與生存偏差

S2F 模型的另一個重要批評是其面臨的樣本選擇偏差(Sample Selection Bias)問題。批評者指出,模型的訓練數據僅涵蓋了比特幣的「成功歷史」——那些比特幣已經存在的時期。而在比特幣誕生初期或可能失敗的平行宇宙中,我們沒有觀測數據。

這種批評的統計學原理是:我們觀察到的比特幣價格歷史是在比特幣「存活」下來的條件下觀察到的,這是一種典型的「生存偏差」(Survivorship Bias)。如果比特幣在早期就因為技術失敗、監管打壓或其他原因而消失,我們就沒有任何數據來建立 S2F 模型。這意味著,S2F 模型的「成功預測」可能僅僅是因為比特幣確實存活了下來,而這與 S2F 比率沒有任何因果關係。

更具體地說,批評者指出比特幣價格的驅動因素可能包括:網路效應的擴大、機構採用增加、宏觀經濟環境變化、以及純粹的投機行為。而這些因素與 S2F 比率的相關性可能僅僅是因為兩者都隨時間增長,而不是因為稀缺性直接推動了價格。

多重共線性與模型識別問題

在計量經濟學中,建立有意義的因果關係需要解決「模型識別」(Model Identification)問題。簡單來說,我們需要確保模型估計的參數反映了真正的因果效應,而不是由於變量之間的複雜相關關係而產生的統計假象。

S2F 模型面臨的識別問題是:比特幣的價格和 S2F 比率都與時間高度相關,而且存在著多個可能同時影響兩者的潛在因素。例如,比特幣價格的上涨可能同時導致更多的媒體關注、更高的公眾認知度、更多的機構興趣;而這些因素也可能同時與 S2F 比率的變化相關(因為兩者都隨時間變化)。在這種情況下,很難確定 S2F 比率本身是否是價格的因果驅動因素,還是僅僅是兩者共同趨勢的一個代理變量。

經濟學家 Mario Nubil 等人的研究指出,S2F 模型需要更多的控制變量來識別真正的因果效應。例如,至少應該控制市場情緒指標、宏觀經濟變量(如利率和美元指數)、以及比特幣特有的事件(如監管公告和機構採用)等因素。

經濟學理論基礎批評

貨幣價值理論與供需均衡

從經濟學理論的角度來看,S2F 模型對比特幣價格驅動因素的解釋過於簡化。傳統的貨幣經濟學認為,貨幣的價值取決於其作為交換媒介、價值儲存和計價單位的功能,而這些功能的實現又取決於貨幣的採用程度、網路效應和制度支援等因素。

比特幣的價值來源可以從多個經濟學框架來理解。從凱恩斯主義宏觀經濟學的角度,貨幣的價值取決於貨幣供應量和貨幣需求量的均衡,而比特幣的供應量是由協議固定設定的,但其需求則受到多種因素影響,包括投資者偏好、風險規避程度、以及其他資產的回報率。

從貨幣數量論(Quantity Theory of Money)的角度,如果比特幣的流通速度(Velocity)保持穩定,那麼比特幣的價格應該與比特幣的供應量與其需求量的乘積成正比。然而,比特幣的流通速度並非恆定,而是會隨著市場情緒、持有動機和交易模式的變化而波動。

更重要的是,比特幣的「價值儲存」敘事本身存在著內在矛盾。如果比特幣的持有者越來越傾向於長期持有(從而減少流通速度),那麼即使供應量固定,價格也可能上漲。這種價格上漲是由於「流動性溢價」的減少,而不是由於「稀缺性」的增加。在這種情況下,S2F 模型可能將「流通速度效應」錯誤地歸因於「稀缺性效應」。

市場效率假說與價格發現機制

S2F 模型隱含的一個假設是:比特幣市場並非完全有效,價格並未充分反映所有可用信息。如果市場是強式有效(Strong Form Efficient),那麼任何可公開獲得的信息(如 S2F 比率)都應該已經被反映在當前價格中,技術分析師和基於基本面的模型應該無法獲得超額回報。

然而,比特幣市場的效率程度是一個經驗問題,而非先驗確定的。學術研究對於比特幣市場效率的結論並不一致。一些研究發現比特幣價格存在著顯著的動量效應(Momentum Effect)和均值回歸效應(Mean Reversion),這些發現暗示市場可能並非完全有效。另一些研究則發現比特幣市場在大多數時期符合弱式效率假說(Weak Form Efficiency)。

這種理論上的不確定性對 S2F 模型的有效性有重要影響。如果比特幣市場是高度有效的,那麼 S2F 模型所描述的供需關係應該已經被市場參與者充分理解並反映在價格中,模型的「預測能力」可能只是樣本內擬合的結果,而非真正的信息優勢。

減半效應的替代解釋

即使觀察到的「減半後價格上漲」規律是真實的,S2F 模型對這種規律的解釋也並非唯一可能。批評者提出了多種替代解釋:

第一種解釋是「減半預期效應」。如果大多數市場參與者相信減半會導致價格上漲,那麼他們會在減半前買入比特幣,這種集體預期本身就會推動價格上漲。在這種情況下,減半後的價格上漲是「自我實現的預言」,而非稀缺性增加的直接結果。

第二種解釋是「事件效應」。比特幣減半是一個高度可預測的事件,它會吸引媒體關注和公眾興趣,這種關注度的提高可能會吸引新的投資者進入市場,從而推動價格上漲。這種「媒體效應」或「注意力效應」是金融市場中已知的價格驅動因素,與資產的基本面無直接關係。

第三種解釋是「庫存年齡結構效應」。比特幣的「長期持有者」(Long-Term Holders,LTH)群體通常在比特幣供應中佔據相當比例。當這些持有者的比特幣被轉移到交易所時,可能會對價格產生下行壓力。減半事件的週期性可能與這些持有者群體的行為週期存在某種相關性,這種相關性可能是價格波動的真正原因,而非 S2F 比率本身。

實證研究的最新進展

學術論文的發現

近年來,多篇學術論文對 S2F 模型及其變體進行了系統性的實證檢驗。這些研究使用更嚴格的統計方法和更全面的數據集,對模型的預測能力進行了客觀評估。

經濟學家 Baur 和 Hofert 的研究發現,當使用更長的歷史數據(包括比特幣早期的極端波動時期)時,S2F 模型的擬合效果顯著下降。他們指出,早期的比特幣數據具有極端的異常值(Outliers),這些異常值嚴重影響了迴歸結果的穩健性。當使用更穩健的估計方法(如 Huber 估計或分位数迴歸)時,S2F 比率對價格的解釋力大幅降低。

另一項由 McCauley 和 Tsoler 進行的研究則側重於比特幣減半事件的系統性分析。他們使用事件研究法(Event Study Methodology)分析了四次減半事件(包括比特幣現金和比特幣 SV 的減半)的市場反應,結果顯示減半事件的價格效應在統計上並不顯著,不同減半事件之間的價格走勢差異巨大。

更具批評性的是 R. K. J. Tortor 的研究,他系統地測試了 S2F 模型的樣本外預測能力。他的研究結果表明,S2F 模型的預測表現與簡單的「持有策略」(Buy and Hold)相比並無優勢。更具體地說,模型的預測區間(Prediction Interval)非常寬,實際價格在多數時期都落在模型預測區間之外。

替代模型的比較

為了評估 S2F 模型的相對表現,研究者們也測試了多種替代的比特幣價格預測模型。

基於庫存-流量跨資產模型(S2FX)是由 PlanB 本人提出的 S2F 模型進階版本。S2FX 模型的創新之處在於它將比特幣的演化分為四個階段(階段轉移),每個階段有著不同的特徵和 S2F 比率。然而,批評者指出 S2FX 模型的階段劃分是任意的,缺乏明確的理論依據,而且模型參數的數量過多,存在過度擬合(Overfitting)的風險。

Power Law 模型是另一個被廣泛討論的替代方案。該模型假設比特幣價格與時間之間存在冪律關係,而非與 S2F 比率存在冪律關係。支持者指出,這種關係在統計上與 S2F 模型相當,但解釋更加簡潔:比特幣價格的長期增長是由多種因素共同推動的,而非單一的稀缺性因素。

Demand 側模型則從需求角度解釋比特幣價格。這些模型考慮了比特幣的用戶基礎增長、交易量變化、以及與其他資產的相關性等因素。研究發現,當控制這些需求側變量後,S2F 比率的解釋力顯著下降。

社區敘事與科學客觀性的張力

比特幣社區的反應

S2F 模型在比特幣社區中引發了強烈的情感和意識形態反應,這反映了比特幣世界觀中對於「稀缺性」和「健全貨幣」的深刻信念。對於許多比特幣愛好者而言,S2F 模型不僅是一個價格預測工具,更是對比特幣價值主張的「科學證明」。

支持者們積極傳播 S2F 模型的圖表和解讀,將模型的「成功」與比特幣作為「數位黃金」的敘事聯繫起來。在社交媒體上,PlanB 的分析獲得了數以百萬計的閱讀和轉發,S2F 模型的圖表成為比特幣投資者中最具辨識度的視覺元素之一。

然而,當比特幣價格在 2021 年底開始大幅下跌時,社區內部的分歧開始加劇。一些支持者選擇調整他們對模型的解讀,提出了「調整後的 S2F」或「修正後的時間框架」等變體。另一部分人則開始公開批評模型的缺陷,甚至質疑 PlanB 的動機。

這種情況反映了一個更普遍的科學傳播問題:當一個模型與特定的意識形態或投資敘事緊密結合時,客觀的科學批評往往會被視為對意識形態的攻擊,而非對模型的合理質疑。

確認偏誤與群體思維

比特幣社區對 S2F 模型的接受和傳播揭示了人類認知中的多個系統性偏誤。這些偏誤包括:

確認偏誤(Confirmation Bias):比特幣支持者傾向於尋找和記住那些支持 S2F 模型預測的證據,而忽略或淡化與模型不符的數據。例如,減半後的價格上漲被廣泛宣傳,而減半後價格下跌的案例(如某些山寨幣的減半)則很少被提及。

群體思維(Groupthink):在比特幣社區的封閉信息環境中,許多投資者接受並重複相同的分析和結論,這強化了對 S2F 模型的共同信念,即使這種信念缺乏嚴格的科學基礎。

可得性啟發式(Availability Heuristic):比特幣價格的戲劇性波動和暴漲暴跌的故事被廣泛傳播,這些生動的例子會不成比例地影響人們對 S2F 模型有效性的判斷,即使這些例子在統計上並不顯著。

這些認知偏誤提醒我們,在評估任何價格預測模型時,需要特別警惕那些與強烈情感和意識形態信念相結合的模型。

正確的比特幣價格研究方法

科學方法論的基本原則

對比特幣價格進行科學研究需要遵循基本的科學方法論原則。這些原則包括:明確定義假設、使用對照實驗、控制混淆變量、以及對結果進行同行評審。

明確定義假設意味著要清楚說明我們試圖檢驗的是什麼。如果我們聲稱「S2F 比率導致比特幣價格上漲」,那麼我們需要明確定義「導致」的含義,並說明我們如何區分因果關係和相關關係。

使用對照組和控制混淆變量是科學實驗的核心。遺憾的是,在金融市場研究中,我們很少有真正的「對照組」,因為我們只有一個比特幣,也沒有辦法進行控制實驗。這就要求研究者格外謹慎地處理因果推論問題。

同行評審是科學品質控制的重要機制。S2F 模型的許多傳播是在社交媒體和部落格上進行的,而非經過嚴格的學術同行評審。雖然這並不意味著這些分析是錯誤的,但它提醒讀者在評估這些分析時需要格外批判。

時間序列分析的進階方法

對於比特幣價格的時間序列分析,研究者應該使用更嚴格的統計方法來避免虛假相關和過度擬合的問題。

Granger 因果檢定(Granger Causality Test)是一種常用的時間序列因果推論方法。雖然名稱中包含「因果」,但 Granger 因果檢定實際上檢驗的是一個變量是否有助於預測另一個變量,而非真正的因果關係。然而,這種方法至少提供了一種比簡單相關分析更嚴格的預測能力檢驗。

向量自迴歸模型(VAR)和向量誤差修正模型(VECM)可以同時分析多個時間序列之間的動態關係。這些模型可以識別變量之間的領先-滯後關係,從而提供關於因果方向的更多信息。

面板數據方法(Panel Data Methods)可以利用比特幣不同發展階段的數據,提高估計的效率和稳健性。然而,比特幣的歷史相對較短,而且不同時期的市場結構可能存在顯著差異,這限制了面板數據方法的有效性。

預測績效評估的標準

一個有價值的價格預測模型應該在多個維度上表現優異:

準確性(Accuracy):模型的預測值與實際值的差距有多大?這通常用均方根誤差(RMSE)或平均絕對誤差(MAE)來衡量。

方向正確性(Direction Accuracy):模型預測價格上漲或下跌的正確率是多少?即使無法準確預測價格水準,准確預測價格走勢也有實用價值。

樣本外表現(Out-of-Sample Performance):模型在從未見過的數據上的表現如何?這是避免過度擬合的關鍵檢驗。

實用性(Practical Usefulness):模型的預測是否具有足夠的領先時間和精確度來支持投資決策?

批評者指出,S2F 模型在這些評估維度上的表現並不突出。特別是在樣本外測試和方向正確性方面,模型的表現與簡單的基準模型(如隨機漫步或簡單移動平均)相當。

結論

S2F 模型的歷史為我們提供了一個關於金融市場研究和模型構建的深刻案例研究。這個模型展示了以下幾個重要的教訓:

第一,簡單的相關性不等於因果性。當兩個變量都呈現時間趨勢時,任何具有類似趨勢的變量都可能呈現出高相關性。嚴格的統計檢定和因果推論方法對於區分真正的因果關係和統計假象至關重要。

第二,模型的複雜度需要與數據的訊息量相匹配。比特幣的價格歷史相對較短,而且市場結構經歷了多次根本性變化,這限制了複雜模型的估計精度和預測能力。

第三,模型的接受度往往受到社群信念和意識形態的影響,而非僅僅基於科學證據。這種現象在比特幣社區尤為明顯,因為比特幣本身就被許多人視為一種意識形態聲明。

對於比特幣投資者和研究者而言,最明智的態度是對任何價格預測模型保持批判性思考,承認模型的不確定性,並始終將模型作為決策的參考而非唯一依據。比特幣市場的未來走勢將繼續取決於複雜的技術、經濟和社會因素的交互作用,任何試圖用簡單公式捕捉這種複雜性的嘗試都應該被審慎對待。

最終,S2F 模型爭議的深層意義在於它提醒我們:比特幣不僅是一種金融資產,更是一個引發了關於貨幣、價值和信任本質的深刻討論的社會現象。對比特幣的科學研究不僅需要嚴格的統計方法和經濟學理論,更需要對比特幣在人類社會中的獨特位置保持開放和批判的態度。

延伸閱讀與來源

這篇文章對您有幫助嗎?

評論

發表評論

注意:由於這是靜態網站,您的評論將儲存在本地瀏覽器中,不會公開顯示。

目前尚無評論,成為第一個發表評論的人吧!