了解Cysic:硬件加速的曙光和ZK挖礦的出現

中級Aug 14, 2024
本文介紹了ZK證明系統的工作流程,並探討了加速MSM和NTT計算的挑戰和優化策略。
了解Cysic:硬件加速的曙光和ZK挖礦的出現

在四月,維塔利克參加了香港區塊鏈峰會並發表了題為“達到協議設計極限”的演講,在演講中他強調了ZK-SNARKs在以太坊Danksharding路線圖中的潛力,並討論了ASIC晶片在加速ZK處理過程中的有前景的作用。早些時候,Scroll的聯合創始人張烨建議ZK的潛在應用可能在傳統領域中甚至比在Web3中更大,這些領域的需求非常大,例如受信任的計算、數據庫、可驗證硬件、內容驗證和zkML。如果實時ZK證明生成變得可行,它可能會導致Web3和傳統行業的變革。然而,從效率和成本的角度來看,廣泛採用ZK仍有一段路要走。

早在2022年,領先的風險投資公司a16z和Paradigm發布了報告,強調ZK硬件加速的重要性。 Paradigm甚至預測未來ZK礦工的收入可能會與比特幣或以太坊礦工的收入相媲美,基於GPU、FPGA和ASIC的硬件加速解決方案有望佔據重要市場份額。 隨著主流ZK Rollups(如Scroll和Starknet)的崛起,硬件加速已成為熱門話題,並且隨著像Cysic這樣的項目即將推出,人們對此的興趣已經加劇。

鑒於對ZK的巨大需求,ZK礦池和即時ZKP一代SaaS模型可能會催生一個新的行業。在這個新興市場中,擁有強大能力和先發優勢的ZK硬體製造商有可能成為下一個比特大陸,主導硬體加速領域。Cysic是這個領域最有前途的球員之一。該團隊贏得了ZKP技術競賽平臺ZPrize的顯著獎項,並於2023年開始指導ZPrize。他們的路線圖包括ToB(企業對企業)ZK礦池和ToC(企業對消費者)ZK-Depin硬體,吸引了Polychain,ABCDE,OKX Ventures和Hashkey等頂級風險投資公司的大量投資,獲得了近2000萬美元的資金。

隨著Cysic準備在7月底推出測試網並開放其ZK挖礦池,關於該公司的討論在各個社區中越來越熱烈。本文旨在向更多人介紹Cysic的產品概念和商業模式,同時提供ZK硬件加速原理的易於理解的概述。在接下來的部分中,我們將簡要概述Cysic的關鍵方面,以便讀者更容易理解。

了解零知識證明系統:工作流程透視

零知識(ZK)證明系統復雜,但通過分解其功能和工作流程,我們可以簡化其理解。這是一個對將ZK應用於普通計算的系統的基本概述:首先,用戶通過前端界面與ZK系統進行交互,提交他們想要證明的內容。然後,前端將此內容轉換為適合ZK證明系統處理的格式。系統使用特定的證明系統或框架(如Halo2或Plonk)生成ZK證明。這個過程包括幾個關鍵步驟:

  1. 定義問題:第一步是確定需要證明的具體內容。例如,證明者可能聲稱知道或擁有某些數據,例如聲稱“我知道方程式F(x)=w的解N”,而不揭示N的實際值。
  2. 算術轉換和約束滿足問題(CSP):在證明者提交內容後,系統創建一個專門的數學模型或程序,準確地表示要證明的內容。然後將其轉換為證明系統可以處理的格式。例如,語句“我知道方程F(x)= w的解N”從其原始數學方程轉換為由邏輯門電路和多項式表示的形式。

  1. 編譯成ZKP:接下來,系統選擇適合的證明系統,如Halo或Plonk,並將先前生成的內容編譯成ZKP程序。然後,證明者使用此程序生成證明,驗證者檢查其有效性。

對於像zkEVM這樣的系統,在以太坊Layer 2解決方案中通常使用的,智能合約首先被編譯成EVM(以太坊虛擬機)的字節碼。然後,每個操作碼被轉換為邏輯Gate電路或多項式約束,然後進一步由後端ZK證明系統進行處理。

值得注意的是,zk-SNARKs(零知證明)是當今區塊鏈中最常用的ZKP技術。許多ZK Rollups利用SNARKs的簡潔性而非其零知證明性質。簡潔性指的是ZKP將大量數據壓縮成幾百字節,從而顯著降低驗證成本。這導致了Prover和Verifier的工作負載不對稱:對於Prover來說,生成ZKP的成本很高,但對於Verifier來說,驗證ZKP的成本相對較低。通過利用這種不對稱性,一個Prover和多個Verifier的場景可以顯著降低Verifier端的整體成本。這種模型對於分散驗證特別有利,正如以太坊的第二層解決方案所設想的那樣。

然而,將驗證成本轉嫁到 ZKP 生成過程的這種模式並非萬靈藥。對於 ZK Rollup 項目來說,生成 ZKP 的高成本將不可避免地轉嫁到用戶體驗和交易費用上,這可能會阻礙 ZK Rollups 的長期採用。儘管 ZK 在無信任和去中心化驗證方面具有潛力,但當前的經濟條件並不支持大規模實施 zkEVM、zkVM、ZK Rollups 或 ZK 橋接,因為生成證明存在時間限制。這導致了 ZK 加速項目的崛起,如 Cysic、Ingonyama 和 Irreducible,它們各自致力於從不同角度降低 ZKP 生成成本。在接下來的部分中,我們將簡要討論 ZKP 生成的主要計算成本和加速技術,以及為什麼 Cysic 在 ZK 加速領域具有重大潛力。

計算挑戰:MSM和NTT

眾所周知,在ZK系統中,生成證據對於證明者來說是耗時的。在ZK-SNARK協議中,驗證者可能只需要1秒鐘就能驗證一個證據,但證明者可能需要半天甚至一整天的時間來生成該證據。為了優化ZKP計算的使用,有必要將計算格式從傳統編程轉換為ZK友好格式。

目前有兩種主要方法可以實現這一點:一種涉及使用Halo2等證明系統框架編寫電路,而另一種涉及使用Cairo或Circom等領域特定語言(DSL)將計算轉換為中間格式,然後可以提交給證明系統。校樣系統根據這些電路或DSL編譯的中間格式生成ZK校樣。操作越複雜,生成證明所需的時間就越長。此外,某些操作本質上是對 ZK 不友好的,需要額外的努力才能實現。例如,像 SHA 或 Keccak 這樣的哈希函數對 ZKP 不友好,這意味著使用它們會增加證明生成時間。即使是在經典計算機上執行成本低廉的操作,對於 ZKP 也可能效率不高。

排除這些 ZK-unfriendly 任務,證明生成過程中的瓶頸在不同的證明系統中非常相似。在 ZK 證明生成中,有兩個主要的計算任務佔用大部分資源:MSM(多標量乘法)和 NTT(數論變換)。這兩個任務可以佔證明生成時間的 80-95%,具體取決於 ZKP 承諾方案和特定實現。MSM 涉及在橢圓曲線上執行多標量乘法,而 NTT 是有限域上的 FFT(快速傅立葉變換),用於加速多項式乘法。這些任務的不同組合可能導致 FFT 和 MSM 之間的負載分佈不同。例如,Stark 使用 FRI,這是一種基於哈希的承諾方案,與像 KZG 或 IPA 這樣的橢圓曲線方案不涉及 MSM。通常,所需的 FFT 操作越多,則 MSM 操作越少,反之亦然。

優化策略

MSM 操作的特點是可預測的記憶體訪問,這允許高度並行化,但需要大量記憶體資源。但是,MSM 也帶來了可擴充性挑戰;即使使用並行化,它仍然可能很慢。雖然硬體加速可以説明加速 MSM,但它需要大量記憶體和並行計算資源。

另一方面,NTT涉及隨機內存訪問,這使得它不太適合硬件加速並且在分散系統中難以處理。這是因為NTT的隨機訪問性質通常需要從分散環境中的其他節點訪問數據。當需要網絡互動時,性能可能會大幅下降。

因此,存儲數據的訪問和移動成為了主要的瓶頸,限制了對NTT操作進行並行化的能力。大多數加速NTT的努力都集中在管理計算與內存的交互方式上。

事實上,解決MSM和NTT的效率瓶頸最簡單的方法是完全消除這些操作。一些新提出的算法,如Hyperplonk,修改了Plonk以消除NTT操作,使Hyperplonk更易加速,儘管引入了新的瓶頸。其他例子包括計算開銷大的sumcheck協議或STARK算法,它消除了MSM,但通過其FRI協議添加了顯著的哈希計算。

ZK 硬體加速和 Cysic 的終極目標

雖然軟體和演演演算法優化是必不可少且有價值的,但它們有明顯的局限性。為了充分優化ZKP生成的效率,硬體加速至關重要,就像ASIC和GPU最終主導BTC和ETH挖礦市場一樣。

那么问题就变成了:加速ZKP生成的最佳硬件是什么?目前,有几种硬件选项可用于ZK加速,例如GPU、FPGA或ASIC,每种选项都有其自身的优势和劣势。

比較 GPU、FPGA 和 ASIC 硬體

為了更好地了解GPU、FPGA和ASIC硬體開發過程中的差異,讓我們考慮一個簡單的例子:實現並行乘法。

  • GPU:使用CUDA SDK,開發人員可以編寫代碼,利用並行計算,類似於編寫本地代碼。
  • FPGA: 開發人員需要學習硬體描述語言 (HDL) 來控制硬體級連接並實現並行算法。
  • ASIC:芯片的晶体管布局在设计阶段固定,后期无法修改。

每個硬件選項都有其優點和缺點,使它們適用於不同階段的ZK技術發展。Cysic的目標是成為ZK硬件加速的終極解決方案,採用分階段策略:

  1. GPU:開發一個SDK,為ZK應用程序提供解決方案,並整合網絡中的GPU資源。
  2. FPGA:利用FPGA的靈活性快速創建定制的ZK硬件加速。
  3. ASIC:獨立開發基於ASIC的ZK Depin硬件。
  4. Cysic Network將整合ZK Depin和GPU的所有計算能力作為SAAS平台/挖礦池,為整個ZK行業提供計算能力和驗證解決方案。

讓我們探索這些不同的子領域,以更好地理解 ZK 加速解決方案和 Cysic 的開發方法之間的區別。

ZK挖礦池和SaaS平台:Cysic Network

Scroll和Polygon zkEVM都在其路線圖中提出了“去中心化的證明者”概念,這基本上意味著建立ZK挖礦池。這種市場驅動的方法有助於ZK Rollup項目減輕其工作量,同時激勵礦工和礦池運營商不斷優化ZK加速解決方案。Cysic的路線圖包括開發名為Cysic Network的ZK挖礦池和SaaS平台,該平台將整合Cysic的計算能力,並通過挖礦激勵吸引第三方資源,包括閒置的GPU和用戶擁有的zk DePIN設備。整個驗證工作流程如下:

  1. 任務提交:zk項目團隊向代理提交證明生成任務,代理將任務轉發到驗證網絡。最初,這些代理將由Cysic運營,但後來,資產抵押將允許任何人成為代理。
  2. 證明生成: 證明者接受任務並使用硬件生成零知識證明。證明者必須抵押代幣以參與,並在完成任務後獲得獎勵。
  3. 驗證:驗證委員會檢查證明的有效性並對其進行投票。一旦達到一定的投票數量,該證明被認為是有效的。驗證人通過押注代幣、參與投票和獲得獎勵加入委員會。此過程可能會融入EigenLayer的AVS概念,以重複使用現有的Restaking設施。

詳細的互動過程如下所示

在此過程中,某些行動,如資產權抵押、獎勵分配和任務提交,需要區塊鏈基礎設施支持的專用平台。為了滿足這一需求,Cysic Network 開發了一個具有獨特共識算法稱為計算驗證(PoC)的專用公鏈。該算法使用 VRF 函數和 Prover 的歷史表現(如設備可用性、提交的證明數量、證明準確性等)來選擇負責創建區塊的區塊生產者(這些區塊可能記錄設備信息並分發代幣激勵)。除了 ZK 挖礦池和 SaaS 平台外,Cysic 在基於不同硬體的 ZK 加速解決方案上進行了廣泛部署。讓我們探索 Cysic 在 GPU、FPGA 和 ASIC 技術上的成就。

GPU、FPGA 和 ASIC:一個比較

ZK(Zero-Knowledge)硬體加速的本質在於最大程度地並行化關鍵計算。從硬體角度來看,CPU 設計用於最大靈活性和通用用途。然而,CPU 晶片區域的相當部分專用於控制功能和各個層級的快取,這限制了其並行運算能力。相比之下,GPU 晶片區域的比例更大部分用於計算,使其能夠支援大規模的並行處理。GPU 現在已廣泛可用,像 Nvidia CUDA 這樣的庫使開發人員能夠利用 GPU 的並行性,而無需深入了解底層硬體。CUDA SDK 提供了一個加速 MSM(多標量乘法)和 NTT(數論轉換)計算的框架,使用 CUDA ZK 库。

FPGA(現場可編程閘陣列)採用不同的方法,包括大量小型處理單元的陣列。要編程 FPGA,開發人員必須使用專門的硬件描述語言(HDL),然後將其編譯成晶體管電路組合。基本上,FPGA 通過晶體管電路直接實現特定算法,繞過傳統指令系統的編譯過程。與 GPU 相比,這種方法提供了更大的定製和靈活性。目前,FPGA 的價格約為 GPU 價格的三分之一,並且其能效比可以更高出十倍以上。這種能源效率的優勢部分是因為 GPU 需要連接到主機設備,這通常會消耗大量電能。FPGA 可以增加更多的計算模塊來滿足 MSM 和 NTT 的需求,而不會增加能源消耗,這使其特別適用於計算密集型的 ZK 憑證場景,需要高數據吞吐量且需要低響應時間。然而,FPGA 面臨的最大挑戰是缺乏必要的編程經驗的開發人員。對於 ZK 項目團隊來說,組建既具有密碼學專業知識又具有 FPGA 工程知識的團隊極具挑戰性。

ASIC(Application-Specific Integrated Circuit)是三者中最專業化的,基本上完全在硬體中實現一個程序。一旦設計了ASIC,硬體配置就是固定的,不能改變,這意味著它只能執行特定的任務。FPGA在加速MSM和NTT方面的優勢也適用於ASIC,但由於ASIC是為特定應用而設計的,因此它在所有硬件選項中提供了最高效率和最低功耗。對於當今的主流ZK電路,Cysic的目標是實現1-5秒的證明時間,這只有ASIC才能實現。盡管這些優點非常吸引人,但ZK技術正在迅速發展,ASIC設計和生產周期通常需要1-2年,成本在1000萬至2000萬美元之間。因此,大規模生產必須等到ZK技術穩定下來,以避免生產很快就會過時的芯片。

為應對這些挑戰,Cysic 在三大硬件類別:GPU、FPGA 和 ASIC 上進行了全面投資。在 GPU 加速方面,Cysic 通過其自主開發的 CUDA 加速 SDK 適應了各種新的 ZK 證明系統的出現。通過整合社區資源,Cysic 將數以萬計的頂級 GPU 連接到其 GPU 計算網絡中,實現了與最新的開源框架相比速度提升 50%-80% 或更多的成果。在 FPGA 領域,Cysic 開發了設定了 MSM、NTT 和 Poseidon Merkle 樹模塊全球性能基準的解決方案,覆蓋了 ZK 計算的最關鍵部分。這些解決方案已經由幾個領先的 ZK 項目進行了原型測試和驗證。Cysic 的專有 SolarMSM 可以在短短 0.195 秒內完成 2^30 次 MSM 計算,而 SolarNTT 則可以在 0.218 秒內執行 2^30 次 NTT 計算,使它們成為目前最高效的 FPGA 硬件加速結果。

在ASIC領域,雖然ZK ASIC的廣泛採用可能還需要一段時間,但Cysic已經通過開發自己的ZK DePIN晶元和設備在這個新興市場中定位自己。為了吸引消費者使用者,滿足不同ZK專案多樣化的性能和成本要求,Cysic計劃推出兩款ZK硬體產品:ZK Air和ZK Pro。

  • ZK Air:此設備體積小巧,與行動電源或筆記型電腦充電器大小相似,普通用戶可以通過Type-C接口將其連接到筆記型電腦、iPad甚至智能手機上。它為特定的ZK項目提供計算支持,同時為用戶賺取獎勵。儘管體積小,ZK Air的計算能力超過了消費級GPU,使其能夠加速小規模的ZK證明生成任務。
  • ZK Pro:針對更加密集的應用設計,ZK Pro類似於傳統的挖礦機,提供了與多GPU伺服器相當的運算能力。它顯著加快了大規模專案(如ZK-Rollup和ZKML(Zero-Knowledge Machine Learning))的ZK證明生成速度。

通過這兩個設備,Cysic旨在創建一個穩定可靠的ZK-DePIN網絡。 ZK Air和ZK Pro目前正在開發中,預計於2025年發布。此外,Cysic網絡將使消費者用戶能夠以非常低的進入門檻進入ZK硬件加速市場。再加上ZK項目團隊對計算能力的高需求,這可能會引發類似比特幣挖礦熱潮的新熱情,潛在地導致ZK計算市場的爆炸性增長。

參考

https://medium.com/amber-group/need-for-speed-zero-knowledge-1e29d4a82fcdhttps://figmentcapital.medium.com/accelerating-zero-knowledge-proofs-cfc806de611b

免責聲明:

  1. 本文轉載自 業餘科技 Web3. 版權歸原作者[Nickqiao & Wuyue]所有。如果有任何對轉載的異議,請聯繫Gate Learn團隊將根據相關程序及時處理。
  2. 免責聲明:本文所表達的觀點和意見僅為作者個人觀點,並不構成任何投資建議。
  3. Gate Learn團隊已經翻譯了本文的其他語言版本。未經提及Gate學習團隊,請勿複製、分發或抄襲翻譯的文章。Gate.io.

了解Cysic:硬件加速的曙光和ZK挖礦的出現

中級Aug 14, 2024
本文介紹了ZK證明系統的工作流程,並探討了加速MSM和NTT計算的挑戰和優化策略。
了解Cysic:硬件加速的曙光和ZK挖礦的出現

在四月,維塔利克參加了香港區塊鏈峰會並發表了題為“達到協議設計極限”的演講,在演講中他強調了ZK-SNARKs在以太坊Danksharding路線圖中的潛力,並討論了ASIC晶片在加速ZK處理過程中的有前景的作用。早些時候,Scroll的聯合創始人張烨建議ZK的潛在應用可能在傳統領域中甚至比在Web3中更大,這些領域的需求非常大,例如受信任的計算、數據庫、可驗證硬件、內容驗證和zkML。如果實時ZK證明生成變得可行,它可能會導致Web3和傳統行業的變革。然而,從效率和成本的角度來看,廣泛採用ZK仍有一段路要走。

早在2022年,領先的風險投資公司a16z和Paradigm發布了報告,強調ZK硬件加速的重要性。 Paradigm甚至預測未來ZK礦工的收入可能會與比特幣或以太坊礦工的收入相媲美,基於GPU、FPGA和ASIC的硬件加速解決方案有望佔據重要市場份額。 隨著主流ZK Rollups(如Scroll和Starknet)的崛起,硬件加速已成為熱門話題,並且隨著像Cysic這樣的項目即將推出,人們對此的興趣已經加劇。

鑒於對ZK的巨大需求,ZK礦池和即時ZKP一代SaaS模型可能會催生一個新的行業。在這個新興市場中,擁有強大能力和先發優勢的ZK硬體製造商有可能成為下一個比特大陸,主導硬體加速領域。Cysic是這個領域最有前途的球員之一。該團隊贏得了ZKP技術競賽平臺ZPrize的顯著獎項,並於2023年開始指導ZPrize。他們的路線圖包括ToB(企業對企業)ZK礦池和ToC(企業對消費者)ZK-Depin硬體,吸引了Polychain,ABCDE,OKX Ventures和Hashkey等頂級風險投資公司的大量投資,獲得了近2000萬美元的資金。

隨著Cysic準備在7月底推出測試網並開放其ZK挖礦池,關於該公司的討論在各個社區中越來越熱烈。本文旨在向更多人介紹Cysic的產品概念和商業模式,同時提供ZK硬件加速原理的易於理解的概述。在接下來的部分中,我們將簡要概述Cysic的關鍵方面,以便讀者更容易理解。

了解零知識證明系統:工作流程透視

零知識(ZK)證明系統復雜,但通過分解其功能和工作流程,我們可以簡化其理解。這是一個對將ZK應用於普通計算的系統的基本概述:首先,用戶通過前端界面與ZK系統進行交互,提交他們想要證明的內容。然後,前端將此內容轉換為適合ZK證明系統處理的格式。系統使用特定的證明系統或框架(如Halo2或Plonk)生成ZK證明。這個過程包括幾個關鍵步驟:

  1. 定義問題:第一步是確定需要證明的具體內容。例如,證明者可能聲稱知道或擁有某些數據,例如聲稱“我知道方程式F(x)=w的解N”,而不揭示N的實際值。
  2. 算術轉換和約束滿足問題(CSP):在證明者提交內容後,系統創建一個專門的數學模型或程序,準確地表示要證明的內容。然後將其轉換為證明系統可以處理的格式。例如,語句“我知道方程F(x)= w的解N”從其原始數學方程轉換為由邏輯門電路和多項式表示的形式。

  1. 編譯成ZKP:接下來,系統選擇適合的證明系統,如Halo或Plonk,並將先前生成的內容編譯成ZKP程序。然後,證明者使用此程序生成證明,驗證者檢查其有效性。

對於像zkEVM這樣的系統,在以太坊Layer 2解決方案中通常使用的,智能合約首先被編譯成EVM(以太坊虛擬機)的字節碼。然後,每個操作碼被轉換為邏輯Gate電路或多項式約束,然後進一步由後端ZK證明系統進行處理。

值得注意的是,zk-SNARKs(零知證明)是當今區塊鏈中最常用的ZKP技術。許多ZK Rollups利用SNARKs的簡潔性而非其零知證明性質。簡潔性指的是ZKP將大量數據壓縮成幾百字節,從而顯著降低驗證成本。這導致了Prover和Verifier的工作負載不對稱:對於Prover來說,生成ZKP的成本很高,但對於Verifier來說,驗證ZKP的成本相對較低。通過利用這種不對稱性,一個Prover和多個Verifier的場景可以顯著降低Verifier端的整體成本。這種模型對於分散驗證特別有利,正如以太坊的第二層解決方案所設想的那樣。

然而,將驗證成本轉嫁到 ZKP 生成過程的這種模式並非萬靈藥。對於 ZK Rollup 項目來說,生成 ZKP 的高成本將不可避免地轉嫁到用戶體驗和交易費用上,這可能會阻礙 ZK Rollups 的長期採用。儘管 ZK 在無信任和去中心化驗證方面具有潛力,但當前的經濟條件並不支持大規模實施 zkEVM、zkVM、ZK Rollups 或 ZK 橋接,因為生成證明存在時間限制。這導致了 ZK 加速項目的崛起,如 Cysic、Ingonyama 和 Irreducible,它們各自致力於從不同角度降低 ZKP 生成成本。在接下來的部分中,我們將簡要討論 ZKP 生成的主要計算成本和加速技術,以及為什麼 Cysic 在 ZK 加速領域具有重大潛力。

計算挑戰:MSM和NTT

眾所周知,在ZK系統中,生成證據對於證明者來說是耗時的。在ZK-SNARK協議中,驗證者可能只需要1秒鐘就能驗證一個證據,但證明者可能需要半天甚至一整天的時間來生成該證據。為了優化ZKP計算的使用,有必要將計算格式從傳統編程轉換為ZK友好格式。

目前有兩種主要方法可以實現這一點:一種涉及使用Halo2等證明系統框架編寫電路,而另一種涉及使用Cairo或Circom等領域特定語言(DSL)將計算轉換為中間格式,然後可以提交給證明系統。校樣系統根據這些電路或DSL編譯的中間格式生成ZK校樣。操作越複雜,生成證明所需的時間就越長。此外,某些操作本質上是對 ZK 不友好的,需要額外的努力才能實現。例如,像 SHA 或 Keccak 這樣的哈希函數對 ZKP 不友好,這意味著使用它們會增加證明生成時間。即使是在經典計算機上執行成本低廉的操作,對於 ZKP 也可能效率不高。

排除這些 ZK-unfriendly 任務,證明生成過程中的瓶頸在不同的證明系統中非常相似。在 ZK 證明生成中,有兩個主要的計算任務佔用大部分資源:MSM(多標量乘法)和 NTT(數論變換)。這兩個任務可以佔證明生成時間的 80-95%,具體取決於 ZKP 承諾方案和特定實現。MSM 涉及在橢圓曲線上執行多標量乘法,而 NTT 是有限域上的 FFT(快速傅立葉變換),用於加速多項式乘法。這些任務的不同組合可能導致 FFT 和 MSM 之間的負載分佈不同。例如,Stark 使用 FRI,這是一種基於哈希的承諾方案,與像 KZG 或 IPA 這樣的橢圓曲線方案不涉及 MSM。通常,所需的 FFT 操作越多,則 MSM 操作越少,反之亦然。

優化策略

MSM 操作的特點是可預測的記憶體訪問,這允許高度並行化,但需要大量記憶體資源。但是,MSM 也帶來了可擴充性挑戰;即使使用並行化,它仍然可能很慢。雖然硬體加速可以説明加速 MSM,但它需要大量記憶體和並行計算資源。

另一方面,NTT涉及隨機內存訪問,這使得它不太適合硬件加速並且在分散系統中難以處理。這是因為NTT的隨機訪問性質通常需要從分散環境中的其他節點訪問數據。當需要網絡互動時,性能可能會大幅下降。

因此,存儲數據的訪問和移動成為了主要的瓶頸,限制了對NTT操作進行並行化的能力。大多數加速NTT的努力都集中在管理計算與內存的交互方式上。

事實上,解決MSM和NTT的效率瓶頸最簡單的方法是完全消除這些操作。一些新提出的算法,如Hyperplonk,修改了Plonk以消除NTT操作,使Hyperplonk更易加速,儘管引入了新的瓶頸。其他例子包括計算開銷大的sumcheck協議或STARK算法,它消除了MSM,但通過其FRI協議添加了顯著的哈希計算。

ZK 硬體加速和 Cysic 的終極目標

雖然軟體和演演演算法優化是必不可少且有價值的,但它們有明顯的局限性。為了充分優化ZKP生成的效率,硬體加速至關重要,就像ASIC和GPU最終主導BTC和ETH挖礦市場一樣。

那么问题就变成了:加速ZKP生成的最佳硬件是什么?目前,有几种硬件选项可用于ZK加速,例如GPU、FPGA或ASIC,每种选项都有其自身的优势和劣势。

比較 GPU、FPGA 和 ASIC 硬體

為了更好地了解GPU、FPGA和ASIC硬體開發過程中的差異,讓我們考慮一個簡單的例子:實現並行乘法。

  • GPU:使用CUDA SDK,開發人員可以編寫代碼,利用並行計算,類似於編寫本地代碼。
  • FPGA: 開發人員需要學習硬體描述語言 (HDL) 來控制硬體級連接並實現並行算法。
  • ASIC:芯片的晶体管布局在设计阶段固定,后期无法修改。

每個硬件選項都有其優點和缺點,使它們適用於不同階段的ZK技術發展。Cysic的目標是成為ZK硬件加速的終極解決方案,採用分階段策略:

  1. GPU:開發一個SDK,為ZK應用程序提供解決方案,並整合網絡中的GPU資源。
  2. FPGA:利用FPGA的靈活性快速創建定制的ZK硬件加速。
  3. ASIC:獨立開發基於ASIC的ZK Depin硬件。
  4. Cysic Network將整合ZK Depin和GPU的所有計算能力作為SAAS平台/挖礦池,為整個ZK行業提供計算能力和驗證解決方案。

讓我們探索這些不同的子領域,以更好地理解 ZK 加速解決方案和 Cysic 的開發方法之間的區別。

ZK挖礦池和SaaS平台:Cysic Network

Scroll和Polygon zkEVM都在其路線圖中提出了“去中心化的證明者”概念,這基本上意味著建立ZK挖礦池。這種市場驅動的方法有助於ZK Rollup項目減輕其工作量,同時激勵礦工和礦池運營商不斷優化ZK加速解決方案。Cysic的路線圖包括開發名為Cysic Network的ZK挖礦池和SaaS平台,該平台將整合Cysic的計算能力,並通過挖礦激勵吸引第三方資源,包括閒置的GPU和用戶擁有的zk DePIN設備。整個驗證工作流程如下:

  1. 任務提交:zk項目團隊向代理提交證明生成任務,代理將任務轉發到驗證網絡。最初,這些代理將由Cysic運營,但後來,資產抵押將允許任何人成為代理。
  2. 證明生成: 證明者接受任務並使用硬件生成零知識證明。證明者必須抵押代幣以參與,並在完成任務後獲得獎勵。
  3. 驗證:驗證委員會檢查證明的有效性並對其進行投票。一旦達到一定的投票數量,該證明被認為是有效的。驗證人通過押注代幣、參與投票和獲得獎勵加入委員會。此過程可能會融入EigenLayer的AVS概念,以重複使用現有的Restaking設施。

詳細的互動過程如下所示

在此過程中,某些行動,如資產權抵押、獎勵分配和任務提交,需要區塊鏈基礎設施支持的專用平台。為了滿足這一需求,Cysic Network 開發了一個具有獨特共識算法稱為計算驗證(PoC)的專用公鏈。該算法使用 VRF 函數和 Prover 的歷史表現(如設備可用性、提交的證明數量、證明準確性等)來選擇負責創建區塊的區塊生產者(這些區塊可能記錄設備信息並分發代幣激勵)。除了 ZK 挖礦池和 SaaS 平台外,Cysic 在基於不同硬體的 ZK 加速解決方案上進行了廣泛部署。讓我們探索 Cysic 在 GPU、FPGA 和 ASIC 技術上的成就。

GPU、FPGA 和 ASIC:一個比較

ZK(Zero-Knowledge)硬體加速的本質在於最大程度地並行化關鍵計算。從硬體角度來看,CPU 設計用於最大靈活性和通用用途。然而,CPU 晶片區域的相當部分專用於控制功能和各個層級的快取,這限制了其並行運算能力。相比之下,GPU 晶片區域的比例更大部分用於計算,使其能夠支援大規模的並行處理。GPU 現在已廣泛可用,像 Nvidia CUDA 這樣的庫使開發人員能夠利用 GPU 的並行性,而無需深入了解底層硬體。CUDA SDK 提供了一個加速 MSM(多標量乘法)和 NTT(數論轉換)計算的框架,使用 CUDA ZK 库。

FPGA(現場可編程閘陣列)採用不同的方法,包括大量小型處理單元的陣列。要編程 FPGA,開發人員必須使用專門的硬件描述語言(HDL),然後將其編譯成晶體管電路組合。基本上,FPGA 通過晶體管電路直接實現特定算法,繞過傳統指令系統的編譯過程。與 GPU 相比,這種方法提供了更大的定製和靈活性。目前,FPGA 的價格約為 GPU 價格的三分之一,並且其能效比可以更高出十倍以上。這種能源效率的優勢部分是因為 GPU 需要連接到主機設備,這通常會消耗大量電能。FPGA 可以增加更多的計算模塊來滿足 MSM 和 NTT 的需求,而不會增加能源消耗,這使其特別適用於計算密集型的 ZK 憑證場景,需要高數據吞吐量且需要低響應時間。然而,FPGA 面臨的最大挑戰是缺乏必要的編程經驗的開發人員。對於 ZK 項目團隊來說,組建既具有密碼學專業知識又具有 FPGA 工程知識的團隊極具挑戰性。

ASIC(Application-Specific Integrated Circuit)是三者中最專業化的,基本上完全在硬體中實現一個程序。一旦設計了ASIC,硬體配置就是固定的,不能改變,這意味著它只能執行特定的任務。FPGA在加速MSM和NTT方面的優勢也適用於ASIC,但由於ASIC是為特定應用而設計的,因此它在所有硬件選項中提供了最高效率和最低功耗。對於當今的主流ZK電路,Cysic的目標是實現1-5秒的證明時間,這只有ASIC才能實現。盡管這些優點非常吸引人,但ZK技術正在迅速發展,ASIC設計和生產周期通常需要1-2年,成本在1000萬至2000萬美元之間。因此,大規模生產必須等到ZK技術穩定下來,以避免生產很快就會過時的芯片。

為應對這些挑戰,Cysic 在三大硬件類別:GPU、FPGA 和 ASIC 上進行了全面投資。在 GPU 加速方面,Cysic 通過其自主開發的 CUDA 加速 SDK 適應了各種新的 ZK 證明系統的出現。通過整合社區資源,Cysic 將數以萬計的頂級 GPU 連接到其 GPU 計算網絡中,實現了與最新的開源框架相比速度提升 50%-80% 或更多的成果。在 FPGA 領域,Cysic 開發了設定了 MSM、NTT 和 Poseidon Merkle 樹模塊全球性能基準的解決方案,覆蓋了 ZK 計算的最關鍵部分。這些解決方案已經由幾個領先的 ZK 項目進行了原型測試和驗證。Cysic 的專有 SolarMSM 可以在短短 0.195 秒內完成 2^30 次 MSM 計算,而 SolarNTT 則可以在 0.218 秒內執行 2^30 次 NTT 計算,使它們成為目前最高效的 FPGA 硬件加速結果。

在ASIC領域,雖然ZK ASIC的廣泛採用可能還需要一段時間,但Cysic已經通過開發自己的ZK DePIN晶元和設備在這個新興市場中定位自己。為了吸引消費者使用者,滿足不同ZK專案多樣化的性能和成本要求,Cysic計劃推出兩款ZK硬體產品:ZK Air和ZK Pro。

  • ZK Air:此設備體積小巧,與行動電源或筆記型電腦充電器大小相似,普通用戶可以通過Type-C接口將其連接到筆記型電腦、iPad甚至智能手機上。它為特定的ZK項目提供計算支持,同時為用戶賺取獎勵。儘管體積小,ZK Air的計算能力超過了消費級GPU,使其能夠加速小規模的ZK證明生成任務。
  • ZK Pro:針對更加密集的應用設計,ZK Pro類似於傳統的挖礦機,提供了與多GPU伺服器相當的運算能力。它顯著加快了大規模專案(如ZK-Rollup和ZKML(Zero-Knowledge Machine Learning))的ZK證明生成速度。

通過這兩個設備,Cysic旨在創建一個穩定可靠的ZK-DePIN網絡。 ZK Air和ZK Pro目前正在開發中,預計於2025年發布。此外,Cysic網絡將使消費者用戶能夠以非常低的進入門檻進入ZK硬件加速市場。再加上ZK項目團隊對計算能力的高需求,這可能會引發類似比特幣挖礦熱潮的新熱情,潛在地導致ZK計算市場的爆炸性增長。

參考

https://medium.com/amber-group/need-for-speed-zero-knowledge-1e29d4a82fcdhttps://figmentcapital.medium.com/accelerating-zero-knowledge-proofs-cfc806de611b

免責聲明:

  1. 本文轉載自 業餘科技 Web3. 版權歸原作者[Nickqiao & Wuyue]所有。如果有任何對轉載的異議,請聯繫Gate Learn團隊將根據相關程序及時處理。
  2. 免責聲明:本文所表達的觀點和意見僅為作者個人觀點,並不構成任何投資建議。
  3. Gate Learn團隊已經翻譯了本文的其他語言版本。未經提及Gate學習團隊,請勿複製、分發或抄襲翻譯的文章。Gate.io.
即刻開始交易
註冊並交易即可獲得
$100
和價值
$5500
理財體驗金獎勵!