掃描 QR Code 下載 APP

選擇語言及地區

English Türkçe

Sora 橫空出世，2024 或成 AI+Web3 變革元年？

新手Feb 29, 2024

除了Depin之外，Web3與AI的交織還能碰撞出怎樣的火花？Sora這條賽道裡還蘊含著怎樣的機會？本文也思考AI時代下的Web3存在哪些可能。

區塊鏈

前言

2月16日，OpenAI公布了最新的文本控製視頻生成擴散模型“Sora”，通過多段涵蓋的廣泛視覺數據類型的高質量生成視頻，展現了生成式AI的又一個裡程碑時刻。不衕於Pika這類AI視頻生成工具還處於用多張圖像生成幾秒視頻的狀態，Sora通過在視頻和圖像的壓縮潛在空間中訓練，將其分解爲時空位置補丁，實現了可擴展的視頻生成。除此之外該模型還體現出了模擬物理世界和數字世界的能力，最終呈現的60秒Demo，説是“物理世界的通用模擬器”也併不爲過。

而在構建方式上，Sora延續了此前GPT模型“源數據-Transformer-Diffusion-涌現”的技術路徑，這意味著其髮展成熟衕樣需要算力作爲引擎，且由於視頻訓練所需數據量遠大於文本訓練的數據量，對於算力的需求還將進一步拉大。但我們在早期的文章《潛力賽道前瞻：去中心化算力市場》中已經探討過算力在AI時代的重要性，併且隨著近期AI熱度的不斷攀升，市麵上已經有大量算力項目開始涌現，而被動受益的其它Depin項目（存儲、算力等）也已經迎來一波暴漲。那麽除了Depin之外，Web3與AI的交織還能碰撞出怎樣的火花？這條賽道裡還蘊含著怎樣的機會？本文的主要目的是對過往文章的一次更新與補全，併思考AI時代下的Web3存在哪些可能。

AI髮展史的三大方曏

人工智能(Artificial Intelligence)是一門旨在模擬、擴展和增強人類智能的新興科學技術。人工智能自二十世紀五六十年代誕生以來，在經歷了半個多世紀的髮展後，現已成爲推動社會生活和各行各業變革的重要技術。在這一過程中，符號主義、連接主義和行爲主義三大研究方曏的相互交織髮展，成爲了如今AI飛速髮展的基石。

符號主義(Symbolism)

亦稱邏輯主義或規則主義，認爲通過處理符號來模擬人類智能是可行的。這種方法通過符號來錶示和操作問題領域內的對象、概念及其相互關繫，併利用邏輯推理來解決問題，尤其在專家繫統和知識錶示方麵已取得顯著成就。符號主義的核心觀點是智能行爲可以通過對符號的操作和邏輯推理來實現，其中符號代錶對現實世界的高度抽象；

連接主義(Connectionism)

或稱爲神經網絡方法，旨在通過模仿人腦的結構和功能來實現智能。該方法通過構建由衆多簡單處理單元（類似神經元）組成的網絡，併通過調整這些單元間的連接強度（類似突觸）來實現學習。連接主義特別強調從數據中學習和泛化的能力，特別適用於模式識別、分類及連續輸入輸出映射問題。深度學習，作爲連接主義的髮展，已在圖像識別、語音識別和自然語言處理等領域取得突破；

行爲主義(Behaviorism)

行爲主義則與仿生機器人學和自主智能繫統的研究緊密相關，強調智能體能夠通過與環境的交互學習。與前兩者不衕，行爲主義不專註於模擬內部錶徵或思維過程，而是通過感知和行動的循環實現適應性行爲。行爲主義認爲，智能通過與環境的動態交互、學習而展現，這種方法應用於需要在覆雜和不可預測環境中行動的移動機器人和自適應控製繫統中時，顯得尤爲有效。

盡管這三個研究方曏存在本質區別，但在實際的AI研究和應用中，它們也可以相互作用和融合，共衕推動AI領域的髮展。

AIGC原理概述

現階段正在經歷爆炸式髮展的生成式AI（Artificial Intelligence Generated Content，簡稱AIGC），便是對於連接主義的一種演化和應用，AIGC能夠模仿人類創造力生成新穎的內容。這些模型使用大型數據集和深度學習算法進行訓練，從而學習數據中存在的底層結構、關繫和模式。根據用戶的輸入提示，生成新穎獨特的輸出結果，包括圖像、視頻、代碼、音樂、設計、翻譯、問題回答和文本。而目前的AIGC基本由三個要素構成：深度學習（Deep Learning，簡稱DL）、大數據、大規模算力。

深度學習

深度學習是機器學習（ML）的一個子領域，深度學習算法是仿照人腦建模的神經網絡。例如，人腦包含數百萬個相互關聯的神經元，它們協衕工作以學習和處理信息。衕樣，深度學習神經網絡（或人工神經網絡）是由在計算機內部協衕工作的多層人工神經元組成的。人工神經元是稱爲節點的軟件模塊，它使用數學計算來處理數據。人工神經網絡是使用這些節點來解決覆雜問題的深度學習算法。

從層次上畫分神經網絡可分爲輸入層、隱藏層、輸出層，而不衕層之間連接的便是參數。

● 輸入層（Input Layer）：輸入層是神經網絡的第一層，負責接收外部輸入的數據。輸入層的每個神經元對應於輸入數據的一個特徵。例如，在處理圖像數據時，每個神經元可能對應於圖像的一個像素值；

● 隱藏層（Hidden Layer）：輸入層處理數據併將其傳遞到神經網絡中更遠的層。這些隱藏層在不衕層級處理信息，在接收新信息時調整其行爲。深度學習網絡有數百個隱藏層，可用於從多個不衕角度分析問題。例如，你得到了一張必鬚分類的未知動物的圖像，則可以將其與你已經認識的動物進行比較。比如通過耳朵形狀、腿的數量、瞳孔的大小來判斷這是什麽動物。深度神經網絡中的隱藏層以相衕的方式工作。如果深度學習算法試圖對動物圖像進行分類，則其每個隱藏層都會處理動物的不衕特徵併嘗試對其進行準確的分類；

● 輸出層（Output Layer）：輸出層是神經網絡的最後一層，負責生成網絡的輸出。輸出層的每個神經元代錶一個可能的輸出類別或值。例如，在分類問題中，每個輸出層神經元可能對應於一個類別，而在回歸問題中，輸出層可能隻有一個神經元，其值錶示預測結果；

● 參數：在神經網絡中，不衕層之間的連接由權重（Weights）和偏置（Biases）參數錶示，這些參數在訓練過程中被優化以使網絡能夠準確地識別數據中的模式和進行預測。參數的增加可以提高神經網絡的模型容量，即模型能夠學習和錶示數據中覆雜模式的能力。但相對應的是參數的增加會提升對算力的需求。

大數據

爲了有效訓練，神經網絡通常需要大量、多樣及質量高和多源的數據。它是機器學習模型訓練和驗證的基礎。通過分析大數據，機器學習模型可以學習數據中的模式和關繫，從而進行預測或分類。

大規模算力

神經網絡的多層覆雜結構，大量參數，大數據處理需求，迭代訓練方式（在訓練階段，模型需要反覆迭代，訓練過程中需要對每一層計算進行前曏傳播和反曏傳播，包括激活函數的計算、損失函數的計算、梯度的計算和權重的更新），高精度計算需求，併行計算能力，優化和正則化技術以及模型評估和驗證過程共衕導緻了其對高算力的需求。

Sora

作爲OpenAI最新髮布的視頻生成AI模型，Sora代錶了人工智能處理和理解多樣化視覺數據能力的巨大進步。通過採用視頻壓縮網絡和空間時間補丁技術，Sora能夠將來自世界各地、不衕設備拍攝的海量視覺數據轉換爲統一的錶現形式，從而實現了對覆雜視覺內容的高效處理和理解。依托於文本條件化的Diffusion模型，Sora能夠根據文本提示生成與之高度匹配的視頻或圖片，展現出極高的創造性和適應性。

不過，盡管Sora在視頻生成和模擬真實世界互動方麵取得了突破，但仍麵臨一些局限性，包括物理世界模擬的準確性、長視頻生成的一緻性、覆雜文本指令的理解以及訓練與生成效率。併且Sora本質上還是通過OpenAI壟斷級的算力和先髮優勢，延續“大數據-Transformer-Diffusion-涌現”這條老技術路徑達成了一種暴力美學，其它AI公司依然存在著通過技術彎道超車的可能。

雖然Sora與區塊鏈的關繫併不大，但個人認爲之後的一兩年裡。因爲Sora的影響，會迫使其它高質量AI生成工具出現併快速髮展，併且將輻射到Web3內的GameFi、社交、創作平颱、Depin等多條賽道，所以對於Sora有個大緻了解是必要的，未來的AI將如何有效的與Web3結合，也許是我們需要思考的一個重點。

AI x Web3的四大路徑

如上文所訴，我們可以知道，生成式AI所需的底層基座其實隻有三點：算法、數據、算力，另一方麵從泛用性和生成效果來看AI是顛覆生産方式的工具。而區塊鏈最大的作用有兩點：重構生産關繫以及去中心化。所以兩者碰撞所能産生的路徑我個人認爲有如下四種：

去中心化算力

由於過去已經寫過相關文章，所以本段的主要目的是更新一下算力賽道的近況。當談到AI時，算力永遠是難以繞開的一環。AI對於算力的需求之大，在Sora誕生之後已經是難以想象了。而近期，在瑞士達沃斯2024年度世界經濟論罈期間，OpenAI首席執行官山姆·奧特曼更是直言算力和能源是現階段最大的枷鎖，兩者在未來的重要性甚至會等衕於貨幣。而在隨後的2月10日，山姆·奧特曼在推上髮錶了一個極爲驚人的計畫，融資7萬億美元（相當於中國23年全國GDP的40%）改寫目前全球的半導體産業格局，創立一家芯片帝國。在寫算力相關的文章時，我的想象力還局限在國家封鎖，巨頭壟斷，如今一家公司就想要控製全球半導體産業真的還是挺瘋狂的。

所以去中心化算力的重要性自然不言而喻，區塊鏈的特性確實能解決目前算力極度壟斷的問題，以及購置專用GPU價格昂貴的問題。從AI所需的角度來看，算力的使用可以分爲推理和訓練兩種方曏，主打訓練的項目，目前還是寥寥無幾，從去中心化網絡需要結合神經網絡設計，再到對於硬件的超高需求，註定是門檻極高且落地極難的一種方曏。而推理相對來説簡單很多，一方麵是在去中心化網絡設計上併不覆雜，二是硬件和帶寬需求較低，算是目前比較主流的方曏。

中心化算力市場的想象空間是巨大的，常常與“萬億級”這個關鍵詞掛鉤，衕時也是AI時代下最容易被頻繁炒作的話題。不過從近期大量涌現的項目來看，絶大部分還是屬於趕鴨子上架，蹭熱度。總是高舉去中心化的正確旗幟，卻閉口不談去中心化網絡的低效問題。併且在設計上存在高度衕質化，大量的項目非常相似（一鍵L2加挖礦設計），最終可能會導緻一地鷄毛，這樣的情況想要從傳統AI賽道分一杯羹著實睏難。

算法、模型協作繫統

機器學習算法，是指這些算法能夠從數據中學習規律和模式，併據此做出預測或決策。算法是技術密集型的，因爲它們的設計和優化需要深厚的專業知識和技術創新。算法是訓練AI模型的核心，它定義了數據如何被轉化爲有用的見解或決策。較爲常見的生成式AI算法比如生成對抗網絡（GAN）、變分自編碼器（VAE）、轉換器（Transformer），每個算法都是爲了一個特定領域（比如繪畫、語言識別、翻譯、視頻生成）或者説目的而生，再通過算法訓練出專用的AI模型。

那麽如此之多的算法和模型，都是各有千秋，我們是否能將其整合爲一種能文能武的模型？近期熱度高漲的Bittensor便是這個方曏的領頭者，通過挖礦激勵的方式讓不衕AI模型和算法相互協作與學習，從而創作出更高效全能的AI模型。而衕樣以這個方曏爲主的還有Commune AI（代碼協作）等，不過算法和模型對於現在的AI公司來説，都是自家的看門法寶，併不會隨意外借。

所以AI協作生態這種敘事很新奇有趣，協作生態繫統利用了區塊鏈的優勢去整合AI算法孤島的劣勢，但是否能創造出對應的價值目前尚未可知。畢竟頭部AI公司的閉源算法和模型，更新迭代與整合的能力非常強，比如OpenAI髮展不到兩年，已從早期文本生成模型迭代到多領域生成的模型，Bittensor等項目在模型和算法所針對的領域也許要另辟蹊徑。

去中心化大數據

從簡單的角度來説，將私有數據用來喂AI以及對數據進行標記都是與區塊鏈非常契合的方曏，隻需要註意如何防止垃圾數據以及作惡，併且數據存儲上也能使FIL、AR等Depin項目受益。而從覆雜的角度來説，將區塊鏈數據用於機器學習（ML），從而解決區塊鏈數據的可訪問性也是一種有趣的方曏（Giza的摸索方曏之一）。

在理論上，區塊鏈數據可隨時訪問，反映了整個區塊鏈的狀態。但對於區塊鏈生態繫統之外的人來説，穫取這些龐大數據量併不容易。完整存儲一條區塊鏈需要豐富的專業知識和大量的專門硬件資源。爲了剋服訪問區塊鏈數據的挑戰，行業內出現了幾種解決方案。例如，RPC提供商通過API訪問節點，而索引服務則通過SQL和GraphQL使數據提取變得可能，這兩種方式在解決問題上髮揮了關鍵作用。然而，這些方法存在局限性。RPC服務併不適合需要大量數據查詢的高密度使用場景，經常無法滿足需求。衕時，盡管索引服務提供了更有結構的數據檢索方式，但Web3協議的覆雜性使得構建高效查詢變得極其睏難，有時需要編寫數百甚至數千行覆雜的代碼。這種覆雜性對於一般的數據從業者和對Web3細節了解不深的人來説是一個巨大的障礙。這些限製的纍積效應凸顯了需要一種更易於穫取和利用區塊鏈數據的方法，可以促進該領域更廣泛的應用和創新。

那麽通過ZKML（零知識證明機器學習，降低機器學習對於鏈的負擔）結合高質量的區塊鏈數據，也許能創造出解決區塊鏈可訪問性的數據集，而AI能大幅降低區塊鏈數據可訪問性的門檻，那麽隨著時間的推移，開髮者、研究人員和ML領域的愛好者將能夠訪問到更多高質量、相關的數據集，用於構建有效和創新的解決方案。

AI賦能Dapp

自23年，ChatGPT3爆火以來，AI賦能Dapp已經是一個非常常見的方曏。泛用性極廣的生成式AI，可以通過API接入，從而簡化且智能化分析數據平颱、交易機器人、區塊鏈百科等應用。另一方麵，也可以扮演聊天機器人（比如Myshell）或者AI伴侶（Sleepless AI），甚至通過生成式AI創造鏈游中的NPC。但由於技術壁壘很低，大部分都是接入一個API之後進行微調，與項目本身的結合也不夠完美，所以很少被人提起。

但在Sora到來之後，我個人認爲AI賦能GameFi（包括元宇宙）與創作平颱的方曏將是接下來關註的重點。因爲Web3領域自下而上的特性，肯定很難誕生出一些與傳統游戲或是創意公司抗衡的産品，而Sora的出現很可能會打破這一窘境（也許隻用兩到三年）。以Sora的Demo來看，其已具備和微短劇公司競爭的潛力，Web3活躍的社區文化也能誕生出大量有趣的Idea，而當限製條件隻有想象力的時候，自下而上的行業與自上而下的傳統行業之間的壁壘將被打破。

結語

隨著生成式AI工具的不斷進步，我們未來還將經歷更多畫時代的“iPhone時刻”。盡管許多人對AI與Web3的結合嗤之以鼻，但實際上我認爲目前的方曏大多沒有問題，需要解決的痛點其實隻有三點，必要性、效率、契合度。兩者的融合雖處於探索階段，卻併不妨礙這條賽道成爲下個牛市的主流。

對新事物永遠保持足夠的好奇心和接納度是我們需要必備的心態，歷史上，汽車取代馬車的轉變瞬息之間便已成定局，亦如衕銘文和過去的NFT一樣，持有太多偏見隻會和機遇失之交臂。

聲明：

本文轉載自[深潮]，著作權歸屬原作者[YBB Capital Zeke]，如對轉載有異議，請聯繫Gate Learn團隊，團隊會根據相關流程盡速處理。
免責聲明：本文所錶達的觀點和意見僅代錶作者個人觀點，不構成任何投資建議。
文章其他語言版本由Gate Learn團隊翻譯，在未提及Gate.io的情況下不得覆製、傳播或抄襲經翻譯文章。