ИИ революционизирует Ethereum

СреднийMar 18, 2024
С постепенным увеличением вычислительной мощности цепочки мы можем предвидеть разработку более сложных моделей для управления сетью, мониторинга транзакций, аудита безопасности и многого другого. Эти достижения направлены на повышение эффективности и безопасности сети Ethereum, предлагая уникальные перспективы, которые вдохновляют на множество инновационных комбинаций "AI+Blockchain" в экосистеме разработчиков.
ИИ революционизирует Ethereum

Переслать оригинальное название:另一个角度看「AI+Blockchain」:AI 如何革新以太坊?

За последний год, когда генеративный ИИ неоднократно разрушал ожидания общественности, волна революции в области производительности ИИ захлестнула криптовалютное сообщество. Мы видели, как многие проекты на тему ИИ на вторичном рынке создавали легенды о богатстве, и все чаще разработчики начинают создавать свои собственные проекты "ИИ+Крипто". Однако при ближайшем рассмотрении становится очевидно, что эти проекты очень однородны, и большинство из них направлены только на улучшение "производственных отношений", например, на организацию вычислительных мощностей через децентрализованные сети или создание "децентрализованных обнимающихся лиц". Лишь немногие проекты пытаются по-настоящему интегрировать и внедрить инновации в техническую основу. Мы считаем, что это связано с "доменным перекосом" между областями ИИ и блокчейна. Несмотря на их широкое пересечение, мало кто глубоко разбирается в обеих областях. Например, разработчикам ИИ может быть сложно разобраться в технических реализациях и исторической инфраструктуре Ethereum, что затруднит предложение глубоких решений по оптимизации.

Если взять в качестве примера машинное обучение (ML), самую базовую ветвь ИИ, то это технология, которая позволяет машинам принимать решения на основе данных без явных инструкций по программированию. Машинное обучение продемонстрировало огромный потенциал в анализе данных и распознавании образов и стало обычным явлением в web2. Однако из-за ограничений эпохи, существовавших в самом начале ее развития, даже в таких передовых инновационных технологиях блокчейна, как Ethereum, их архитектура, сеть и механизмы управления пока не позволяют использовать машинное обучение в качестве эффективного инструмента для решения сложных проблем.

"Великие инновации часто возникают на пересечении областей". Наша главная цель при написании этой статьи - помочь разработчикам ИИ лучше понять мир блокчейна, а также предложить новые идеи разработчикам сообщества Ethereum. В этой статье мы сначала представим техническую реализацию Ethereum, а затем предложим применить машинное обучение, основополагающий алгоритм искусственного интеллекта, к сети Ethereum для повышения ее безопасности, эффективности и масштабируемости. Мы надеемся, что этот пример послужит отправной точкой для того, чтобы предложить уникальные перспективы и стимулировать больше инновационных комбинаций "AI+Blockchain" в экосистеме разработчиков.

Техническая реализация Ethereum

  • Базовые структуры данныхБазовые структуры данных

По своей сути, блокчейн - это цепочка, связывающая блоки между собой, причем различие между цепочками заключается, прежде всего, в конфигурации цепочки. Эта конфигурация является важной частью генезиса блокчейна, начальной фазы любого блокчейна. В случае с Ethereum конфигурация цепочки позволяет различать различные цепочки Ethereum и идентифицировать важные протоколы обновления и знаковые события. Например, блок DAOForkBlock обозначает высоту жесткой развилки после атаки DAO, а блок ConstantinopleBlock - высоту блока, на которой произошло обновление Constantinople. Для более крупных модернизаций, включающих в себя множество предложений по улучшению, устанавливаются специальные поля для обозначения соответствующих высот блоков. Более того, Ethereum включает в себя множество тестовых сетей и основную сеть, каждая из которых уникально идентифицируется по ChainID, разграничивающему ее сетевую экосистему.

Блок генезиса, будучи самым первым блоком всего блокчейна, прямо или косвенно ссылается на другие блоки. Таким образом, очень важно, чтобы узлы при запуске загружали правильную информацию о блоках генезиса без каких-либо изменений. Конфигурация этого генезис-блока включает в себя конфигурацию цепочки, о которой говорилось ранее, а также дополнительную информацию, такую как вознаграждение за добычу, временные метки, сложность и лимиты газа. Примечательно, что Ethereum перешел от механизма консенсуса майнинга proof-of-work к механизму proof-of-stake.

Счета Ethereum делятся на внешние счета и контрактные счета. Внешние аккаунты управляются уникальным закрытым ключом, в то время как контрактные аккаунты, не имеющие закрытых ключей, могут управляться только посредством выполнения кода контракта внешними аккаунтами. Оба типа счетов имеют уникальный адрес. Мировое состояние" Ethereum представляет собой дерево счетов, где каждому счету соответствует листовой узел, хранящий состояние счета, включая различную информацию о счете и коде.

  • Transactions

Ethereum, будучи децентрализованной платформой, в основном способствует проведению транзакций и заключению контрактов. Ethereum блокирует пакетные транзакции вместе с некоторой дополнительной информацией. В частности, блок делится на заголовок блока и тело блока. Заголовок блока содержит данные, связывающие все блоки в цепочку, под которыми понимается хэш предыдущего блока, а также корень состояния, корень транзакции, корень квитанции и другие данные, такие как сложность и nonce, которые означают состояние всего мира Ethereum. В теле блока содержится список транзакций и список заголовков "дядиных" блоков (хотя с переходом Ethereum на proof-of-stake ссылки на "дядины" блоки прекратились).

Квитанции об оплате транзакций предоставляют результаты и дополнительную информацию, полученную после выполнения транзакций, предлагая сведения, которые нельзя получить непосредственно из самих транзакций. Эти детали включают в себя содержание консенсуса, информацию о транзакции и информацию о блоке, указывающую на то, была ли транзакция успешной, а также журналы транзакций и расход газа. Анализ информации в квитанциях помогает отладить код смарт-контракта и оптимизировать использование газа, служит подтверждением того, что транзакция была обработана сетью, и позволяет изучить результаты и влияние транзакции.

В Ethereum плата за газ может быть упрощена как плата за транзакции, необходимые для таких операций, как отправка токенов, выполнение контрактов, перевод эфира или другие действия на блоке. Эти операции требуют платы за газ, поскольку виртуальная машина Ethereum должна вычислять и использовать сетевые ресурсы для обработки транзакции, что требует оплаты за эти вычислительные услуги. В конечном счете, стоимость топлива, или плата за транзакцию, выплачивается майнерам и рассчитывается по формуле Fee = Использованный газ * Цена газа, где цена газа устанавливается инициатором транзакции. Сумма в значительной степени влияет на скорость обработки транзакций в цепочке. Слишком низкое значение может привести к невыполненным транзакциям. Кроме того, очень важно установить лимит газа, чтобы предотвратить непредвиденный расход газа из-за ошибок в контрактах.

  • Пул транзакций

В Ethereum существует огромное количество транзакций. По сравнению с централизованными системами, скорость обработки транзакций в секунду в децентрализованных системах значительно ниже. Из-за притока транзакций на узлы, узлам необходимо поддерживать пул транзакций, чтобы правильно управлять этими транзакциями. Трансляция транзакций осуществляется через одноранговую (P2P) сеть, где один узел передает исполняемые транзакции соседним узлам, которые, в свою очередь, передают транзакции своим соседям. Благодаря этому процессу транзакция может распространиться по всей сети Ethereum в течение 6 секунд.

Транзакции в пуле транзакций делятся на исполняемые и неисполняемые. Исполняемые транзакции имеют более высокий приоритет, выполняются и включаются в блоки, в то время как все вновь поступившие в пул транзакции являются неисполняемыми и только позже могут стать исполняемыми. Исполняемые и неисполняемые транзакции соответственно записываются в контейнеры "pending" и "queue".

Более того, в пуле транзакций хранится список локальных транзакций, которые имеют несколько преимуществ: у них более высокий приоритет, на них не влияют ограничения по объему транзакций, и их можно немедленно перезагрузить в пул транзакций при перезагрузке узла. Для хранения локальных транзакций используется журнал (для перезагрузки при перезагрузке узла), цель которого - не потерять незавершенные локальные транзакции, и который периодически обновляется.

Перед постановкой в очередь транзакции проходят проверку на законность, включая различные виды проверок, такие как предотвращение DOS-атак, отрицательных транзакций и транзакций, превышающих лимит газа. Основной состав пула транзакций можно разделить на: очередь + отложенные (формирующие все транзакции). После прохождения проверки на законность выполняются дальнейшие проверки, в том числе проверка того, не достигла ли очередь транзакций своего предела, затем определение того, являются ли удаленные транзакции (т.е. нелокальные транзакции) самыми низкими в пуле транзакций, чтобы заменить транзакцию с самой низкой ценой. Для замены исполняемых транзакций, по умолчанию, только транзакции с комиссией, увеличенной на 10%, могут быть заменены транзакциями, ожидающими исполнения, и хранятся как неисполняемые транзакции. Кроме того, во время обслуживания пула транзакций недействительные и сверхлимитные транзакции удаляются, а подходящие транзакции заменяются.

  • Механизм консенсуса

Ранняя теория консенсуса в Ethereum была основана на вычислении хэш-значения сложности, что означало, что хэш-значение блока должно было соответствовать целевому значению сложности, чтобы блок считался действительным. Поскольку алгоритм консенсуса в Ethereum теперь перешел от Proof of Work (POW) к Proof of Stake (POS), обсуждение теорий, связанных с майнингом, здесь опускается. Краткий обзор алгоритма POS приведен ниже: В сентябре 2022 года Ethereum завершил слияние с Beacon Chain, реализовав алгоритм POS. В частности, в Ethereum на базе POS время блока стабилизировано на уровне 12 секунд. Пользователи ставят на кон свои Эфиры, чтобы получить право стать валидаторами. Группа валидаторов выбирается случайным образом из тех, кто участвует в ставках. В каждом цикле, состоящем из 32 слотов, в каждом слоте выбирается валидатор, который предлагает создать блоки, а остальные валидаторы этого слота действуют как комиссия, которая проверяет законность блока валидатора и выносит суждения о законности блоков из предыдущего цикла. Алгоритм POS значительно стабилизирует и увеличивает скорость производства блоков, при этом значительно снижая потери вычислительных ресурсов.

  • Алгоритм подписи

Ethereum унаследовал стандарт алгоритма подписи от Bitcoin, также приняв кривую secp256k1. Специальный алгоритм подписи, который он использует, - ECDSA, что означает, что вычисление подписи основано на хэше исходного сообщения. Композиция всей подписи может быть представлена просто как R+S+V. Каждое вычисление, соответственно, вводит случайное число, где R+S - исходные результаты ECDSA. Последнее поле, V, известное как поле восстановления, указывает количество поисков, необходимых для успешного восстановления открытого ключа из содержимого и подписи, поскольку на эллиптической кривой может быть несколько точек координат, которые удовлетворяют требованиям, основанным на значении R.

Весь процесс может быть организован следующим образом: Данные транзакции и информация о подписанте хэшируются после кодирования RLP, а окончательная подпись может быть получена с помощью ECDSA-подписи с закрытым ключом, где кривая, используемая в ECDSA, - это эллиптическая кривая secp256k1. Наконец, объединив данные подписи с данными транзакции, можно получить подписанные данные транзакции и передать их в эфир.

Структура данных Ethereum опирается не только на традиционную технологию блокчейн, но и представляет собой дерево Меркла Патриция, также известное как трие Меркла, для эффективного хранения и проверки больших объемов данных. MPT сочетает в себе криптографическую хэш-функцию дерева Меркла и функцию сжатия ключевого пути дерева Патриция, обеспечивая решение, которое одновременно гарантирует целостность данных и поддерживает быстрый поиск.

  • Merkle Patricia Tree

В Ethereum MPT используется для хранения всех данных о состоянии и транзакциях, гарантируя, что любое изменение в данных будет отражено в корневом хэше дерева. Это означает, что, проверив корневой хэш, можно убедиться в целостности и точности данных, не проверяя всю базу данных. MPT состоит из четырех типов узлов: листовых узлов, узлов расширения, узлов ветвления и нулевых узлов, которые вместе образуют дерево, способное приспосабливаться к динамическим изменениям данных. При каждом обновлении данных MPT отражает эти изменения, добавляя, удаляя или изменяя узлы и обновляя корневой хэш дерева. Поскольку каждый узел зашифрован с помощью хэш-функции, любые незначительные изменения в данных приведут к значительному изменению корневого хэша, что обеспечивает безопасность и согласованность данных. Более того, дизайн MPT поддерживает проверку "легкого клиента", позволяя узлам проверять существование или состояние определенной информации, сохраняя только хэш корня дерева и необходимые узлы пути, что значительно снижает требования к хранению и обработке данных.

Благодаря MPT, Ethereum не только добивается эффективного управления и быстрого доступа к данным, но и обеспечивает безопасность и децентрализацию сети, поддерживая работу и развитие всей сети Ethereum.

  • Машина состояний

Основная архитектура Ethereum включает в себя концепцию машины состояний, в которой виртуальная машина Ethereum (EVM) служит средой исполнения для выполнения всего кода смарт-контрактов, а сам Ethereum можно рассматривать как глобально разделяемую систему с переходами состояний. Выполнение каждого блока можно рассматривать как процесс перехода из одного глобально разделяемого состояния в другое. Такая конструкция не только обеспечивает согласованность и децентрализацию сети Ethereum, но и делает результаты выполнения смарт-контрактов предсказуемыми и защищенными от взлома.

В Ethereum состояние означает текущую информацию обо всех счетах, включая баланс каждого счета, сохраненные данные и код смарт-контракта. Когда происходит транзакция, EVM вычисляет и переводит состояние, основываясь на содержании транзакции, и этот процесс эффективно и безопасно записывается с помощью дерева Меркла Патриция (MPT). Каждый переход состояния не только изменяет данные учетной записи, но и приводит к обновлению MPT, что отражается в изменении корневого хэш-значения дерева.

Взаимосвязь между EVM и MPT очень важна, поскольку MPT гарантирует целостность данных при переходах между состояниями Ethereum. Когда EVM выполняет транзакции и изменяет состояние счета, соответствующие узлы MPT обновляются, чтобы отразить эти изменения. Поскольку каждый узел в MPT связан хэшами, любая модификация состояния приводит к изменению корневого хэша, который затем включается в новый блок, обеспечивая согласованность и безопасность всего состояния Ethereum. Ниже мы представим виртуальную машину EVM.

  • EVM

Виртуальная машина EVM является основой конструкции Ethereum, обеспечивая выполнение смарт-контрактов и переходы между состояниями. Благодаря EVM, Ethereum можно по-настоящему представить как всемирный компьютер. EVM является Тьюринг-полным, что означает, что смарт-контракты на Ethereum могут выполнять произвольно сложные логические вычисления, а внедрение механизма газа успешно предотвращает бесконечные циклы внутри контрактов, обеспечивая стабильность и безопасность сети. С более глубокой технической точки зрения EVM - это виртуальная машина на основе стека, которая выполняет смарт-контракты с помощью байткода, специфичного для Ethereum. Разработчики обычно используют языки высокого уровня, такие как Solidity, для написания смарт-контрактов, которые затем компилируются в байт-код, понятный EVM для выполнения. EVM является ключевым элементом инновационного потенциала блокчейна Ethereum, не только поддерживая работу смарт-контрактов, но и обеспечивая прочную основу для разработки децентрализованных приложений. Благодаря EVM, Ethereum формирует децентрализованное, безопасное и открытое цифровое будущее.

Исторический обзор

Рисунок 1 Исторический обзор Ethereum

Вызовы

Безопасность

Смарт-контракты - это компьютерные программы, которые работают на блокчейне Ethereum. Они позволяют разработчикам создавать и развертывать различные приложения, включая, помимо прочего, приложения для кредитования, децентрализованные биржи, страхование, вторичное финансирование, социальные сети и NFT. Безопасность смарт-контрактов очень важна для этих приложений, поскольку они напрямую работают с криптовалютами и контролируют их. Любая уязвимость в смарт-контрактах или вредоносные атаки могут представлять прямую угрозу безопасности средств, потенциально приводя к значительным финансовым потерям. Например, 26 февраля 2024 года протокол кредитования DeFi Blueberry Protocol был атакован из-за изъяна в логике смарт-контракта, в результате чего было потеряно около $1 400 000.

Уязвимости в смарт-контрактах многогранны и включают в себя необоснованную бизнес-логику, неправильный контроль доступа, неадекватную проверку данных, атаки на ретрансляцию и DOS (отказ в обслуживании), а также другие. Эти уязвимости могут привести к проблемам при выполнении контрактов, что повлияет на эффективность работы смарт-контрактов. Например, DOS-атаки включают в себя отправку злоумышленниками большого количества транзакций, чтобы исчерпать ресурсы сети, не позволяя обычным пользовательским транзакциям обрабатываться своевременно. Такое ухудшение пользовательского опыта может также привести к увеличению платы за проведение транзакций, так как пользователям может потребоваться платить более высокую плату за приоритетность своих транзакций в перегруженной сети.

Кроме того, пользователи Ethereum также сталкиваются с инвестиционными рисками, поскольку безопасность фондов находится под угрозой. Например, "говнокоины" - это криптовалюты, которые, как считается, не имеют практически никакой ценности или долгосрочного потенциала роста. Шиткоины часто используются в качестве инструментов для мошенничества или для схем "накачивания и сброса". Инвестиционный риск, связанный с шиткоинами, высок, что потенциально может привести к значительным финансовым потерям. Из-за низкой цены и рыночной капитализации они очень подвержены манипуляциям и волатильности. Эти криптовалюты обычно используются в схемах "накачай и сбрось" и мошенничествах с медовыми горшками, когда инвесторов заманивают фальшивыми проектами, а затем лишают их средств. Еще один распространенный риск, связанный с шиткоинами, - это "вырывание ковра", когда создатели внезапно удаляют всю ликвидность из проекта, в результате чего стоимость токена резко падает. Такие аферы часто рекламируются с помощью ложных партнерств и рекомендаций, и как только цена токена возрастает, мошенники продают свои токены, получают прибыль и исчезают, оставляя инвесторов с ничего не стоящими токенами. Более того, инвестирование в "шиткоины" может отвлечь внимание и ресурсы от законных криптовалют, имеющих реальное применение и потенциал роста.

Помимо shitcoins, "воздушные монеты" и "монеты финансовой пирамиды" также являются способами получения быстрой прибыли. Для пользователей, не обладающих профессиональными знаниями и опытом, отличить их от легальных криптовалют особенно сложно.

Эффективность

Два очень прямых показателя для оценки эффективности Ethereum - это скорость транзакций и газовые сборы. Скорость транзакций относится к количеству транзакций, которые сеть Ethereum может обработать за единицу времени. Эта метрика напрямую отражает вычислительные возможности сети Ethereum, где более высокая скорость указывает на более высокую эффективность. Каждая транзакция в Ethereum требует определенного количества газовых сборов, которые компенсируют майнерам верификацию транзакций. Более низкая плата за газ указывает на более высокую эффективность Ethereum.

Снижение скорости транзакций приводит к увеличению платы за газ. Как правило, когда скорость обработки транзакций снижается из-за ограниченного пространства блока, конкуренция между транзакциями за попадание в следующий блок может возрасти. Чтобы выделиться в этой конкурентной борьбе, трейдеры часто увеличивают плату за газ, поскольку майнеры склонны отдавать предпочтение транзакциям с более высокой платой за газ при проверке. Поэтому более высокая плата за газ может ухудшить впечатления пользователя.

Транзакции - это лишь основные действия в Ethereum. В рамках этой экосистемы пользователи также могут заниматься различными видами деятельности, такими как кредитование, ставки, инвестирование, страхование и т.д., и все это можно делать через специальные приложения DApps. Однако, учитывая широкое разнообразие DApps и отсутствие персонализированных рекомендательных сервисов, подобных тем, что существуют в традиционных отраслях, пользователи могут запутаться в выборе подходящих приложений и продуктов для себя. Такая ситуация может привести к снижению удовлетворенности пользователей, что скажется на общей эффективности экосистемы Ethereum.

Возьмем, к примеру, кредитование. Некоторые платформы кредитования DeFi используют механизм избыточного залога для поддержания безопасности и стабильности своей платформы. Это означает, что заемщикам необходимо предоставить в качестве залога больше активов, которые нельзя использовать для других видов деятельности в течение срока кредитования. Это приводит к снижению коэффициента использования капитала заемщиками, тем самым уменьшая ликвидность рынка.

Применение машинного обучения в Ethereum

Модели машинного обучения, такие как модель RFM, генеративные адверсарные сети (GAN), модели дерева решений, алгоритм K-Nearest Neighbors (KNN) и алгоритм кластеризации DBSCAN, играют важную роль в Ethereum. Применение этих моделей машинного обучения в Ethereum может помочь оптимизировать эффективность обработки транзакций, повысить безопасность смарт-контрактов, реализовать сегментацию пользователей для предоставления более персонализированных услуг, а также способствовать стабильной работе сети.

Введение в алгоритмы

Алгоритмы машинного обучения - это набор инструкций или правил, используемых для анализа данных, изучения закономерностей в данных и принятия прогнозов или решений на основе этих знаний. Они автоматически совершенствуются благодаря обучению на основе предоставленных данных, без необходимости явного программирования со стороны человека. Модели машинного обучения, такие как модель RFM, генеративные адверсарные сети (GAN), модели дерева решений, алгоритм K-Nearest Neighbors (KNN) и алгоритм кластеризации DBSCAN, играют важную роль в Ethereum. Применение этих моделей машинного обучения в Ethereum может помочь оптимизировать эффективность обработки транзакций, повысить безопасность смарт-контрактов, реализовать сегментацию пользователей для предоставления более персонализированных услуг, а также способствовать стабильной работе сети.

Байесовские классификаторы

Байесовские классификаторы относятся к числу различных статистических методов классификации, направленных на минимизацию вероятности ошибок классификации или минимизацию среднего риска при определенной системе затрат. Их философия дизайна глубоко укоренилась в теореме Байеса, которая позволяет рассчитать вероятность того, что объект принадлежит к определенному классу, учитывая некоторые известные характеристики. Вычисляя апостериорную вероятность объекта, принимаются решения. В частности, байесовские классификаторы сначала рассматривают предварительную вероятность объекта, а затем применяют формулу Байеса, чтобы учесть наблюдаемые данные, тем самым обновляя убеждение о классификации объекта. Среди всех возможных классификаций байесовские классификаторы выбирают категорию с наибольшей апостериорной вероятностью для данного объекта. Основное преимущество этого метода заключается в его естественной способности работать с неопределенностью и неполной информацией, что делает его мощным и гибким инструментом, подходящим для широкого спектра приложений.

Как показано на Рисунке 2, в машинном обучении с контролем классификационные решения принимаются с использованием данных и вероятностных моделей, основанных на теореме Байеса. Используя вероятность, предшествующие вероятности категорий и признаков, байесовские классификаторы вычисляют апостериорные вероятности каждой категории для точек данных и относят точки данных к категории с наибольшей апостериорной вероятностью. На диаграмме рассеивания справа классификатор пытается найти кривую, которая наилучшим образом разделяет точки разных цветов, тем самым минимизируя ошибки классификации.

Рисунок 2 Байесовский классификатор

  • Деревья решений

Алгоритмы дерева решений обычно используются для задач классификации и регрессии, применяя иерархический подход к принятию решений. Они генерируют деревья, разделяя признаки с высокой информативностью на основе известных данных, и таким образом обучают дерево решений. По сути, алгоритм может самостоятельно выучить правило принятия решений на основе данных для определения значений переменных. В частности, он упрощает сложные процессы принятия решений до нескольких более простых подрешений. Каждое более простое решение выводится из родительского критерия принятия решения, образуя древовидную структуру.

Как показано на Рис. 3, каждый узел представляет собой решение, определяющее критерий для оценки определенного атрибута, а ветви представляют собой результаты решения. Каждый листовой узел представляет окончательный предсказанный результат и категорию. С точки зрения структуры, модель дерева решений интуитивна, проста для понимания и обладает большой объяснительной силой.

Изображение 3 Модель дерева решений

  • Алгоритм DBSCAN

DBSCAN (Density-Based Spatial Clustering of Applications with Noise) - это алгоритм пространственной кластеризации на основе плотности, который особенно эффективен для наборов данных с шумом и для выявления кластеров любой формы без необходимости заранее задавать количество кластеров. Он устойчив к выбросам в наборе данных. Алгоритм может эффективно выявлять провалы, определяемые как точки в областях с низкой плотностью, как показано на рисунке 4.

Рисунок 4 Идентификация шума с помощью алгоритма DBSCAN

  • Алгоритм KNN

Алгоритм K-Nearest Neighbors (KNN) можно использовать как для классификации, так и для регрессии. В классификации категория классифицируемого предмета определяется с помощью механизма голосования; в регрессии - путем вычисления среднего или взвешенного среднего значения k ближайших образцов.

Как показано на Рисунке 5, принцип работы алгоритма KNN в классификации заключается в поиске ближайших k соседей новой точки данных и предсказании категории новой точки данных на основе категорий этих соседей. Если K=1, новая точка данных просто присваивается категории ближайшего соседа. Если K>1, категория обычно определяется большинством голосов, то есть новая точка данных относится к той категории, которая наиболее распространена среди ее соседей. При использовании в регрессии принцип остается тем же, но результатом является среднее значение выходов ближайших k выборок.

Рисунок 5 Алгоритм KNN, используемый для классификации

  • Генеративный искусственный интеллектГенеративный искусственный интеллект

Генеративный искусственный интеллект (ИИ) - это разновидность технологии ИИ, которая может генерировать новый контент (например, текст, изображения, музыку и т.д.) на основе входных требований. В его основе лежат достижения в области машинного обучения и глубокого обучения, особенно в приложениях для обработки естественного языка и распознавания изображений. Генеративный ИИ изучает закономерности и ассоциации на основе огромного количества данных, а затем генерирует совершенно новые результаты на основе этой изученной информации. Ключ к генеративному искусственному интеллекту лежит в обучении модели, что требует высококачественных данных для обучения и тренировки. В ходе этого процесса модель постепенно улучшает свою способность генерировать новый контент, анализируя и понимая структуру, закономерности и взаимосвязи в наборе данных.

  • Трансформатор

Трансформер, как краеугольный камень генеративного искусственного интеллекта, представил механизм внимания революционным образом. Это позволяет при обработке информации фокусироваться на ключевых моментах и одновременно использовать глобальный взгляд - уникальная возможность, благодаря которой Transformer стал лучшим в области создания текстов. Использование новейших моделей естественного языка, таких как GPT (Generative Pre-trained Transformer), для понимания требований пользователя, выраженных на естественном языке, и автоматического преобразования их в исполняемый код может снизить сложность разработки и значительно повысить эффективность.

Как показано на Рисунке 6, внедрение механизма многоголового внимания и механизма самовнимания, в сочетании с остаточными связями и полностью подключенными нейронными сетями, а также использование технологий встраивания слов, применявшихся ранее, значительно повысило производительность генеративных моделей, связанных с обработкой естественного языка.

Рисунок 6 Модель трансформатора

  • Модель RFM

Модель RFM - это аналитическая модель, основанная на покупательском поведении клиентов, которая позволяет выявить различные группы покупателей, анализируя их поведение при совершении сделок. Эта модель оценивает и классифицирует покупателей на основе времени их последней покупки (Recency, R), частоты покупок (Frequency, F) и потраченной суммы (Monetary value, M).

Как показано на Рисунке 7, эти три показателя составляют основу модели RFM. Модель оценивает клиентов по этим трем параметрам и сортирует их на основе полученных оценок, чтобы определить наиболее ценные группы клиентов. Более того, эта модель эффективно разделяет покупателей на различные группы, облегчая функциональность стратификации покупателей.

Рисунок 7 Модель наслоения RFM

Потенциальные применения

Применяя технологию машинного обучения для решения проблем безопасности Ethereum, мы проводили исследование в четырех основных аспектах:

Потенциальные применения

Решая проблемы безопасности Ethereum с помощью методов машинного обучения, мы проводили исследования в четырех основных аспектах:

  • Идентификация и фильтрация вредоносных транзакций на основе байесовского классификатора**.

    Построив байесовский классификатор, можно выявить и отфильтровать потенциальные спам-транзакции, включая, но не ограничиваясь теми, которые вызывают DOS-атаки за счет большого количества частых и мелких транзакций. Этот метод эффективно поддерживает работоспособность сети, анализируя характеристики транзакций, такие как цены на газ и частота транзакций, обеспечивая стабильную работу сети Ethereum.

  • Генерация безопасного и удовлетворяющего конкретным требованиям кода смарт-контракта**.

    Генеративные адверсарные сети (GAN) и генеративные сети на основе трансформаторов могут использоваться для генерации кода смарт-контракта, который отвечает определенным требованиям, при этом максимально обеспечивая безопасность кода. Однако эти два подхода различаются по типам данных, на которые они опираются при обучении моделей: первый в основном зависит от образцов небезопасного кода, а второй - наоборот.

    Обучив GAN изучать существующие модели безопасных контрактов и создав самоаверсальные модели для генерации потенциально небезопасного кода, а затем научившись определять эти небезопасности, можно автоматически генерировать высококачественный, более безопасный код смарт-контрактов. Используя генеративные сетевые модели на основе трансформаторов, обучаясь на огромном количестве примеров безопасных контрактов, можно генерировать коды контрактов, которые отвечают конкретным потребностям и оптимизируют расход газа, что, несомненно, повышает эффективность и безопасность разработки умных контрактов.

  • Анализ рисков смарт-контрактов на основе деревьев принятия решений**.

    Использование деревьев решений для анализа характеристик смарт-контрактов, таких как частота вызова функций, стоимость транзакций и сложность исходного кода, может эффективно определить потенциальный уровень риска контрактов. Анализ моделей работы и структуры кода контрактов может предсказать возможные уязвимости и точки риска, обеспечивая разработчикам и пользователям оценку безопасности. Ожидается, что этот метод значительно повысит безопасность смарт-контрактов в экосистеме Ethereum, тем самым снизив потери, вызванные уязвимостями или вредоносным кодом.

  • Построение модели оценки криптовалют для снижения инвестиционных рисков**.

    Анализируя торговые данные, активность в социальных сетях и рыночные показатели криптовалют с помощью алгоритмов машинного обучения, можно построить модель оценки, которая может предсказать вероятность того, что криптовалюта окажется "нежелательной монетой". Эта модель может предложить инвесторам ценную информацию, помогая им избежать инвестиционных рисков и тем самым способствуя здоровому развитию криптовалютного рынка.

Более того, применение машинного обучения также способно еще больше повысить эффективность Ethereum. Мы можем изучить это с помощью следующих трех ключевых аспектов:

  • Применение дерева решений для оптимизации модели очереди в пул транзакций

Применение деревьев решений для оптимизации модели очереди в пул транзакций

Использование деревьев решений позволяет эффективно оптимизировать механизм очередей в пуле транзакций Ethereum. Анализируя характеристики сделок, такие как цены на газ и размер сделки, деревья решений могут оптимизировать выбор и упорядочивание сделок. Этот метод может значительно повысить эффективность обработки транзакций, эффективно снизить перегрузку сети и сократить время ожидания пользователями транзакций.

  • Сегментирование пользователей и предоставление персонализированных услуг

Модель RFM (Recency, Frequency, Monetary value), широко используемая в управлении взаимоотношениями с клиентами, позволяет эффективно сегментировать пользователей, оценивая время их последних транзакций (Recency), частоту транзакций (Frequency) и сумму транзакций (Monetary value). Применение модели RFM на платформе Ethereum поможет выявить группы пользователей с высокой ценностью, оптимизировать распределение ресурсов и предоставлять более персонализированные услуги, тем самым повышая удовлетворенность пользователей и общую эффективность платформы. Модель RFM (Recency, Frequency, Monetary value), широко используемая в управлении взаимоотношениями с клиентами, позволяет эффективно сегментировать пользователей, оценивая время их последних транзакций (Recency), частоту транзакций (Frequency) и сумму транзакций (Monetary value). Применение модели RFM на платформе Ethereum поможет выявить высокоценные группы пользователей, оптимизировать распределение ресурсов и предоставлять более персонализированные услуги, тем самым повышая удовлетворенность пользователей и общую эффективность платформы.

Алгоритм DBSCAN также может анализировать транзакционное поведение пользователей, помогая выявить различные группы пользователей Ethereum и в дальнейшем предоставлять более адаптированные финансовые услуги различным пользователям. Эта стратегия сегментации пользователей может оптимизировать маркетинговые стратегии, повысить удовлетворенность клиентов и эффективность обслуживания.

  • Кредитный скоринг на основе KNN

Алгоритм K-Nearest Neighbors (KNN) может оценивать кредитоспособность пользователей, анализируя историю их транзакций и модели поведения в Ethereum, что играет чрезвычайно важную роль в финансовой деятельности, такой как кредитование. Кредитный скоринг помогает финансовым учреждениям и кредитным платформам оценивать возможности заемщиков по погашению кредитов и кредитный риск, принимая более точные решения о кредитовании. Это может предотвратить чрезмерное заимствование и повысить ликвидность рынка.

Будущие направления

С точки зрения распределения макрокапитала, Ethereum, как крупнейший в мире распределенный компьютер, никогда не может быть переинвестирован в инфра-слой, нуждаясь в привлечении большего количества разработчиков из разных слоев общества для участия в совместном строительстве. В этой статье, проанализировав техническую реализацию Ethereum и проблемы, с которыми она сталкивается, мы представляем ряд интуитивных применений машинного обучения и с нетерпением ждем, когда разработчики ИИ в сообществе воплотят эти видения в реальную ценность.

По мере постепенного увеличения вычислительной мощности цепочки мы можем предвидеть появление более сложных моделей для управления сетью, мониторинга транзакций, аудита безопасности и т.д., что повысит эффективность и безопасность сети Ethereum.

Кроме того, механизмы управления, управляемые ИИ/агентами, также могут стать значительной инновацией в экосистеме Ethereum. Этот механизм, обеспечивающий более эффективные, прозрачные и автоматизированные процессы принятия решений, может предоставить Ethereum более гибкую и надежную структуру управления. Эти будущие разработки не только будут способствовать инновациям в технологии Ethereum, но и предоставят пользователям более качественный опыт работы с цепочкой.

Отказ от ответственности:

  1. Эта статья перепечатана из [TechFlow]. *Переслать оригинальное название'另一个角度看「AI+Blockchain」:AI 如何革新以太坊?'.Все авторские права принадлежат оригинальному автору[Salus]. Если у Вас есть возражения против этой перепечатки, пожалуйста, свяжитесь с командой Gate Learn, и они незамедлительно рассмотрят их.
  2. Предупреждение об ответственности: Мнения и взгляды, выраженные в этой статье, принадлежат исключительно автору и не являются инвестиционным советом.
  3. Перевод статьи на другие языки осуществляется командой Gate Learn. Если не указано, копирование, распространение или плагиат переведенных статей запрещены.

ИИ революционизирует Ethereum

СреднийMar 18, 2024
С постепенным увеличением вычислительной мощности цепочки мы можем предвидеть разработку более сложных моделей для управления сетью, мониторинга транзакций, аудита безопасности и многого другого. Эти достижения направлены на повышение эффективности и безопасности сети Ethereum, предлагая уникальные перспективы, которые вдохновляют на множество инновационных комбинаций "AI+Blockchain" в экосистеме разработчиков.
ИИ революционизирует Ethereum

Переслать оригинальное название:另一个角度看「AI+Blockchain」:AI 如何革新以太坊?

За последний год, когда генеративный ИИ неоднократно разрушал ожидания общественности, волна революции в области производительности ИИ захлестнула криптовалютное сообщество. Мы видели, как многие проекты на тему ИИ на вторичном рынке создавали легенды о богатстве, и все чаще разработчики начинают создавать свои собственные проекты "ИИ+Крипто". Однако при ближайшем рассмотрении становится очевидно, что эти проекты очень однородны, и большинство из них направлены только на улучшение "производственных отношений", например, на организацию вычислительных мощностей через децентрализованные сети или создание "децентрализованных обнимающихся лиц". Лишь немногие проекты пытаются по-настоящему интегрировать и внедрить инновации в техническую основу. Мы считаем, что это связано с "доменным перекосом" между областями ИИ и блокчейна. Несмотря на их широкое пересечение, мало кто глубоко разбирается в обеих областях. Например, разработчикам ИИ может быть сложно разобраться в технических реализациях и исторической инфраструктуре Ethereum, что затруднит предложение глубоких решений по оптимизации.

Если взять в качестве примера машинное обучение (ML), самую базовую ветвь ИИ, то это технология, которая позволяет машинам принимать решения на основе данных без явных инструкций по программированию. Машинное обучение продемонстрировало огромный потенциал в анализе данных и распознавании образов и стало обычным явлением в web2. Однако из-за ограничений эпохи, существовавших в самом начале ее развития, даже в таких передовых инновационных технологиях блокчейна, как Ethereum, их архитектура, сеть и механизмы управления пока не позволяют использовать машинное обучение в качестве эффективного инструмента для решения сложных проблем.

"Великие инновации часто возникают на пересечении областей". Наша главная цель при написании этой статьи - помочь разработчикам ИИ лучше понять мир блокчейна, а также предложить новые идеи разработчикам сообщества Ethereum. В этой статье мы сначала представим техническую реализацию Ethereum, а затем предложим применить машинное обучение, основополагающий алгоритм искусственного интеллекта, к сети Ethereum для повышения ее безопасности, эффективности и масштабируемости. Мы надеемся, что этот пример послужит отправной точкой для того, чтобы предложить уникальные перспективы и стимулировать больше инновационных комбинаций "AI+Blockchain" в экосистеме разработчиков.

Техническая реализация Ethereum

  • Базовые структуры данныхБазовые структуры данных

По своей сути, блокчейн - это цепочка, связывающая блоки между собой, причем различие между цепочками заключается, прежде всего, в конфигурации цепочки. Эта конфигурация является важной частью генезиса блокчейна, начальной фазы любого блокчейна. В случае с Ethereum конфигурация цепочки позволяет различать различные цепочки Ethereum и идентифицировать важные протоколы обновления и знаковые события. Например, блок DAOForkBlock обозначает высоту жесткой развилки после атаки DAO, а блок ConstantinopleBlock - высоту блока, на которой произошло обновление Constantinople. Для более крупных модернизаций, включающих в себя множество предложений по улучшению, устанавливаются специальные поля для обозначения соответствующих высот блоков. Более того, Ethereum включает в себя множество тестовых сетей и основную сеть, каждая из которых уникально идентифицируется по ChainID, разграничивающему ее сетевую экосистему.

Блок генезиса, будучи самым первым блоком всего блокчейна, прямо или косвенно ссылается на другие блоки. Таким образом, очень важно, чтобы узлы при запуске загружали правильную информацию о блоках генезиса без каких-либо изменений. Конфигурация этого генезис-блока включает в себя конфигурацию цепочки, о которой говорилось ранее, а также дополнительную информацию, такую как вознаграждение за добычу, временные метки, сложность и лимиты газа. Примечательно, что Ethereum перешел от механизма консенсуса майнинга proof-of-work к механизму proof-of-stake.

Счета Ethereum делятся на внешние счета и контрактные счета. Внешние аккаунты управляются уникальным закрытым ключом, в то время как контрактные аккаунты, не имеющие закрытых ключей, могут управляться только посредством выполнения кода контракта внешними аккаунтами. Оба типа счетов имеют уникальный адрес. Мировое состояние" Ethereum представляет собой дерево счетов, где каждому счету соответствует листовой узел, хранящий состояние счета, включая различную информацию о счете и коде.

  • Transactions

Ethereum, будучи децентрализованной платформой, в основном способствует проведению транзакций и заключению контрактов. Ethereum блокирует пакетные транзакции вместе с некоторой дополнительной информацией. В частности, блок делится на заголовок блока и тело блока. Заголовок блока содержит данные, связывающие все блоки в цепочку, под которыми понимается хэш предыдущего блока, а также корень состояния, корень транзакции, корень квитанции и другие данные, такие как сложность и nonce, которые означают состояние всего мира Ethereum. В теле блока содержится список транзакций и список заголовков "дядиных" блоков (хотя с переходом Ethereum на proof-of-stake ссылки на "дядины" блоки прекратились).

Квитанции об оплате транзакций предоставляют результаты и дополнительную информацию, полученную после выполнения транзакций, предлагая сведения, которые нельзя получить непосредственно из самих транзакций. Эти детали включают в себя содержание консенсуса, информацию о транзакции и информацию о блоке, указывающую на то, была ли транзакция успешной, а также журналы транзакций и расход газа. Анализ информации в квитанциях помогает отладить код смарт-контракта и оптимизировать использование газа, служит подтверждением того, что транзакция была обработана сетью, и позволяет изучить результаты и влияние транзакции.

В Ethereum плата за газ может быть упрощена как плата за транзакции, необходимые для таких операций, как отправка токенов, выполнение контрактов, перевод эфира или другие действия на блоке. Эти операции требуют платы за газ, поскольку виртуальная машина Ethereum должна вычислять и использовать сетевые ресурсы для обработки транзакции, что требует оплаты за эти вычислительные услуги. В конечном счете, стоимость топлива, или плата за транзакцию, выплачивается майнерам и рассчитывается по формуле Fee = Использованный газ * Цена газа, где цена газа устанавливается инициатором транзакции. Сумма в значительной степени влияет на скорость обработки транзакций в цепочке. Слишком низкое значение может привести к невыполненным транзакциям. Кроме того, очень важно установить лимит газа, чтобы предотвратить непредвиденный расход газа из-за ошибок в контрактах.

  • Пул транзакций

В Ethereum существует огромное количество транзакций. По сравнению с централизованными системами, скорость обработки транзакций в секунду в децентрализованных системах значительно ниже. Из-за притока транзакций на узлы, узлам необходимо поддерживать пул транзакций, чтобы правильно управлять этими транзакциями. Трансляция транзакций осуществляется через одноранговую (P2P) сеть, где один узел передает исполняемые транзакции соседним узлам, которые, в свою очередь, передают транзакции своим соседям. Благодаря этому процессу транзакция может распространиться по всей сети Ethereum в течение 6 секунд.

Транзакции в пуле транзакций делятся на исполняемые и неисполняемые. Исполняемые транзакции имеют более высокий приоритет, выполняются и включаются в блоки, в то время как все вновь поступившие в пул транзакции являются неисполняемыми и только позже могут стать исполняемыми. Исполняемые и неисполняемые транзакции соответственно записываются в контейнеры "pending" и "queue".

Более того, в пуле транзакций хранится список локальных транзакций, которые имеют несколько преимуществ: у них более высокий приоритет, на них не влияют ограничения по объему транзакций, и их можно немедленно перезагрузить в пул транзакций при перезагрузке узла. Для хранения локальных транзакций используется журнал (для перезагрузки при перезагрузке узла), цель которого - не потерять незавершенные локальные транзакции, и который периодически обновляется.

Перед постановкой в очередь транзакции проходят проверку на законность, включая различные виды проверок, такие как предотвращение DOS-атак, отрицательных транзакций и транзакций, превышающих лимит газа. Основной состав пула транзакций можно разделить на: очередь + отложенные (формирующие все транзакции). После прохождения проверки на законность выполняются дальнейшие проверки, в том числе проверка того, не достигла ли очередь транзакций своего предела, затем определение того, являются ли удаленные транзакции (т.е. нелокальные транзакции) самыми низкими в пуле транзакций, чтобы заменить транзакцию с самой низкой ценой. Для замены исполняемых транзакций, по умолчанию, только транзакции с комиссией, увеличенной на 10%, могут быть заменены транзакциями, ожидающими исполнения, и хранятся как неисполняемые транзакции. Кроме того, во время обслуживания пула транзакций недействительные и сверхлимитные транзакции удаляются, а подходящие транзакции заменяются.

  • Механизм консенсуса

Ранняя теория консенсуса в Ethereum была основана на вычислении хэш-значения сложности, что означало, что хэш-значение блока должно было соответствовать целевому значению сложности, чтобы блок считался действительным. Поскольку алгоритм консенсуса в Ethereum теперь перешел от Proof of Work (POW) к Proof of Stake (POS), обсуждение теорий, связанных с майнингом, здесь опускается. Краткий обзор алгоритма POS приведен ниже: В сентябре 2022 года Ethereum завершил слияние с Beacon Chain, реализовав алгоритм POS. В частности, в Ethereum на базе POS время блока стабилизировано на уровне 12 секунд. Пользователи ставят на кон свои Эфиры, чтобы получить право стать валидаторами. Группа валидаторов выбирается случайным образом из тех, кто участвует в ставках. В каждом цикле, состоящем из 32 слотов, в каждом слоте выбирается валидатор, который предлагает создать блоки, а остальные валидаторы этого слота действуют как комиссия, которая проверяет законность блока валидатора и выносит суждения о законности блоков из предыдущего цикла. Алгоритм POS значительно стабилизирует и увеличивает скорость производства блоков, при этом значительно снижая потери вычислительных ресурсов.

  • Алгоритм подписи

Ethereum унаследовал стандарт алгоритма подписи от Bitcoin, также приняв кривую secp256k1. Специальный алгоритм подписи, который он использует, - ECDSA, что означает, что вычисление подписи основано на хэше исходного сообщения. Композиция всей подписи может быть представлена просто как R+S+V. Каждое вычисление, соответственно, вводит случайное число, где R+S - исходные результаты ECDSA. Последнее поле, V, известное как поле восстановления, указывает количество поисков, необходимых для успешного восстановления открытого ключа из содержимого и подписи, поскольку на эллиптической кривой может быть несколько точек координат, которые удовлетворяют требованиям, основанным на значении R.

Весь процесс может быть организован следующим образом: Данные транзакции и информация о подписанте хэшируются после кодирования RLP, а окончательная подпись может быть получена с помощью ECDSA-подписи с закрытым ключом, где кривая, используемая в ECDSA, - это эллиптическая кривая secp256k1. Наконец, объединив данные подписи с данными транзакции, можно получить подписанные данные транзакции и передать их в эфир.

Структура данных Ethereum опирается не только на традиционную технологию блокчейн, но и представляет собой дерево Меркла Патриция, также известное как трие Меркла, для эффективного хранения и проверки больших объемов данных. MPT сочетает в себе криптографическую хэш-функцию дерева Меркла и функцию сжатия ключевого пути дерева Патриция, обеспечивая решение, которое одновременно гарантирует целостность данных и поддерживает быстрый поиск.

  • Merkle Patricia Tree

В Ethereum MPT используется для хранения всех данных о состоянии и транзакциях, гарантируя, что любое изменение в данных будет отражено в корневом хэше дерева. Это означает, что, проверив корневой хэш, можно убедиться в целостности и точности данных, не проверяя всю базу данных. MPT состоит из четырех типов узлов: листовых узлов, узлов расширения, узлов ветвления и нулевых узлов, которые вместе образуют дерево, способное приспосабливаться к динамическим изменениям данных. При каждом обновлении данных MPT отражает эти изменения, добавляя, удаляя или изменяя узлы и обновляя корневой хэш дерева. Поскольку каждый узел зашифрован с помощью хэш-функции, любые незначительные изменения в данных приведут к значительному изменению корневого хэша, что обеспечивает безопасность и согласованность данных. Более того, дизайн MPT поддерживает проверку "легкого клиента", позволяя узлам проверять существование или состояние определенной информации, сохраняя только хэш корня дерева и необходимые узлы пути, что значительно снижает требования к хранению и обработке данных.

Благодаря MPT, Ethereum не только добивается эффективного управления и быстрого доступа к данным, но и обеспечивает безопасность и децентрализацию сети, поддерживая работу и развитие всей сети Ethereum.

  • Машина состояний

Основная архитектура Ethereum включает в себя концепцию машины состояний, в которой виртуальная машина Ethereum (EVM) служит средой исполнения для выполнения всего кода смарт-контрактов, а сам Ethereum можно рассматривать как глобально разделяемую систему с переходами состояний. Выполнение каждого блока можно рассматривать как процесс перехода из одного глобально разделяемого состояния в другое. Такая конструкция не только обеспечивает согласованность и децентрализацию сети Ethereum, но и делает результаты выполнения смарт-контрактов предсказуемыми и защищенными от взлома.

В Ethereum состояние означает текущую информацию обо всех счетах, включая баланс каждого счета, сохраненные данные и код смарт-контракта. Когда происходит транзакция, EVM вычисляет и переводит состояние, основываясь на содержании транзакции, и этот процесс эффективно и безопасно записывается с помощью дерева Меркла Патриция (MPT). Каждый переход состояния не только изменяет данные учетной записи, но и приводит к обновлению MPT, что отражается в изменении корневого хэш-значения дерева.

Взаимосвязь между EVM и MPT очень важна, поскольку MPT гарантирует целостность данных при переходах между состояниями Ethereum. Когда EVM выполняет транзакции и изменяет состояние счета, соответствующие узлы MPT обновляются, чтобы отразить эти изменения. Поскольку каждый узел в MPT связан хэшами, любая модификация состояния приводит к изменению корневого хэша, который затем включается в новый блок, обеспечивая согласованность и безопасность всего состояния Ethereum. Ниже мы представим виртуальную машину EVM.

  • EVM

Виртуальная машина EVM является основой конструкции Ethereum, обеспечивая выполнение смарт-контрактов и переходы между состояниями. Благодаря EVM, Ethereum можно по-настоящему представить как всемирный компьютер. EVM является Тьюринг-полным, что означает, что смарт-контракты на Ethereum могут выполнять произвольно сложные логические вычисления, а внедрение механизма газа успешно предотвращает бесконечные циклы внутри контрактов, обеспечивая стабильность и безопасность сети. С более глубокой технической точки зрения EVM - это виртуальная машина на основе стека, которая выполняет смарт-контракты с помощью байткода, специфичного для Ethereum. Разработчики обычно используют языки высокого уровня, такие как Solidity, для написания смарт-контрактов, которые затем компилируются в байт-код, понятный EVM для выполнения. EVM является ключевым элементом инновационного потенциала блокчейна Ethereum, не только поддерживая работу смарт-контрактов, но и обеспечивая прочную основу для разработки децентрализованных приложений. Благодаря EVM, Ethereum формирует децентрализованное, безопасное и открытое цифровое будущее.

Исторический обзор

Рисунок 1 Исторический обзор Ethereum

Вызовы

Безопасность

Смарт-контракты - это компьютерные программы, которые работают на блокчейне Ethereum. Они позволяют разработчикам создавать и развертывать различные приложения, включая, помимо прочего, приложения для кредитования, децентрализованные биржи, страхование, вторичное финансирование, социальные сети и NFT. Безопасность смарт-контрактов очень важна для этих приложений, поскольку они напрямую работают с криптовалютами и контролируют их. Любая уязвимость в смарт-контрактах или вредоносные атаки могут представлять прямую угрозу безопасности средств, потенциально приводя к значительным финансовым потерям. Например, 26 февраля 2024 года протокол кредитования DeFi Blueberry Protocol был атакован из-за изъяна в логике смарт-контракта, в результате чего было потеряно около $1 400 000.

Уязвимости в смарт-контрактах многогранны и включают в себя необоснованную бизнес-логику, неправильный контроль доступа, неадекватную проверку данных, атаки на ретрансляцию и DOS (отказ в обслуживании), а также другие. Эти уязвимости могут привести к проблемам при выполнении контрактов, что повлияет на эффективность работы смарт-контрактов. Например, DOS-атаки включают в себя отправку злоумышленниками большого количества транзакций, чтобы исчерпать ресурсы сети, не позволяя обычным пользовательским транзакциям обрабатываться своевременно. Такое ухудшение пользовательского опыта может также привести к увеличению платы за проведение транзакций, так как пользователям может потребоваться платить более высокую плату за приоритетность своих транзакций в перегруженной сети.

Кроме того, пользователи Ethereum также сталкиваются с инвестиционными рисками, поскольку безопасность фондов находится под угрозой. Например, "говнокоины" - это криптовалюты, которые, как считается, не имеют практически никакой ценности или долгосрочного потенциала роста. Шиткоины часто используются в качестве инструментов для мошенничества или для схем "накачивания и сброса". Инвестиционный риск, связанный с шиткоинами, высок, что потенциально может привести к значительным финансовым потерям. Из-за низкой цены и рыночной капитализации они очень подвержены манипуляциям и волатильности. Эти криптовалюты обычно используются в схемах "накачай и сбрось" и мошенничествах с медовыми горшками, когда инвесторов заманивают фальшивыми проектами, а затем лишают их средств. Еще один распространенный риск, связанный с шиткоинами, - это "вырывание ковра", когда создатели внезапно удаляют всю ликвидность из проекта, в результате чего стоимость токена резко падает. Такие аферы часто рекламируются с помощью ложных партнерств и рекомендаций, и как только цена токена возрастает, мошенники продают свои токены, получают прибыль и исчезают, оставляя инвесторов с ничего не стоящими токенами. Более того, инвестирование в "шиткоины" может отвлечь внимание и ресурсы от законных криптовалют, имеющих реальное применение и потенциал роста.

Помимо shitcoins, "воздушные монеты" и "монеты финансовой пирамиды" также являются способами получения быстрой прибыли. Для пользователей, не обладающих профессиональными знаниями и опытом, отличить их от легальных криптовалют особенно сложно.

Эффективность

Два очень прямых показателя для оценки эффективности Ethereum - это скорость транзакций и газовые сборы. Скорость транзакций относится к количеству транзакций, которые сеть Ethereum может обработать за единицу времени. Эта метрика напрямую отражает вычислительные возможности сети Ethereum, где более высокая скорость указывает на более высокую эффективность. Каждая транзакция в Ethereum требует определенного количества газовых сборов, которые компенсируют майнерам верификацию транзакций. Более низкая плата за газ указывает на более высокую эффективность Ethereum.

Снижение скорости транзакций приводит к увеличению платы за газ. Как правило, когда скорость обработки транзакций снижается из-за ограниченного пространства блока, конкуренция между транзакциями за попадание в следующий блок может возрасти. Чтобы выделиться в этой конкурентной борьбе, трейдеры часто увеличивают плату за газ, поскольку майнеры склонны отдавать предпочтение транзакциям с более высокой платой за газ при проверке. Поэтому более высокая плата за газ может ухудшить впечатления пользователя.

Транзакции - это лишь основные действия в Ethereum. В рамках этой экосистемы пользователи также могут заниматься различными видами деятельности, такими как кредитование, ставки, инвестирование, страхование и т.д., и все это можно делать через специальные приложения DApps. Однако, учитывая широкое разнообразие DApps и отсутствие персонализированных рекомендательных сервисов, подобных тем, что существуют в традиционных отраслях, пользователи могут запутаться в выборе подходящих приложений и продуктов для себя. Такая ситуация может привести к снижению удовлетворенности пользователей, что скажется на общей эффективности экосистемы Ethereum.

Возьмем, к примеру, кредитование. Некоторые платформы кредитования DeFi используют механизм избыточного залога для поддержания безопасности и стабильности своей платформы. Это означает, что заемщикам необходимо предоставить в качестве залога больше активов, которые нельзя использовать для других видов деятельности в течение срока кредитования. Это приводит к снижению коэффициента использования капитала заемщиками, тем самым уменьшая ликвидность рынка.

Применение машинного обучения в Ethereum

Модели машинного обучения, такие как модель RFM, генеративные адверсарные сети (GAN), модели дерева решений, алгоритм K-Nearest Neighbors (KNN) и алгоритм кластеризации DBSCAN, играют важную роль в Ethereum. Применение этих моделей машинного обучения в Ethereum может помочь оптимизировать эффективность обработки транзакций, повысить безопасность смарт-контрактов, реализовать сегментацию пользователей для предоставления более персонализированных услуг, а также способствовать стабильной работе сети.

Введение в алгоритмы

Алгоритмы машинного обучения - это набор инструкций или правил, используемых для анализа данных, изучения закономерностей в данных и принятия прогнозов или решений на основе этих знаний. Они автоматически совершенствуются благодаря обучению на основе предоставленных данных, без необходимости явного программирования со стороны человека. Модели машинного обучения, такие как модель RFM, генеративные адверсарные сети (GAN), модели дерева решений, алгоритм K-Nearest Neighbors (KNN) и алгоритм кластеризации DBSCAN, играют важную роль в Ethereum. Применение этих моделей машинного обучения в Ethereum может помочь оптимизировать эффективность обработки транзакций, повысить безопасность смарт-контрактов, реализовать сегментацию пользователей для предоставления более персонализированных услуг, а также способствовать стабильной работе сети.

Байесовские классификаторы

Байесовские классификаторы относятся к числу различных статистических методов классификации, направленных на минимизацию вероятности ошибок классификации или минимизацию среднего риска при определенной системе затрат. Их философия дизайна глубоко укоренилась в теореме Байеса, которая позволяет рассчитать вероятность того, что объект принадлежит к определенному классу, учитывая некоторые известные характеристики. Вычисляя апостериорную вероятность объекта, принимаются решения. В частности, байесовские классификаторы сначала рассматривают предварительную вероятность объекта, а затем применяют формулу Байеса, чтобы учесть наблюдаемые данные, тем самым обновляя убеждение о классификации объекта. Среди всех возможных классификаций байесовские классификаторы выбирают категорию с наибольшей апостериорной вероятностью для данного объекта. Основное преимущество этого метода заключается в его естественной способности работать с неопределенностью и неполной информацией, что делает его мощным и гибким инструментом, подходящим для широкого спектра приложений.

Как показано на Рисунке 2, в машинном обучении с контролем классификационные решения принимаются с использованием данных и вероятностных моделей, основанных на теореме Байеса. Используя вероятность, предшествующие вероятности категорий и признаков, байесовские классификаторы вычисляют апостериорные вероятности каждой категории для точек данных и относят точки данных к категории с наибольшей апостериорной вероятностью. На диаграмме рассеивания справа классификатор пытается найти кривую, которая наилучшим образом разделяет точки разных цветов, тем самым минимизируя ошибки классификации.

Рисунок 2 Байесовский классификатор

  • Деревья решений

Алгоритмы дерева решений обычно используются для задач классификации и регрессии, применяя иерархический подход к принятию решений. Они генерируют деревья, разделяя признаки с высокой информативностью на основе известных данных, и таким образом обучают дерево решений. По сути, алгоритм может самостоятельно выучить правило принятия решений на основе данных для определения значений переменных. В частности, он упрощает сложные процессы принятия решений до нескольких более простых подрешений. Каждое более простое решение выводится из родительского критерия принятия решения, образуя древовидную структуру.

Как показано на Рис. 3, каждый узел представляет собой решение, определяющее критерий для оценки определенного атрибута, а ветви представляют собой результаты решения. Каждый листовой узел представляет окончательный предсказанный результат и категорию. С точки зрения структуры, модель дерева решений интуитивна, проста для понимания и обладает большой объяснительной силой.

Изображение 3 Модель дерева решений

  • Алгоритм DBSCAN

DBSCAN (Density-Based Spatial Clustering of Applications with Noise) - это алгоритм пространственной кластеризации на основе плотности, который особенно эффективен для наборов данных с шумом и для выявления кластеров любой формы без необходимости заранее задавать количество кластеров. Он устойчив к выбросам в наборе данных. Алгоритм может эффективно выявлять провалы, определяемые как точки в областях с низкой плотностью, как показано на рисунке 4.

Рисунок 4 Идентификация шума с помощью алгоритма DBSCAN

  • Алгоритм KNN

Алгоритм K-Nearest Neighbors (KNN) можно использовать как для классификации, так и для регрессии. В классификации категория классифицируемого предмета определяется с помощью механизма голосования; в регрессии - путем вычисления среднего или взвешенного среднего значения k ближайших образцов.

Как показано на Рисунке 5, принцип работы алгоритма KNN в классификации заключается в поиске ближайших k соседей новой точки данных и предсказании категории новой точки данных на основе категорий этих соседей. Если K=1, новая точка данных просто присваивается категории ближайшего соседа. Если K>1, категория обычно определяется большинством голосов, то есть новая точка данных относится к той категории, которая наиболее распространена среди ее соседей. При использовании в регрессии принцип остается тем же, но результатом является среднее значение выходов ближайших k выборок.

Рисунок 5 Алгоритм KNN, используемый для классификации

  • Генеративный искусственный интеллектГенеративный искусственный интеллект

Генеративный искусственный интеллект (ИИ) - это разновидность технологии ИИ, которая может генерировать новый контент (например, текст, изображения, музыку и т.д.) на основе входных требований. В его основе лежат достижения в области машинного обучения и глубокого обучения, особенно в приложениях для обработки естественного языка и распознавания изображений. Генеративный ИИ изучает закономерности и ассоциации на основе огромного количества данных, а затем генерирует совершенно новые результаты на основе этой изученной информации. Ключ к генеративному искусственному интеллекту лежит в обучении модели, что требует высококачественных данных для обучения и тренировки. В ходе этого процесса модель постепенно улучшает свою способность генерировать новый контент, анализируя и понимая структуру, закономерности и взаимосвязи в наборе данных.

  • Трансформатор

Трансформер, как краеугольный камень генеративного искусственного интеллекта, представил механизм внимания революционным образом. Это позволяет при обработке информации фокусироваться на ключевых моментах и одновременно использовать глобальный взгляд - уникальная возможность, благодаря которой Transformer стал лучшим в области создания текстов. Использование новейших моделей естественного языка, таких как GPT (Generative Pre-trained Transformer), для понимания требований пользователя, выраженных на естественном языке, и автоматического преобразования их в исполняемый код может снизить сложность разработки и значительно повысить эффективность.

Как показано на Рисунке 6, внедрение механизма многоголового внимания и механизма самовнимания, в сочетании с остаточными связями и полностью подключенными нейронными сетями, а также использование технологий встраивания слов, применявшихся ранее, значительно повысило производительность генеративных моделей, связанных с обработкой естественного языка.

Рисунок 6 Модель трансформатора

  • Модель RFM

Модель RFM - это аналитическая модель, основанная на покупательском поведении клиентов, которая позволяет выявить различные группы покупателей, анализируя их поведение при совершении сделок. Эта модель оценивает и классифицирует покупателей на основе времени их последней покупки (Recency, R), частоты покупок (Frequency, F) и потраченной суммы (Monetary value, M).

Как показано на Рисунке 7, эти три показателя составляют основу модели RFM. Модель оценивает клиентов по этим трем параметрам и сортирует их на основе полученных оценок, чтобы определить наиболее ценные группы клиентов. Более того, эта модель эффективно разделяет покупателей на различные группы, облегчая функциональность стратификации покупателей.

Рисунок 7 Модель наслоения RFM

Потенциальные применения

Применяя технологию машинного обучения для решения проблем безопасности Ethereum, мы проводили исследование в четырех основных аспектах:

Потенциальные применения

Решая проблемы безопасности Ethereum с помощью методов машинного обучения, мы проводили исследования в четырех основных аспектах:

  • Идентификация и фильтрация вредоносных транзакций на основе байесовского классификатора**.

    Построив байесовский классификатор, можно выявить и отфильтровать потенциальные спам-транзакции, включая, но не ограничиваясь теми, которые вызывают DOS-атаки за счет большого количества частых и мелких транзакций. Этот метод эффективно поддерживает работоспособность сети, анализируя характеристики транзакций, такие как цены на газ и частота транзакций, обеспечивая стабильную работу сети Ethereum.

  • Генерация безопасного и удовлетворяющего конкретным требованиям кода смарт-контракта**.

    Генеративные адверсарные сети (GAN) и генеративные сети на основе трансформаторов могут использоваться для генерации кода смарт-контракта, который отвечает определенным требованиям, при этом максимально обеспечивая безопасность кода. Однако эти два подхода различаются по типам данных, на которые они опираются при обучении моделей: первый в основном зависит от образцов небезопасного кода, а второй - наоборот.

    Обучив GAN изучать существующие модели безопасных контрактов и создав самоаверсальные модели для генерации потенциально небезопасного кода, а затем научившись определять эти небезопасности, можно автоматически генерировать высококачественный, более безопасный код смарт-контрактов. Используя генеративные сетевые модели на основе трансформаторов, обучаясь на огромном количестве примеров безопасных контрактов, можно генерировать коды контрактов, которые отвечают конкретным потребностям и оптимизируют расход газа, что, несомненно, повышает эффективность и безопасность разработки умных контрактов.

  • Анализ рисков смарт-контрактов на основе деревьев принятия решений**.

    Использование деревьев решений для анализа характеристик смарт-контрактов, таких как частота вызова функций, стоимость транзакций и сложность исходного кода, может эффективно определить потенциальный уровень риска контрактов. Анализ моделей работы и структуры кода контрактов может предсказать возможные уязвимости и точки риска, обеспечивая разработчикам и пользователям оценку безопасности. Ожидается, что этот метод значительно повысит безопасность смарт-контрактов в экосистеме Ethereum, тем самым снизив потери, вызванные уязвимостями или вредоносным кодом.

  • Построение модели оценки криптовалют для снижения инвестиционных рисков**.

    Анализируя торговые данные, активность в социальных сетях и рыночные показатели криптовалют с помощью алгоритмов машинного обучения, можно построить модель оценки, которая может предсказать вероятность того, что криптовалюта окажется "нежелательной монетой". Эта модель может предложить инвесторам ценную информацию, помогая им избежать инвестиционных рисков и тем самым способствуя здоровому развитию криптовалютного рынка.

Более того, применение машинного обучения также способно еще больше повысить эффективность Ethereum. Мы можем изучить это с помощью следующих трех ключевых аспектов:

  • Применение дерева решений для оптимизации модели очереди в пул транзакций

Применение деревьев решений для оптимизации модели очереди в пул транзакций

Использование деревьев решений позволяет эффективно оптимизировать механизм очередей в пуле транзакций Ethereum. Анализируя характеристики сделок, такие как цены на газ и размер сделки, деревья решений могут оптимизировать выбор и упорядочивание сделок. Этот метод может значительно повысить эффективность обработки транзакций, эффективно снизить перегрузку сети и сократить время ожидания пользователями транзакций.

  • Сегментирование пользователей и предоставление персонализированных услуг

Модель RFM (Recency, Frequency, Monetary value), широко используемая в управлении взаимоотношениями с клиентами, позволяет эффективно сегментировать пользователей, оценивая время их последних транзакций (Recency), частоту транзакций (Frequency) и сумму транзакций (Monetary value). Применение модели RFM на платформе Ethereum поможет выявить группы пользователей с высокой ценностью, оптимизировать распределение ресурсов и предоставлять более персонализированные услуги, тем самым повышая удовлетворенность пользователей и общую эффективность платформы. Модель RFM (Recency, Frequency, Monetary value), широко используемая в управлении взаимоотношениями с клиентами, позволяет эффективно сегментировать пользователей, оценивая время их последних транзакций (Recency), частоту транзакций (Frequency) и сумму транзакций (Monetary value). Применение модели RFM на платформе Ethereum поможет выявить высокоценные группы пользователей, оптимизировать распределение ресурсов и предоставлять более персонализированные услуги, тем самым повышая удовлетворенность пользователей и общую эффективность платформы.

Алгоритм DBSCAN также может анализировать транзакционное поведение пользователей, помогая выявить различные группы пользователей Ethereum и в дальнейшем предоставлять более адаптированные финансовые услуги различным пользователям. Эта стратегия сегментации пользователей может оптимизировать маркетинговые стратегии, повысить удовлетворенность клиентов и эффективность обслуживания.

  • Кредитный скоринг на основе KNN

Алгоритм K-Nearest Neighbors (KNN) может оценивать кредитоспособность пользователей, анализируя историю их транзакций и модели поведения в Ethereum, что играет чрезвычайно важную роль в финансовой деятельности, такой как кредитование. Кредитный скоринг помогает финансовым учреждениям и кредитным платформам оценивать возможности заемщиков по погашению кредитов и кредитный риск, принимая более точные решения о кредитовании. Это может предотвратить чрезмерное заимствование и повысить ликвидность рынка.

Будущие направления

С точки зрения распределения макрокапитала, Ethereum, как крупнейший в мире распределенный компьютер, никогда не может быть переинвестирован в инфра-слой, нуждаясь в привлечении большего количества разработчиков из разных слоев общества для участия в совместном строительстве. В этой статье, проанализировав техническую реализацию Ethereum и проблемы, с которыми она сталкивается, мы представляем ряд интуитивных применений машинного обучения и с нетерпением ждем, когда разработчики ИИ в сообществе воплотят эти видения в реальную ценность.

По мере постепенного увеличения вычислительной мощности цепочки мы можем предвидеть появление более сложных моделей для управления сетью, мониторинга транзакций, аудита безопасности и т.д., что повысит эффективность и безопасность сети Ethereum.

Кроме того, механизмы управления, управляемые ИИ/агентами, также могут стать значительной инновацией в экосистеме Ethereum. Этот механизм, обеспечивающий более эффективные, прозрачные и автоматизированные процессы принятия решений, может предоставить Ethereum более гибкую и надежную структуру управления. Эти будущие разработки не только будут способствовать инновациям в технологии Ethereum, но и предоставят пользователям более качественный опыт работы с цепочкой.

Отказ от ответственности:

  1. Эта статья перепечатана из [TechFlow]. *Переслать оригинальное название'另一个角度看「AI+Blockchain」:AI 如何革新以太坊?'.Все авторские права принадлежат оригинальному автору[Salus]. Если у Вас есть возражения против этой перепечатки, пожалуйста, свяжитесь с командой Gate Learn, и они незамедлительно рассмотрят их.
  2. Предупреждение об ответственности: Мнения и взгляды, выраженные в этой статье, принадлежат исключительно автору и не являются инвестиционным советом.
  3. Перевод статьи на другие языки осуществляется командой Gate Learn. Если не указано, копирование, распространение или плагиат переведенных статей запрещены.
Начните торговать сейчас
Зарегистрируйтесь сейчас и получите ваучер на
$100
!