Содержание:
В ноябре 2022 года компания OpenAI представила чат-бота ChatGPT. Спустя два месяца после запуска число активных пользователей сервиса достигло 100 млн. Для сравнения: TikTok потребовалось порядка девяти месяцев, чтобы дойти до этой отметки, а Instagram — более двух лет.
К тому моменту генеративные нейронные сети уже были достаточно популярны, а новый продукт дополнительно подогрел интерес к сегменту. Не удивительно, что волна хайпа вокруг искусственного интеллекта (ИИ) не обошла стороной и криптовалютную индустрию.
С конца 2022 года периодически можно было наблюдать локальные ралли в токенах проектов, которые, по заверениям разработчиков, использовали технологию. Однако некоторые со скепсисом относятся к подобным активам, небезосновательно считая, что степень интеграции каких-либо алгоритмов находится на слишком низком уровне.
This is why you shouldn't buy AI tokens pic.twitter.com/6QhQQPcAvm
— Bankless (@BanklessHQ) February 13, 2023
Тем не менее, если касательно существующих продуктов высказываются разные и достаточно полярные мнения, то в отношении потенциала возможной синергии блокчейна и искусственного интеллекта наблюдается определенный консенсус.
Многие игроки, в том числе биржи и Web3-акселераторы, считают, что слияние технологий принесет пользу обеим отраслям, позволив каждой решить имеющиеся проблемы. Схожего мнения придерживаются и некоторые венчурные инвесторы. Например, в мае сообщалось, что Paradigm расширит сферу своих интересов на ИИ.
Incrypted разобрался, как искусственный интеллект и блокчейн могут дополнить друг друга, зачем алгоритмам нужны децентрализованные сети и почему синергия технологий может значительно ускорить их развитие.
Зачем алгоритмам децентрализация?
Нарратив о синергии искусственного интеллекта и блокчейна не является чем-то новым. При этом интерес к области значительно возрос в последние несколько лет — на это в том числе указывают данные релевантных исследований.
Интеграция распределенных сетей с ИИ-сервисами в перспективе несет много выгоды разработчикам последних. Потенциально блокчейн способен устранить или по крайней мере ослабить ряд критических барьеров вроде тех, что связаны с нехваткой вычислительных мощностей.
Эта синергия также открывает доступ к инновационным вариантам взаимодействия. Например, DLT-технология может позволить выполнять тонкую настройку нейронных моделей и собирать более репрезентативные наборы данных для обучения алгоритмов.
Блокчейн-индустрия также выиграет от интеграции систем с искусственным интеллектом — особенно ончейн и в смарт-контрактах. ИИ способен повысить производительность распределенных сетей и стать одним из основных драйверов роста сектора децентрализованных финансов (DeFi).
Проблемы есть у всех
История искусственного интеллекта как научного направления насчитывает практически 70 лет. Однако отрасли так и не удалось устранить некоторые барьеры, которые препятствуют ее широкому принятию. Более того, по мере развития индустрии появились новые вызовы.
Далее мы подробно рассмотрим некоторые потенциальные сценарии, в которых распределенные сети могут нивелировать определенные ограничения.
Нехватка мощностей
Графические процессоры (GPU) играю важную роль в обучении алгоритмов и выводе пользовательских запросов. Об этом, в частности, свидетельствует отчет Nvidea за I квартал 2024 фискального года.
На фоне роста ИИ-сектора произошло резкое увеличение спроса на GPU — это привело к существенному дефициту чипов. Ситуация оказалась настолько серьезной, что крупные провайдеры облачных услуг вроде Google и Amazon даже начали вводить ограничения для своих клиентов.
Многие из занятых в сфере искусственного интеллекта компаний обратились к альтернативным поставщикам (например, Lambda), но они также уже близки к пределу своих возможностей.
I am gonna forecast this happening a lot to everyone soon. Get your GPU trainings in while the world is still upskilling to AI research. pic.twitter.com/w8WGBul9gm
— Suhail (@Suhail) April 3, 2023
Проблему потенциально могут исправить децентрализованные вычислительные сети. Последние де-факто являются посредниками, которые соединяют организации, нуждающиеся в вычислительных мощностях, с владельцами систем, обладающих необходимым ресурсом.
Подобные решения предлагают более низкие цены по сравнению с централизованными поставщиками услуг. Это в основном связано с отсутствием дополнительных издержек у подключенных к системе провайдеров.
Сравнение предложения Akash с расценками крупных поставщиков. Данные: Cloudmos.
Существует два основных типа подобных вычислительных сетей: общего назначения (general purpose; GP) и специального назначения (special purpose; SP).
К первым относятся децентрализованные облачные сервисы, предоставляющие ресурсы широкому спектру приложений. Их модель работы чем-то напоминает маркетплейс — клиенты арендуют серверное пространство у провайдеров, которые самостоятельно устанавливают цены. Вышеупомянутая Akash относится именно к GP-сетям.
SP-сети, напротив, предназначены для конкретных сценариев использования. Обычно их архитектура объединяет вычислительные ресурсы в единый пул — своеобразный децентрализованный компьютер. При этом стоимость услуг определяет динамика рынка или параметры, контролируемые сообществом.
Примером таких продуктов является Gensyn, которая предназначена для обучения ML-моделей.
Децентрализованные сети демократизируют доступ к вычислительным мощностям. Это позволяет снизить стоимость обучения, тонкой настройки алгоритмов и обработки пользовательских запросов, что является еще более ресурсоемкой задачей.
Вместе с тем в сообществе есть опасения касательно скорости обучения ML-моделей на распределенном ресурсе. По словам участника Alliance и партнера Volt Capital Мохамеда Фуда, в сравнении с централизованными методами она может быть ниже на один или даже два порядка.
11/ For all these reasons, decentralized computing is not really a fit for AI training.
The performance hit is unlikely to justify any reduction in cost you can get via decentralization.— Mohamed Fouda (@MohamedFFouda) April 5, 2023
Команды уже трудятся над оптимизацией процесса децентрализованного обучения. Разработчики Together создают решение, которое теоретически позволит устранить «бутылочное горлышко», а в Gensyn пытаются снять вопросы, возникающие из-за подключения к сети различного оборудования.
Тем не менее вполне вероятно, что сообществу придется пойти на компромисс — смириться с медленным обучением в угоду экономии средств.
Машинное обучение с нулевым разглашением
Отдельно стоит выделить проекты, ориентированные на машинное обучение с нулевым разглашением (zero-knowledge machine learning; ZKML).
Для обеспечения корректной работы в вычислительных сетях используются различные механизмы вроде доверенных сред исполнения (trusted execution environments; TEE) и репутационных моделей. Но каждый подход имеет свои ограничения и недостатки. Например, в TEE может присутствовать потенциальный вектор аппаратной атаки.
Поэтому новая волна проектов (Gensyn, Modulus Labs и Giza) начала экспериментировать с применением доказательства с нулевым разглашением (zero-knowledge proof; ZKP) для проверки целостности вычислений для ML.
ZKP – это криптографический протокол, который позволяет одной стороне (доказывающей) подтвердить истинность утверждения другой стороне (проверяющей), не раскрывая при этом никакой дополнительной информации. Протокол достаточно популярен в блокчейн-индустрии, поскольку позволяет разработчикам создавать масштабируемые и безопасные приложения.
Применительно к машинному обучению ZKP при необходимости скрывает часть входных данных или самой модели. Это особенно актуально, когда алгоритмы работают в строго регулируемых отраслях вроде здравоохранения и финансов.
Схема создания DataSet для ML-модели с использованием ZKP. Данные: Мохамед Фуда.
У ZKML есть и другие преимущества. Метод, например, позволяет доказать, что конкретный алгоритм обучался на строго определенном наборе данных. В случае проприетарных ИИ он также дает возможность проверить, что всем пользователям доступна одна и та же модель.
Недостатком подхода можно считать сам процесс генерации доказательств — это ресурсоемкая задача, выполнение которой может стоить дороже исходных операций. Это означает, что в некоторых случаях их вычисление является нецелесообразным и непрактичным.
Тем не менее ZKML является вектором децентрализации для ИИ-индустрии, что важно в ситуации, когда концентрация технологии в руках узкого пула игроков вызывает опасения.
Проверка подлинности контента
Развитие и распространение генеративных нейросетей привело к появлению реалистичных дипфейков. Примером могут служить сфабрикованные изображение Папы Франциска в пуховике Balenciaga и видео со сценой взрыва возле Пентагона.
Для борьбы с подобными подделками можно использовать криптографические подписи — личность создателя контента верифицируется путем сопоставления пары закрытый-открытый ключ.
Одним из примеров реализации являются децентрализованные социальные сети. Построенные на базе Lens Protocol проекты связывают учетные записи пользователей с адресами в публичном блокчейне. Это упрощает идентификацию.
Отображение адреса пользователя Saswat в его профиле на Lenstube. Данные: Lenstube.
Команды Bundlr и Arweave также работают над созданием единых для индустрии стандартов. Последние предполагают введение спецификаций, обязывающих интегрировать в цифровой контент неизменяемые криптографические подписи и временные метки, которые записываются в распределенный реестр.
На пути к эффективности
В перспективе блокчейн повысит эффективность обучения нейронных моделей и может изменить сам сложившийся подход к проведению изысканий в отрасли.
Если в начале существования направления большинство исследований проводилось в академических кругах, то сейчас доминируют крупные технологические компании. Такая ситуация ограничивает участие локальных лабораторий и частных лиц ввиду недостатка стимулов и возможностей сотрудничества.
Децентрализованные платформы вроде Bittensor могут исправить положение вещей. Это своеобразные маркетплейсы, где участники получают вознаграждение за свой вклад в разработку и могут обмениваться данными для обучения моделей. Особенно привлекательными подобные площадки выглядят при создании ИИ с открытым исходным кодом.
Блокчейн также упрощает применения обучения с подкреплением на основе отзывов людей (Reinforcement Learning from Human Feedback; RLHF). Это метод, который включает в процесс обратную связь от человека для более тонкой настройки нейронной модели.
RLHF позволяет «отшлифовать» модель, снизив число неточных или необъективных результатов. Например, OpenAI использовала его для отладки GPT-3 и при разработке ChatGPT.
Тонкая настройка увеличивает производительность алгоритмов и дает им возможность приобретать опыт в конкретных областях. По мере роста спроса на такие узкоспециализированные модели растет и потребность в экспертах для обеспечения обратной связи.
В Multicoin предлагают способ масштабирования RLHF за счет использования стимулирующих выплат в виде токенов. Однако у такого подхода есть как минимум две проблемы:
- поскольку эксперты должны согласиться принять токены в качестве компенсации, это ограничивает круг лиц, участвующих в обучении;
- подобную систему необходимо защитить от манипулятивных атак, чтобы сохранить точность обратной связи.
Вместе с тем уже существуют проекты вроде Hivemapper, которые реализуют метод на практике.
Насколько умным может быть смарт-контракт?
Есть множество областей, в которых блокчейн-платформы могут использовать искусственный интеллект на самых разных уровнях: от инфраструктурного до прикладного.
Данные: OP Crypto.
Вместе с тем наибольший интерес для криптовалютной индустрии представляют сценарии, при которых ИИ работает непосредственно в распределенном реестре. В общем смысле существуют два способа перенести деятельность алгоритмов в блокчейн:
- позволить автономным агентам использовать инфраструктуру Web3 для совершения платежей и доступа к цифровым ресурсам;
- позволить нейронным моделям взаимодействовать со смарт-контрактами через ZKML.
Платежи и ресурсы для автономных агентов
Автономные экономические агенты (AEA) — это автономные системы на базе алгоритмов машинного обучения, выполняющие конкретные задачи от имени своих владельцев без их непосредственного вмешательства в процесс.
Специалисты ожидают, что по мере развития технологии AEA станут более узкоспециализированными, что приведет к распространению «мультиагентных систем».
Схема простейшей мультиагентной системы, в которой AEA работают вне цепочки. Данне: совместное исследование Fetch.ai и Римского Университета Ла Сапиенца.
Это, в свою очередь, повлечет за собой появление рынка, на котором одни агенты смогут «нанимать» других и платить им вознаграждение за выполнение определенных заданий. В этом контексте вполне вероятно, что криптовалютные платежи будут предпочтительней фиатных по нескольким причинам:
- существующие законодательства не позволяет AEA открывать банковские счета или использовать аккаунты владельцев для проведения трансграничных транзакций;
- криптовалюты устраняют необходимость в доверенных посредниках;
- блокчейн-инфраструктура обеспечивает более быстрые и дешевые взаиморасчеты.
AEA смогут взаимодействовать не только с платежными, но и с децентрализованными сетями физической инфраструктуры (Decentralized Physical Infrastructure Networks; DePIN). Последние объединяют аппаратные устройства — рассмотренные выше вычислительные системы также можно отнести к этому сегменту.
DePIN предоставит ИИ доступ к цифровым ресурсам вроде дискового пространства и компьютерных мощностей. Например, если алгоритму нужно создать 3D-модель, он может использовать Render Network для рендеринга и Arweave для хранения данных, вместо того, чтобы полагаться на централизованные решения.
Интеграция ИИ в смарт-контракты
Применение ИИ-моделей в смарт-контрактах значительно расширяет возможности последних. Нейронные сети не только откроют доступ к инновационным вариантам использования, но и повысят эффективность существующих инструментов.
Во многом этой интеграции мешают высокие вычислительные затраты, связанные с развертыванием алгоритмов в блокчейне. Однако применение ZKP для подтверждения точного исполнения моделей офчейн может решить эту проблему, поскольку в распределенном реестре можно размещать только релевантные доказательства.
Подобный подход позволит смарт-контрактам принимать решения на основе динамических данных, не ограничиваясь набором жестко закодированных правил. Таким образом они станут более автономными, гибкими и сложными.
ZKML можно использовать во множестве секторов индустрии, включая DeFi, GameFi, DeSo (Decentralized Social) и DePIN.
Например, в децентрализованных финансовых приложениях ИИ способен корректировать параметры протокола в зависимости от текущих параметров сети. Один из возможных юзкейсов — лендинговый протокол использует ML-модель, чтобы регулировать фактор залога в режиме реального времени.
Среди других сценариев: автоматизированное управление казначейством, кредитный ончейн-скоринг и управление ликвидностью AMM.
Удачное противоречие
На текущий момент между отраслями ИИ и Web3 существует противоречие на уровне базовой логики: первая является высоко централизованной, вторая — строится на принципах повсеместной децентрализации. Порой такая ситуация затрудняет интеграцию приложений.
Однако то же самое противоречие позволяет продуктам из этих двух секторов эффективно дополнять друг друга и способствовать обоюдному развитию.
Совсем не обязательно, что блокчейн станет фундаментом для будущих нейронных моделей. И нет абсолютно никакой гарантии, что алгоритмы будут работать в самом ядре децентрализованных платформ.
Но можно с уверенностью сказать, что сочетание двух технологий еще принесет множество новых нарративов, некоторые из которых окажутся вполне жизнеспособными.