Zephyrnet Logo

CoinFund lidera rodada de rede Bagel de US$ 3.1 milhões para apoiar infraestrutura de dados de última geração em web3 x AI Stack

Data:

Publicado em

7 min read

23 horas atrás

-

Rede Bagel: a camada de dados computáveis ​​de última geração para IA

A CoinFund tem orgulho de liderar um financiamento de US$ 3.1 milhões para Rede Bagel, uma startup que constrói um protocolo descentralizado para conjuntos de dados de incorporação colaborativa e expande o ecossistema descentralizado de dados computáveis ​​de IA. Para ficar por dentro das pesquisas e investimentos contínuos da CoinFund na emergente pilha web3 x AI, consulte nosso conteúdo anterior em moeda mundial, Giza, Visão geral de 2022 AI x web3 e nosso Tese da semente Gensyn.

Introdução aos embeddings de vetores

Como introdução, os embeddings vetoriais são uma forma de converter palavras, frases, imagens e outros dados em objetos matemáticos (vetores), preservando dados individuais e relativos. Por exemplo, uma incorporação poderia traduzir a palavra “maçã” em um vetor de 200 dimensões com base no contexto da palavra em um grande conjunto de dados. Este vetor capturaria o significado essencial da maçã e suas relações com conceitos relacionados como fruta, pomar, torta, etc. Embora as principais aplicações em incorporações de vetores tenham sido em texto com modelos emblemáticos como Word2Vec e Luva, embeddings vetoriais podem ser produzidos para outros tipos de dados, incluindo dados de imagem e áudio. Este contexto é crítico à medida que o desenvolvimento da IA ​​se torna cada vez mais focado no desenvolvimento de multimodalidade, onde um modelo pode processar texto, imagem ou áudio e também produzir qualquer um desses três meios. Além disso, modelos de incorporação podem ser usados ​​para capturar tipos de dados maiores, como incorporações específicas do usuário que capturam preferências, comportamentos e características do usuário ou incorporações em nível de produto que capturam atributos, recursos ou qualquer outra informação semântica de um produto.

A oportunidade do bagel

A oportunidade comercial para bancos de dados vetoriais cresceu rapidamente nos últimos 12 meses, juntamente com a adoção generalizada de aplicações iniciais de IA para consumidores, como ChatGPT, Midjourney e Runway, apenas para citar alguns. Bagel está entre as primeiras tentativas nativas da web3 de combinar um banco de dados de incorporação de vetores com um protocolo de mercado incentivado, aproveitando os primitivos da web3 para turbinar dados autorizados e compartilhamento e colaboração de modelos, com um caminho potencial para ganhar a categoria nativa da web3 de um produto e uma perspectiva de rede incentivada e a capacidade de agir rapidamente para preservar sua liderança inicial, dada a experiência profissional interdisciplinar do fundador Bidhan Roy na equipe Amazon Alexa, na Instacart e na Arweave. Acreditamos que a Bagel Network é um facilitador chave para a próxima geração de aplicações de IA, cuja adoção hoje permanece limitada pela capacidade de fornecer respostas contextualizadas, altamente aplicáveis ​​e específicas para casos de uso, limitadas pela demanda insaciável por dados de treinamento, especialmente porque a maioria dos os dados do mundo permanecem não estruturados.

Embora algumas empresas de embeddings web2 (tanto financiadas por VC quanto spinouts corporativos) façam parte do conjunto competitivo mais amplo, a Bagel Network conseguiu aproveitar rapidamente sua oportunidade limitada de liderar a categoria de embeddings de uma perspectiva nativa da web3, com uma demonstração já ativa, SDK e usuários piloto. No longo prazo, acreditamos que a abordagem de Bagel de construir um protocolo descentralizado e um mercado para conjuntos de dados de incorporação de vetores indexados posiciona a rede na interseção de duas tendências principais que se reforçam mutuamente - a ascensão dos LLMs (e aplicações derivadas) e a adoção dos sem permissão, valores fundamentais transparentes e descentralizados da web3.

Embora o mercado seja incipiente para incorporações de vetores, há pontos de dados que podemos considerar. Primeiro, podemos olhar para o mercado de gerenciamento de banco de dados relacional como uma comparação de mercado estabelecida que poderia ser alcançada (fonte). Hoje esse mercado vale US$ 69.44 bilhões e cresce a um CAGR de 12%. Há também a análise do mercado final: algumas indústrias primárias atendidas por incorporações de vetores incluem reconhecimento de imagem ($ 38B), mecanismo de recomendação (US$ 4.55 bilhões) e chatbots de IA ($ 5.4B) aqueles que, coletivamente, devem crescer com um CAGR de 20-40% até 2030. Por último, projeta-se agora que os gastos globais em inteligência artificial (incluindo ML, robótica de IA, visão computacional, PNL e tecnologia de sensores) cresçam de US$ 300 bilhões + em 2024 para mais de US$ 700 bilhões até 2030. Com esses números em mente, a incorporação de vetores provavelmente desempenhará um papel como uma tecnologia facilitadora para os modelos e aplicações de IA multimodais cada vez mais capazes que surgirão na próxima década.

O papel de Bagel na pilha de IA descentralizada

Acreditamos que a Bagel Network irá turbinar o compartilhamento e a colaboração autorizados por meio de seu modelo de mercado criptonativo, resolvendo problemas importantes na camada de dados da pilha de tecnologia de IA. Isso se adapta ao espírito da web3 de acesso e colaboração sem permissão, ao mesmo tempo em que fornece a infraestrutura necessária para a próxima geração de IA. Atualmente, uma quantidade desproporcional de dados pertence e é controlada por grandes entidades, isolando organizações mais pequenas através da acessibilidade a conjuntos de dados de alta qualidade ou simplesmente pelo efeito agravado da inteligência em escala. A Bagel Network redefine o cenário de dados de IA criando um mercado bilateral onde engenheiros de aprendizado de máquina, pesquisadores e agentes de IA constroem, comercializam e licenciam conjuntos de dados de forma colaborativa. Como a geração de incorporação costuma ser uma das partes de maior intensidade computacional de um pipeline de IA, existem hoje altos níveis de redundância nos sistemas de banco de dados vetoriais, levando a ineficiências, custos mais elevados e trabalho duplicado. A Bagel Network permite que os modelos compartilhem embeddings, evitando trabalho duplicado. Isso é mais eficiente, ao mesmo tempo que mantém a atribuição por meio de metadados de blockchain e outros ingredientes necessários para compartilhar de forma justa o potencial de monetização futura e ajudar a contornar o atrito relacionado à inicialização a frio. No contexto da inteligência artificial, já estamos vendo esforços de código aberto para replicar conjuntos de dados de código fechado para avançar na melhoria do modelo (ver RedPajama-Data, reprodução do conjunto de dados de treinamento LLaMA ou a abordagem de modelo aberto Mistral/Mixtral).

Prevemos que um banco de dados vetorial acoplado a uma rede descentralizada pode superar a concorrência através do aproveitamento do código aberto e do desenvolvimento colaborativo (uma abordagem que já venceu na pilha backend web2). Por exemplo, um contrato inteligente pode gerenciar o acesso autorizado com especificidade para incorporações discretas, o que não é possível com uma abordagem centralizada semelhante ao Github. Um protocolo pode recompensar contribuições de dados, monitorar e incentivar a participação na rede (por meio de bifurcação) e rastrear o uso de recursos computacionais. As soluções atuais de banco de dados vetoriais não têm capacidade de colaboração, enquanto plataformas de código aberto como Github/HuggingFace não têm incentivo para produzir embeddings de alta qualidade. Hoje, existem muitos dados de alta qualidade nas empresas e nos conjuntos de dados públicos, fragmentados e subexplorados, que poderão no futuro ser integrados, alinhados e rentabilizados. Finalmente, um mercado aberto permite o desenvolvimento autorizado na incorporação de coleções por várias equipes simultaneamente, por exemplo, por meio de software de código aberto, mas para conjuntos de dados vetorizados. Isto catalisa a inovação em todos os setores, em contraste com os esforços isolados.

Conclusão

Tal como acontece com qualquer investimento, existem muitos riscos (execução, concorrência, escala, monetização) com uma visão tão ambiciosa. No entanto, acreditamos que a Bagel Network exibe uma tração inicial promissora e está bem posicionada em um mercado de alto crescimento com vários ventos favoráveis ​​seculares a seu favor, especialmente dada uma oportunidade greenfield atualmente deserta definida para projetar e lançar uma implementação web3 líder bem alinhada com o volante de criação de valor de IA/dados. Em última análise, a CoinFund vê a visão de longo prazo de Bagel de criar um mercado descentralizado para conjuntos de dados computáveis ​​de aprendizado de máquina como uma peça crítica e faltante da parte da pilha web3 que está sendo construída para casos de uso de IA/ML. Embora ainda seja cedo, acreditamos que o potencial do mercado supera os riscos – daí a aposta de alta convicção da CoinFund e nosso entusiasmo em arregaçar as mangas junto com Bidhan Roy e o resto da equipe Bagel. Para saber mais ou inscrever-se como um parceiro de dados antecipado, visite www.bagel.net!

Isenção de responsabilidade: as opiniões expressas aqui são as do pessoal individual da CoinFund Management LLC (“CoinFund”) citado e não são as opiniões da CoinFund ou de suas afiliadas. Certas informações aqui contidas foram obtidas de fontes de terceiros, que podem incluir empresas de portfólio de fundos administrados pela CoinFund. Embora retirado de fontes consideradas confiáveis, o CoinFund não verificou independentemente essas informações e não faz representações sobre a precisão duradoura das informações ou sua adequação para uma determinada situação.

Este conteúdo é fornecido apenas para fins informativos e não deve ser considerado como aconselhamento jurídico, comercial, de investimento ou tributário. Você deve consultar seus próprios conselheiros quanto a esses assuntos. As referências a quaisquer valores mobiliários ou ativos digitais são apenas para fins ilustrativos e não constituem uma recomendação de investimento ou oferta para fornecer serviços de consultoria de investimento. Além disso, este conteúdo não é direcionado nem destinado a ser usado por nenhum investidor ou investidor em potencial e, em nenhuma circunstância, pode ser considerado ao tomar uma decisão de investir em qualquer fundo administrado pela CoinFund. Uma oferta para investir em um fundo CoinFund será feita apenas pelo memorando de colocação privada, contrato de subscrição e outra documentação relevante de qualquer fundo e deve ser lida na íntegra. Quaisquer investimentos ou empresas de portfólio mencionados, referidos ou descritos não são representativos de todos os investimentos em veículos administrados pela CoinFund, e não pode haver garantia de que os investimentos serão lucrativos ou que outros investimentos feitos no futuro terão características ou resultados semelhantes. Uma lista de investimentos feitos por fundos administrados pelo CoinFund (excluindo investimentos para os quais o emissor não deu permissão para o CoinFund divulgar publicamente, bem como investimentos não anunciados em ativos digitais negociados publicamente) está disponível em https://www.coinfund.io/portfolio.

Tabelas e gráficos fornecidos são apenas para fins informativos e não devem ser considerados ao tomar qualquer decisão de investimento. O desempenho passado não é indicativo de resultados futuros. O conteúdo fala apenas a partir da data indicada. Quaisquer projeções, estimativas, previsões, metas, perspectivas e/ou opiniões expressas nestes materiais estão sujeitas a alterações sem aviso prévio e podem diferir ou ser contrárias às opiniões expressas por terceiros. Esta apresentação contém “declarações prospectivas”, que podem ser identificadas pelo uso de terminologia prospectiva, como “pode”, “irá”, “deveria”, “espera”, “antecipa”, “projeta”, “estima”, “pretende”, “continua” ou “acredita” ou seus negativos ou outras variações ou terminologia comparável. Devido a vários riscos e incertezas, os eventos ou resultados reais podem diferir material e adversamente daqueles refletidos ou contemplados nas declarações prospectivas.

local_img

Inteligência mais recente

local_img