Zephyrnet Logo

Entrevista com o CEO: Patrick T. Bowen da Neurophos – Semiwiki

Data:

Patrick T. Bowen Neurofos

Patrick é um empresário com formação em física e metamateriais. Patrick define a visão para o futuro da arquitetura Neurophos e dirige sua equipe em pesquisa e desenvolvimento, especialmente em design de metamateriais. Ele possui mestrado em sistemas Micro-Nano pela ETH Zurich e doutorado em Engenharia Elétrica pela Duke University, sob a orientação do Prof. Após a formatura, Patrick foi cofundador da Metacept com o Prof. Smith; Metacept é o principal centro de comercialização de metamateriais e empresa de consultoria do mundo.

Conte-nos sobre o Neurophos. Que problemas você está resolvendo?
Dizemos que existimos para trazer o poder computacional do cérebro humano para a inteligência artificial. Em 2009, descobriu-se que as GPUs são muito melhores no reconhecimento de gatos na Internet do que as CPUs, mas as GPUs não são a resposta para o futuro das cargas de trabalho de IA. Assim como as GPUs eram melhores que as CPUs para redes neurais, pode haver arquiteturas que são melhores que as GPUs em ordens de magnitude. Neurophos é o que vem a seguir para IA depois das GPUs.

Os grandes modelos de linguagem de IA em geral têm sido limitados porque não tivemos poder computacional suficiente para realizar plenamente seu potencial. As pessoas se concentraram principalmente no lado do treinamento, só porque era necessário treinar algo útil antes mesmo de pensar em implantá-lo. Esses esforços destacaram o incrível poder dos grandes modelos de IA e, com essa prova, as pessoas estão começando a se concentrar em como implantar a IA em escala. O poder desses modelos de IA significa que temos milhões de usuários que os utilizarão todos os dias. Quanta energia custa por usuário? Quanto custa o cálculo por inferência? Se não for barato o suficiente por inferência, isso pode ser muito limitante para as empresas que desejam implantar IA.

A eficiência energética também é um grande problema a resolver. Se você tem um servidor que queima, digamos, 6 quiloWatts, e deseja ir 100 vezes mais rápido, mas não faz nada em relação à eficiência energética fundamental, então esse servidor de 6 quiloWatt de repente se torna um servidor de 600 quiloWatt. Em algum momento você bate em uma parede; você está simplesmente queimando muita energia e não consegue sugar o calor dos chips com rapidez suficiente. E, claro, há questões relacionadas com as alterações climáticas que se somam a tudo isto. Quanta energia está sendo consumida pela IA? Quanta energia adicional estamos desperdiçando apenas tentando manter os data centers refrigerados? Então, alguém precisa primeiro resolver o problema da eficiência energética, e então você poderá ir rápido o suficiente para atender às demandas das aplicações.

As pessoas propuseram o uso de computação óptica para IA quase desde que a IA existe. Há muitas ideias nas quais trabalhamos hoje que também são ideias antigas dos anos 80. Por exemplo, as equações originais para a famosa “capa de invisibilidade dos metamateriais” e outras coisas como o índice negativo de refração remontam aos físicos russos dos anos 60 e 80. Mesmo que tenha sido pensado, foi realmente reinventado por David Smith e Sir John Pendry.

Da mesma forma, as matrizes sistólicas, que normalmente são o que as pessoas querem dizer quando dizem “processador tensor”, são uma ideia antiga do final dos anos 70. A computação quântica é uma ideia antiga dos anos 80 que ressuscitamos hoje. O processamento óptico também é uma ideia antiga dos anos 80, mas naquela época não tínhamos tecnologia para implementá-lo. Assim, com o Neurophos, voltamos a reinventar o transistor óptico, criando desde o início o hardware subjacente necessário para implementar as ideias sofisticadas de computação óptica de muito tempo atrás.

O que fará com que os clientes deixem de usar uma GPU da Nvidia e passem a usar sua tecnologia?
Então, a principal coisa que eu acho que a maioria dos clientes realmente se preocupa é a métrica de dólares por inferência, porque é isso que realmente faz ou quebra seu modelo de negócios. Estamos abordando essa métrica com uma solução que realmente pode aumentar a velocidade de computação em 100x em relação a uma GPU de última geração, tudo dentro do mesmo envelope de potência.

A preocupação ambiental também é algo com que as pessoas se preocupam, e estamos a fornecer uma solução muito real para mitigar significativamente o consumo de energia diretamente numa das suas fontes mais significativas: os datacenters.

Se você parar e pensar em como isso se dimensiona... alguém tem que entregar uma solução aqui, seja nós ou outra pessoa. A largura de banda na embalagem de chips é aproximadamente proporcional à raiz quadrada da área e o consumo de energia na embalagem de chips é geralmente proporcional à área. Isso levou a todos os tipos de formas distorcidas pelas quais tentamos criar e empacotar sistemas.

A embalagem é uma das coisas que realmente tem sido revolucionária para a IA em geral. Inicialmente, tratava-se de custo e da capacidade de misturar chips de diferentes nós de tecnologia e, acima de tudo, de velocidade de acesso à memória e largura de banda, porque você poderia integrar com chips DRAM. Mas agora você está colocando cada vez mais fichas lá!

O uso da abordagem de computação analógica restaura o consumo de energia para computação até a raiz quadrada da área, em vez de proporcional à área. Portanto, agora a maneira como sua computação e consumo de energia são dimensionados é a mesma; você os está equilibrando.

Acreditamos ter desenvolvido a única abordagem até o momento para computação analógica na memória que pode realmente escalar para densidades de computação altas o suficiente para colocar essas leis de escala em ação.

Como os clientes podem interagir com o Neurophos hoje? 
Estamos criando um programa de parceria de desenvolvimento e fornecendo um modelo de software de nosso hardware que permite às pessoas carregar diretamente o código PyTorch e compilá-lo. Isso fornece métricas de rendimento e latência e quantas instâncias por segundo, etc., para o cliente. Ele também nos fornece dados sobre quaisquer gargalos de produtividade no sistema, para que possamos ter certeza de que estamos arquitetando o sistema geral de uma forma que realmente importe para as cargas de trabalho dos clientes.

Em quais novos recursos/tecnologia você está trabalhando?
Há muito tempo que os académicos sonham com o que poderiam fazer se tivessem uma metassuperfície como a que estamos a construir em Neurophos, e há muitos artigos teóricos por aí... mas ninguém alguma vez construiu uma. Somos os primeiros a fazê-lo. Na minha opinião, a maioria das aplicações interessantes são realmente para superfícies dinâmicas, não para estáticas, e há outros trabalhos em andamento na Metacept, Duke e em empresas irmãs como a Lumotive, com os quais eu e acho que o mundo ficará muito entusiasmado. .

Por que você ingressou na Incubadora SC e quais são os objetivos do Neurophos ao trabalhar com sua organização nos próximos 24 meses?

Silicon Catalyst se tornou um acelerador de prestígio para startups de semicondutores, com altos padrões de admissão. Estamos entusiasmados por tê-los como parceiros. As startups de hardware têm uma grande desvantagem em relação às startups de software devido ao seu maior custo de demonstração/protótipo e tempo de ciclo de engenharia, e isso é ainda mais verdadeiro em startups de semicondutores, onde as ferramentas EDA e os custos de máscara e a escala das equipes de engenharia podem ser proibitivamente caro para uma empresa em estágio inicial. O Silicon Catalyst formou um ecossistema incrível de parceiros que fornecem ajuda significativa na redução de custos de desenvolvimento e na aceleração do tempo de lançamento no mercado.

Leia também:

Um bate-papo sincero com Sean Redmond sobre ChipStart no Reino Unido

Entrevista com o CEO: Jay Dawani do Lemurian Labs

Sete empresas de catalisadores de silício exporão na CES, o evento de tecnologia mais poderoso do mundo

Compartilhe esta postagem via:

local_img

Inteligência mais recente

local_img