Zephyrnet Logo

Cientista de dados autônomo desenvolve modelo Telugu baseado em Gemma, Nandi

Data:

inteligência artificial (IA) e modelos de linguagem baseados em IA em línguas regionais estão crescendo na Índia. O membro mais recente desse cenário em evolução é Nandi, um modelo de linguagem Telugu, cuidadosamente elaborado pelo cientista de dados freelancer Bharadwaj Swarna. Nandi, com as suas raízes entrelaçadas com simbolismo cultural e precisão linguística, representa um avanço significativo em direção à inclusão e acessibilidade na IA. Vamos nos aprofundar na criação e nas implicações deste novo modelo de língua índica.

Leia também: Microsoft e Sarvam AI colaboram para melhorar a acessibilidade da IA ​​na Índia

Nandi, modelo de língua índica de Bharadwaj Swarna

A criação da Nandi AI

Bharadwaj Swarna, conhecido por sua experiência em IA e processamento de linguagem natural, embarcou numa jornada alimentada pela paixão pela democratização do acesso à informação. Baseando-se na sua herança cultural, Swarna conceituou Nandi com a visão de superar as barreiras linguísticas, especialmente para quem não fala inglês.

Seu compromisso com a diversidade linguística e a inclusão transparece enquanto Nandi visa facilitar a tradução e a compreensão perfeitas para a comunidade de língua télugo. Através de ajustes meticulosos e melhorias contínuas usando Otimização de preferência direta (DPO), Nandi promete respostas precisas e diferenciadas às consultas no idioma Telugu.

Leia também: Reliance Hanooman: modelo de IA estilo ChatGPT da Índia

Inspiração, treinamento e arquitetura

Nandi é muito inspirado pelos esforços pioneiros de Ramsri Goutham Golla e Ravi Theja Desetty do Telugu LLM Labs. Construído sobre a base do Zephyr-7b-Gemma, ele é treinado em um conjunto de dados robusto com curadoria do Telugu LLM Labs. Ele reflete o espírito colaborativo que impulsiona a exploração linguística, constituindo um testemunho da crescente onda de modelos de linguagem índica que emana da comunidade de desenvolvedores na Índia.

Explorando o cenário da diversidade linguística

Na mesma linha, o Telugu LLM Labs introduziu o Navarasa 2.0 após seu revolucionário modelo Telugu Llama. Esta nova jóia O modelo 7B/2B ajustado por instrução é capaz de processar conteúdo em 15 idiomas indianos junto com o inglês. Enquanto isso, os esforços futuros de Swarna incluem a expansão dos conjuntos de dados para DPO e o refinamento do tokenizador. Isso mostra sua dedicação à melhoria contínua e à inovação no domínio do processamento da linguagem Telugu. À medida que o panorama da IA ​​evolui, iniciativas como estas destacam um impulso concertado no sentido da inclusão linguística.

Leia também: Explore o Krutrim de Ola, a IA que oferece suporte a 10 idiomas indianos

Modelos de linguagem índica | IA na Índia | Nandi IA

nossa palavra

A revelação de Nandi e os esforços contínuos de indivíduos apaixonados como Bharadwaj Swarna marcam uma conjuntura transformadora na intersecção da IA ​​e da diversidade linguística. A cada modelo e iniciativa, o horizonte da exploração linguística se expande, promovendo um cenário digital mais inclusivo e acessível. Ao celebrarmos a riqueza da língua e do património cultural, abracemos a jornada rumo à equidade linguística. Trabalhemos para um futuro onde cada voz regional encontre ressonância na esfera digital.

Siga-nos no Google News para se manter atualizado com as últimas inovações no mundo da IA, ciência de dados e GenAI.

local_img

Inteligência mais recente

local_img