inteligência artificial (IA) e modelos de linguagem baseados em IA em línguas regionais estão crescendo na Índia. O membro mais recente desse cenário em evolução é Nandi, um modelo de linguagem Telugu, cuidadosamente elaborado pelo cientista de dados freelancer Bharadwaj Swarna. Nandi, com as suas raízes entrelaçadas com simbolismo cultural e precisão linguística, representa um avanço significativo em direção à inclusão e acessibilidade na IA. Vamos nos aprofundar na criação e nas implicações deste novo modelo de língua índica.
Leia também: Microsoft e Sarvam AI colaboram para melhorar a acessibilidade da IA na Índia
A criação da Nandi AI
Bharadwaj Swarna, conhecido por sua experiência em IA e processamento de linguagem natural, embarcou numa jornada alimentada pela paixão pela democratização do acesso à informação. Baseando-se na sua herança cultural, Swarna conceituou Nandi com a visão de superar as barreiras linguísticas, especialmente para quem não fala inglês.
Seu compromisso com a diversidade linguística e a inclusão transparece enquanto Nandi visa facilitar a tradução e a compreensão perfeitas para a comunidade de língua télugo. Através de ajustes meticulosos e melhorias contínuas usando Otimização de preferência direta (DPO), Nandi promete respostas precisas e diferenciadas às consultas no idioma Telugu.
Leia também: Reliance Hanooman: modelo de IA estilo ChatGPT da Índia
Inspiração, treinamento e arquitetura
Nandi é muito inspirado pelos esforços pioneiros de Ramsri Goutham Golla e Ravi Theja Desetty do Telugu LLM Labs. Construído sobre a base do Zephyr-7b-Gemma, ele é treinado em um conjunto de dados robusto com curadoria do Telugu LLM Labs. Ele reflete o espírito colaborativo que impulsiona a exploração linguística, constituindo um testemunho da crescente onda de modelos de linguagem índica que emana da comunidade de desenvolvedores na Índia.
Explorando o cenário da diversidade linguística
Na mesma linha, o Telugu LLM Labs introduziu o Navarasa 2.0 após seu revolucionário modelo Telugu Llama. Esta nova jóia O modelo 7B/2B ajustado por instrução é capaz de processar conteúdo em 15 idiomas indianos junto com o inglês. Enquanto isso, os esforços futuros de Swarna incluem a expansão dos conjuntos de dados para DPO e o refinamento do tokenizador. Isso mostra sua dedicação à melhoria contínua e à inovação no domínio do processamento da linguagem Telugu. À medida que o panorama da IA evolui, iniciativas como estas destacam um impulso concertado no sentido da inclusão linguística.
Leia também: Explore o Krutrim de Ola, a IA que oferece suporte a 10 idiomas indianos
nossa palavra
A revelação de Nandi e os esforços contínuos de indivíduos apaixonados como Bharadwaj Swarna marcam uma conjuntura transformadora na intersecção da IA e da diversidade linguística. A cada modelo e iniciativa, o horizonte da exploração linguística se expande, promovendo um cenário digital mais inclusivo e acessível. Ao celebrarmos a riqueza da língua e do património cultural, abracemos a jornada rumo à equidade linguística. Trabalhemos para um futuro onde cada voz regional encontre ressonância na esfera digital.
Siga-nos no Google News para se manter atualizado com as últimas inovações no mundo da IA, ciência de dados e GenAI.
- Conteúdo com tecnologia de SEO e distribuição de relações públicas. Seja amplificado hoje.
- PlatoData.Network Gerativa Vertical Ai. Capacite-se. Acesse aqui.
- PlatoAiStream. Inteligência Web3. Conhecimento Amplificado. Acesse aqui.
- PlatãoESG. Carbono Tecnologia Limpa, Energia, Ambiente, Solar, Gestão de resíduos. Acesse aqui.
- PlatoHealth. Inteligência em Biotecnologia e Ensaios Clínicos. Acesse aqui.
- Fonte: https://www.analyticsvidhya.com/blog/2024/04/freelance-data-scientist-develops-gemma-based-telugu-model-nandi/