제퍼넷 로고

프리랜서 데이터 과학자, Gemma 기반 Telugu 모델 Nandi 개발

시간

인공 지능 (AI) 및 AI 기반 언어 모델이 인도에서 지역 언어로 급성장하고 있습니다. 이 진화하는 환경의 최신 멤버는 프리랜스 데이터 과학자 Bharadwaj Swarna가 정교하게 제작한 Telugu 언어 모델인 Nandi입니다. 문화적 상징성과 언어적 정확성에 뿌리를 두고 있는 Nandi는 AI의 포용성과 접근성을 향한 중요한 진전을 나타냅니다. 이 새로운 인도어 언어 모델의 생성과 의미를 자세히 살펴보겠습니다.

또한 읽기 : Microsoft와 Sarvam AI, 인도의 AI 접근성 향상을 위해 협력

Nandi, Bharadwaj Swarna의 인도어 모델

Nandi AI의 창조

AI 분야의 전문 지식으로 유명한 Bharadwaj Swarna 자연어 처리, 정보에 대한 접근을 민주화하려는 열정으로 여정을 시작했습니다. Swarna는 자신의 문화 유산을 바탕으로 특히 영어를 사용하지 않는 사람들의 언어 장벽을 해소하려는 비전으로 Nandi를 개념화했습니다.

언어적 다양성과 포괄성에 대한 그의 헌신은 Nandi가 텔루구어를 사용하는 커뮤니티의 원활한 번역과 이해를 촉진하는 것을 목표로 함에 따라 빛을 발합니다. 세심한 미세 조정과 지속적인 개선을 통해 직접 선호도 최적화 (DPO) Nandi는 텔루구어 쿼리에 정확하고 미묘한 응답을 약속합니다.

또한 읽기 : Reliance Hanooman: 인도의 ChatGPT 스타일 AI 모델

영감, 교육 및 아키텍처

Nandi는 Telugu LLM Labs의 Ramsri Goutham Golla와 Ravi Theja Desetty의 선구적인 노력에서 큰 영감을 받았습니다. Zephyr-7b-Gemma를 기반으로 구축되었으며 Telugu LLM Labs에서 선별한 강력한 데이터 세트를 기반으로 교육되었습니다. 이는 인도 개발자 커뮤니티에서 발생하는 인도어 언어 모델의 급증세에 대한 증거로서 언어 탐구를 주도하는 협업 정신을 반영합니다.

언어 다양성의 풍경 탐구

같은 추세에 따라 Telugu LLM Labs는 혁신적인 Telugu Llama 모델 이후 Navarasa 2.0을 도입했습니다. 이 새로운 아체 7B/2B 명령 조정 모델은 영어와 함께 15개 인도 언어로 콘텐츠를 처리할 수 있습니다. 한편 Swarna의 향후 노력에는 DPO용 데이터 세트 확장 및 토크나이저 개선이 포함됩니다. 이는 텔루구어 언어 처리 영역의 지속적인 개선과 혁신에 대한 그의 헌신을 보여줍니다. AI 환경이 발전함에 따라 이와 같은 이니셔티브는 언어적 포용성을 향한 공동 추진을 강조합니다.

또한 읽기 : 10가지 인도 언어를 지원하는 AI인 Ola의 Krutrim을 살펴보세요.

인도어 모델 | 인도의 AI | 난디 AI

우리말

Nandi의 공개와 Bharadwaj Swarna와 같은 열정적인 개인의 지속적인 노력은 AI와 언어 다양성의 교차점에서 획기적인 전환점을 표시합니다. 각 모델과 이니셔티브를 통해 언어 탐구의 지평이 확장되어 보다 포괄적이고 접근 가능한 디지털 환경이 조성됩니다. 언어와 문화유산의 풍부함을 기리면서 언어적 평등을 향한 여정을 함께 합시다. 모든 지역의 목소리가 디지털 영역에서 공명하는 미래를 향해 노력합시다.

우리를 따라 오세요 구글 뉴스 AI, 데이터 과학 및 세계의 최신 혁신에 대한 최신 소식을 받아보세요. GenAI.

spot_img

최신 인텔리전스

spot_img