제퍼넷 로고

WellSaid는 고품질 합성 음성을 위해 $ 10MA 라운드를 유치합니다.

시간

실물로 착각 할 수있는 합성 음성을 만드는 도구를 사용하는 WellSaid Labs는 비즈니스 성장을 위해 10 만 달러의 시리즈 A를 모금했습니다. 이 회사의 집에서 만든 텍스트 음성 변환 엔진은 실시간보다 빠르게 작동하며 빠른 스 니펫에서 몇 시간 길이의 판독에 이르기까지 거의 모든 길이의 자연스러운 사운드 클립을 생성합니다.

WellSaid는 2019 년 AI 인큐베이터를위한 Allen Institute에서 나왔습니다., 그 목표는 교육 및 마케팅 콘텐츠와 같은 일반적인 비즈니스 목적에 적합하지 않은 합성 음성을 만드는 것이 었습니다.

먼저 Google과 학술 연구자들이 개발 한 음성 엔진 인 Tacotron을 기반으로 솔루션을 구축했습니다. 그러나 곧보다 효율적인 자체를 구축하여보다 설득력있는 음성을 생성하고 임의 길이의 클립을 생성 할 수있었습니다. 음성 엔진은 종종 몇 개의 문장 후에 작동하여 옹알이로 내려가거나 어조를 잃지 만 WellSaid의 딸꾹질없이 Mary Shelley의 "Frankenstein"전체 읽기.

음성은 청취자에 의해 인간 또는 인간으로 평가 될만큼 충분히 좋았습니다. 일반적인 가상 비서 용의자들이 몇 단어 이상을 말할 때 실제로 말할 수있는 것은 아닙니다. 뿐만 아니라 음성이 실시간보다 훨씬 빠르게 생성되었습니다. 다른 고품질 옵션은 종종 실시간으로 XNUMX 분의 XNUMX 이하로 작동합니다. 즉, WellSaid에서 XNUMX 분 음성을 생성하는 데 XNUMX 분, XNUMX 분 이상이 소요됩니다. Tacotron에 의해.

마지막으로,이 시스템은 신뢰할 수있는 회사 대변인 또는 성우 아티스트와 같은 기존 성우를 기반으로 새로운 "보이스 아바타"를 만들 수 있습니다. 원래는 그들의 특징과 음성 스타일의 모델을 구축하는 데 약 20 시간의 오디오가 필요했지만 이제는 단 XNUMX 시간 만에 그렇게 할 수 있다고 CEO Matt Hocking이 말했습니다.

이 회사는 현재 비즈니스에 엄격하게 초점을 맞추고 있습니다. 즉, 음성을 아바타 등으로 디지털화 할 수있는 사용자 용 앱이 없습니다. 수반되는 위험이 있고 이에 대한 현실적인 비즈니스 모델이 없으므로 지금은 그럴 필요가 없습니다.

그러한 현실적인 목소리는 여전히 장애를 가진 사람들에게 큰 도움이 될 수 있지만 Hocking은 인정하지만 아직 대처할 준비가되어 있지 않다는 것을 인정합니다.

WellSaid Labs의 합성 음성 인터페이스의 스크린 샷입니다.

이미지 크레딧 : 웰사이드 연구소

"우리는 비언어적 의사 소통 자, 비영리 단체 및 다른 사람들이이 기술의 혜택을 누릴 수 있도록이 기술에 대한 액세스를 확대하기 위해 최선을 다하고 있습니다."라고 그는 말했습니다.

그 동안 회사는 첫 번째 시장, 기업 교육 비디오에서 마케팅, 긴 카피, 상당한 텍스트 및 앱 경험을 갖춘 대화 형 제품으로 확장했습니다. 이 아바타의 기반이되는 재능이 음성의 디지털 유사성을 만드는 데 도움이되는 적절한 보상을 받기를 바랍니다.

초과 가입 된 10 만 달러의 라운드는 FUSE가 주도했으며 재 투자자 Voyager, Qualcomm Ventures LLC 및 GoodFriends의 참여로 모두 제품 및 비즈니스 성장에 깊은 인상을 받았습니다. 합성 음성은 몇 가지 인기있는 사용 사례를 제공했지만 콘텐츠는 그다지 크지 않았으므로 성장할 여지가 충분합니다. 회사는 제품 제공을 심화하고 함께 팀을 성장시키는 데 돈을 투자 할 것입니다.

PlatoAi. Web3 재창조. 데이터 인텔리전스 증폭.

액세스하려면 여기를 클릭하십시오.

출처 : https://techcrunch.com/2021/07/07/wellsaid-attracts-10m-a-round-for-higher-quality-synthetic-speech/

spot_img

최신 인텔리전스

spot_img