제퍼넷 로고

WellSaid Labs는 인공 지능을 통해 합성 음성 사업을 활성화하기 위해 10 만 달러를 모금했습니다.

시간


WellSaid 소프트웨어
WellSaid Labs는 텍스트 음성 변환 애플리케이션을 위한 자연스러운 음성 아바타를 만듭니다. (WellSaid Labs 그래픽)

웰사이드 연구소 AI 생성 합성 음성의 폭넓은 합창을 작동시키려는 시애틀 스타트업의 노력을 강화하는 데 사용될 천만 달러의 새로운 투자 덕분에 앞으로 몇 년 동안 더 많은 이야기를 할 것입니다.

시리즈 A 자금 조달 라운드 — 주도 퓨즈, 초기 단계의 벤처 캐피탈 회사 Seattle Seahawks의 스타 라인배커 Bobby Wagner를 파트너로 포함s — WellSaid가 2년에 모금한 종자 자금 2019만 달러에 대한 후속 조치입니다. 시애틀 앨런 인공지능연구소에서 분사.

이전 시드 라운드의 투자자 중 한 명은 보이저 캐피탈, 새로 발표된 시리즈A 펀딩에 기여했습니다. 그래서 그랬데 퀄컴 벤처좋은 친구.

웰사이드 CEO 매트 호킹 새로운 자금은 직원이 XNUMX명인 텍스트 음성 변환 스타트업을 성장시키는 데 사용될 것이라고 말했습니다.

WellSaid Labs CEO Matt Hocking.

Hocking은 GeekWire에 “우리가 수행하고 있는 연구와 기술을 지속적으로 개선하기 위해 여기서 수행 중인 연구를 두 배로 늘려야 합니다.”라고 말했습니다. “게다가 우리의 제품 제공을 확장하고 더 다양하고 흥미로운 방식으로 더 많은 고객에게 서비스를 제공할 채용인이 분명히 있습니다. 그리고 그뿐만 아니라 우리는 확실히 영업팀에 집중하고 이를 구축하고 있습니다.”

WellSaid Labs의 플랫폼은 오디오 제작 플랫폼을 통해 사내 교육 자료부터 빠르게 인기를 끄는 소셜 미디어 비디오에 이르기까지 다양한 응용 분야에 사용할 수 있도록 다양한 종류의 자연스러운 합성 음성을 제공합니다.

Hocking은 “우리는 인간보다 더 나은 목소리를 만들려고 노력하지 않습니다. “우리가 여기 있는 이유는 그게 아닙니다. 빠른 처리가 필요하거나 지속적으로 업데이트해야 하거나 관련 예산이 없는 내부 콘텐츠일 뿐이기 때문에 많은 콘텐츠가 음성으로 처리되지 않습니다.”

WellSaid가 도움이 되는 상황입니다. Hocking은 “보통 대안이 없는 프로덕션에 음성을 추가할 수 있는 기회가 열립니다.”라고 말했습니다.

그는 고객 이름을 밝히기를 거부했지만 WellSaid의 웹사이트에는 Nokia, 샌프란시스코 캘리포니아 대학, Blue Sky eLearn 및 Sobeys라는 캐나다 식품 소매업체의 추천 목록이 나와 있습니다.

WellSaid는 인간의 음성 패턴을 기반으로 한 XNUMX개 이상의 텍스트 음성 변환 아바타를 제공합니다. 자동차 세일즈맨의 활기 넘치는 말투마치 여성 연구자가 하는 것처럼 들리는 말도 안 되는 낭송. 회사는 자사의 소프트웨어가 짧은 오디오 클립의 자연스러움에 대해 "인간 패리티"를 달성했다고 주장합니다.

하지만 잠깐만요... 더 많은 것이 있습니다. 고객은 브랜드 음성의 말하기 스타일을 캡처하여 사양에 맞게 자신만의 "AI 음성 아바타"를 만들 수 있습니다. 이론적으로 WellSaid는 Jeff Bezos를 스튜디오로 데려와 마치 전 Amazon CEO가 신입사원들에게 환영 메시지를 읽어주는 것처럼 들리게 하는 합성 음성을 생성할 수 있습니다. (현실적으로 그러한 필요성이 발생한다면 Amazon은 아마도 자체 음성 합성 팀이 그 일을 맡게 될 것입니다.)

시간이 지남에 따라 WellSaid는 레퍼토리를 추가하고 합성 음성의 충실도를 높이는 것을 목표로 합니다. 미래에는 회사의 목소리가 비디오 게임에서 말하는 역할을 하거나 컴퓨터로 생성된 뉴스 프로그램의 대본을 읽거나 소비자와 복잡한 실시간 상호 작용에 참여할 수도 있습니다.

이 모든 것은 WellSaid의 기술과 비즈니스 모델에 대한 더 깊은 질문을 제기합니다. 우선, 누군가가 조 바이든 대통령의 목소리를 악의적인 목적으로 합성하는 것을 막으려면 어떻게 해야 할까요?

Hocking은 “우리는 우리의 기술이 올바른 목적을 위해 올바른 방식으로 사용되도록 보장할 책임이 분명히 있습니다.”라고 말했습니다. “우리는 실제 음성을 기반으로 도메인별 음성을 만듭니다. 우리는 누군가의 동의 없이는 절대 가서 목소리를 내지 않을 것입니다.”

그리고 비즈니스 모델에 있어서 WellSaid가 자체 음성 합성 플랫폼을 보유하고 있는 Google, Amazon 및 Microsoft와 같은 회사와 어떻게 경쟁할 수 있을까요?

Hocking은 “그들이 TTS(텍스트 음성 변환)를 하기 때문에 우리는 그들과 경쟁하고 있습니다.”라고 인정했습니다. "그러나 우리는 TTS가 무엇인지 재설계하고 재창조했습니다."

Hocking은 WellSaid가 텍스트 음성 변환 기술의 새로운 응용 프로그램을 추구하기에 적합한 위치에 있다고 주장했습니다. “우리는 이러한 다른 흥미로운 사용 사례를 접했습니다.”라고 그는 설명했습니다. "XNUMX년 전만 해도 영화 세트장에서만 가능했던 것들이 이제는 다른 관점에서 가능해졌습니다."

그리고 Hocking의 관점에서 볼 때 시애틀은 음성 합성 분야를 더욱 발전시키기에 적합한 장소입니다.

“우리 팀의 대다수는 시애틀 출신입니다.”라고 그는 지적했습니다. "우리는 모두 여기서 만났고, 우리가 선호하는 것은 분명히 그 지역에 사람들이 사는 것입니다. 여기에 훌륭한 인재가 있다고 느낄 뿐만 아니라 사업을 구축하기에 좋은 곳이라고 느끼기 때문입니다."

PlatoAi. Web3 재창조. 데이터 인텔리전스 증폭.
액세스하려면 여기를 클릭하십시오.

출처: https://www.geekwire.com/2021/wellsaid-labs-raises-10-million-boost-synthetic-voice-business-fueled-ai/

spot_img

최신 인텔리전스

spot_img