Zephyrnet Logo

Como a “Tradução como serviço” da Unbabel traduzirá tudo para a qualidade humana

Data:

Em um US $ 38 bilhões por ano mercado de serviços de tradução e localização, o maior jogador é um empreiteiro militar que ganha US $ 730 milhões por ano. O restante do Top 10 ganha entre US $ 80 e US $ 430 milhões por ano.

É um mercado extremamente fragmentado, com uma longa cauda de participantes que operam modelos de negócios muito semelhantes - mercados que processam briefings do cliente de um lado, e grandes grupos de tradutores profissionais do outro, que concorrem pelo trabalho com base em suas habilidades, experiência e cotações. Uma vez que uma licitação é ganha, cada tradutor irá então começar a aplicar sua arte a um conteúdo de cada vez. Precisa de mais idiomas? Contrate mais tradutores.

É como as coisas sempre funcionaram. Mas a história recente mostra que o que não é escalável não é sustentável. E, uma vez que você encontre uma nova maneira de fazer as coisas, enormes novos mercados de potencial inexplorado estarão disponíveis para serem conquistados.

Mercado de Tradução

Para a Unbabel, a tradução tal como existe atualmente é parte do problema.

Como você traduz tudo?

E se você quiser traduzir todas as informações do mundo para todos os idiomas e quase instantaneamente? Não apenas documentos legais, termos e condições e catálogos de produtos, mas cada e-mail, cada conversa de chat, cada legenda, cada pedaço de conteúdo imaginável.

Para enfrentar o desafio, você precisa repensar fundamentalmente como a tradução funciona. Não como um problema de “jogar mais gente nisso”, mas como um problema de software em que um processo pode ser definido e continuamente aprimorado para produzir uma saída de melhor qualidade.

Algumas empresas de tecnologia já vêem o mundo dessa forma, mas não conseguem ver as necessidades da maioria das empresas e organizações em fazer a ponte entre o enorme abismo entre a tradução automática mais avançada e o que parece ter sido feito "à moda antiga" - ou seja, por um ser humano real.

Para serem levadas a sério, as empresas modernas precisam de uma solução que possa entender o contexto envolvente de tom, estilo e subtexto e detectar os erros esquecidos na pressa de automatizar totalmente.

Sapateiros x produção de sapatos

Para entender o que a Unbabel está fazendo com a tradução, pense na fabricação de calçados no século XVIII.

Em toda a história da humanidade, os sapatos foram feitos um de cada vez à mão. Em uma escala tão pessoal, cada par era confeccionado para seu dono com grande gasto de tempo e energia e, conseqüentemente, era um serviço realizado por apenas uma pequena porcentagem da população.

Mas, em meados do século 18, a fabricação de calçados começou a ser comercializada em uma escala nunca antes vista. Uma indústria artesanal explodiu para abater as pessoas do mundo em processo de industrialização, com milhares de sapateiros trabalhando sem parar para acompanhar a demanda (muito parecido com a longa cauda das agências de tradução mencionadas anteriormente).

As Guerras Napoleônicas proporcionaram um impulso para a mecanização do processo de produção, com o famoso engenheiro inglês Marc Brunel desenvolvendo máquinas para a produção em massa de botas para soldados do Exército Britânico. Um visitante de sua fábrica em Battersea escreveu o seguinte:

“Cada passo nele é efetuado pelas máquinas mais elegantes e precisas ... todos os detalhes são executados pela aplicação engenhosa dos poderes mecânicos; e todas as peças são caracterizadas por precisão, uniformidade e exatidão. Como cada homem realiza apenas uma etapa do processo, o que implica nenhum conhecimento do que é feito por aqueles que o precedem ou seguem, então as pessoas empregadas não são sapateiros, mas soldados feridos, que podem aprender seus respectivos deveres em um algumas horas."

Se você deseja remover as barreiras do idioma completamente, se deseja permitir que todos entendam e sejam compreendidos em qualquer idioma, em qualquer meio, então você precisa abstrair o problema da tradução a um nível muito mais alto do que “mais pessoas”.

Você precisa dividi-lo em uma série de etapas com trabalho preciso, uniforme e preciso por máquinas, guiadas por mãos humanas em intervalos chave, e não necessariamente por especialistas que antes faziam esse trabalho inteiramente por si próprios.

Um pouco como a fábrica de sapatos de Brunel.

Pipeline de linguagem da Unbabel

O que garante a qualidade na Unbabel não é a qualidade dos próprios tradutores - que mesmo em um nível profissional pode variar muito e são naturalmente propensos a erro humano (sendo, er, humanos) - mas a qualidade do pipeline que produz o trabalho em passos precisos, uniformes e precisos.

O trabalho humano ainda é necessário, mas em momentos não críticos em que eles corrigem e editam o trabalho da máquina, em vez de encarregar-se de todo o trabalho a ser feito. Ele remove a dependência humana, mas aumenta muito seu valor para as correções de qualidade em geral e permite uma taxa de transferência de conteúdo exponencialmente maior.

Em um alto nível, o Unbabel ingere conteúdo de texto em um idioma de origem em uma extremidade e o envia aos clientes em um ou todos os outros 27 idiomas de destino.

Olhando mais de perto, há uma série de outras etapas que acontecem entre A e B.

Pipeline de tradução

Encomenda

Um pedido é um trecho de texto que precisa ser traduzido. Pode ser um e-mail de atendimento ao cliente em uma plataforma como Salesforce, Zendesk ou Freshdesk, ou uma das milhões de descrições de produtos em uma plataforma global de comércio eletrônico, ou legendas para centenas de horas de filmagem de vídeo.

Cada tipo de conteúdo terá seu próprio fluxo personalizado no pipeline, colocando diferentes pesos de prioridade em aspectos como qualidade e velocidade, mas o processo geral é praticamente o mesmo para todos os textos.

PREPARAÇÃO

Nesta fase, a Unbabel analisa o texto fonte, detectando e determinando uma série de fatores que irão influenciar sua jornada pelo pipeline.

Primeiro, várias ações são realizadas com base no cliente Unbabel de onde o texto vem. Glossários personalizados e guias de estilo que fazem parte do processo de integração são automaticamente marcados para pedidos, e informações confidenciais, como números de cartão de crédito, são criptografadas e tornadas anônimas.

São feitas análises sofisticadas no idioma de origem, detectando elementos difíceis de traduzir, como locais, nomes e endereços, e estimando a dificuldade geral do texto, com base no vocabulário usado, comprimentos de frases e outros padrões gramaticais.

Um modelo é construído unindo esses dados com outros insights sobre o tom do documento (formal x informal), além de detectar
ing seu tópico, o que permite o encaminhamento inteligente do conteúdo para determinados editores por seus interesses declarados (viagens, esportes, médicos, entretenimento, etc).

Tradução Automática Adaptada da Unbabel

Tradução Automática Adaptada

Feita essa preparação, o primeiro trabalho de tradução é feito inteiramente por máquina. Para começar, o Unbabel verifica seu Memória de Tradução - um armazenamento enorme e dinâmico de dados que garante que, se uma frase completa já tiver sido feita para o mesmo cliente ou mesmo domínio, ela seja recuperada e reutilizada, permitindo uma melhoria potencial na velocidade de entrega e consistência da tradução (embora ainda possa ser alterado posteriormente por editores humanos se o contexto estiver incorreto).

A próxima etapa é por meio do Roteador de tradução automática, que escolhe os melhores motores MT especializados, com base no conteúdo, domínio e cliente (um e-mail do cliente versus descrições de produtos de relógios de luxo feitos à mão têm requisitos diferentes).

O conteúdo traduzido automaticamente vai para o Pós-editor automático, onde a Unbabel é capaz de melhorar essas traduções automaticamente, aprendendo com o que a rede humana já fez no passado. Isso produz uma nova versão a ser avaliada quanto à qualidade (usando nosso sistema de estimativa de qualidade premiado) e distribuído para as pessoas certas na comunidade da Unbabel.

Seleção do Editor

Seleção do Editor

A Unbabel tem uma comunidade global de 50,000 pessoas encarregadas de revisar os resultados dessa tradução automática adaptada. Mas como saber quem fica com qual tarefa?

Existem vários critérios para a seleção do editor, mas os principais se resumem a: quem está disponível, quão bem avaliados eles são para certos tipos de conteúdo e quão urgentes são as tarefas que precisam ser concluídas.

A prioridade da tarefa é avaliada pelos SLAs do cliente e outros fatores e são classificados em uma fila verde e uma vermelha. Todas as tarefas começam na fila verde, e em um mundo ideal não há fila vermelha, mas ela existe para backup e redundância, garantindo que os prazos sejam cumpridos.

Seleção de editor inteligente

Além disso, temos feito testes que mostram que os editores que estão emparelhados com o conteúdo pelo qual expressam interesse têm melhor desempenho nas tarefas.

SmartCheck

SmartCheck

Assim que as pessoas certas realizam as tarefas certas, a Unbabel começa a ajudá-las a fazer o melhor trabalho possível, no menor tempo possível.

O Smartcheck do Unbabel é como uma versão sobrecarregada da Correção gramatical encontrada em editores de documentos comuns. Ele verifica uma gama de erros potenciais com sugestões úteis para correções de um toque, incluindo ortografia, tom, consistência lexical (concordância de sujeito e verbo; correspondência de pronomes; gênero, etc.) e regras mais específicas relacionadas aos requisitos declarados do cliente.

É ineficiente fazer com que cada editor leia os guias de estilo de cada cliente, então o Smartcheck sobrepõe dicas automaticamente ao longo do texto, tornando rápido e fácil corrigir erros não gramaticais como tonalidades subjetivas versus objetivas ou escrever números como palavras em vez de dígitos.

Rede de Autoaprendizagem da Unbabel

Network

A mágica de todo esse processo é que quanto mais o Unbabel traduz, melhores se tornam os resultados do sistema. Os mecanismos de tradução automática podem ser retreinados, as memórias de tradução podem ser ampliadas e a pós-edição automática melhora a cada passagem de novo texto.

Quanto mais você joga, melhor fica.

Empresas internacionais como Pinterest, Skyscanner, Under Armour, Trello e Oculus VR confiam na plataforma empresarial da Unbabel para abrir e fazer crescer novos mercados.

Para agendar uma demonstração, entre em contato hoje.

Fonte: https://unbabel.com/blog/translate-human-quality/

local_img

Inteligência mais recente

local_img