Google Tradutor adiciona 110 novos idiomas e traz o português de Portugal

31 Comentários

[Atualização: Português de Portugal já está disponível! Ver no final do artigo]

A Google anunciou hoje que o Google Tradutor (Google Translate) suporta agora mais 110 idiomas. A adição mais notável é o cantonês, que tem mais de 85 milhões de falantes. Além disso, a empresa refere um foco maior nas variações linguísticas. Será agora que teremos no Google Tradutor o português de Portugal?

Ilustração Google Tradutor com português de Portugal


Apoio à tradução para mais de 500 mil milhões de pessoas

Do cantonês ao Qʼeqchiʼ, estas novas línguas representam mais de 614 milhões de falantes, permitindo traduções para cerca de 8% da população mundial. Algumas são as principais línguas mundiais, com mais de 100 milhões de falantes; outras são faladas por pequenas comunidades de povos indígenas; e algumas quase não têm falantes nativos, mas têm esforços ativos de revitalização.

Cerca de um quarto das novas línguas provém de África, representando a maior expansão de línguas africanas até à data, incluindo Fon, Kikongo, Luo, Ga, Swati, Venda e Wolof.

Agora, o Google Translate (Google Tradutor) suporta mais 110 idiomas. A empresa observa que o seu modelo de linguagem grande PaLM 2 foi fundamental para ajudar o Tradutor a aprender com mais eficiência idiomas intimamente relacionados.

Em 2022, adicionámos 24 novos idiomas utilizando a tradução automática Zero-Shot, em que um modelo de aprendizagem automática aprende a traduzir para outro idioma sem nunca ter visto um exemplo. E anunciámos a Iniciativa 1.000 Línguas, um compromisso para criar modelos de IA que suportem as 1.000 línguas mais faladas em todo o mundo.

Agora, estamos a utilizar a IA para expandir a variedade de idiomas que suportamos. Graças ao nosso modelo de linguagem de grande dimensão PaLM 2, estamos a lançar 110 novos idiomas no Google Translate, a nossa maior expansão de sempre.

Eis algumas das novas línguas suportadas pelo Google Tradutor:

  • O afar é uma língua tonal falada no Djibuti, na Eritreia e na Etiópia. De todas as línguas neste lançamento, o Afar foi a que recebeu mais contribuições voluntárias da comunidade.
  • O cantonês é, desde há muito, uma das línguas mais solicitadas pelo Google Translate. Como o cantonês sobrepõe-se frequentemente ao mandarim na escrita, é difícil encontrar dados e treinar modelos.
  • O manx é a língua celta da Ilha de Man. Quase foi extinta com a morte do seu último falante nativo em 1974. Mas graças a um movimento de revitalização em toda a ilha, existem agora milhares de falantes.
  • O NKo é uma forma normalizada das línguas Manding da África Ocidental que unifica muitos dialetos numa língua comum. O seu alfabeto único foi inventado em 1949 e tem uma comunidade de investigação ativa que desenvolve recursos e tecnologia para ele atualmente.
  • Punjabi (Shahmukhi) é a variedade do Punjabi escrita em escrita perso-árabe (Shahmukhi) e é a língua mais falada no Paquistão.
  • O tamazight (Amazigh) é uma língua berbere falada no Norte de África. Embora existam muitos dialetos, a forma escrita é geralmente compreensível para todos. Escreve-se em escrita latina e em escrita Tifinagh, ambas suportadas pelo Google Tradutor.
  • Tok Pisin é um crioulo de base inglesa e a língua franca da Papua-Nova Guiné. Se fala inglês, tente traduzir para Tok Pisin – talvez consiga perceber o significado!

Finalmente é referido o suporte ao português de Portugal

As línguas têm uma enorme quantidade de variações: variedades regionais, dialetos, diferentes padrões ortográficos. De facto, muitas línguas não têm uma forma padrão, pelo que é impossível escolher a variedade “certa”.

Na informação partilhada no seu blog, a abordagem é dar prioridade às variedades mais utilizadas de cada língua. Por exemplo, o Romani é uma língua que tem muitos dialetos em toda a Europa. Os modelos produzem um texto que se aproxima mais do Romani do Vlax do Sul, uma variedade comummente utilizada online. Mas também misturam elementos de outras, como o Vlax do Norte e o Romani dos Balcãs.

Aqui, conforme é descrito pela da empresa, cabe o português de Portugal. E, apesar da versão atual da aplicação Google Tradutor não estar ainda a fazer esta destrinça, a ideia será haver uma maior correção na tradução do nosso idioma.

Pode começar a traduzir a partir de translate.google.com ou através da app Google Translate para Android e para iOS.

[Atualização: Português de Portugal já está disponível!]

O nosso idioma já está disponível para os utilizadores, tanto na app para Android como na app para iOS. Bastará mudar o idioma de Português do Brasil para Português de Portugal e passará a usar o novo idioma.

Comentários

31

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *

  1. Avatar de PM
    PM

    Vamos ver se é PT/PT e não PT/BR. Sim porque Português, sempre foi Português. Disso não tenho dúvidas.

    1. Avatar de Aves
      Aves

      E o PT/BR é Português (embora haja brasileiros e portugueses que digam que não). O PT/Alentejano também.

      1. Avatar de anonimo
        anonimo

        Não tem nada a ver…. PT-PB não é português de Portugal. Eu já estou farto até nos call Centers ter que andar a tentar perceber o brasileiro. Eu não vejo novelas, não percebo patavina o que dizem. Já tive que pedir que me passassem para alguém que falasse português.

        1. Avatar de Camões
          Camões

          +1
          Português é de Portugal e Ilhas, tudo o resto são dialectos.

          1. Avatar de Tiago Ferreira
            Tiago Ferreira

            +1

  2. Avatar de Carlos Castanheira
    Carlos Castanheira

    Finalmente! Vamos ver se funciona bem

    1. Avatar de AlexS
      AlexS

      Latinam translationem habet

  3. Avatar de Manuel Espamo Pau
    Manuel Espamo Pau

    Era interessante meterem o mirandes

    1. Avatar de freakonaleash
      freakonaleash

      a língua que vive dos fundos

  4. Avatar de Anung
    Anung

    Não existe português de Portugal e português do Brasil.
    Existe português e português do Brasil.

    1. Avatar de Aindanaoseitudo
      Aindanaoseitudo

      Verdade, há sites que sabem a diferença (ver foto), parece que a Google quer meter tudo no mesmo saco.
      Sapos e Rãs para a Google também deve ser a mesma coisa.

      https://postimg.cc/PNCTmWDQ

    2. Avatar de _RJCA_
      _RJCA_

      Que na verdade deveria chamar-se de “Brasileiro”

    3. Avatar de Aindanaoseitudo
      Aindanaoseitudo

      https://postimg.cc/PNCTmWDQ

      Verdade, há sites que sabem a diferença (ver foto), parece que a Google quer meter tudo no mesmo saco.
      Sapos e Rãs para a Google também deve ser a mesma coisa.

      https://postimg.cc/PNCTmWDQ

    4. Avatar de nunof
      nunof

      Português®

  5. Avatar de Adolfo Dias
    Adolfo Dias

    O português é tão inútil que até metem brasileiros a comentar futebol tuga hahahaha

  6. Avatar de Vitor
    Vitor

    Finalmente o bus é autocarro

    1. Avatar de _RJCA_
      _RJCA_

      tens o caso pratico duma “xerox”. Na nossa lingua é uma “fotocópia”…

  7. Avatar de Dr. X
    Dr. X

    A unica empresa a fazer traduções de confiança é a Vasco ( http://www.vasco-tranlator.pt ), sou medico nas Urgencias do São João e desde falar, tradução de documentos é o único tradutor que até hoje faz as mesmas acertadas, google tradutor é para esquecer completamente é pura recolha de informação.

    1. Avatar de 2 dedos de testa
      2 dedos de testa

      melhor comentário aqui, deu para aprender algo, obrigado Dr.

    2. Avatar de _RJCA_
      _RJCA_

      De certeza que é esse endereço? A mim deu-me este erro no Firefox:

      Hum. Estamos a ter problemas em encontrar esse site.

      Não é possível estabelecer a ligação ao servidor em http://www.vasco-tranlator.pt.

      Se inseriu o endereço correto, pode:

      Tentar novamente mais tarde
      Verificar a sua ligação à rede
      Verificar se Firefox tem permissão para aceder à Internet (pode estar ligado, mas atrás de uma firewall)

  8. Avatar de bin
    bin

    Será que é o fim do pesadelo? É que, sem ofensa para os brasileiros, podes usar as mesmas palavras numa frase e o sentido é completamente diferente.

  9. Avatar de Zé Alfa
    Zé Alfa

    Seja qual for a forma como olhamos para o português que se fala no Brasil, não deixa de ser a expressão de um povo, produto de uma amálgama de diferentes culturas e dinâmicas.

    1. Avatar de _RJCA_
      _RJCA_

      Ninguém diz o contrário e é tudo uma questão de semântica mas porque razão o povo do “Brasil” não fala “brasileiro” mas sim “português do brasil”? Por acaso o país deles chama-se “portugal do brasil”?

      1. Avatar de Zé Alfa
        Zé Alfa

        A linguística chama-lhe variante. Independentemente dos afastamentos, o português do Brasil será sempre isso, uma variante da matriz portuguesa.
        Veja-se, a este propósito, o caso dos EUA, que continuam a chamar ao seu idioma American English.

      2. Avatar de nunof
        nunof

        Porquê os americanos falam americano, os argentinos, argentino, os chilenos, chileno certo?

  10. Avatar de Zé Alfa
    Zé Alfa

    A linguística chama-lhe variante. Independentemente dos afastamentos, o português do Brasil será sempre isso, uma variante da matriz portuguesa.
    Veja-se, a este propósito, o caso dos EUA, que continuam a chamar ao seu idioma American English.

    1. Avatar de nunof
      nunof

      E não tens o British English???

  11. Avatar de João Ferreira
    João Ferreira

    Então agora os burlões já vão conseguir enviar mails e mensagens em PT-PT……

  12. Avatar de mp
    mp

    Se o traductor se fôr «enganando» e injectando palavras brasileiras de vez em quando, só estará a contribuir silenciosamente para a corrupção da nossa língua. Um pau de dois bicos.