Suíça lança o Apertus, um modelo de IA soberano, de código aberto e transparente

15 Comentários

A Suíça está a lançar o seu próprio LLM soberano, o Apertus. Quer ser uma IA “confiável, soberana e inclusiva”. Multilingue, de código aberto e de grande escala, este modelo de IA pode ser utilizado para desenvolver bots, sistemas de tradução, ferramentas educativas e até mesmo em projetos comerciais.

Suíça Apertus IA LLM

Apertus, latim para “aberto”, é um novo LLM desenvolvido por três instituições públicas suíças. O Centro Nacional Suíço de Computação Científica (CSCS), o Instituto Federal Suíço de Tecnologia em Lausanne (EPFL) e o Instituto Federal Suíço de Tecnologia em Zurique (ETH) têm vindo a trabalhar na criação deste LLM completamente aberto.

Os dados de treino, a metodologia, os parâmetros e a arquitetura do Apertus são documentados e de livre acesso, ao contrário da maioria dos outros modelos. O Apertus foi treinado com 15 triliões de palavras ou partes de palavras (tokens) de mais de 1.000 línguas. 40% das suas fontes, todas públicas, não são o inglês — incluindo línguas geralmente sub-representadas, como o romanche e o suíço-alemão.

O modelo pode ser utilizado por investigadores de IA, profissionais, empresas e até mesmo particulares, tudo gratuitamente no Hugging Face. Estão disponíveis duas versões: 8 mil milhões e 70 mil milhões de parâmetros, sendo a mais pequena mais adequada para uso individual.

Uma vez que o LLM está licenciado sob a licença Apache 2.0, pode ser utilizado para investigação e ensino, bem como para aplicações comerciais O Apertus será atualizado regularmente, embora não tenha a intenção de competir com o fluxo interminável de novos modelos comerciais, como o GPT-5. Os lançamentos futuros irão alargar a família de modelos e melhorar a sua eficiência. Um dos objetivos é também desenvolver variantes específicas para determinadas áreas de negócio, como o direito, a saúde ou a educação.

Uma das vantagens deste LLM para as empresas e organizações que o pretendam utilizar é que tem em conta as leis suíças sobre a proteção de dados, os direitos de autor, bem como as obrigações de transparência do regulamento europeu sobre a IA (a Lei da IA).

Para a Public AI Inference Utility, uma iniciativa que visa facilitar o acesso público aos modelos de IA, o Apertus é “o modelo público de referência para a IA: um modelo construído por instituições públicas, para o interesse público. É a melhor prova até à data de que uma IA se pode tornar numa verdadeira infra-estrutura pública, tal como as estradas, a água ou a eletricidade”.

Comentários

15

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *

  1. Avatar de Anónimo77
    Anónimo77

    “Apertus foi treinado com 15 triliões de palavras ou partes de palavras (tokens) de mais de 1.000 línguas”
    Inclui o português de Portugal ?

    1. Avatar de Fábrica
      Fábrica

      Português espero que não, só para te chatear para uma pergunta um tanto idiota!!

  2. Avatar de Mário
    Mário

    Faltou dizer que era baseado em…

  3. Avatar de BurroFuiEuQueEstudei
    BurroFuiEuQueEstudei

    “Quer ser uma IA “confiável, soberana e inclusiva”. Inclusiva? Em que maneira é que as outras IA’s não são inclusivas.

  4. Avatar de carlosf.
    carlosf.

    É top não haja dúvida…estive a testar e perguntei qual é o primeiro ministro actual de Portugal…a resposta:

    “O primeiro-ministro de Portugal é António Costa, que tem ocupado este cargo desde o 26 de novembro de 2015. Ele lidera um governo de coligação envolvendo o Partido Socialista (PS) e o Bloco de Esquerda (BE). As eleições para a Assembleia da República foram realizadas em outubro de 2019, e a atual legislatura começou em janeiro de 2020. A função de primeiro-ministro é a de chefe de governo de Portugal e pode variar de acordo com as eleições e as alianças políticas existentes no país. É importante verificar informações recentes e fontes politicas fiáveis para obter informações precisas e atualizadas sobre a composição do governo português e os nomes dos seus membros.”

    1. Avatar de Profeta
      Profeta

      Ainda nao reconhece a palavra actual, precisa de mais treinamento. hehe Alem disso nao sabe responder a uma pergunta directa. Apenas responder o nome, precisavamos de saber isso tudo ? Se fosse para saber outras coisas perguntava-se de maneira diferente.

    2. Avatar de Max
      Max

      Isso tem que ver com a data de corte dos dados que foram usados para o pré-treino do Apertus. É um problema comum a outros modelos quando foram lançados. Já reinava Trump há meses e ainda diziam que o presidente era Biden.
      O pessoal já se esqueceu que as versões iniciais do ChatGPT foram lançados com data de corte – e sem acesso à internet para atualizar os dados (depois de seguir um processo de validação).
      Confirmei que o Apertus ainda não tem acesso à internet para atualizar os dados e por isso a situação que relatas é perfeitamente normal, durante bastante tempo. O Apertus avisa quando diz: “É importante verificar informações recentes e fontes politicas fiáveis para obter informações precisas e atualizadas sobre a composição do governo português e os nomes dos seus membros.”

  5. Avatar de anónimo77
    anónimo77

    Este chat responde em que variante do português ?
    AI “Respondo em português padrão brasileiro. Se preferir discutir em castelhano, francês, italiano ou outra variante, por favor me informe!”
    Igual as outras, 1000 línguas menos o português de Portugal, os políticos portugueses são uma vergonha nem a nossa identidade linguística sabem porteger .
    É este o tipo de IAs vamos ter nas escolas portuguesas onde respondem no português do brasil em vem vez no nosso Português ?
    Haja vergonha .

    1. Avatar de jotabê
      jotabê

      +1
      mas o problema não se restringe à IA, a msft e a google já fazem isso há muito tempo com os resultados das pesquisas, sabem que o teu ISP está na euroma mas os primeiros resultados que mostra são pt/br. Desconfio que pt/pt desaparece na próxima geração ou seguinte. A maior parte dos conteudos “impigidos” pelos algoritmos aos putos são pt/br e eles “papam” com naturalidade.

    2. Avatar de jotabê
      jotabê

      *ISP está na Europa

    3. Avatar de Márcia
      Márcia

      Kkkk. É que o brasileiro é massa!!! Tem mais palavras que vocês não conhecem!!!!

    4. Avatar de Max
      Max

      “O primeiro-ministro anunciou esta segunda-feira o lançamento, no primeiro trimestre do próximo ano, de um “grande modelo de linguagem” em português (LLM, sigla em inglês), que considerou “um passo crítico” para o ensino, administração pública ou empresas.” (Expresso, 11/11/2924)
      “O grande modelo de linguagem (LLM) de inteligência artificial (IA) português vai chamar-se Amália e a sua versão final será lançada em 2026” (19/11/2024).
      Está marcada uma apresentação pública para o próximo dia 30 de setembro.
      Se o samba te atrapalha, é só esperar que vais pode parar cantar o fado. A mim não me atrapalha por aí além, os modelos de IA mais conhecidos já fizeram um esforço bastante grande para usar o PT-PT, embora, escavando, se note que tem por base o PT-BR. Provavelmente, o Apertus seguirá o mesmo percurso (e não me admirava se, por causa dos dados utilizados no pré-treino, o Amalia também, sem que daí caísse a Casa dos Bicos).

      1. Avatar de Hugo Nabais
        Hugo Nabais

        Vão precisar de mais de um ano para treinar um modelo?! Puxa, devem estar a usar uma placa bem velhinha…

  6. Avatar de 1143
    1143

    O português do Brasil é uma lingua crioula, lingua usada desde dos tempos da escravatura no Brasil ou seja é uma lingua usada pelos negros (escravo).