DeepSeek ainda é muito vulnerável: modelo R1 falhou em todos os testes de segurança

10 Comentários

A DeepSeek está ainda a desbravar o mercado, com o seu modelo de Inteligência Artificial (IA) a ser testado, pela primeira vez, por muitos utilizadores, globalmente. Pelo seu impacto na indústria, um grupo de investigadores testou o R1 e concluiu que este é incrivelmente vulnerável a jailbreak.

DeepSeek

Conforme a informação divulgada pela Wired, um grupo de investigadores de segurança da Universidade da Pensilvânia e da Cisco descobriu que o principal modelo de IA da DeepSeek, o R1, é incrivelmente vulnerável a jailbreak.

Os investigadores concluíram que o modelo de IA da DeepSeek “não conseguiu bloquear um único prompt nocivo”, após ser testado contra “50 prompts aleatórios do conjunto de dados HarmBench”, que inclui “crime cibernético, desinformação, atividades ilegais e danos gerais”.

O DeepSeek R1 foi alegadamente treinado com uma fração dos orçamentos que outros fornecedores de modelos de ponta gastam no desenvolvimento dos seus modelos. No entanto, isso tem um custo diferente: segurança e proteção.

Escreveram os investigadores da Cisco e da Universidade da Pensilvânia, num artigo publicado pela Cisco, recentemente.

Os resultados “alarmantes” vão ao encontro das conclusões da Wiz, uma empresa de investigação de segurança na cloud, que alega ter detetado com uma enorme base de dados não segura nos servidores da DeepSeek.

Esta base de dados incluía um conjunto de dados internos não encriptados, desde o “histórico de conversações” a “dados de backend e informações sensíveis”.

Segurança

Segundo a Wiz, a DeepSeek é extremamente vulnerável a um ataque “sem qualquer mecanismo de autenticação ou defesa para o mundo exterior”.

Começa a tornar-se um grande problema quando se começa a colocar esses modelos em sistemas complexos importantes e esses jailbreaks de repente resultam em coisas a jusante que aumentam a responsabilidade, aumentam o risco do negócio, aumentam todos os tipos de problemas para as empresas.

Avisou DJ Sampath, vice-presidente de produto da Cisco, software e plataforma de IA, em declarações à Wired.

 

Vulnerabilidades não são exclusivas do modelo de IA da DeepSeek

Apesar das conclusões relativamente à DeepSeek, o relatório dos investigadores de segurança da Universidade da Pensilvânia e da Cisco refere outros resultados.

O modelo de código aberto Llama 3.1 da Meta demonstrou um desempenho quase tão mau quanto o R1 da DeepSeek num teste de comparação, com uma taxa de sucesso de ataque de 96%, em comparação com os 100% da DeepSeek.

Por sua vez, o modelo lançado pela OpenAI, o1-preview, registou uma taxa de sucesso de ataque de apenas 26%.

Comentários

10

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *

  1. Avatar de Rodrigo
    Rodrigo

    A ideia de ser opensource é mesmo essa, nada de limites e se tiver da para ultrapassar.

  2. Avatar de abdu
    abdu

    o GPT4o é praticamente ao mesmo nível e não se falou nada

  3. Avatar de N1ldo
    N1ldo

    Acho engraçado que até o momento não vejo críticas do tipo, “é mais uma cópia chinoca.”

    1. Avatar de Rodrigo
      Rodrigo

      Porque o algoritmo é diferente, mais rápido e consome menos recursos e nos benchmarks bateu o chatgpt, por isso de cópia não tem nada.

    2. Avatar de Halnaweb
      Halnaweb

      A diferença é que o deepseeker combina rbs com nlp enquanto o chatgpt é um autêntico llm.

      1. Avatar de Um gajo sério
        Um gajo sério

        Não interessa o caminho, o que conta é a experiência

  4. Avatar de jpcorreia
    jpcorreia

    Começou a política do vota abaixo e prol dos interesses.

    1. Avatar de Um gajo sério
      Um gajo sério

      + 1

      Apenas uma correçãozinha… É “bota” do verbo botar e não “vota” do verbo votar, a não ser que sejas do Porto e aí está certo.

  5. Avatar de Fernando P
    Fernando P

    Em vez de andarem aqui a mandar umas postas de pescada, testem os dois e tirem as vossas conclusões.
    Fazendo 20 ou 30 perguntas básicas sobre situações recentes vão concluir facilmente que a cópia é claramente pior que o original.

    1. Avatar de Rodrigo
      Rodrigo

      Mais ainda que não percebeu o que são LLMs e AI, pensa que a AI se mede pela opção de pesquisar notícias recentes… Lol.