OpenAI tem novo brinquedo para transformar textos em vídeos (muito) realistas

10 Comentários

A Inteligência Artificial (IA), treinada por nós, é capaz de gerar coisas inacreditáveis, fazendo os utilizadores questionarem a veracidade dos conteúdos. Indo além do texto, a OpenAI, mãe do ChatGPT, lançou, agora, um modelo capaz de criar vídeos incrivelmente realistas com base em orientações escritas. Conheça o Sora!



No site oficial da OpenAI, lê-se que a empresa está a “ensinar a IA a compreender e simular o mundo físico em movimento, com o objetivo de treinar modelos que ajudem as pessoas a resolver problemas que impliquem uma interação com o mundo real”.

De nome Sora, a criação da OpenAI trata-se de um modelo text-to-video que consegue gerar vídeos de até um minuto, assegurando a qualidade visual e a conformidade com as instruções do utilizador.

 

Conheça o Sora, o novo modelo de IA da mãe do ChatGPT

O modelo ficou disponível, ontem, para os red teamers (profissionais de cibersegurança), que avaliarão áreas críticas e trabalharão para detetar danos ou riscos.

Conforme informação da empresa, o progresso da sua investigação está a ser partilhado “antecipadamente para começar a trabalhar e obter feedback de pessoas fora da OpenAI e para dar ao público uma noção das capacidades de IA que estão no horizonte”.

Além dos profissionais de cibersegurança, a OpenAI disponibilizou o novo modelo a artistas visuais, designers e cineastas, por forma a reunir feedback sobre o desenvolvimento da ferramenta, no sentido de ser mais útil para profissionais criativos.

No Twitter, o utilizador @duborges compilou alguns vídeos que os entusiastas da tecnologia vão querer espreitar; o nível de realismo é surpreendente:

O Sora é capaz de gerar cenas complexas com vários elementos, tipos de movimento específicos e detalhes muito precisos de contexto e background.

O modelo entende não apenas o que o utilizador pediu no prompt, mas também como essas coisas existem no mundo físico.

Aliás, por ter “um profundo conhecimento da linguagem”, interpreta com precisão as instruções dadas pelo utilizador e gera personagens “convincentes que expressam emoções vibrantes”. Além disso, é capaz de gerar vários “takes” num único vídeo, mantendo as personagens e o estilo visual, precisamente.

Apesar dos vídeos partilhados pela OpenAI, “o modelo tem fraquezas”, uma vez que “pode ter dificuldade em simular com precisão a física de uma cena complexa e pode não compreender instâncias específicas de causa e efeito”.

Por exemplo, uma pessoa pode dar uma mordida num biscoito, mas depois o biscoito pode não ter a marca dessa mordida.

Mais, o modelo “também pode confundir detalhes espaciais de um prompt, por exemplo, misturando esquerda e direita, e pode ter dificuldades com descrições precisas de eventos que ocorrem ao longo do tempo, como seguir uma trajetória específica de câmara”.

De qualquer modo, vendo os vídeos e confiando nas suas potenciais capacidades, sabemos que nos espera um modelo muito interessante. Por cá, já estamos ansiosos por experimentar.

Comentários

10

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *

  1. Avatar de Ricardo A.
    Ricardo A.

    Assustador. A malta da multimédia vai ficar sem emprego.

    1. Avatar de Rodrigo
      Rodrigo

      A malta do Machine Learning vai ganhar emprego.

      1. Avatar de Hugo+Nabais
        Hugo+Nabais

        Acredita que a esmagadora maioria vai ser automatizado, e os empregos que vão surgir na área de “machine learning/AI” vão ser uma fração dos empregos que existem atualmente na área de multimédia, fotografia, cinema, ilustração, etc etc.
        Eu diria que nem 1%!

        1. Avatar de Rodrigo
          Rodrigo

          Não sei, só vejo por todo lado pessoal a procura de pessoal com conhecimentos em Machine Learning.

          O tempo do pessoal tirar uma licenciatura e arranjar um emprego para a vida já acabou a 2 décadas, agora temos que andar em formação constante se queremos empregos bons.

        2. Avatar de Maria+Albertina
          Maria+Albertina

          Eu diria que:
          – enquanto a AI não estiver no ponto, os trabalhos tradicionais vão existir

          – enquanto a AI não estiver no ponto, os trabalhos especializados em AÍ vão existir

          Quando estiver no ponto: vão estar todos no olho da rua a contar os passarinhos.

          Quando dominar o mundo, controlar armas e produção agrícola, vamos todos trabalhar no campo por um prato de comida ou, com sorte, substituir as peças e olear as máquinas por dois pratos de comida.

          E todos contentes a verem tudo a acontecer e não fazerem nada para evitar. Depois fazemos uma máquina do tempo a pensar que podemos fazer como no filme mas veremos que na realidade não é possível e estamos encravados… parabéns humanidade, afinal não foram os aliens mas a própria humanidade que por guerras ou AI descontrolada que desfizemos a humanidade como era.

          1. Avatar de Rodrigo Pinto
            Rodrigo Pinto

            Quando a IA tiver no pontos ninguem precisa de trabalhar ,podemos viver a vida e desfrutar sem doencas, a comer do bom e do melhor e a aproveitar apenas para estudar e descobrir o universo. A IA vem para nos ajudar a evoluir enquanto civilizacao, so mesmo os cromos dos oculos e barriga de barril para virem com a conversa dos empregos perdidos para a IA. Acordem

    2. Avatar de Zé

      Só ficam sem emprego se quiserem. Só mudam as ferramentas porque qualquer um pode usar a IA, da mesma forma que qualquer um usa uma câmara, mas usar bem já é outra coisa. É uma questão de adaptação. E podes sempre pegar na tua arte e treinar a tua própria IA que vai ter resultados diferentes das IA comuns/básicas. Como digo, é saber adaptar e tens emprego na mesma.

    3. Avatar de Zé Fonseca A.
      Zé Fonseca A.

      Em contrapartida vais conseguir tirar muitas almas perdidas do mundo da indústria pornografica

  2. Avatar de kendimen.c
    kendimen.c

    Muito interessante!

  3. Avatar de João
    João

    Claramente . Quem achar que por cada lugar perdido por uma automatização , outro será criado para alguém tratar dessa mesma automatização, está muito muito longe da realidade . Diria que esta inovação irá despedir muita gente pois a manutenção do AI vai requerer muito menos pessoas do que a produção de filmes em CGI por técnicos e especialistas