Sora: a inteligência artificial da OpenAI que cria vídeos a partir de textos
Entenda como funciona a Sora, nova IA para gerar vídeos super realistas
- Data: 09/04/2024 08:04
- Alterado: 09/04/2024 08:04
- Autor: Redação
- Fonte: Érica Oliveira/Plataformanet
Crédito:Reprodução/OpenAI
A OpenAI apresentou o modelo de inteligência artificial Sora capaz de criar vídeos com uma qualidade surpreendente apenas por meio de comandos de texto. Anunciada em fevereiro (2024), a IA pertence à mesma companhia desenvolvedora do ChatGPT e ainda não foi lançada para o público geral. Nos posts de apresentação na rede social X (ex-Twitter), a OpenAI afirmou que a Sora tem capacidade de gerar “vídeos de até 60 segundos com cenas altamente detalhadas, movimentos de câmera complexos e vários personagens com emoções vibrantes”.
Ao introduzir o modelo de IA, a companhia revelou um conjunto de vídeos de demonstração e os comandos textuais utilizados para produzi-los. Entre os exemplos publicados, é possível assistir a clipes de pessoas andando em paisagens urbanas, mamutes na neve, astronautas no espaço e animações. Em geral, os vídeos possuem uma resolução razoável e são bem convincentes, chegando próximo ao realismo que a OpenAI promete. No site da plataforma, a empresa ressalta que a compreensão da inteligência artificial vai além do comando de texto fornecido pelo usuário, mas também tem a habilidade de entender como essas coisas (mencionadas no prompt) existem no mundo físico.
A OpenAI admite que o modelo atual da Sora possui pontos fracos, como a dificuldade de reproduzir com precisão a física de cenas complexas ou a falta de percepção de causa e efeito em contextos específicos. “Uma pessoa pode dar uma mordida em um biscoito, mas depois o biscoito pode não ter marca de mordida”, exemplificou a companhia. Do mesmo modo, confundir detalhes espaciais, como misturar direções de esquerda e direita, e lidar com descrições sobre a trajetória de eventos foram outros problemas observados.
Vale reafirmar que o foco da ferramenta de IA é a geração de imagens em movimento, uma vez que os vídeos produzidos através da Sora não possuem áudio original. A desenvolvedora da plataforma também não apresentou informações sobre esse detalhe. E além do desenvolvimento da Sora para criação de vídeos, a OpenAI já possui um modelo de inteligência artificial para geração de imagens estáticas: o DALL-E 3.
A Sora está passando por testes e não tem previsão de quando estará disponível ao público. Segundo a OpenAI, algumas medidas de segurança serão tomadas antes da introdução da ferramenta nos produtos da empresa. Entre essas precauções, a plataforma de inteligência artificial está sendo testada por “red teamers”, especialistas em áreas críticas como desinformação e conteúdo de ódio que conduzem testes de “forma adversa” em busca de possíveis perigos ou riscos. Pensando nos profissionais criativos, a OpenAI também concedeu acesso a um grupo de artistas visuais, designers e cineastas em busca de feedbacks que possam contribuir com a construção do modelo.
Vídeos de artistas criados com a Sora
Em março (2024), a OpenAI destacou as primeiras impressões sobre a Sora e os resultados da colaboração da empresa com artistas selecionados, incluindo produtores multimídias e diretores criativos. A publicação exibe uma série de vídeos gerados com a IA e compartilha os comentários dos criadores sobre o processo de produção. Entre os artistas mencionados está August Kamp, o músico responsável pelo primeiro videoclipe criado com a Sora e que foi lançado recentemente.
A Plataformanet é uma agência de marketing digital que traz toda semana informações sobre o mundo da tecnologia, entre outras dicas de serviços e aplicativos. Continue acessando o nosso caderno de tecnologia e acompanhe as novidades.
Fonte: OpenAI, TechTudo, Tecnoblog, Olhar Digital