CEO da Google DeepMind: A AGI ainda está a 5 a 10 anos de distância, e as oportunidades e riscos de desenvolvimento de IA andam de mãos dadas

2025-12-10 07:54:50

No final da “AI+SF Summit” realizada pela Axios em São Francisco, Demis Hassabis, CEO da Google DeepMind, apresentou as direções de investigação da DeepMind, avanços tecnológicos como modelos multimodais e mundiais, e discutiu o desenvolvimento de agentes de IA e os riscos relacionados. Avaliou também a competição de IA entre os Estados Unidos e a China, e deu uma estimativa rara do cronograma da AGI, acreditando que ainda faltam cerca de 5 a 10 anos para “sistemas de IA com capacidades cognitivas humanas”.

Com a bênção da aura Nobel, o pensamento cientista domina a DeepMind

No início do evento, o apresentador Mike Allen apresentou Hassabis como um prodígio do xadrez de 5 anos e um vencedor do Prémio Nobel de 48 anos. Hassabis admite que ganhar o prémio ainda parece super irreal, mas o impacto real é óbvio.

Porque quando fala com funcionários do governo ou decisores transfronteiriços que não estão familiarizados com IA, o “Prémio Nobel” é como uma chave que pode abrir rapidamente qualquer porta, tornando-os mais dispostos a ouvi-lo falar sobre questões como segurança e uso responsável da IA, e ele planeia fazer um uso mais ativo deste título no futuro.

No que diz respeito ao seu trabalho diário e estilo de gestão, Hassabis enfatiza que ele “vem sempre em primeiro lugar como cientista e CEO vem em segundo lugar.” Aos seus olhos, o método científico é uma das invenções mais importantes da humanidade, e ele aplica diretamente o processo de “formular hipóteses, desenhar experiências e atualizar opiniões com base nos resultados” ao desenvolvimento de produtos e à gestão organizacional.

As vantagens do DeepMind vêm de três níveis ao mesmo tempo, nomeadamente “investigação de classe mundial, capacidades de engenharia de classe mundial e infraestrutura informática de classe mundial”. Ele acredita que só quando estes três níveis forem realizados simultaneamente é que a DeepMind pode estar qualificada para estar na vanguarda do desenvolvimento da IA.

Disposição para os próximos 12 meses: evolução multimodal, modelo mundial e agentes

Falando sobre o progresso específico da IA nos próximos 12 meses, Hassabis salientou que o Gemini foi concebido desde o início como um modelo multimodal, capaz de processar texto, imagens, vídeo e áudio ao mesmo tempo. Por exemplo, o seu modelo de imagem mais recente, “Nano Banana Pro”, consegue produzir infográficos muito precisos, indicando que as capacidades de compreensão visual do modelo estão a melhorar rapidamente.

O segundo foco é o modelo mundial (World Models). O Genie 3, desenvolvido pela DeepMind, pode gerar vídeos interativos que permitem aos utilizadores não só ver o vídeo, mas também entrar no ecrã como se estivessem a entrar num jogo, mantendo consistência e coerência no mundo durante cerca de um minuto. Este tipo de modelo é visto como um passo fundamental na compreensão da IA sobre aparências e regras do mundo real.

O terceiro são os agentes de IA. Hassabis admitiu que os atuais agentes de IA não podem sentir-se aliviados por lhe entregar um pacote inteiro de tarefas diretamente, garantindo que tudo é bem feito do zero. Mas espera que, dentro de um ano, a confiança dos agentes de IA aumente definitivamente. O objetivo da Google é fazer do Gemini um “assistente universal” que não só exista em telemóveis e computadores, mas que possa estar ao lado do utilizador a qualquer momento através de dispositivos vestíveis como óculos, tornando-se um assistente regular para o dia a dia e para o trabalho.

( teste: O Gemini 3 Nano Banana Pro gera automaticamente cartoons humorísticos depois de pensar, transformando Trump novamente numa pequena )

O futuro é promissor para a exploração cósmica, mas os riscos de segurança são tão críticos quanto a compreensão em vídeo

Falando dos melhores cenários que a IA pode trazer, Hassabis levanta a hipótese de que a IA pode ajudar a humanidade a ultrapassar vários gargalos-chave, como a fusão nuclear ou novas baterias, novos avanços na ciência dos materiais e semicondutores, e soluções para doenças graves, e que a sociedade humana terá a oportunidade de avançar para a exploração espacial com recursos mais abundantes.

Mas também apontou o pior cenário possível, que se divide em vários níveis:

Atores maliciosos usam IA para desenhar ou melhorar patogénios.

A IA acelera ciberataques de forças estrangeiras a infraestruturas críticas como recursos energéticos e hídricos, e é provável que tais situações estejam a acontecer, mas a IA utilizada ainda não é avançada.

Agentes de IA altamente autónomos desviam-se das suas instruções originais e das expectativas humanas, pelo que têm de investir consideráveis recursos e atenção para os prevenir.

Em termos de capacidade, ele acredita que a parte subestimada do mundo exterior é o profundo entendimento da IA sobre vídeo. Hassabis partilhou que uma vez pediu a Gemini para analisar a cena, e o modelo não só compreende a imagem, como também oferece uma interpretação muito profunda dos símbolos e emoções, em vez de apenas descrever ações superficiais.

Mencionou ainda que o Gemini Live permite obter assistência instantânea para reparações apontando a câmara do telemóvel para equipamentos mecânicos, mas acredita que o veículo verdadeiramente ideal serão os óculos, porque as mãos devem estar vazias durante as operações no local para trabalhar e interagir com a IA ao mesmo tempo.

Restam apenas alguns meses na diferença entre os Estados Unidos e a China, e a AGI ainda está a uma ou duas milhas de distância

No que diz respeito à concorrência internacional, a Hassabis acredita que os Estados Unidos e o Ocidente continuam a liderar a China como um todo em termos de capacidades de modelos e inovação, mas o último lote de modelos da China, como o DeepSeek, já é muito forte e a maioria está a recuperar rapidamente com base nas tecnologias existentes. Ele julgou que, no passado, os Estados Unidos e o Ocidente podem ter liderado em anos, mas agora faltam apenas alguns meses para a China.

Hassabis define a AGI de forma bastante clara, nomeadamente:

“Deves ter todas as principais capacidades cognitivas dos seres humanos, incluindo planeamento a longo prazo, memória a longo prazo, aprendizagem contínua, raciocínio real e criatividade, etc.”

Salientou que, embora os LLMs nesta fase já tenham capacidade para abordar os melhores médicos em algumas áreas, continuarão a cometer erros em muitos cenários, e ainda existe uma lacuna entre a AGI verdadeira e a estimativa que demore entre 5 a 10 anos. Hassabis acrescentou que, mesmo que a escala dos LLMs existentes seja levada ao limite, ainda não é suficiente para ultrapassar o limiar da AGI, e o campo da IA poderá precisar de uma ou duas grandes descobertas tecnológicas que melhorem significativamente as capacidades, como os transformadores, antes de haver uma hipótese de alcançar verdadeiramente a AGI.

(IBM CEO: A indústria da IA é uma aposta “difícil de recuperar”, com os LLMs a terem apenas 1% de hipótese de criar ) AGI com sucesso

O artigo Google DeepMind CEO: A AGI está a 5 a 10 anos de distância, oportunidades e riscos de desenvolvimento de IA andam de mãos dadas apareceu primeiro no Chain News ABMedia.

Ver original

Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.