De ‘This is AGI’ a ‘I’m the Same’: OpenAI GPT-4o Reveal encontra reações mistas

Antes da inauguração de meia hora de seu novo modelo GPT-4o AI pela OpenAI, correram rumores sobre o que poderia

João Portela

João Portela

Olá me chamo João portela e vou te guiar no universo das criptomoedas



Antes da inauguração de meia hora de seu novo modelo GPT-4o AI pela OpenAI, correram rumores sobre o que poderia ser anunciado, levando o CEO da empresa, Sam Altman, a gerenciar expectativas, dizendo que “não é um mecanismo de pesquisa”, mas que anunciarão “algumas coisas novas que achamos que as pessoas vão adorar”. Após a apresentação, os entusiastas da IA ​​e a imprensa tecnológica ficaram surpresos e desapontados.

O lançamento do GPT-4o – e não do GPT-5, como algumas pessoas esperavam – representou uma atualização sólida, mas incremental, para o GPT-4.5 Turbo. O “omnimodelo” funciona com texto, áudio e imagens e oferece habilidades de codificação aprimoradas, uma voz feminina emotiva e tempos de geração mais rápidos. As reações às notícias colocaram GPT-4o e OpenAI no topo da lista de tendências globais do Twitter por mais de um dia.

O evento atraiu comparações imediatas com o Gemini Ultra do Google, lançado em fevereiro. Embora muitos entusiastas de IA tenham elogiado o novo modelo da OpenAI, alguns especialistas em IA não ficaram nada impressionados.

Emad Mostaque, ex-CEO da Stability AI, compartilhou um meme que resumiu a reação ao OpenAI nas pontuações de QI. A maior parte do burburinho atingiu o auge em torno do debate sobre se a inteligência artificial geral (AGI) é iminente, mas a longa cauda em ambas as extremidades parece obcecada por “IA waifus” – companheiros virtuais para nerds solitários.

A ironia era palpável, já que o modelo de Difusão Estável do Stability AI é uma ferramenta favorita para criar tais companheiros.

A OpenAI estava especialmente orgulhosa das características realistas da voz que deram ao ChatGPT, que até Altman brincou ser semelhante à companheira virtual do filme de ficção científica “Her”. O cofundador da OpenAI, Andrej Karpathy, fez a mesma conexão.

“O aplicativo matador de LLMs é Scarlett Johansson. Todos vocês pensaram que era matemática ou algo assim”, ele tuitou.

Elon Musk, o cérebro por trás do Grok, o chatbot de IA concorrente famoso por seu “modo divertido”, foi menos sutil ao compartilhar sua análise. “A demonstração me fez estremecer”, escreveu ele, respondendo a um usuário do Twitter que disse que o GPT-4o só pioraria uma “era pós-verdade”.

Os críticos enfatizaram a falta de um único recurso inovador na apresentação, que demonstrasse amplamente coisas que já poderiam ser feitas com as ferramentas atuais de IA.

“Eu sou o mesmo, mas 20% mais rápido”, Julien Chaumond, cofundador da Hugging Face, twittou. O pesquisador-chefe de IA da Meta, Yan LeCun, não revelou seus sentimentos sobre o evento da OpenAI, mas o fez poste um emoji rindo em resposta à postagem de Chaumond.

Andrew Ng, cofundador do Coursera, elogiou o aumento de eficiência: “Quando um trabalho de agente que costumava levar 10 minutos agora leva 5 minutos apenas com a troca de APIs, isso é um grande progresso”, ele disse.

Outros celebraram as potenciais aplicações práticas de um modelo tão poderoso, que poderia ser testado imediatamente em outras formas. Imran Chaudhri, o construtor do pino Humane AI, demonstrou seu dispositivo usando GPT-4o para jogar, destacando as capacidades de visão do modelo – embora a latência ainda pareça ser um problema.

Enquanto isso, o YouTuber Arun Maini elogiado O manuseio suave das tarefas de tradução do GPT-4o.

Mas alguns entusiastas, como o escritor de ficção Ewan Morrison, viram sinais de um abrandamento no desenvolvimento da IA.

“É uma evidência de que o patamar dos LLMs já foi alcançado”, ele twittou. “A Open AI está fazendo um show de fumaça e espelhos para tentar evitar a fuga de capitais dos investidores.” Ele disse que estava confuso por que a OpenAI não entregou o GPT-5, que havia rumores de ser lançado este ano.

Indo mais fundo, Bindu Reddi, CEO da Abacus AI, publicou resultados de um teste de benchmark indicando que o GPT-4o tem um desempenho pior do que o GPT-4.5 Turbo quando solicitado com tarefas de codificação longas e complexas, possivelmente devido à sua multimodalidade.

Tim Simmons do canal do YouTube Teoricamente Media resumindo o meio termo, dizendo: “Estou sobrecarregado e desapontado.” Embora o GPT-4o tenha capacidades impressionantes, ele desanima pela falta de recursos verdadeiramente novos, disse ele, sendo o salto do GPT-4 menos significativo do que o salto anterior do GPT-3.5.

Apesar das reações mistas, quase todos os quadrantes fizeram comparações entre GPT-4o e assistentes famosos como “Her” ou “Jarvis” do universo de super-heróis da Marvel. Desconstruindo um resumo de suas capacidades linguísticas como mais do que “tradução de voz em tempo real”, Karpathy destacou a importância de a OpenAI lançar um LLM nativamente multimodal em vez de vincular modelos separados.

Tanishq Mathew Abraham, diretor de pesquisa da Stability AI, disse que a demonstração ao vivo não explicava totalmente o que havia de especial no GPT-4o.

“A demonstração ao vivo não é a única parte legal do GPT-4o”, escreveu ele. “Ninguém está lendo o Postagem do blog GPT-4oque destaca muitos outros recursos interessantes”, como geração de texto visual, consistência visual, recursos de conversão de texto em 3D e resumo de vídeo.

Quanto à questão AGI, não estamos nem perto, observou Jim Fan, gerente sênior de pesquisa da NVIDIA. Mas um novo e mais poderoso GPT-5 pode ser: usando o codinome relatado para o projeto pendente, o vazador de IA Jimmy Apples sugerido que o GPT-4o “parece Gobi, ou em essência Gobi”, e deu a entender que haveria mais anúncios da OpenAI em um futuro próximo.

Esmagador ou desanimador, o lançamento do GPT-4o agitou a panela e intensificou a atenção da comunidade na palestra de hoje do Google I/O, na esperança de ver uma resposta forte de um concorrente importante.

Editado por Ryan Ozawa.

Fique por dentro das novidades sobre criptografia, receba atualizações diárias em sua caixa de entrada.





Fonte da Matéria Original em Inglês

Veja mais no coinscope