Model Update2026-04-24VentureBeat

GPT-5.5 da OpenAI Supera Claude Mythos no Terminal Bench

A OpenAI lançou o GPT-5.5, seu modelo de linguagem mais recente, que já está causando impacto ao superar por pouco o Claude Mythos Preview da Anthropic no benchmark Terminal Bench 2.0. Este benchmark testa a capacidade de um modelo de lidar com tarefas complexas baseadas em terminal, tornando-se uma medida relevante para casos de uso voltados a desenvolvedores. Apesar de rumores internos de que o modelo foi codinomeado "Spud" durante o desenvolvimento, o GPT-5.5 oferece melhorias sérias de desempenho. O modelo supera o Claude Mythos por uma margem pequena, mas significativa, demonstrando o compromisso contínuo da OpenAI em ultrapassar os limites das capacidades de IA. A competição entre essas duas empresas líderes de IA está se intensificando, e cada novo lançamento eleva o padrão do que os usuários podem esperar. O GPT-5.5 já está disponível para uso no ChatGPT e através da API da OpenAI, tornando-o acessível tanto para usuários individuais quanto para desenvolvedores empresariais. Os primeiros adotantes relataram melhorias no raciocínio, na geração de código e na adesão a instruções complexas. O modelo parece particularmente forte em cenários que exigem resolução de problemas em várias etapas e execução precisa de comandos. Este lançamento marca outro marco competitivo na corrida contínua de modelos de IA. Embora a diferença de desempenho entre o GPT-5.5 e o Claude Mythos seja estreita, isso ressalta o ritmo acelerado da inovação no campo. Ambas as empresas estão iterando rapidamente, e os usuários são os beneficiários finais dessa rivalidade. Para desenvolvedores e empresas, a conclusão é clara: o cenário da IA está evoluindo a uma velocidade vertiginosa. Modelos que eram estado da arte há apenas alguns meses agora estão sendo superados. Manter-se informado sobre esses desenvolvimentos é crucial para qualquer pessoa que queira aproveitar a IA para produtividade, automação ou trabalho criativo.

Noticias relacionadas

Más noticias de IA

AIStart.ai · Tu Launchpad personal de IA