@cochise
Eu vejo diferente:
- De agora em diante vão "falar" que gastaram cada vez menos recursos pra tentar melhorar a própria imagem.
- Os benchmarks são manipuláveis.
Não me leve a mal, eu acho incrível quando olho os modelos no HuggingFace que usam "reasoning" e você consegue entender como eles chegaram na resposta. É realmente impressionante.
Mas tudo fica muito suspeito quando, para defender o argumento de que estão alcançando a generalização, eles se baseiam em resultados super específicos.