Embed Notice

HTML Code

<blockquote style="position: relative; padding-left: 55px;"><section><a href="https://bolha.us/users/hugoboia/statuses/113885643778772917">Hugo Boia (hugoboia@bolha.us)'s status on Saturday, 25-Jan-2025 11:26:33 JST</a><a href="https://bolha.us/@hugoboia" title="hugoboia@bolha.us"><img src="https://gnusocial.jp/avatar/117492-48-20240404180940.webp" width="48" height="48" alt="Hugo Boia" style="position: absolute; left: 0; top: 0;">Hugo Boia</a></section><article><p><a href="https://social.subversida.de/@cochise">@cochise</a> <br>Eu vejo diferente:<br>- De agora em diante vão "falar" que gastaram cada vez menos recursos pra tentar melhorar a própria imagem.<br>- Os benchmarks são manipuláveis.</p><p>Não me leve a mal, eu acho incrível quando olho os modelos no HuggingFace que usam "reasoning" e você consegue entender como eles chegaram na resposta. É realmente impressionante. </p><p>Mas tudo fica muito suspeito quando, para defender o argumento de que estão alcançando a generalização, eles se baseiam em resultados super específicos.</p></article><footer><a rel="bookmark" href="https://gnusocial.jp/conversation/4443723#notice-8695495">In conversation</a><time datetime="2025-01-25T11:26:33+09:00" title="Saturday, 25-Jan-2025 11:26:33 JST">about a month ago</time> <span>from <span><a href="https://bolha.us/@hugoboia/113885643778772917" rel="external" title="Sent from bolha.us via ActivityPub">bolha.us</a></span></span><a href="https://bolha.us/@hugoboia/113885643778772917">permalink</a></footer></blockquote>

Corresponding Notice

Embed this notice
Hugo Boia (hugoboia@bolha.us)'s status on Saturday, 25-Jan-2025 11:26:33 JST Hugo Boia
@cochise
Eu vejo diferente:
- De agora em diante vão "falar" que gastaram cada vez menos recursos pra tentar melhorar a própria imagem.
- Os benchmarks são manipuláveis.
Não me leve a mal, eu acho incrível quando olho os modelos no HuggingFace que usam "reasoning" e você consegue entender como eles chegaram na resposta. É realmente impressionante.
Mas tudo fica muito suspeito quando, para defender o argumento de que estão alcançando a generalização, eles se baseiam em resultados super específicos.
In conversationabout a month ago from bolha.uspermalink

Public

Embed Notice

HTML Code

Corresponding Notice