Untitled attachment
https://files.mastodon.social/media_attachments/files/113/923/969/081/749/985/original/e566eeb08385a429.png
O DeepSeek-R1 usa tecnologia de aprendizado por reforço em larga escala no estágio pós-treinamento, o que melhora muito a capacidade de raciocínio do modelo com apenas poucos dados rotulados.
GNU social JP is a social network, courtesy of GNU social JP管理人. It runs on GNU social, version 2.0.2-dev, available under the GNU Affero General Public License.
All GNU social JP content and data are available under the Creative Commons Attribution 3.0 license.