A minha idéia desde o começo era criar algo como o AltBot que eu pudesse usar pra qualquer rede, rodando localmente. Então comecei criando uma imagem de container pra rodar o llama.cpp e depois levei esse setup pra a Raspberry. Lá eu rodei uma imagem da Chainguard que já vem com o Docker daemon então é só clonar o repo, buildar a imagem e rodar o llama server com o modelo que quiser. O Qwen3-VL foi lançado mês passado, é bem novo!