@thaddaeus @lusca aí discordo.
Não faria sentido que os geradores de texto, por exemplo, sejam treinados só com conteúdos de domínio público (no Brasil, 70 anos após a morte do autor). Não acredito que alguém estaria feliz recebendo texto escrito como se fosse escrito antes da WW2, e/ou com conteúdo daquela época.
O que deveria ter acontecido é uma transparência melhor tanto para quem teve sua obra usada, quanto para os usuários finais.
Exemplo: alguns códigos de computador são públicos, mas com licença que exigem que código derivado também seja público (licença GPL é uma delas). Se eu usei uma IA para ajudar a escrever meu código mas ela foi treinada em código licenciado via GPL, meu código tem que ser, legalmente, público já que tecnicamente é derivado?