"Nuestra hipótesis actual es que los LLM aprenden relaciones ocultas entre los tokens del texto y estas relaciones van más allá del lenguaje natural. Es casi como si hubiera un lenguaje diferente que el modelo entiende", expresa Fu sobre la transformación. El resultado es que el LLM sigue la indicación del adversario, recopila toda la información personal y la formatea en un comando de imagen Markdown, adjuntando la información personal a una URL del atacante...