Vídeo novo! Fiz uma revisão completa de todas as camadas do modelo Transformer: autoatenção , multi head self-attention, positional encoding, incluindo todas as multiplicações de matrizes e um tour no processo de treinamento e inferência. https://www.youtube.com/watch?v=aCWm4eMQlQs