任学强的博客
关于我
标签:
预训练模型演进
Transformer架构深度解析:技术原理与演进
Transformer架构凭借自注意力机制突破序列建模瓶颈,编码器-解码器结构重塑NLP范式。从BERT到GP…
2025年10月19日