任学强的博客
关于我
标签:
注意力机制解析
Transformer架构深度解析:自注意力与多头注意力机制
Transformer作为深度学习革命性架构,其核心自注意力机制通过计算序列元素依赖关系捕捉全局动态特征,多头…
2025年9月15日