位置编码词义向量 + 位置向量 = 最终输入向量(逐元素相加,不是拼接)