[Bugfix] fix bias optional (PaddlePaddle#9037)

penPenf28 · Mangodadada · commit fd6eda9acdcf · 2024-09-10T11:34:45.000+08:00
diff --git a/paddlenlp/experimental/transformers/fused_transformer_layers.py b/paddlenlp/experimental/transformers/fused_transformer_layers.py
@@ -877,13 +877,6 @@ def compute_ffn_layernorm(self, out_linear_out, residual_input, i):
         return tmp_out, residual_input
 
     def compute_fused_moe(self, tmp_out, i):
-        # todo[xinhw]: make bias optional
-        if self.ffn1_biases[i] is None:
-            shape1 = paddle.to_tensor([self.ffn1_weights[i].shape[0], 1, self.dim_feedforward * 2])
-            self.ffn1_biases[i] = paddle.zeros(shape1)
-        if self.ffn2_biases[i] is None:
-            shape2 = paddle.to_tensor([self.ffn1_weights[i].shape[0], 1, self.embed_dim])
-            self.ffn2_biases[i] = paddle.zeros(shape2)
         fused_moe_out = fused_moe(
             tmp_out,
             self.gate_weights[i],
@@ -1302,13 +1295,6 @@ def compute_out_linear(self, fmha_out, i):
         )
 
     def compute_fused_moe(self, tmp_out, i):
-        # todo[xinhw]: make bias optional
-        if self.ffn1_biases[i] is None:
-            shape1 = paddle.to_tensor([self.ffn1_weights[i].shape[0], 1, self.dim_feedforward * 2])
-            self.ffn1_biases[i] = paddle.zeros(shape1)
-        if self.ffn2_biases[i] is None:
-            shape2 = paddle.to_tensor([self.ffn1_weights[i].shape[0], 1, self.embed_dim])
-            self.ffn2_biases[i] = paddle.zeros(shape2)
         fused_moe_out = fused_moe(
             tmp_out,
             self.gate_weights[i],