google · copybara-service · Oct 1, 2024
diff --git a/build_srcs.bzl b/build_srcs.bzl
@@ -85,6 +85,7 @@ SUBGRAPH_SRCS = [
     "src/subgraph/static-mean.c",
     "src/subgraph/static-resize-bilinear-2d.c",
     "src/subgraph/static-slice.c",
+    "src/subgraph/static-sum.c",
     "src/subgraph/static-transpose.c",
     "src/subgraph/tanh.c",
     "src/subgraph/unpooling-2d.c",

diff --git a/include/xnnpack.h b/include/xnnpack.h
@@ -1334,6 +1334,26 @@ enum xnn_status xnn_define_static_mean(
   uint32_t output_id,
   uint32_t flags);
 
+/// Define a Sum Node and add it to a Subgraph.
+///
+/// @param subgraph - a Subgraph object that will own the created Node.
+/// @param num_reduction_axes - number of axes along which sum is computed.
+/// @param reduction_axes - axes along which sum is computed.
+/// @param input_id - Value ID for the input tensor. The input tensor must be a dense tensor with at least
+///                   @a num_reduction_axes dimensions defined in the @a subgraph.
+/// @param output_id - Value ID for the output tensor. The output tensor must be a dense tensor defined in the
+///                    @a subgraph with @a num_reduction_axes fewer dimensions than the input tensor (if
+///                    XNN_FLAG_KEEP_DIMS is not specified), or has same dimension rank but the dimension at
+///                    @a reduction_axes reduced to 1 (if XNN_FLAG_KEEP_DIMS is specified).
+/// @param flags - binary features of the Sum Node. The only currently supported value is XNN_FLAG_KEEP_DIMS
+enum xnn_status xnn_define_static_sum(
+  xnn_subgraph_t subgraph,
+  size_t num_reduction_axes,
+  const size_t* reduction_axes,
+  uint32_t input_id,
+  uint32_t output_id,
+  uint32_t flags);
+
 /// Define a 2-Input Concatenate Node and add it to a Subgraph.
 ///
 /// The 2-Input Concatenate Node concatenates two tensors along a specified axis.
@@ -5080,6 +5100,89 @@ enum xnn_status xnn_setup_mean_nd_qu8(
   const void* input,
   void* output);
 
+enum xnn_status xnn_create_sum_nd_f16(
+  uint32_t flags,
+  xnn_operator_t* sum_op_out);
+
+enum xnn_status xnn_create_sum_nd_f32(
+  uint32_t flags,
+  xnn_operator_t* sum_op_out);
+
+enum xnn_status xnn_create_sum_nd_qs8(
+  float scale,
+  int8_t input_zero_point,
+  int8_t output_zero_point,
+  uint32_t flags,
+  xnn_operator_t* sum_op_out);
+
+enum xnn_status xnn_create_sum_nd_qu8(
+  float scale,
+  uint8_t input_zero_point,
+  uint8_t output_zero_point,
+  uint32_t flags,
+  xnn_operator_t* sum_op_out);
+
+enum xnn_status xnn_reshape_sum_nd_f16(
+  xnn_operator_t sum_op,
+  size_t num_reduction_axes,
+  const size_t* reduction_axes,
+  size_t num_input_dims,
+  const size_t* input_shape,
+  size_t* workspace_size,
+  size_t* workspace_alignment,
+  pthreadpool_t threadpool);
+
+enum xnn_status xnn_reshape_sum_nd_f32(
+  xnn_operator_t sum_op,
+  size_t num_reduction_axes,
+  const size_t* reduction_axes,
+  size_t num_input_dims,
+  const size_t* input_shape,
+  pthreadpool_t threadpool);
+
+enum xnn_status xnn_reshape_sum_nd_qs8(
+  xnn_operator_t sum_op,
+  size_t num_reduction_axes,
+  const size_t* reduction_axes,
+  size_t num_input_dims,
+  const size_t* input_shape,
+  size_t* workspace_size,
+  size_t* workspace_alignment,
+  pthreadpool_t threadpool);
+
+enum xnn_status xnn_reshape_sum_nd_qu8(
+  xnn_operator_t sum_op,
+  size_t num_reduction_axes,
+  const size_t* reduction_axes,
+  size_t num_input_dims,
+  const size_t* input_shape,
+  size_t* workspace_size,
+  size_t* workspace_alignment,
+  pthreadpool_t threadpool);
+
+enum xnn_status xnn_setup_sum_nd_f16(
+  xnn_operator_t sum_op,
+  void* workspace,
+  const void* input,
+  void* output);
+
+enum xnn_status xnn_setup_sum_nd_f32(
+  xnn_operator_t sum_op,
+  const float* input,
+  float* output);
+
+enum xnn_status xnn_setup_sum_nd_qs8(
+  xnn_operator_t sum_op,
+  void* workspace,
+  const void* input,
+  void* output);
+
+enum xnn_status xnn_setup_sum_nd_qu8(
+  xnn_operator_t sum_op,
+  void* workspace,
+  const void* input,
+  void* output);
+
 enum xnn_status xnn_create_negate_nc_f16(
   uint32_t flags,
   xnn_operator_t* negate_op_out);