上面讨论了开发者如何利用机器学习框架提供的Python接口定义机器学习的整个工作流,以及如何定义复杂的深度神经网络。然而,很多时候,用户也需要添加自定义的算子帮助实现新的模型、优化器、数据处理函数等。这些自定义算子需要通过C和C++实现,从而获得最优性能。但是为了让用户使用算子,也需要添加Python调用接口,从而方便用户将它们整合到已有的以Python为核心编写的工作流和模型中。本节将讨论这一过程是如何实现的。