PyTorch计算机视觉实战:目标检测、图像处理与深度学习
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.2 PyTorch张量

张量是PyTorch的基本数据类型。张量是一个多维矩阵,类似于NumPy的ndarrays:

❍ 标量可以表示为零维张量;

❍ 向量可以表示为一维张量;

❍ 二维矩阵可以表示为二维张量;

❍ 多维矩阵可以表示为多维张量。

这些张量如图2-4所示。

图2-4

例如,可以将一幅彩色图像看作像素值的三维张量,因为一幅彩色图像由height×width×3像素组成——其中这三个通道对应于RGB通道。类似地,可以将灰度图像看成二维张量,因为它由height×width像素组成。

在本节的最后,将学习为什么张量那么有用、如何初始化张量,以及如何在张量上执行各种运算。这将为下一节研究如何利用张量来构建神经网络模型打下良好基础。