1.8 Range-based循环语法
大多数语言都支持for-each语法遍历一个数组或集合中的元素。在C++98/03规范中,对于一个数组int arr[10],如果我们想要遍历这个数组,则只能使用递增的计数去引用数组中的每个元素:
在C++11规范中有了for-each语法,可以这么写:
对于1.7节中遍历std::map的内容,我们也可以使用这种语法:
for-each语法虽然很强大,但是有两个需要注意的地方。
◎ for-each中的迭代器类型与数组或集合中元素的类型完全一致,而原来使用老式语法迭代 stl容器(如 std::map)时,迭代器 iter的类型是 stl容器中元素的指针类型。因此,在上面例子的老式语法中,iter是一个指针类型(std::pair<std::string,std::string>*),使用 iter->second 去引用键值;而在 for-each 语法中,iter 与容器中元素的数据类型(std::pair<std::string,std::string>)相同,因此使用iter.second可直接引用键值。
◎ 在 for-each 语法中,对于复杂的数据类型,迭代器是原始数据的拷贝,而不是原始数据的引用。什么意思呢?来看一个例子:
我们遍历容器 v,试图将 v 中元素的值都修改成“hello”,在实际执行时却达不到我们想要的效果。这就是上文说的for-each中的迭代器是元素的拷贝,所以这里只是将每次的拷贝都修改成“hello”,原始数据并不会被修改。我们可以将迭代器修改成原始数据的引用:
这样就达到修改原始数据的目的了。这是使用for-each比较容易出错的地方。对于容器中的复杂数据类型,我们应该尽量使用这种引用原始数据的方式,减少不必要的拷贝构造函数调用开销:
1.8.1 自定义对象如何支持Range-based循环语法
介绍了这么多,如何让自定义对象支持Range-based循环语法呢?为了支持这种语法,这个对象至少需要实现如下两个方法:
上面的Iterator是自定义数据类型的迭代子类型,这里的Iterator类型必须支持如下三种操作(原因在下文中会解释)。
◎ operator++(自增)操作,可以在自增之后返回下一个迭代子的位置。
◎ operator!=(判不等操作)操作。
◎ operator*(解引用,dereference)操作。
下面是一个自定义对象支持for-each循环的例子:
注意:在以上代码中,迭代子Iterator是T*,是指针类型,本身就支持operator++和operator!=操作,所以这里并没有提供这两个方法的实现。那么为什么迭代子要支持operator++和operator!=操作呢?我们来看一下编译器是如何实现这种for-each循环的。
1.8.2 for-each循环的实现原理
上述for-each循环可被抽象成如下公式:
C++14标准是这样解释上面的公式的:
在这个循环中,begin-expr返回的迭代子__begin 需要支持自增操作,且每次循环时都会与end-expr返回的迭代子__end做判不等比较,在循环内部通过调用迭代子的解引用(*)操作取得实际的元素。这就是上文说的迭代子对象需要支持 operator++、operator!=和operator*的原因了。
但是在上面的公式中,一个逗号表达式中的“auto__begin=begin-expr,__end=end-expr;”只使用了一个类型符号 auto,导致起始迭代子__begin和结束迭代子__end 是同一类型,这样不太灵活。在某些设计中,可能希望结束迭代子是另一种类型。
因此在C++17标准中要求编译器解释for-each循环为如下形式:
看到了吧,代码第 2 行和第 3 行将获取起始迭代子__begin 和结束迭代子__end 分开写,这样这两个迭代子就可以是不同的类型了。虽然类型可以不一样,但这两种类型之间仍然支持operator!=操作。C++17对C++14的这种改变,对旧的代码不会产生任何影响,但可以让之后的开发更加灵活。