迭代器

迭代器iterator),是确使用户可在容器对象(container,例如链表数组)上遍访的对象[1][2][3],设计人员使用此接口无需关心容器对象的内存分配的实现细节。其行为很像数据库技术中的光标cursor),迭代器最早出现在1974年设计的CLU编程语言中。

在各种语言实现迭代器的方式皆不尽同,有些面向对象语言像JavaC#RubyPythonDelphi都已将迭代器的特性内置语言当中,完美的跟语言集成,我们称之隐式迭代器。但像是C++语言本身就没有迭代器的特色,但STL仍利用模板实现了功能强大的迭代器。STL容器的数据的内存地址可能会重新分配(reallocate),与容器绑定的迭代器仍然可以定位到重新分配后的正确的内存地址。

描述

内部迭代器

内部的迭代器是高阶函数(通常接受匿名函数),比如mapreduce等,它实现跨经一个容器的遍历,依次将给定函数应用到每个元素。

外部迭代器和迭代器模式

外部的迭代器可以被认为是某种类型的指针,它有两个主要操作:引用在一个对象搜集英语Collection (abstract data type)(collection)中的一个特定元素(称为元素访问),和修改自身使其指向下一个元素(称为元素遍历)[4]。还必须有一种方式创建迭代器并指向容器的第一个元素,还要有某种方式确定何时迭代器已经穷尽了容器中所有的元素。依据语言和意向用途,迭代器还可以提供额外的操作或展示不同的行为。

迭代器的主要用途是允许用户处理一个容器的所有元素,而将用户隔离于容器的内部结构[2]。这允许容器以任何它希望的方式存储元素,而允许用户把它们看作就是简单的序列或列表。迭代器类通常设计为紧密协作于对应的容器类。容器类通常提供创建迭代器的方法。

循环计数器有时也被称为循环迭代器。但是循环计数器只提供遍历功能而不提供访问功能。

生成器

实现迭代器的一种方式是使用受限形式的协程,也叫做生成器。不同于子例程,生成器协程可以向它的调用者多次产生返回值,而非只是返回一次。多数迭代器可自然的表达为生成器,但是因为生成器在被多次启用之间保存了自己的局部状态,它们特别适合于复杂的、有状态的迭代器,比如树遍历器。在不同的作者和语言之间,术语“生成器”和“迭代器”的用法上有微妙的差异和区别[5]。有些语言将二者视为同一接口,有些语言如JavaScript[6]则将之独立化。在Python中,生成器是一个迭代器构造器,即返回一个迭代器的函数。下面的Python生成器返回一个斐波那契数列的迭代器,使用到了Python的yield语句:

def fibonacci(limit):
    a, b = 0, 1
    for _ in range(limit):
        yield a
        a, b = b, a+b

for number in fibonacci(100):  # 这个生成器构造了一个迭代器
    print(number)

隐式迭代器

一些面向对象语言比如C#C++(后期版本)、 Delphi(后期版本)、GoJava(后期版本)、LuaPerlPythonRuby,提供了迭代一个容器对象的元素的内置方式,而不用介入一个显式的迭代器对象。实际的迭代器对象可以在现实中存在,即便如此,它也不被暴露在这个语言的源代码中[4][7]

隐式迭代器经常通过foreach语句(或等价者)来显现出来,比如下面的Python例子:

for value in iterable:
    print(value)

在Python中,可迭代者(iterable)是可以被转换成迭代器的一个对象,接着在这个for循环期间从头至尾迭代它,这是隐含完成的。

Smalltalk家族语言和受其启发的语言中,它们可以由搜集(collection)对象自身创建。比如下面Ruby例子:

iterable.each do |value|
  puts value
end

这种迭代风格有时叫做“内部迭代”,因为它的代码完全执行在可迭代对象的上下文(context)之内(它控制迭代的所有方面),而编程者只提供在每个步骤要执行的运算操作(使用匿名函数)。

支持列表推导式或类似构造的语言,还可以在结果列表的构造期间使用隐式迭代器,比如在Python中:

names = [person.name for person in roster if person.male]

有时隐式迭代只能做到部分的隐藏实质。C++语言有一些用于隐式迭代的函数模板,比如for_each()。这些函数仍要求显式的迭代器对象作为它们的初始输入,但是后续的迭代不将迭代器对象暴露给用户。

迭代器是对输入流的一种有用的抽象,流提供了潜在的无限可迭代的(但不必然可索引)的对象。一些语言,比如Perl和Python,将流实现为迭代器。流的可替代的实现包括数据驱动语言,比如AWKsed

迭代器分类

迭代器范畴

迭代器可以依据功能而归类,下面是迭代器范畴的一个(不完全)列表[8][9]:

范畴 语言
双向迭代器 C++
前向迭代器 C++
输入迭代器 C++
输出迭代器 C++
随机访问迭代器 C++
Trivial迭代器 C++ (旧STL)[10]

迭代器类型

不同的语言或它们所具有的函数库定义了自己的迭代器的类型,下面是一个(不完全)列表[11]

类型 语言
数组迭代器 PHP, R[12]
缓存迭代器 PHP
常量迭代器 C++,[13] PHP
目录迭代器 PHP, Python
过滤器迭代器 PHP, R
Limit迭代器 PHP
列表迭代器 Java,[7] R
递归数组迭代器 PHP
XML迭代器 PHP

语言示例

C♯

C♯中,一种新形式的迭代器提供了函数语言程序设计中的生成器,使用yield return

类似于Python中使用的yield

// Method that takes an iterable input (possibly an array)
// and returns all even numbers.
public static IEnumerable<int> GetEven(IEnumerable<int> numbers)
{
    foreach(int i in numbers)
    {
        if (i % 2 == 0) yield return i;
    }
}

C++

C++STL可支持迭代器。

 template<typename InputIterator>
 void printall(InputIterator first, InputIterator last)
 {
     for(; first != last; ++first)
     {
         std::cout << *first << std::endl;
     }
 }

Java

Java JDK 1.2 版开始支持迭代器。每一个迭代器提供next()以及hasNext()方法,同时也支持remove()。

Iterator iter = list.iterator();
//Iterator<MyType> iter = list.iterator();    in J2SE 5.0
while (iter.hasNext())
    System.out.println(iter.next());

Python

Python中,迭代器是语言的基础部分,而在很多情况下是不可见的,因为它们隐含的用在了forforeach)语句、列表推导式生成器表达式之中。Python标准内建的所有搜集英语Collection (abstract data type)类型都支持迭代,还有很多支持它的类也是标准库的一部分。下面的例子展示典型的在序列(如列表、元组、字典、集合等)上的隐式迭代:

for value in sequence:
    print(value)

Python字典(某种形式的关联数组),在字典返回了键(key)的时候,可以直接在其上进行迭代:

for key in dictionary:
    value = dictionary[key]
    print(key, value)

或者在字典items方法产生元组形式的对应键-值对的时候,在其上进行迭代:

for key, value in dictionary.items():
    print(key, value)

但是迭代器也可以被显式的使用和定义。对于一个可迭代的序列类型或类,内建的函数iter()可用来创建一个迭代对象。接着可以通过next()函数对这个迭代对象进行迭代;这个函数在内部使用__next__()方法,它返回这个容器中的下一个元素。(前面的叙述适用于Python 3.x,在Python 2.x中要使用等价的next()方法。)当没有元素剩余的时候,引发StopIteration异常。下面的例子展示与前例等价的使用显式迭代器的在序列上的迭代:

it = iter(sequence)
while True:
    try:
        #value = it.next() # in Python 2.x
        value = next(it) # in Python 3.x
    except StopIteration:
        break
    print(value)

任何用户定义的类都可以通过定义返回迭代器对象的__iter__()方法,支持标准迭代(无论隐式还是显式)。接着迭代器对象需要定义返回下一个元素的__next__()方法。

Python生成器实现了这个迭代协议

Ruby

Ruby程序员可以用yield关键字定义迭代器,又将迭代器和生成器分开。

0..42.each do |n|
 puts n
end

...以及...

for n in 0..42
 puts n
end

Rust

使用Rust可以对向量的元素进行迭代,或者创建自己的迭代器。 每个迭代器都有适配器(map,filter,skip,take……)。

for n in 0..42 {
    println!("{}", n);
}

fibonacci()下面是一个自定义迭代器。

for i in fibonacci().skip(4).take(4) {
    println!("{}", i);
}

参见

引用

  1. ^ Gatcomb, Joshua. Understanding and Using Iterators. Perl.com. [2012-08-08]. (原始内容存档于2005-06-30). A user-defined iterator usually takes the form of a code reference that, when executed, calculates the next item in a list and returns it. When the iterator reaches the end of the list, it returns an agreed-upon value. 
  2. ^ 2.0 2.1 Watt, Stephen M. A Technique for Generic Iteration and Its Optimization (PDF). The University of Western Ontario, Department of Computer Science. [2012-08-08]. (原始内容存档于2012-08-06). Iterators were introduced as constructs to allow looping over abstract data structures without revealing their internal representation. 
  3. ^ Alex Allain. STL Iterators. Cprogramming.com - Your resource for C and C++. [2012-08-08]. (原始内容存档于2021-02-13). You can think of an iterator as pointing to an item that is part of a larger container of items. 
  4. ^ 4.0 4.1 Difference between an external iterator and an internal iterator. CareerRide.COM. 2009-04-03 [2012-08-08]. (原始内容存档于2021-04-18). An internal iterator is implemented by the member functions of the class which has the iteration logic. An external iterator is implemented by a separate class which can be attached to the object which has iteration logic. The advantage of external iterator is that, many iterators can be made active simultaneously on the existing or same object. 
  5. ^ Watt, Stephen M. A Technique for Generic Iteration and Its Optimization (PDF). The University of Western Ontario, Department of Computer Science. [2012-08-08]. Some authors use the term iterator, and others the term generator. Some make subtle distinctions between the two. 
  6. ^ Iterators and generators. MDN Web Docs. [2018-10-16]. (原始内容存档于2021-05-18) (美国英语). 
  7. ^ 7.0 7.1 Freeman, Eric; Freeman, Elisabeth; Kathy, Sierra; Bert, Bates. Hendrickson, Mike; Loukides, Mike , 编. Head First Design Patterns 1. O'REILLY: 338. 2004 [2012-08-09]. ISBN 978-0-596-00712-6. (原始内容 (paperback)存档于2020-04-30). 
  8. ^ Kevin Waterson. C++ Iteratoren: Iterator-Kategorien. cppreference.com. [2012-08-09]. (原始内容存档于2016-01-10) (德语). 
  9. ^ Kevin Waterson. Iterators: Concepts. sgi. [2012-08-09]. (原始内容存档于2017-12-03). 
  10. ^ larsmans. Types of iterator: Output vs. input vs. forward vs. random access iterator. stackoverflow. 2011-03-06 [2012-08-09]. (原始内容存档于2015-11-28). 
  11. ^ Kevin Waterson. Introduction to SPL: Introduction to Standard PHP Library (SPL). PHPRO.ORG. [2012-08-09]. (原始内容存档于2016-01-10). 
  12. ^ Collier, Andrew. Iterators in R. [16 November 2013]. (原始内容存档于2018-10-18). 
  13. ^ concurrent_unordered_set Template Class. Intel Threading Building Blocks for Open Source. [2012-08-09]. (原始内容存档于2015-05-01). •The iterator types iterator and const_iterator are of the forward iterator category 

外部链接