<img style = "float: left" src="https://mirrors.creativecommons.org/presskit/buttons/88x31/png/by-nc-nd.png" width="120"> &copy; 2024-2025 Roger Villemaire, [villemaire.roger@uqam.ca](mailto:villemaire.roger@uqam.ca)  
[Creative Commons Paternité - Pas d'Utilisation Commerciale - Pas de Modification 3.0 non transcrit](http://creativecommons.org/licenses/by-nc-nd/3.0/)

# Les itérateurs

Bien que nous n'ayons pas vu explicitement cette notion, nous avons utilisé les itétateurs plusieurs fois, par exemple dans des boucles *for*.

In [None]:
for i in [0,1,2]:
    print(i)

Un *itérateur* est un objet qui représente une **position** dans une énumération et qui permet donc de la traverser.

On peut obtenir un itérateur sur une collection Python avec la fonction *iter()*. Par exemple,

In [None]:
it = iter([0,1,2])

In [None]:
type(it)

est un itérateur sur la collection *[0,1,2]*.

Un type de données qui permet d'obtenir un itérateur avec la fonction *iter()* est appelé un *itérable*.

Un itérateur Python *it* doit nécessairement implémenter les deux fonctions suivantes, qui forment le *protocole* des itérateurs :
  * next(it), qui retourne l'élément courant et avance l'itérateur à la position suivante,
  * iter(it), qui retourne *it* et fait en sorte qu'un itérateur puisse être utilisé à la place d'une collection, par exemple dans une boucle *for*.

In [None]:
next(it)

Un nouvel itérateur est donc positionné, normalement, au début de l'itérable. Les appels à *next()* permettent d'obtenir, successivement, les éléments de l'itérable et lorsqu'il n'y en a plus, *l'exception* *StopIteration* est levée. Une *exception* indique qu'un événement exceptionnel s'est produit. Ici, il s'agit du fait qu'on a épuisé l'itérable. Nous reviendrons bientôt sur cette notion.

Dans tous les cas, il est important de retenir que l'itérateur avance à chaque appel à *next()* et que pour revenir au début de l'itérable il faut normalement créer un nouvel itérateur.

Nous sommes maintenant en mesure d'expliquer qu'une boucle *for*
  * crée un itérateur sur l'itérable (avec la fonction *iter()*)
  * et traverse l'itérable (avec la fonction *next()*).
  
Comme on le verra bientôt, on peut définir nos propres types itérables, en s'assurant que *iter()* retourne un itérateur qui est simplement un type réalisant le protocole des itérateurs. Il sera alors possible d'utiliser les boucles *for* avec ces types, ainsi que toutes les fonctions que nous allons voir aujourd'hui.

Tout d'abord, comme mentionné, il est possible de réaliser une bouche *for* tant sur un itérable

In [None]:
for i in [0,1,2]:
    print(i)

que sur un itérateur

In [None]:
for i in iter([0,1,2]):
    print(i)

Ceci est très utile, car plusieurs fonctions Python retournent des itérateurs, comme nous allons le voir bientôt. De plus,
on peut faire une boucle *for* sur un itérateur qui n'est plus au départ, pour terminer la traversée des éléments, comme suit :

In [None]:
it = iter([0,1,2])
premier = next(it) # affecter le premier élément et avancer l'itérateur
for i in it: # afficher les éléments restants.
    print(i)
print(premier) # afficher le premier élément.

En fait, comme déjà mentionné, itérables et itérateurs sont en pratique essentiellement interchangeables. Par exemple, à partir d'un itérateur

In [None]:
it = iter((0,1,2))

sur un tuple, on peut tout aussi facilement créé la liste correspondante

In [None]:
list(it)

qu'à partir du tuplet lui-même

In [None]:
list((0,1,2))

## Fonctions qui retournent des itérateurs

Tout en Python n'est pas nécessairement de la plus belle cohérence. Par exemple

In [None]:
l = [2,1,0]
s = sorted(l)

In [None]:
s

retourne une nouvelle liste, triée (*attention :* l.sort() trierait la liste l !). D'un autre côté

In [None]:
it = reversed([1,2,3])

In [None]:
it

retourne un itérateur inverse.

In [None]:
next(it)

Il est important de noter que l'itérateur (inverse) est somme toute seulement un curseur sur la liste. Il ne la modifie donc pas.

In [None]:
l

### Map et filter

Il y a deux fonctions particulièrement importantes qui permettent de transformer et de filtrer un itérable.

Tout d'abord, avec une fonction qui transforme les éléments

In [None]:
def prefixerParQ(x):
    """retourne une chaîne égale à 'x' mais préfixée par 'Q'"""
    return 'Q' + x

on peut transformer tous les éléments d'un itérable

In [None]:
m = map(prefixerParQ,["1","2","3"])

In [None]:
m

Bien que techniquement la valeur retournée ne soit pas un itérateur, elle implémente le protocole des itérateurs, ce qui est la seule chose qui compte en définitive !

In [None]:
next(m)

In [None]:
list(map(prefixerParQ,["1","2","3"]))

On peut aussi utiliser *map* avec une fonction à plusieurs variables et le nombre correspondant de listes.

In [None]:
def concatener(x,y):
    """retourne x+y"""
    return x+y

In [None]:
list(map(concatener,["Q","R","S"],["1","2","3"]))

Comme il est fastidieux de constamment devoir introduire de petites fonctions qui ne seront tout probablement pas ré-utilisées, il est souvent plus pratique d'introduire une
**fonction anonyme**.  
Par exemple,

In [None]:
list(map(lambda x,y:x+y,["Q","R","S"],["1","2","3"]))

permet d'obtenir le même résultat que précédemment.

Une fonction anonyme est donc de la forme  
*lambda arg1,arg2,... : valeur retournée*

Il s'agit d'une fonction comme une autre, sauf qu'elle ne porte pas de nom et doit donc être utilisée directement comme argument.

Finalement, la fonction *filter* permet de sélectionner les éléments qui satisfont une condition.

Par exemple, si on veut obtenir la liste des éléments pairs

In [None]:
list(filter(lambda x:x%2==0,[0,1,2,3]))

On peut obtenir des résultats similaires avec la compréhension de liste. La différence essentielle est qu'ici on obtient un itérateur. On peut d'ailleurs l'utiliser pour obtenir d'autres types d'objets, par exemple

In [None]:
tuple(filter(lambda x:x%2==0,[0,1,2,3]))

### Exercices
En utilisant les fonctions *map* et *filter*, répondez aux questions suivantes.

1. Étant donnée le tuplet suivant

In [None]:
l = ("q01","q02","q03")

produisez un tuplet où la lettre "q" est remplacée par "Q".

2. Toujours avec la même liste, produisez une liste où le '0' a été retiré.

3. Produisez maintenant un tuplet où la lettre "q" est remplacée par "Q" **et** où le '0' a été retiré.

4. Avec maintenant la liste suivante

In [None]:
l = ("q01","q12","q03","q13","q20")

produisez une liste ne contenant que les chaînes dont le premier chiffre est pair. On suppose ici que ces chaînes sont toujours formées d'une lettre et de deux chiffres.

5. Produisez maintenant une liste ne contenant que les chaînes dont le premier chiffre est pair et le deuxième chiffre est supérieur au premier.

6. Produisez la même liste que précédemment, mais cette fois-ci on veut en plus avoir un "Q" en majuscules.

7. Même question que la précédente, mais cette fois-ci on veut que "q" soit remplacé par "Question".

## Itertools

Le module *itertools* offre de nombreuses fonctions supplémentaires pour produire des itérateurs permettant de combiner des éléments de différentes façons.

Il faut tout d'abord importer ce module de la façon usuelle

In [None]:
import itertools as itt

Tout d'abord, il est possible de combiner deux itérables de toutes les façons possibles, pour obtenir les tuplets des combinaisons possibles.

In [None]:
for i in itt.product("ab","012"):
    print(i)

In [None]:
for i in itt.product("ABC",range(5)):
    print(i)

Par exemple, si on a les domaines de trois variables, X,Y,Z

In [None]:
domX = [0,1,2]
domY = ['abc','def','xy']
domZ = [True,False]

On peut générer toutes les combinaisons de valeurs avec

In [None]:
for i in itt.product(domX,domY,domZ):
    print(i)

### Exercices

1. Utilisez la fonction *product* pour afficher tous les triplets Pythagoriciens dont les composantes sont inférieures à $15$. 
*Rappel :* $(x,y,z)$ est un triplet Pythagoricien si $x,y,z$ sont positifs et $x^2+y^2=z^2$.  
*Astuce :* *product* a un second paramètre *repeat* qui évite de devoir répéter le premier.

Si on a des associations entre noms et domaines sous la forme d'un dictionnaire comme

In [None]:
doms = {'X' : [0,1,2], 'Y' : ['abc','def','uv'], 'Z' : [True,False]}

On pourrait très bien énumérer les combinaisons des valeurs des domaines avec

In [None]:
for i in itt.product(doms['X'],doms['Y'],doms['Z']):
    print(i)

mais on pourrait se demander s'il n'y aurait pas une méthode pour obtenir les arguments de la fonction directement du dictionnaire *doms*.  
En fait,

In [None]:
doms.values()

semble être essentiellement ce que l'on cherche. Sauf que

In [None]:
for i in itt.product(doms.values()):
    print(i)

Mais en fait, ceci est naturel car *doms.values()* est une collection formée de trois éléments. La fonction *product()* va donc produire trois 1-tuplets. On peut d'ailleurs s'assurer que cette interprétation est la bonne en obtenant un itérateur sur cette collection.

In [None]:
it = iter(doms.values())

In [None]:
next(it)

Ce que l'on voudrait plutôt, c'est que les éléments de *doms.values()* soient utilisés comme les **arguments** de *product()*.  
Il s'agit donc de l'opération de **unpacking** de Python symbolisée par une * qui transforme une **collection** en une **suite d'arguments** d'une fonction.  
Il faut donc plutôt réaliser l'appel de la façon suivante.

In [None]:
for i in itt.product(*doms.values()):
    print(i)

On peut aussi voir cette distinction entre l'appel

In [None]:
print([1,2,3])

qui affiche la liste et

In [None]:
print(*[1,2,3])

qui est équivalente à *print(1,2,3)*, et qui affiche donc simplement les éléments séparés par des espaces.  
Pour conclure, le unpacking sert simplement à passer en paramètre un tuplet, plutôt qu'une suite d'arguments.