Apprendre à programmer avec Python

Apprendre � programmer avec Python

Chapitre 1 : Penser comme un programmeur▲

Nous allons introduire dans ce chapitre quelques concepts qu'il vous faut conna�tre avant de vous lancer dans l'apprentissage de la programmation. Nous avons volontairement limit� nos explications afin de ne pas vous encombrer l'esprit. La programmation n'est pas difficile : il suffit d'un peu de m�thode et de pers�v�rance.

Une part importante de ce chapitre est traduite d'un chapitre similaire de � How to think like a computer scientist � de Downey, Elkner & Meyers.

1.1. La d�marche du programmeur▲

Le but de ce cours est de vous apprendre � penser et � r�fl�chir comme un analyste-programmeur. Ce mode de pens�e combine des d�marches intellectuelles complexes, similaires � celles qu'accomplissent les math�maticiens, les ing�nieurs et les scientifiques.

Comme le math�maticien, l'analyste-programmeur utilise des langages formels pour d�crire des raisonnements (ou algorithmes). Comme l'ing�nieur, il con�oit des dispositifs, il assemble des composants pour r�aliser des m�canismes et il �value leurs performances. Comme le scientifique, il observe le comportement de syst�mes complexes, il �bauche des hypoth�ses explicatives, il teste des pr�dictions.

L'activit� essentielle d'un analyste-programmeur est la r�solution de probl�mes.

Il s'agit l� d'une comp�tence de haut niveau, qui implique des capacit�s et des connaissances diverses : �tre capable de (re)formuler un probl�me de plusieurs mani�res diff�rentes, �tre capable d'imaginer des solutions innovantes et efficaces, �tre capable d'exprimer ces solutions de mani�re claire et compl�te.

La programmation d'un ordinateur consiste en effet � � expliquer � en d�tail � une machine ce qu'elle doit faire, en sachant d'embl�e qu'elle ne peut pas v�ritablement � comprendre � un langage humain, mais seulement effectuer un traitement automatique sur des s�quences de caract�res. Un programme n'est rien d'autre qu'une suite d'instructions, encod�es en respectant de mani�re tr�s stricte un ensemble de conventions fix�es � l'avance que l'on appelle un langage informatique. La machine est ainsi pourvue d'un m�canisme qui d�code ces instructions en associant � chaque � mot � du langage une action pr�cise.

Vous allez donc apprendre � programmer, activit� d�j� int�ressante en elle-m�me parce qu'elle contribue � d�velopper votre intelligence. Mais vous serez aussi amen� � utiliser la programmation pour r�aliser des projets concrets, ce qui vous procurera certainement de tr�s grandes satisfactions.

1.2. Langage machine, langage de programmation▲

A strictement parler, un ordinateur n'est rien d'autre qu'une machine effectuant des op�rations simples sur des s�quences de signaux �lectriques, lesquels sont conditionn�s de mani�re � ne pouvoir prendre que deux �tats seulement (par exemple un potentiel �lectrique maximum ou minimum). Ces s�quences de signaux ob�issent � une logique du type � tout ou rien � et peuvent donc �tre consid�r�s conventionnellement comme des suites de nombres ne prenant jamais que les deux valeurs 0 et 1. Un syst�me num�rique ainsi limit� � deux chiffres est appel� syst�me binaire.

Sachez d�s � pr�sent que dans son fonctionnement interne, un ordinateur est totalement incapable de traiter autre chose que des nombres binaires. Toute information d'un autre type doit �tre convertie, ou cod�e, en format binaire. Cela est vrai non seulement pour les donn�es que l'on souhaite traiter (les textes, les images, les sons, les nombres, etc.), mais aussi pour les programmes, c'est-�-dire les s�quences d'instructions que l'on va fournir � la machine pour lui dire ce qu'elle doit faire avec ces donn�es.

Le seul � langage � que l'ordinateur puisse v�ritablement � comprendre � est donc tr�s �loign� de ce que nous utilisons nous-m�mes. C'est une longue suite de 1 et de 0 (les "bits") souvent trait�s par groupes de 8 (les � octets �), 16, 32, ou m�me 64. Ce � langage machine � est �videmment presqu'incompr�hensible pour nous. Pour � parler � � un ordinateur, il nous faudra utiliser des syst�mes de traduction automatiques, capables de convertir en nombres binaires des suites de caract�res formant des mots-cl�s (anglais en g�n�ral) qui seront plus significatifs pour nous.

Ces syst�mes de traduction automatique seront �tablis sur la base de toute une s�rie de conventions, dont il existera �videmment de nombreuses variantes.

Le syst�me de traduction proprement dit s'appellera interpr�teur ou bien compilateur, suivant la m�thode utilis�e pour effectuer la traduction (voir ci-apr�s). On appellera langage de programmation un ensemble de mots-cl�s (choisis arbitrairement) associ� � un ensemble de r�gles tr�s pr�cises indiquant comment on peut assembler ces mots pour former des � phrases � que l'interpr�teur ou le compilateur puisse traduire en langage machine (binaire).

Suivant son niveau d'abstraction, on pourra dire d'un langage qu'il est � de bas niveau � (ex : Assembler) ou � de haut niveau � (ex : Pascal, Perl, Smalltalk, Clarion, Java...). Un langage de bas niveau est constitu� d'instructions tr�s �l�mentaires, tr�s � proches de la machine �. Un langage de haut niveau comporte des instructions plus abstraites ou, plus � puissantes �. Cela signifie que chacune de ces instructions pourra �tre traduite par l'interpr�teur ou le compilateur en un grand nombre d'instructions machine �l�mentaires.

Le langage que vous allez apprendre en premier est Python. Il s'agit d'un langage de haut niveau, dont la traduction en codes binaires est complexe et prend donc toujours un certain temps. Cela pourrait para�tre un inconv�nient. En fait, les avantages que pr�sentent les langages de haut niveau sont �normes : il est beaucoup plus facile d'�crire un programme dans un langage de haut niveau ; l'�criture du programme prend donc beaucoup moins de temps ; la probabilit� d'y faire des fautes est nettement plus faible ; la maintenance (c'est-�-dire l'apport de modifications ult�rieures) et la recherche des erreurs (les � bugs �) sont grandement facilit�es. De plus, un programme �crit dans un langage de haut niveau sera souvent portable, c'est-�-dire que l'on pourra le faire fonctionner sans gu�re de modifications sur des machines ou des syst�mes d'exploitation diff�rents. Un programme �crit dans un langage de bas niveau ne peut jamais fonctionner que sur un seul type de machine : pour qu'une autre l'accepte, il faut le r��crire enti�rement.

1.3. Compilation et interpr�tation▲

Le programme tel que nous l'�crivons � l'aide d'un logiciel �diteur (une sorte de traitement de texte sp�cialis�) sera appel� d�sormais programme source (ou code source). Comme d�j� signal� plus haut, il existe deux techniques principales pour effectuer la traduction d'un tel programme source en code binaire ex�cutable par la machine : l'interpr�tation et la compilation.

Dans la technique appel�e interpr�tation, le logiciel interpr�teur doit �tre utilis� chaque fois que l'on veut faire fonctionner le programme. Dans cette technique en effet, chaque ligne du programme source analys� est traduite au fur et � mesure en quelques instructions du langage machine, qui sont ensuite directement ex�cut�es. Aucun programme objet n'est g�n�r�.

La compilation consiste � traduire la totalit� du texte source en une fois. Le logiciel compilateur lit toutes les lignes du programme source et produit une nouvelle suite de codes que l'on appelle programme objet (ou code objet). Celui-ci peut d�sormais �tre ex�cut� ind�pendamment du compilateur et �tre conserv� tel quel dans un fichier (� fichier ex�cutable �).

Chacune de ces deux techniques a ses avantages et ses inconv�nients :

L'interpr�tation est id�ale lorsque l'on est en phase d'apprentissage du langage, ou en cours d'exp�rimentation sur un projet. Avec cette technique, on peut en effet tester imm�diatement toute modification apport�e au programme source, sans passer par une phase de compilation qui demande toujours du temps.

Par contre, lorsqu'un projet comporte des fonctionnalit�s complexes qui doivent s'ex�cuter rapidement, la compilation est pr�f�rable : il est clair en effet qu'un programme compil� fonctionnera toujours nettement plus vite que son homologue interpr�t�, puisque dans cette technique l'ordinateur n'a plus � (re)traduire chaque instruction en code binaire avant qu'elle puisse �tre ex�cut�e.

Certains langages modernes tentent de combiner les deux techniques afin de retirer le meilleur de chacune. C'est le cas de Python et aussi de Java. Lorsque vous lui fournissez un programme source, Python commence par le compiler pour produire un code interm�diaire, similaire � un langage machine, que l'on appelle bytecode, lequel sera ensuite transmis � un interpr�teur pour l'ex�cution finale. Du point de vue de l'ordinateur, le bytecode est tr�s facile � interpr�ter en langage machine. Cette interpr�tation sera donc beaucoup plus rapide que celle d'un code source.

Les avantages de cette m�thode sont appr�ciables :

Le fait de disposer en permanence d'un interpr�teur permet de tester imm�diatement n'importe quel petit morceau de programme. On pourra donc v�rifier le bon fonctionnement de chaque composant d'une application au fur et � mesure de sa construction.
L'interpr�tation du bytecode compil� n'est pas aussi rapide que celle d'un v�ritable code binaire, mais elle est tr�s satisfaisante pour de tr�s nombreux programmes, y compris graphiques.
Le bytecode est portable. Pour qu'un programme Python ou Java puisse s'ex�cuter sur diff�rentes machines, il suffit de disposer pour chacune d'elles d'un interpr�teur adapt�.

Tout ceci peut vous para�tre un peu compliqu�, mais la bonne nouvelle est que tout ceci est pris en charge automatiquement par l'environnement de d�veloppement de Python. Il vous suffira d'entrer vos commandes au clavier, de frapper <Enter>, et Python se chargera de les compiler et de les interpr�ter pour vous.

1.4. Mise au point d'un programme - Recherche des erreurs (� debug �)▲

La programmation est une d�marche tr�s complexe, et comme c'est le cas dans toute activit� humaine, on y commet de nombreuses erreurs. Pour des raisons anecdotiques, les erreurs de programmation s'appellent des � bugs � (ou � bogues �, en France)⁴, et l'ensemble des techniques que l'on met en oeuvre pour les d�tecter et les corriger s'appelle � debug � (ou � d�boguage �).

En fait, il peut exister dans un programme trois types d'erreurs assez diff�rentes, et il convient que vous appreniez � bien les distinguer :

4 "bug" est � l'origine un terme anglais servant � d�signer de petits insectes g�nants, tels les punaises. Les premiers ordinateurs fonctionnaient � l'aide de "lampes" radios qui n�cessitaient des tensions �lectriques assez �lev�es. Il est arriv� � plusieurs reprises que des petits insectes s'introduisent dans cette circuiterie complexe et se fassent �lectrocuter, leurs cadavres calcin�s provoquant alors des court-circuits et donc des pannes incompr�hensibles. Le mot fran�ais "bogue" a �t� choisi par homonymie approximative. Il d�signe la coque �pineuse de la ch�taigne.

1.4.1. Erreurs de syntaxe▲

Python ne peut ex�cuter un programme que si sa syntaxe est parfaitement correcte. Dans le cas contraire, le processus s'arr�te et vous obtenez un message d'erreur. Le terme syntaxe se r�f�re aux r�gles que les auteurs du langage ont �tablies pour la structure du programme.

Tout langage comporte sa syntaxe. Dans la langue fran�aise, par exemple, une phrase doit toujours commencer par une majuscule et se terminer par un point. ainsi cette phrase comporte deux erreurs de syntaxe

Dans les textes ordinaires, la pr�sence de quelques petites fautes de syntaxe par-ci par-l� n'a g�n�ralement pas d'importance. Il peut m�me arriver (en po�sie, par exemple), que des fautes de syntaxe soient commises volontairement. Cela n'emp�che pas que l'on puisse comprendre le texte.

Dans un programme d'ordinateur, par contre, la moindre erreur de syntaxe produit invariablement un arr�t de fonctionnement (un � plantage �) ainsi que l'affichage d'un message d'erreur. Au cours des premi�res semaines de votre carri�re de programmeur, vous passerez certainement pas mal de temps � rechercher vos erreurs de syntaxe. Avec de l'exp�rience, vous en commettrez beaucoup moins.

Gardez � l'esprit que les mots et les symboles utilis�s n'ont aucune signification en eux-m�mes : ce ne sont que des suites de codes destin�s � �tre convertis automatiquement en nombres binaires. Par cons�quent, il vous faudra �tre tr�s attentifs � respecter scrupuleusement la syntaxe du langage.

Il est heureux que vous fassiez vos d�buts en programmation avec un langage interpr�t� tel que Python. La recherche des erreurs y est facile et rapide. Avec les langages compil�s (tel C++), il vous faudrait recompiler l'int�gralit� du programme apr�s chaque modification, aussi minime soitelle.

1.4.2. Erreurs s�mantiques▲

Le second type d'erreur est l'erreur s�mantique ou erreur de logique. S'il existe une erreur de ce type dans un de vos programmes, celui-ci s'ex�cute parfaitement, en ce sens que vous n'obtenez aucun message d'erreur, mais le r�sultat n'est pas celui que vous attendiez : vous obtenez autre chose.

En r�alit�, le programme fait exactement ce que vous lui avez dit de faire. Le probl�me est que ce que vous lui avez dit de faire ne correspond pas � ce que vous vouliez qu'il fasse. La s�quence d'instructions de votre programme ne correspond pas � l'objectif poursuivi. La s�mantique (la logique) est incorrecte.

Rechercher des fautes de logique peut �tre une t�che ardue. Il faut analyser ce qui sort de la machine et t�cher de se repr�senter une par une les op�rations qu'elle a effectu�es, � la suite de chaque instruction.

1.4.3. Erreurs � l'ex�cution▲

Le troisi�me type d'erreur est l'erreur en cours d'ex�cution (Run-time error), qui appara�t seulement lorsque votre programme fonctionne d�j�, mais que des circonstances particuli�res se pr�sentent (par exemple, votre programme essaie de lire un fichier qui n'existe plus). Ces erreurs sont �galement appel�es des exceptions, parce qu'elles indiquent g�n�ralement que quelque chose d'exceptionnel s'est produit (et qui n'avait pas �t� pr�vu). Vous rencontrerez davantage ce type d'erreur lorsque vous programmerez des projets de plus en plus volumineux.

1.5. Recherche des erreurs et exp�rimentation▲

L'une des comp�tences les plus importantes � acqu�rir au cours de votre apprentissage est celle qui consiste � � d�boguer � efficacement un programme. Il s'agit d'une activit� intellectuelle parfois �nervante mais toujours tr�s riche, dans laquelle il faut faire montre de beaucoup de perspicacit�.

Ce travail ressemble par bien des aspects � une enqu�te polici�re. Vous examinez un ensemble de faits, et vous devez �mettre des hypoth�ses explicatives pour reconstituer les processus et les �v�nements qui ont logiquement entra�n� les r�sultats que vous constatez.

Cette activit� s'apparente aussi au travail exp�rimental en sciences. Vous vous faites une premi�re id�e de ce qui ne va pas, vous modifiez votre programme et vous essayez � nouveau. Vous avez �mis une hypoth�se, qui vous permet de pr�dire ce que devra donner la modification. Si la pr�diction se v�rifie, alors vous avez progress� d'un pas sur la voie d'un programme qui fonctionne. Si la pr�diction se r�v�le fausse, alors il vous faut �mettre une nouvelle hypoth�se. Comme l'a bien dit Sherlock Holmes : � Lorsque vous avez �limin� l'impossible, ce qui reste, m�me si c'est improbable, doit �tre la v�rit� � (A. Conan Doyle, Le signe des quatre).

Pour certaines personnes, � programmer � et � d�boguer � signifient exactement la m�me chose. Ce qu'elles veulent dire par l� est que l'activit� de programmation consiste en fait � modifier, � corriger sans cesse un m�me programme, jusqu'� ce qu'il se comporte finalement comme vous le vouliez. L'id�e est que la construction d'un programme commence toujours par une �bauche qui fait d�j� quelque chose (et qui est donc d�j� d�bogu�e), � laquelle on ajoute couche par couche de petites modifications, en corrigeant au fur et � mesure les erreurs, afin d'avoir de toute fa�on � chaque �tape du processus un programme qui fonctionne.

Par exemple, vous savez que Linux est un syst�me d'exploitation (et donc un gros logiciel) qui comporte des milliers de lignes de code. Au d�part, cependant, cela a commenc� par un petit programme simple que Linus Torvalds avait d�velopp� pour tester les particularit�s du processeur Intel 80386. Suivant Larry GreenField (� The Linux user's guide �, beta version 1) : � L'un des premiers projets de Linus �tait un programme destin� � convertir une cha�ne de caract�res AAAA en BBBB. C'est cela qui plus tard finit par devenir Linux ! �.

Ce qui pr�c�de ne signifie pas que nous voulions vous pousser � programmer par approximations successives, � partir d'une vague id�e. Lorsque vous d�marrerez un projet de programmation d'une certaine importance, il faudra au contraire vous efforcer d'�tablir le mieux possible un cahier des charges d�taill�, lequel s'appuiera sur un plan solidement construit pour l'application envisag�e.

Diverses m�thodes existent pour effectuer cette t�che d'analyse, mais leur �tude sort du cadre de ces notes. Veuillez consulter votre professeur pour de plus amples informations et r�f�rences.

1.6. Langages naturels et langages formels▲

Les langages naturels sont ceux que les �tres humains utilisent pour communiquer. Ces langages n'ont pas �t� mis au point d�lib�r�ment (encore que certaines instances t�chent d'y mettre un peu d'ordre) : ils �voluent naturellement.

Les langages formels sont des langages d�velopp�s en vue d'applications sp�cifiques. Ainsi par exemple, le syst�me de notation utilis� par les math�maticiens est un langage formel particuli�rement efficace pour repr�senter les relations entre nombres et grandeurs diverses. Les chimistes utilisent un langage formel pour repr�senter la structure des mol�cules, etc.

Les langages de programmation sont des langages formels qui ont �t� d�velopp�s pour d�crire des algorithmes et des structures de donn�es.

Comme on l'a d�j� signal� plus haut, les langages formels sont dot�s d'une syntaxe qui ob�it � des r�gles tr�s strictes. Par exemple, 3+3=6 est une repr�sentation math�matique correcte, alors que $3=+6 ne l'est pas. De m�me, la formule chimique H₂O est correcte, mais non Zq₃G₂

Les r�gles de syntaxe s'appliquent non seulement aux symboles du langage (par exemple, le symbole chimique Zq est ill�gal parce qu'il ne correspond � aucun �l�ment), mais aussi � la mani�re de les combiner. Ainsi l'�quation math�matique 6+=+/5- ne contient que des symboles parfaitement autoris�s, mais leur arrangement incorrect ne signifie rien du tout.

Lorsque vous lisez une phrase quelconque, vous devez arriver � vous repr�senter la structure logique de la phrase (m�me si vous faites cela inconsciemment la plupart du temps). Par exemple, lorsque vous lisez la phrase � la pi�ce est tomb�e �, vous comprenez que � la pi�ce � en est le sujet et � est tomb�e � le verbe. L'analyse vous permet de comprendre la signification, la logique de la phrase (sa s�mantique). D'une mani�re analogue, l'interpr�teur Python devra analyser la structure de votre programme source pour en extraire la signification.

Les langages naturels et formels ont donc beaucoup de caract�ristiques communes (des symboles, une syntaxe, une s�mantique), mais ils pr�sentent aussi des diff�rences tr�s importantes :

Ambigu�t�.

Les langages naturels sont pleins d'ambigu�t�s, que nous pouvons lever dans la plupart des cas en nous aidant du contexte. Par exemple, nous attribuons tout naturellement une signification diff�rente au mot vaisseau, suivant que nous le trouvons dans une phrase qui traite de circulation sanguine ou de navigation � voiles. Dans un langage formel, il ne peut pas y avoir d'ambigu�t�. Chaque instruction poss�de une seule signification, ind�pendante du contexte.

Redondance.

Pour compenser toutes ces ambigu�t�s et aussi de nombreuses erreurs ou pertes dans la transmission de l'information, les langages naturels emploient beaucoup la redondance (dans nos phrases, nous r�p�tons plusieurs fois la m�me chose sous des formes diff�rentes, pour �tre s�rs de bien nous faire comprendre). Les langages formels sont beaucoup plus concis.

Litt�ralit�.

Les langages naturels sont truff�s d'images et de m�taphores. Si je dis � la pi�ce est tomb�e ! � dans un certain contexte, il se peut qu'il ne s'agisse en fait ni d'une v�ritable pi�ce, ni de la chute de quoi que ce soit. Dans un langage formel, par contre, les expressions doivent �tre prises pour ce qu'elles sont, � au pied de la lettre �.

Habitu�s comme nous le sommes � utiliser des langages naturels, nous avons souvent bien du mal � nous adapter aux r�gles rigoureuses des langages formels. C'est l'une des difficult�s que vous devrez surmonter pour arriver � penser comme un analyste-programmeur efficace.

Pour bien nous faire comprendre, comparons encore diff�rents types de textes :

Un texte po�tique :

Les mots y sont utilis�s autant pour leur musicalit� que pour leur signification, et l'effet recherch� est surtout �motionnel. Les m�taphores et les ambigu�t�s y r�gnent en ma�tres.

Un texte en prose :

La signification litt�rale des mots y est plus importante, et les phrases sont structur�es de mani�re � lever les ambigu�t�s, mais sans y parvenir toujours compl�tement. Les redondances sont souvent n�cessaires.

Un programme d'ordinateur :

La signification du texte est unique et litt�rale. Elle peut �tre comprise enti�rement par la seule analyse des symboles et de la structure. On peut donc automatiser cette analyse.

Pour conclure, voici quelques suggestions concernant la mani�re de lire un programme d'ordinateur (ou tout autre texte �crit en langage formel).

Premi�rement, gardez � l'esprit que les langages formels sont beaucoup plus denses que les langages naturels, ce qui signifie qu'il faut davantage de temps pour les lire. De plus, la structure y est tr�s importante. Aussi, ce n'est g�n�ralement pas une bonne id�e que d'essayer de lire un programme d'une traite, du d�but � la fin. Au lieu de cela, entra�nez-vous � analyser le programme dans votre t�te, en identifiant les symboles et en interpr�tant la structure.

Finalement, souvenez-vous que tous les d�tails ont de l'importance. Il faudra en particulier faire tr�s attention � la casse (c'est-�-dire l'emploi des majuscules et des minuscules) et � la ponctuation. Toute erreur � ce niveau (m�me minime en apparence, tel l'oubli d'une virgule, par exemple) peut modifier consid�rablement la signification du code, et donc le d�roulement du programme.

Le contenu de cet article est rédigé par Gérard Swinnen et est mis à disposition selon les termes de la Licence Creative Commons Attribution 3.0 non transposé.
Les logos Developpez.com, en-tête, pied de page, css, et look & feel de l'article sont Copyright © 2013 Developpez.com.