Patrick Juignet, Philosciences.com,
2011.
Nous allons essayer de préciser la notion d’information telle qu'elle est
utilisée depuis Shannon dans les théories scientifiques dites "de
l'information".
Ces théories ne traitent pas de l'information au sens
ordinaire, puisqu'elles excluent toute signification. Pourtant une confusion a
été savamment organisée.
Nous nous contenterons de rappels brefs, car les
acteurs de cette geste informationnelle sont trop nombreux pour être tous cités
et leurs travaux sont très spécialisés.
Un nouveau domaine de
recherche apparaît en 1949, avec un livre intitulé The Mathematical
Theory off
Communication, écrit par l’ingénieur et mathématicien Claude Elwood
Shannon. À
l’époque, Shannon travaille au Bell Laboratory sur les systèmes de
télécommunications. Cette recherche obéit à des préoccupations
techniques sur
la transmission des messages malgré le bruit qui la brouille. Le
message, constitué par des signaux codés, est transmis, de l'émetteur
au récepteur, au travers d'un canal en utilisant les propriétés
physiques de
celui-ci. Dans leur cheminement, les signaux rencontrent des
perturbations qui
brouillent le message. La transmission est donc aléatoire et présente
une
incertitude.
Cette incertitude a été définie par Shannon grâce à une approche
probabiliste. Une façon de
décrire un système de transmission incertain est d’en donner un modèle
probabiliste. On va comparer le nombre de signaux qui arrivent et tous ceux qui
devraient arriver (possible). Selon un tel modèle, fournir une
"information" consiste à lever une incertitude concernant l’arrivée
aléatoire des signaux. La notion d’information est une notion probabiliste qui rend compte de la diminution
de l'incertitude.
Cela a aboutit à la formule : H (i) = - Somme pi log2 pi
dans laquelle pi est la probabilité ni/N d'apparition de
l'évènement i. Shannon a repris l'unité définie par John Tukey, le bit. Le bit est
l'unité de mesure des systèmes de codage binaire. Claude Shannon a
introduit une formule mathématique pour mesurer la quantité
"d'information" contenue dans une distribution de probabilité. Il
s'agit de la diminution d'incertitude concernant la probabilité d'évènements
discrets. Cette probabilité est un nombre sans unité. Les événements
concernés sont des signaux, leur transmission par un canal matériel et
leurs taux de réception.
Il s'agit d'une théorie statistique de la transmission des signaux électriques dans un canal bruité. D'emblée il y a confusion produite par des abus de langage. La transmission dans un canal bruité devient communication et théorisation statistique du résultat devient théorie de l'information. Conscient de ce problème, l'informaticien américain Joseph Weizenbaum invita, en 1996 lors d'une conférence à Berlin, à délaisser l'expression "théorie de l'information " pour "théorie du signal", proposition à laquelle nous adhérons.
Nous allons tenter de voir comment le mot
"information" en est venu à désigner ce qui se passe dans les
ordinateurs. L'informatique s'est préparée avec Boole qui a pu lier la logique
au calcul algébrique. Les raisonnements sont exprimés dans un langage
symbolique permettant le calcul ce qui ouvre la voie à leur mécanisation. Un de
ses compatriotes, William Stanley Jevons s'avança vers la réalisation. Dans un
article de 1870 « Réalisation mécanique de l’inférence logique », il
présente les principes et les plans sommaires d’une machine qui permettrait de
mécaniser la logique booléenne.
En 1936, Turing partant d’une question mathématique débattue depuis Hilbert, celle de la calculabilité d’un nombre, passe pour traiter ce problème par l’intermédiaire d’une machine formelle (une procédure algorithmique). Son apport à la calculabilité et à la décidabilité est passé en arrière-plan, alors que sa « machine » est devenue un modèle pour l'informatique à venir.
Le projet de Jevon se concrétisera grâce à Shannon. En 1937, ce dernier écrivit une thèse dans laquelle il démontra que la réalisation électrique de l'algèbre de Boole (réduite à ses deux élément remarquables 0 et 1) était possible à condition de s'en tenir à une forme binaire de sa logique. Il proposa donc des schémas de calcul binaire de type booléen pouvant être reproduits dans un circuit composé de relais à deux états (ouvert ou fermé). Shannon en déduisit que l’on peut comprendre le circuit (un réseau de relais et de commutateurs) comme un ensemble de propositions logiques. Ultérieurement, c'est H.H. Aiken qui élaborera un circuit de type électronique réalisant une fonction logique.
À partir de là l'informatique était née. La résolution de
problèmes techniques prendra une dizaine des années puis cela étant fait,
l'extension sera gigantesque. On définit cette science formelle et technique comme le
traitement automatique de "l'information". Deux questions se posent :
comment cela s'est il produit et quel est le sens du mot dans ce
cadre. Pour y répondre voyons ce qu'il y a de commun et de différent avec
le propos de Shannon.
Ce qu'il y a de commun entre informatique et
télécommunication, c'est la présence de signaux codés et leur transmission via
un support matériel. Mais sur ce point commun, certaines différences
apparaissent. Dans un ordinateur, il y a de nombreuses voies de communication
et la transmission doit se faire intégralement (sans perte) car une erreur sur
le signal est immédiatement fatale. On n'est pas dans la perspective d'une
statistique sur la levée de l'incertitude concernant une multitude de signaux.
Ici, tous les signaux comptent.
Mais ce qu'il y a de vraiment différent, c'est le rapport au calcul. La théorie
informatique ramenée à sa base la plus simple est une abstraction par rapport à
deux états physiques (signal, absence de signal) et une notation symbolique
sous forme de chiffres 0 et 1. Cette notation se complexifie par paliers
successifs dans les programmes. Mais de toutes les façons, elle aboutit
toujours à une suite de 0 et 1 mise dans le bon ordre (dit langage machine) qui
seuls peuvent être exécutés physiquement. Elle abstrait et symbolise,
c'est à dire est indépendante du support physique. Bien que ce n'ait jamais été
défini ainsi par les informaticiens, il nous semble que le mot information est
utilisé dans ce sens.
L'information en informatique désigne la création d'un ordre abstrait qui
puisse être concrétisé par un support physique dédié. Le terme "qui
puisse" est important dans la définition, car il nous amène au cœur du
concept d'information. Nous remarquons deux choses nécessaires pour parler
d'information : 1/ Il y a un ordonnancement abstrait concrétisable. 2/ la
concrétisation peut se faire sur des supports différents dont l'ordonnancement
est indépendant. La question centrale est alors de se demander ce qu'il y a de
stable et commun lorsque différents supports sont utilisés ? Nous répondrons que
c’est l'ordonnancement, la suite ordonnée d'éléments abstraits. Nous en
concluons que c'est ce qui spécifie l'information, ce qui constitue
l'information au sens informatique du terme.
La création de cet ordre est un algorithme, et plus largement un programme. Un
programme peut être conçu pour calculer ou pour exécuter toute autre
tâche. Dans ce cas l'information correspond à cet ensemble à la fois
théorique et technique d'un programme réalisable par une machine adaptée à
cela. À partir de cet aspect technique, nous donnerons le second aspect
important de la définition de l'information. Cet ordre abstrait a une
effectivité, il a une action sur le monde, ici par l'intermédiaire d'une
machine. Cet ordre produit des effets.
Le mot a donc ici un sens très différent de celui d'évaluation statistique. Le
point commun avec les télécommunications c'est qu'il y a transmission de
signaux et un code qui les organise. Par code nous entendons une manière
d'ordonner les symboles. Par exemple 0 puis 1 n'est pas équivalent à 1 puis 0.
Il n'y a pas de réversibilité. La réalisation concrète du code implique que les
signaux soient distincts (dans le temps et dans l'espace) et distribués selon
un ordre précis.
La théorisation de la
complexité a été initiée par Almogorov dans les années 1960. C'est une théorie
mathématique et informatique sur la complexité aléatoire, ou encore complexité
algorithmique. Il s'agit d'une fonction permettant d'évaluer la complexité de
calcul d'un nombre ou d'une suite de nombres.
Kolmogorov s'est intéressé aux travaux de Shannon traduits en Russe en1953. Il
y voit assez vite le moyen de décrire un objet mathématique. Il suggère que la
formule de Shannon appliqué à un nombre représenterait le nombre de bits qui
suffisent en moyenne à décrire ce nombre.
Puis il propose une approche originale de l'information. L'information peut
être définie individuellement et non de manière probabiliste. Elle concerne
deux séries de nombre L'information apportée par une série de nombres sur un
autre peut être défini à une constante près par l'algorithme utilisé pour
construire la seconde série.
L'interprétation informatique de ce principe est la suivante. Les machines informatiques
pouvant exécuter des programmes. La complexité est donc la longueur du plus
petit programme écrit pour la machine qui génère la suite de nombres x. Une
suite constante a une complexité faible car les programmes qui la génèrent
peuvent être très courts et une suite aléatoire a une complexité qui est grande
par rapport à sa taille.
La complexité de Kolmogorov pose des problèmes, car il est des cas où
elle ne
fonctionne pas. La notion de « plus petit programme théorique »
ne peut
être définie opérationnellement, de façon rigoureuse et univoque,
qu'avec la
référence à une machine particulière. Elle n'est pas générale et
universelle. Une autre difficulté réside dans le fait que la complexité
de Kolmogorov n'est
pas décidable : on peut donner un algorithme produisant l'objet voulu,
ce qui
prouve que la complexité de cet objet est au plus la taille de cet
algorithme.
Mais on ne peut pas écrire de programme qui donne la complexité de
Kolmogorov
de tout objet que l'on voudrait lui donner en entrée. Ces
discussions ne sont indiquées que pour montrer que la notion, même dans
un
cadre strictement mathématique ou informatique, est difficile à manier.
Son
extension à d'autres domaines est d'autant plus sujette à caution.
Remarquons enfin que cette complexité ne prétend pas être celle "de"
l'information, mais qu'elle prétend être l'information. Autrement dit c'est le
rapport lui-même et le degré de complexité qu'il définit qui est nommé
information. Il s'agit d'une notion purement mathématique définissant un
rapport entre des nombres. Elle donne une idée sur un objet mathématique ou
informatique.
En physique l'information s'introduit par le biais du Démon de
Maxwell. Les travaux de Szilard (1929) entrent en jeu de manière inaugurale par
l'affirmation le démon a besoin d'énergie ou d'entropie pour être renseigné. Le
raisonnement a été poursuivi par Wiener et Brillouin. Reconstituons le.
Dans l'expérience de Maxwell le principe d'augmentation d'entropie est bafoué.
Pour exorciser ce démon, Wiener et Brillouin supposent que l'information
demande une certaine néguentropie. Du coup le principe de Boltzmann est
respecté car c'est l'ensemble (information + néguentropie) qui intervient. Mais
alors l'information est assimilable à une grandeur physique de type de
l'entropie puisqu'elle interagit avec elle.
Parallèlement il se trouve que la formule de Shannon et celle de Boltzman ont
un libellé identique, identité renforcée par l'appellation donnée par Shannon.
D'où une assimilation entre les deux. Certains chercheurs ont donné une expression
du second principe de la thermodynamique sous la forme d'une équation S = k log
W, qui exprime l'entropie S en fonction du
nombre W de microétats du
système, avec k la constante de Boltzmann. Mais surtout il a inventé
le théorème H qui se formule : H = - Somme pi log
pi dans lequel pi représente les probabilités des micro états d'un
système. Ramené à une expression statistique la transmission du signal et
l'entropie ont la même forme.
Le raisonnement est bouclé et il s'ensuit que le démon peut acquérir de
l'information au sens de Shannon qui est une grandeur physique puisqu'elle doit
être compensée par de la néguentropie (inverse de l'entropie). Wiener et
Brillouin déclarent en 1948 que l'information est un troisième grandeur
physique à côté de la matière et de l'énergie.
Cette réflexion avait été préparée par Erwin Schroedinger qui avait donné une
définition de l'entropie négative comme mesure d'ordre. (What il life ? 1944).
Von Neumann dans les années 1950 a emboîté le pas, en proposant que
chaque opération logique effectuée dans un ordinateur doit utiliser une
quantité d'énergie, ce qui augmente l'entropie (von Neumann, 1966). Cette
façon de voir a été acceptée jusqu'à ce que la société IBM, concernée directement
par les limites de cette contrainte physique, ait demandé à ses ingénieurs
d'étudier la situation.
Rolf Landauer, travaillant chez IBM sur les limites physiques du calcul a
démontré que tout calcul peut être réalisé de façon réversible sans
consommer d'énergie (Landauer, 1961), ce qui est assez simple à comprendre car
s’il y a consommation d'énergie le mouvement inverse l'annule et la somme est
nulle. Par contre les opérations irréversibles nécessitent la consommation
d'énergie pour chaque bit. Par exemple, effacer un bit consommerait la quantité
définie par Von Neumann, puisque l'opération n'est pas compensée.
En parallèle, Landauer a construit de vrais microprocesseurs et des circuits
électroniques basés sur la logique du calcul réversible. La plupart des
microprocesseurs rapides sont construits selon ce schéma et réduisent
considérablement le gaspillage d'énergie auquel conduisaient les circuits plus
conventionnels.
En 1973, Charles Bennett étendit le théorème de Landauer, et montra que tout
calcul pouvait être effectué en utilisant uniquement des opérations logiques
réversibles, sans exiger la consommation d'énergie, par conséquent. La
propriété de réversibilité a été mise en œuvre dans les ordinateurs sous le nom
de « logique adiabatique ». Rolf Landauer en 1980 affirma que l'information pouvait
être considérée est une quantité physique et fait partie du monde. Cela aboutit
à lui donner un statut ontologique. À sa suite, Antoine Danchin (2010)
considère que l'information est le cinquième constituant du monde (après la
matière, l'espace, le temps et l'énergie).
Bien que n'ayant pas la compétence nécessaire en physique, l'ensemble de
ces raisonnements est selon nous douteux. Les raisons en sont les
suivantes. Ce qui est appelé information dans le cas de l'informatique
c'est la manipulation d'entités physiques, généralement des électrons qui,
naturellement, obéissent aux lois de la physique. Par analogie ce serait
affirmer que le temps est une entité physique parce que les horloges demandent
de l'énergie pour fonctionner. La discussion sur le temps n'est pas de cet
ordre. Dire que l'information est une entité physique est douteux. Il est plus
raisonnable de la considérer comme un concept d'ordre que comme une
entité physique constitutive du monde.
C'est la théorie qui permet l’utilisation des spécificités de la physique
quantique pour le traitement et la transmission de signaux correspondant à des
valeurs numériques (information au sens informatique). La possibilité en a été
ouverte début des années 1980, par la possibilité technique de manipuler et
d’observer des objets quantiques individuels : photons, atomes, ions etc., (et
pas seulement d’agir sur le comportement quantique collectif d’un grand nombre
de tels objets).
Le bit de l’informatique classique prend les valeurs 0 ou 1. Le bit quantique,
ou qu-bit, pourra non seulement prendre les valeurs 0 et 1, mais aussi, toutes
les valeurs intermédiaires. Cela est dû à une propriété fondamentale des états
quantiques : on peut fabriquer des superpositions linéaires de ces états, en
superposant linéairement un état où le qu-bit a la valeur 0 et un état où il a
la valeur 1. La seconde propriété à la base de l’informatique quantique est
l’intrication : en mécanique quantique, il peut arriver que deux objets,
éloignés l’un de l’autre ne constituent qu’une entité indissociable.
La combinaison de ces deux propriétés, superposition linéaire et intrication,
est au cœur du parallélisme quantique, la possibilité d’effectuer en parallèle
un grand nombre d’opérations. Cependant, le parallélisme quantique diffère
fondamentalement du parallélisme classique : alors que dans un ordinateur
classique on peut toujours savoir (au moins en théorie) quel est l’état interne
de l’ordinateur, une telle connaissance est par principe exclue dans un
ordinateur quantique.
Le parallélisme quantique demande le développement d’algorithmes entièrement
nouveaux. Le nombre d’algorithmes existant est pour l’instant très limité. La
seconde limite est que l’on ne sait pas s’il sera possible de construire un
jour des ordinateurs quantiques de taille suffisante. On ne sait, à
l’heure actuelle (en 2010/11), manipuler que quelques qu-bits (sept au
maximum)
La difficulté technique de l’ordinateur quantique est la décohérence,
l’interaction des qu-bits avec l’environnement qui brouille les délicates
superpositions linéaires. Cette décohérence introduit des erreurs, et
idéalement, il faudrait que l’ordinateur quantique soit parfaitement isolé de
son environnement.
Aucun changement de fond avec le passage au niveau quantique par rapport à la
doctrine informatique de base. Il s'agit de reproduire physiquement des
ordonnancements définis mathématiquement.
Par quels biais se fait l'introduction de l'information en biologie.
Deux idées sont lancées par Schrödinger dans son livre Qu'est-ce que
la vie (1944) : celle d'un ordre au sein des gènes et celle d'un rapport
entre ordre et entropie. L'élucidation de l'organisation moléculaire des gènes a montré qu'il y a
un ordre moléculaire dans les gènes et que celui-ci se traduit par une
organisation macroscopique. Comment cela se produit-il ? Par un code et
sa transcription. C’est Schrödinger qui lancé la notion de code génétique. Elle
a fait fortune !
De plus dans son ouvrage Schrödinger fait un lien entre ordre
et entropie. (qui rappelle les tentatives d'exorciser le démon de Maxwell). Concernant
le rapport entre ordre, code et entropie, le raisonnement généralement repris
est le suivant. S'il y a un ordre, il va contre le désordre et donc à
l'encontre du principe d'augmentation constante et spontanée de
l'entropie. Produire de l'ordre implique donc une lutte contre l'entropie
à un gain en information. Intuitivement on comprend bien le raisonnement qui
est plausible. Toutefois que cela soit plausible ne veut pas dire que ce soit
démontré. Cela se résume par les équations suivantes :
entropie
croissante = désordre= perte d'information = baisse énergétique = équilibre
entropie diminuant = ordre = gain d'information = demande énergétique =
déséquilibre
L'idée
d'information s'est aussi introduite en biologie par le biais de la
transmission. Car il est évident qu'au sein d'un organisme vivant de
nombreuses transmissions ont lieu. Du coup Wiener en 1950 compare les types de
transmissions utilisées pour envoyer un télégramme à celles qui ont lieu dans
un organisme vivant comme un être humain. L'analogie est faite entre la
distribution des perforations sur une carte perforée et celle des acides
nucléiques du gène qui peuvent toutes deux être considérées comme de
l'information codée. (von Foerster 1952 introduction à la 18e conférence Macy).
La grosse avancée de l'information en biologie se fait par l'intermédiaire de
l'élucidation des processus génétiques. La découverte de Crick et Watson de la
composition chimique des chromosomes a ouvert la voie à l'élucidation de
l'information génétique qui avait été supposée par les précurseurs que nous
avons cité ci-dessus. On a découvert qu'au sein des chromosomes, ce sont les
bases azotées (adénine guanine, thymine, cytosine) qui spécifient les gènes et
plus particulièrement leur ordre. Cet ordre est constitué de triplets
successifs, le départ étant marqué par un triplet « start » et la fin
par un triplet « stop ». Il est possible de symboliser ces bases par
leurs lettres (A,C,G,T) et donc de former un modèle simplifié du chromosome
sous forme d'une liste de lettres ordonnées. Pour l'homme on estime leur nombre
pour le génome entier à 3,4 . 109.
D'un point de vue pratique, après
analyse chimique, le chercheur se retrouve devant des centaines de pages de
symboles pourvus d'un ordonnancement mystérieux, avec à faire un travail
équivalent au décryptage d'un code (ce qui été un des moteur de l'informatique
pendant la seconde guerre mondiale). On a appelé cet ordre et ses effets "information", par analogie avec
l'informatique. La modélisation donne une liste de lettres qui ressemble à un
code. Ce code n'a aucune signification, il est seulement possible de le découper
en des séquences pertinentes, c’est-à-dire auxquelles correspond un gène. (La
partie du chromosome qui organise la synthèse d'une protéine).
L'information en informatique désigne un ordre abstrait qui puisse être concrétisé par un support physique. Ici, on a exactement la même chose inversée : un support qu'on peut se modéliser par un ordre abstrait. Autre analogie avec l’informatique, l'ordonnancement est producteur de quelque chose : en informatique cet ordonnancement permet de commander une action et ici l'ordonnancement commande la production des protéines. On a bien là quelque chose de commun dans le concept d'information appliqué à deux domaines différents celui des artefacts et celui de la biologie. Par le biais de la mise en forme, ce qui rejoint l'aspect macroscopique. En reprenant la distinction classique entre forme et matière Danchin définit l'information comme étatn ce qui met en forme la matière. (voir Antoine Danchin : http://www.normalesup.org/~adanchin/). Nous ne sommes pas d'accord sur ce point. Bien que défendant une ontologie de l'organisation, il nous semble que l'information au sens d'un ordonnancement n'est pas suffisante pour expliquer l'organisation. C'est l'une des explications, valide dans certains cas bien précis et non en général. Nous sommes réticent à cette extension du concept qui risque de masquer les problèmes plutôt que d'être heuristique.
Deux
offensives complémentaires, que nous avons déjà vu dans l'article
le cerveau-machine, sont lancées avec d'un côté l'assimilation du
cerveau à une
machine à calculer et, de l'autre, l'assimilation de la pensée à un
traitement
de l'information. C’est ce qui a donné la thèse
« computationniste ». Après la publication en 1943 de
l'article inaugural, un véritable modèle de
raisonnement s'est formé à la suite de Pitts et McCulloch. Les neurones
biologiques y sont assimilés à des portes électroniques fonctionnant en
tout ou
rien. De l'analogie supposée Pitts et McCulloch concluent que la
logique serait
inhérente au système nerveux, c’est-à-dire produite par sa structure et
son
fonctionnement.
Trois postulats sont présents :
1/ l'esprit fonctionne de manière logique
2/ Le cerveau fonctionne comme machine électronique
3/ La relation entre les deux est la même que dans l'informatique
La conclusion est que la logique est implémentée par un calcul exécuté par la
machinerie neuronale. L'aboutissement de ces thèses se trouve dans un article de 1949 publié dans la
revue Electrical Engineering, intitulé "The brain as a
computing machine". Il y est explicitement affirmé "le cerveau est un
machine logique". Nous avons là le fondement du computationnisme. Le
cerveau serait une machine de traitement de l'information au sens informatique
du terme. Von Neumann a pendant un temps emboîté le pas et repris ce modèle
mais il a inversé la tendance : il s'en est servi pour construire des automates
(utilisant par exemple la redondance pour palier aux éléments non fiables). Il
s'est servi du modèle pour forger une technologie et non pour expliquer le
cerveau et la pensée.
Corrélativement on trouve la proposition d'un modèle de la connaissance
fondé sur la théorie de l'information. Le principe en est que toute pensée
connaissante (cognitive) est fondée sur un calcul. Comme tout calcul peut être
exécuté par une machine, notre connaissance peut être programmée sur une
machine informatique. C'est la thèse computationniste de l'équivalence entre calcul
et activité cognitive. Il s'ensuit deux conséquences importantes. La première est
que les machines ne font pas que reproduire (mimer)
"artefactuellement" l'activité cognitive, mais qu'elles pourraient en
avoir une, comme l'homme. La seconde est l'analogie entre le cerveau et la
machine sur la base d'un calcul qui leur serait commun. Elle conduit vers des
tentatives pour montrer que le cerveau est une machine informatique (voir
l'article Le cerveau
machine). Globalement se fonde là une épistémologie, qui constitue
un naturalisme informationnel. Toute connaissance est fondée sur le traitement
de l'information, au sens informatique du terme. Elle peut être effectuée
indifféremment par une machine biologique ou électronique. C'est la thèse expressément
défendue par H. Simon.
Pour Herbert
Simon, l’intelligence artificielle s'apparente au raisonnement humain parce
que, comme le cerveau, un ordinateur combine des symboles et ces symboles sont
liés à des formes physiques. On est bien, avec cette conception, au cœur de la
théorie de l'information et d'ailleurs Simon proposera le terme
"d'information processing paradigm". Il écrit : « au cœur du paradigme
du traitement de l’information repose une hypothèse qu’Allen Newell et moi
avons appelé l’hypothèse de symbole physique » (H. Simon 1981, "L’unité des arts
et des sciences : la psychologie de la pensée et de la découverte", in Les
Introuvables en langue française de H.A. Simon, p. 4). Ces symboles sont
qualifiés de physiques parce qu’ils reposent sur des substrats physiques que ce
soit dans les ordinateurs ou dans le cerveaux (H. Simon 1969, La science de
l'artificiel Paris, Gallimard, 2004, p.59).
Ces éléments simples se composent en "structures de
symboles". Ainsi, une structure de symboles, peut-être créée,
stockée, mise en relation avec d’autres structures de symboles, transformée
pour donner de nouvelles structures de symboles, etc. « L’hypothèse du système de symbole physique a deux importants
corollaires : Corollaire 1 : Un ordinateur, programmé de façon appropriée peut
engager une action générale intelligente ; Corollaire 2 : Le cerveau humain est
un système de symbole physique ». L'intelligence artificielle n'est pas pour
Simon une reproduction artefactuelle de certains raisonnements logicisés, mais
un équivalent de la pensée.
L’intelligence artificielle peut aussi être une description et une explication
de la manière dont les individus pensent : « aussi primitifs que les
programmes de compréhension puissent être, ils fournissent vraiment un ensemble
de mécanismes de base, une théorie, pour expliquer comment les êtres humains
sont capables de comprendre les problèmes, à la fois dans les nouveaux
domaines auxquels ils ne connaissent rien et dans les domaines sur lesquels ils
ont une plus ou moins grande quantité de connaissances sémantiques antérieures
» (Simon 1969, p. 179).
Une partie du structuralisme a repris à son compte le postulat
informationnel d'un calcul symbolique autonome qui peut être une syntaxe
langagière en lien avec un support (ici le cerveau humain). La référence
explicite à la théorie de l'information n'est pas faite, mais on sent une forte
influence.
On la trouve d’abord en linguistique avec Roman Jackobson et la mise en avant
de la phonologie. L’aspect le plus caractéristique de sa recherche est la
décomposition de la langue en phonèmes et la recherche d'invariant relationnels
entre eux. Il sera le précurseur qui influencera Lévi-Strauss et Lacan.
Pour Claude Lévi-Srauss la fonction symbolique peut être décrit selon des
formes logiques qui sont les opérations de la logique élémentaire et de
la théorie des ensembles. Plusieurs essais de formalisation ont lieu sous forme
de permutations de groupe. On trouve également énoncé un système d’opérations
qui, schématisées, « se rapprocherait d’une algèbre de Boole ». Il
semblerait que les groupes booléens s’appliquent aux mythes.
Dans la
psychanalyse avec Lacan cela atteindra un point caricatural. L'influence
commence à se faire sentir vers les années 1950. En 1954-55 il fait une
conférence et deux séminaires sur les machines (cybernétiques et
informatiques). Un amalgame est fait entre structure, symbolique, machine et
information (Séminaire 1954-55, Paris, Seuil, 1978). Il est fait allusion aux
travaux de Shannon à la transmission téléphonique qui consiste à transmettre
par un circuit des aspects matériels du langage. Le sens est détaché de son
support (symbole ou signifiant). Le symbolique joue, indépendamment de son
support humain. L'exemple en est donné par un calcul. Il est affirmé que le
symbolique a ses propres structures de type mathématiques et qui sont
autonomes l'homme qui s'y insère. L'inconscient freudien (c’est-à-dire
la partie non consciente du psychisme), est
déclaré structuré comme un langage, c'est-à-dire syntaxisable au travers des relations entre signifiants.
Pour nous le concept
d'information, en tant qu'il désigne et
quantifie un ordonnancement remarquable, peut s'appliquer
légitimement au niveau neurosignalétique, mais pas au niveau
représentationnel
(qu'il vient masquer). Le niveau représentationnel fonde ce qui
est communément nommé sens, signification. Par exemple, il paraît
évident que
ce que Herbert Simon nomme " la mise en relation entre structures de
symboles," si on y inclut la dimension sémantique, prend une autonomie
et forme une
nouvelle couche organisationnelle, différente de celle l'information.
C'est justement celle que l'on peut nommer représentationnelle.
En nier l'existence est un projet à la fois réducteur et
réductionniste. Il
rapetisse l'objet d'étude en laissant de côté la signification pour la
seule
syntaxe et il le réduit en ramenant l'étude au seul substrat
informationnel. Citons
Jérôme Segal à ce sujet.
Segal écrit " on peut se demander ce qui a poussé, surtout les philosophes
et les divers représentants des sciences humaines, à vouloir utiliser la
théorie de l'information dans les cas ou la signification de l'information est
primordiale". La réponse qu'il donne est que "le problème posé
concerne ... le réductionnisme et même pour certains chercheurs un
certain type de scientisme les amenant à croire que la théorie de l'information
peut être la clé de toute la connaissance humaine. Toutefois, ... cette
attitude réductionniste n'est pas consciente et on peut estimer avoir affaire à
un phénomène de mode ..." (Le zéro et le un, Paris, Syllepse, 2003,
p. 724)
D'emblée les conditions
de la confusion sont présentes. La transmission dans un canal bruité devient
"communication" et l'évaluation statistique du résultat devient
"théorie de l'information". Il n'est pas possible que cela soit un
hasard ou un emprunt fait par inadvertance au langage courant. D'autant que le
domaine considéré, la téléphonie concerne la transmission d'information au sens
ordinaire et plein du terme qui est le transfert de connaissances entre des
personnes humaines. Un peu tardivement, Shannon s'inquiéta de l'extension
inconsidérée d'une notion qui n'était qu'un outil mathématique pour les
ingénieurs en télécommunications. Certes, il n'a pas participé à cet abus, mais
il n'a rien fait pour rectifier l'ambiguïté terminologique.
D'autre part Shannon nomma cette fonction Entropie terme déjà utilisé pour une
fonction d'état parfaitement définie. Cette appellation laisse supposer que sa
formule serait-elle reliée à l'entropie définie par Boltzman. Là encore une
ambiguïté nullement anodine apparaît qui a favorisé l'extension physique de
l'information.
Kolomorov et Shannon définissent l'information comme des mesures de la
transmission ou de la complexité. On peut remarquer que toute mesure donne une
idée sur ce qu'elle mesure, toute formule statistique donne une idée sur la
répartition d'une distribution d'événements et mériterait donc le titre
d'information. Les développements sur le démon de Maxwell se fondent sur l'idée
que celui-ci devrait mesurer les particules concernées. L'information
comme mesure de quelque chose rejoint le sens ordinaire, car toute mesure n'a
d'intérêt que si elle apporte une information sur le fait concerné. Mais bien
sûr, la mesure demande à être lu et interprété conceptuellement par un être
humain ce qui fait passer vers la notion ordinaire du terme. Or le passage de l'un
à l'autre se fait par un changement de registre qui est gommée par l’utilisation
du terme d'information.
"L'information [au sens courant] ne peut-elle être mesurée à la manière de
Shannon ? On voit là s'esquisser, en filigrane, une théorie très générale de la
connaissance qui devrait toucher aussi bien la pédagogie l'apprentissage, que
la fonction mémoriale ..." écrit Claude Allègre (1995). Dans un compte
rendu à l'Académie des sciences de novembre 2010, l'orateur nous dit que
l'information rend compte autant d'une conversation, que du code génétique, ou
du codage informatique. Il donne l'exemple d'un objet manufacturé (une barque)
explicable grâce à l'information ou encore celui de la gestion du personnel
dans une entreprise selon la théorie de l'information et de l'image de marque
de ladite entreprise.
On arrive avec de tels propos au degré zéro de l'information. Appliquons la
formule de Shannon à ce propos (comme il est légitime de le faire au vu de la
généralisation admise) et l'on tombe sur zéro, puisque la probabilité d'une
information sur l'information est nulle tant elle est vague et étendue. Tous
ces jeux de mot sur l'information lui font perdre son sens scientifique et la
transforment en slogan. La théorie de l'information devient idéologie de
l'information, discours a finalité sociale, pour rassembler, faire du liant,
faire mode, etc. La transformation d'un concept en slogan fait sortir du cadre
scientifique pour entrer dans celui de l'idéologie.
Il ressort quelque chose de central dans cet examen de la notion
d'information que nous venons de faire. Historiquement c'est à partir du XVIe
siècle, mais surtout au XIXe siècle, qu'on effectue la mise en relation entre
des éléments concrets (roue dentée, signal électrique) et des symboles
(chiffres, lettres) en notant la possibilité d'une concordance parfaite entre
les deux. Au XXe siècle on comprend que c'est leur mise en ordre qui compte,
ainsi que les manques pouvant affecter celle-ci. On a tenté d'énoncer cette
mise en ordre et de chiffrer par des notions mathématiques et plus
particulièrement statistiques.
Le centre de la découverte c'est la puissance de l'ordonnancement. Le
point commun aux différentes formes d'information c'est l'existence d'un code,
d'une manière d'ordonner les symboles qui puisse être réalisé concrètement. La
réalisation concrète du code implique que les signaux soient distincts et
distribués selon un ordre précis. S'il n'est pas respecté il se passe autre
chose, le monde change, car c'est cet ordre qui produit un effet dans le monde
(et non la présence des éléments qui le concrétisent). Cet ordre a un rôle de
détermination dans le monde, une effectivité.
Par exemple que si des éléments A, B, C, se présentent dans ce ordre ou dans
l'ordre inverse B, C, A, cela produira deux effets différents. Identifier cela
et pouvoir le manipuler techniquement constitue quelque chose de spécifique et
de nouveau dans l'histoire de la pensée. Il y a quelque chose de nouveau dans
l'histoire de la pensée D'une manière générale dans l'étude des phénomènes,
lorsque des faits sont identifiés comme conditions, on note l'effet de leur
présence ou absence et si la présence de A ou B ou C a un effet, ils seront
identifiés comme causes. Ici il n'y a pas un tel rapport causal car
c'est l'ordre (ABC ou BCA) qui joue un rôle.
L'homme a obtenu une puissance technique sans précédent par le codage et le
traitement du signal, ce qui permet de construire des machines d'une
polyvalence extrême. On peut leur commander d'effectuer les tâches les plus
diverses, y compris commander d'autres machines, et même d'avoir une
autonomie. En biologie la manipulation de l'ordre au sein du génome permet des
transformations du vivant dont l'extension est immense et les conséquences
majeures.
Le gros problème est l'ontologisation de l'information qui a été située
comme une entité existant dans le monde et pas seulement une grandeur
théorique, instrumentale. L'information est ainsi pourvue d'une forme
d'existence. L'information est vue comme une entité perdurante et
distribuée dans le monde. Rapporté à l'ordonnancement, comme nous le proposons,
cette existence est très particulière.
L'énorme progrès théorique apporté par le concept d'information s'est accompagné d'un abus d'extension.
Du côté de la physique, c'est probablement l'exemple de
l'énergie, dont l'extension a été universelle, qui a poussé à faire de même
avec l'information donnant à espérer qu'elle puisse être une clé du même type tant
pour la compréhension du monde que pour l'unification de la science. La
tentative d'une extension comme constituant physique qui nous paraît douteux et
nous sommes réservé à ce sujet. Cette extension a été favorisée par
l'appellation d'entropie donnée à la fois à la mesure de transmission des
signaux et de l'évolution des états dans les systèmes physico-chimiques.
Du côté de
l'humain, la reprise d’un terme commun a provoqué une confusion dont nous
subissons actuellement. L'extension du domaine de l'information masque un autre
domaine, celui de la représentation. Derrière cette extension de l'information
se tient masquée une visée réductionniste plus ou moins consciente : remplacer
la représentation par le traitement de l'information. Dans cette optique
l'homme est une machine émettant des signaux et la communication humaine un
échange entre émetteur et récepteur. Le cerveau serait parcouru par des
signaux électriques codés, permettant d'émettre des signaux communicationnels
reçus par les organes des sens qui opèrent une transduction vers le cerveau et
ainsi de suite. Cette hypothèse qui a une certaine validité à un niveau
inférieur (à condition d'être complexifiée), ne doit pas servir à éliminer le
niveau de complexité supérieur qui est représentationnel. C'est la thèse computationniste
que nous avons critiquée ailleurs
Il peut être intéressant et heuristique de rassembler divers aspects du monde sous une même appellation en montrant ce qu'ils ont en commun. La démarche n'est nullement critiquable en soi, mais elle est parfois infondée. L'information si l'on s'en tient à son essence ordonnatrice possède déjà une extension considérable et actuellement il nous paraît hâtif d'aller au-delà.
Bibliographie :