Philo Sciences   Sciences formelles

Les théories scientifiques de l'information

Patrick Juignet, Philosciences.com, 2011.

information Nous allons essayer de préciser la notion d’information telle qu'elle est utilisée depuis Shannon dans les théories scientifiques dites "de l'information".

Ces théories ne traitent pas de l'information au sens ordinaire, puisqu'elles excluent toute signification. Pourtant une confusion a été savamment organisée.

Nous nous contenterons de rappels brefs, car les acteurs de cette geste informationnelle sont trop nombreux pour être tous cités et leurs travaux sont très spécialisés. 


PLAN DE L'ARTICLE



1/ Shannon le  fondateur

Un nouveau domaine de recherche apparaît en 1949, avec un livre intitulé The Mathematical Theory off Communication, écrit par l’ingénieur et mathématicien Claude Elwood Shannon. À l’époque, Shannon travaille au Bell Laboratory sur les systèmes de télécommunications. Cette recherche obéit à des préoccupations techniques sur la transmission des messages malgré le bruit qui la brouille. Le message, constitué par des signaux codés, est transmis, de l'émetteur au récepteur, au travers d'un canal en utilisant les propriétés physiques de celui-ci. Dans leur cheminement, les signaux rencontrent des perturbations qui brouillent le message. La transmission est donc aléatoire et présente une incertitude.

Cette incertitude a été définie par Shannon grâce à une approche probabiliste. Une façon de décrire un système de transmission incertain est d’en donner un modèle probabiliste. On va comparer le nombre de signaux qui arrivent et tous ceux qui devraient arriver (possible). Selon un tel modèle, fournir une "information" consiste à lever une incertitude concernant l’arrivée aléatoire des signaux. La notion d’information est une notion probabiliste qui rend compte de la diminution de l'incertitude.

Cela a aboutit à la formule : H (i) = - Somme pi log2 pi dans laquelle pi  est la probabilité ni/N d'apparition de l'évènement i. Shannon a repris l'unité définie par John Tukey, le bit. Le bit est l'unité de mesure des systèmes de codage binaire.  Claude Shannon a introduit une formule mathématique pour mesurer la quantité "d'information" contenue dans une distribution de probabilité. Il s'agit de la diminution d'incertitude concernant la probabilité d'évènements discrets. Cette probabilité est un nombre sans unité. Les événements concernés sont des signaux, leur transmission par un canal matériel et leurs taux de réception.

Il s'agit d'une théorie statistique de la transmission des signaux électriques dans un canal bruité. D'emblée il y a confusion  produite par des abus de langage. La transmission dans un canal bruité devient communication et théorisation statistique du résultat devient théorie de l'information. Conscient de ce problème, l'informaticien américain Joseph Weizenbaum invita, en 1996 lors d'une conférence à Berlin, à délaisser l'expression "théorie de l'information " pour "théorie du signal", proposition à laquelle nous adhérons.

2/ L'extension informatique

Nous allons tenter de voir comment le mot "information" en est venu à désigner ce qui se passe dans les ordinateurs. L'informatique s'est préparée avec Boole qui a pu lier la logique au calcul algébrique. Les raisonnements sont exprimés dans un langage symbolique permettant le calcul ce qui ouvre la voie à leur mécanisation. Un de ses compatriotes, William Stanley Jevons s'avança vers la réalisation. Dans un article de 1870 « Réalisation mécanique de l’inférence logique », il présente les principes et les plans sommaires d’une machine qui permettrait de mécaniser la logique booléenne.

En 1936, Turing partant d’une question mathématique débattue depuis Hilbert, celle de la calculabilité d’un nombre, passe pour traiter ce problème par l’intermédiaire d’une machine formelle (une procédure algorithmique). Son apport à la calculabilité et à la décidabilité est passé en arrière-plan, alors que sa « machine » est devenue un modèle pour l'informatique à venir.

Le projet de Jevon se concrétisera grâce à Shannon. En 1937, ce dernier écrivit une thèse dans laquelle il démontra que la réalisation électrique de l'algèbre de Boole (réduite à ses deux élément remarquables 0 et 1) était possible à condition de s'en tenir à une forme binaire de sa logique. Il proposa donc des schémas de calcul binaire de type booléen pouvant être reproduits dans un circuit composé de relais à deux états (ouvert ou fermé). Shannon en déduisit que l’on peut comprendre le circuit (un réseau de relais et de commutateurs) comme un ensemble de propositions logiques. Ultérieurement, c'est H.H. Aiken qui élaborera un circuit de type électronique réalisant une fonction logique.

À partir de là l'informatique était née. La résolution de problèmes techniques prendra une dizaine des années puis cela étant fait, l'extension sera gigantesque. On définit cette science formelle et technique comme le traitement automatique de "l'information". Deux questions se posent : comment cela s'est il produit et quel est le sens  du mot dans ce cadre.  Pour y répondre voyons ce qu'il y a de commun et de différent avec le propos de Shannon.

Ce qu'il y a de commun entre informatique et télécommunication, c'est la présence de signaux codés et leur transmission via un support matériel. Mais sur ce point commun, certaines différences apparaissent. Dans un ordinateur, il y a de nombreuses voies de communication et la transmission doit se faire intégralement (sans perte) car une erreur sur le signal est immédiatement fatale. On n'est pas dans la perspective d'une statistique sur la levée de l'incertitude concernant une multitude de signaux. Ici, tous les signaux comptent.

Mais ce qu'il y a de vraiment différent, c'est le rapport au calcul. La théorie informatique ramenée à sa base la plus simple est une abstraction par rapport à deux états physiques (signal, absence de signal) et une notation symbolique sous forme de chiffres 0 et 1. Cette notation se complexifie par paliers successifs dans les programmes. Mais de toutes les façons, elle aboutit toujours à une suite de 0 et 1 mise dans le bon ordre (dit langage machine) qui seuls peuvent être exécutés physiquement.  Elle abstrait et symbolise, c'est à dire est indépendante du support physique. Bien que ce n'ait jamais été défini ainsi par les informaticiens, il nous semble que le mot information est utilisé dans ce sens.

L'information en informatique désigne la création d'un ordre abstrait qui puisse être concrétisé par un support physique dédié. Le terme "qui puisse" est important dans la définition, car il nous amène au cœur du concept d'information. Nous remarquons deux choses nécessaires pour parler d'information : 1/ Il y a un ordonnancement abstrait concrétisable.  2/ la concrétisation peut se faire sur des supports différents dont l'ordonnancement est indépendant. La question centrale est alors de se demander ce qu'il y a de stable et commun lorsque différents supports sont utilisés ? Nous répondrons que c’est l'ordonnancement, la suite ordonnée d'éléments abstraits. Nous en concluons que c'est ce qui spécifie l'information, ce qui constitue l'information au sens informatique du terme.

La création de cet ordre est un algorithme, et plus largement un programme. Un programme peut être conçu pour calculer ou pour exécuter toute autre tâche.  Dans ce cas l'information correspond à cet ensemble à la fois théorique et technique d'un programme réalisable par une machine adaptée à cela. À partir de cet aspect technique, nous donnerons le second aspect important de la définition de l'information. Cet ordre abstrait a une effectivité, il a une action sur le monde, ici par l'intermédiaire d'une machine. Cet ordre produit des effets.

Le mot a donc ici un sens très différent de celui d'évaluation statistique. Le point commun avec les télécommunications c'est qu'il y a transmission de signaux et un code qui les organise. Par code nous entendons une manière d'ordonner les symboles. Par exemple 0 puis 1 n'est pas équivalent à 1 puis 0. Il n'y a pas de réversibilité. La réalisation concrète du code implique que les signaux soient distincts (dans le temps et dans l'espace) et distribués selon un ordre précis.

3/ Kolmogorov et la complexité de l'information

La théorisation de la complexité a été initiée par Almogorov dans les années 1960. C'est une théorie mathématique et informatique sur la complexité aléatoire, ou encore complexité algorithmique. Il s'agit d'une fonction permettant d'évaluer la complexité de calcul d'un nombre ou d'une suite de nombres.

Kolmogorov s'est intéressé aux travaux de Shannon traduits en Russe en1953. Il y voit assez vite le moyen de décrire un objet mathématique. Il suggère que la formule de Shannon appliqué à un nombre représenterait le nombre de bits qui suffisent en moyenne à décrire ce nombre.

Puis il propose une approche originale de l'information. L'information peut être définie individuellement et non de manière probabiliste. Elle concerne deux séries de nombre L'information apportée par une série de nombres sur un autre peut être défini à une constante près par l'algorithme utilisé pour construire la seconde série.

L'interprétation informatique de ce principe est la suivante. Les machines informatiques pouvant exécuter des programmes. La complexité est donc la longueur du plus petit programme écrit pour la machine qui génère la suite de nombres x. Une suite constante a une complexité faible car les programmes qui la génèrent peuvent être très courts et une suite aléatoire a une complexité qui est grande par rapport à sa taille.

La complexité de Kolmogorov pose des problèmes, car il est des cas où elle ne fonctionne pas.  La notion de « plus petit programme théorique » ne peut être définie opérationnellement, de façon rigoureuse et univoque, qu'avec la référence à une machine particulière. Elle n'est pas générale et universelle. Une autre difficulté réside dans le fait que la complexité de Kolmogorov n'est pas décidable : on peut donner un algorithme produisant l'objet voulu, ce qui prouve que la complexité de cet objet est au plus la taille de cet algorithme. Mais on ne peut pas écrire de programme qui donne la complexité de Kolmogorov de tout objet que l'on voudrait lui donner en entrée.  Ces discussions ne sont indiquées que pour montrer que la notion, même dans un cadre strictement mathématique ou informatique, est difficile à manier. Son extension à d'autres domaines est d'autant plus sujette à caution.

Remarquons enfin que cette complexité ne prétend pas être celle "de" l'information, mais qu'elle prétend être l'information. Autrement dit c'est le rapport lui-même et le degré de complexité qu'il définit qui est nommé information. Il s'agit d'une notion purement mathématique définissant un rapport entre des nombres. Elle donne une idée sur un objet mathématique ou informatique.

4/ Vers l'information physique

En physique l'information s'introduit par le biais du Démon de Maxwell. Les travaux de Szilard (1929) entrent en jeu de manière inaugurale par l'affirmation le démon a besoin d'énergie ou d'entropie pour être renseigné. Le raisonnement a été poursuivi par  Wiener et Brillouin. Reconstituons le.

Dans l'expérience de Maxwell le principe d'augmentation d'entropie est bafoué. Pour exorciser ce démon, Wiener et Brillouin supposent que l'information demande une certaine néguentropie. Du coup le principe de Boltzmann est respecté car c'est l'ensemble (information + néguentropie) qui intervient. Mais alors l'information est assimilable à une grandeur physique de type de l'entropie puisqu'elle interagit avec elle.

Parallèlement il se trouve que la formule de Shannon et celle de Boltzman ont un libellé identique, identité renforcée par l'appellation donnée par Shannon. D'où une assimilation entre les deux. Certains chercheurs ont  donné une expression du second principe de la thermodynamique sous la forme d'une équation S = k log W, qui exprime l'entropie S en fonction du nombre W de microétats du système, avec k la constante de Boltzmann. Mais surtout il a inventé le théorème H  qui se formule  :   H = - Somme pi log pi  dans lequel pi représente les probabilités des micro états d'un système. Ramené à une expression statistique la transmission du signal et l'entropie ont la même forme. 

Le raisonnement est bouclé et il s'ensuit que le démon peut acquérir de l'information au sens de Shannon qui est une grandeur physique puisqu'elle doit être compensée par de la néguentropie (inverse de l'entropie). Wiener et Brillouin déclarent en 1948 que l'information est un troisième grandeur physique à côté de la matière et de l'énergie.

Cette réflexion avait été préparée par Erwin Schroedinger qui avait donné une définition de l'entropie négative comme mesure d'ordre. (What il life ? 1944). Von Neumann dans les années 1950  a emboîté le pas, en proposant que chaque opération logique effectuée dans un ordinateur doit utiliser une quantité d'énergie, ce qui augmente l'entropie  (von Neumann, 1966). Cette façon de voir a été acceptée jusqu'à ce que la société IBM, concernée directement par les limites de cette contrainte physique, ait demandé à ses ingénieurs d'étudier la situation.

Rolf Landauer, travaillant chez IBM sur les limites physiques du calcul  a démontré que tout calcul peut être réalisé de façon réversible sans consommer d'énergie (Landauer, 1961), ce qui est assez simple à comprendre car s’il y a consommation d'énergie le mouvement inverse l'annule et la somme est nulle. Par contre les opérations irréversibles nécessitent la consommation d'énergie pour chaque bit. Par exemple, effacer un bit consommerait la quantité définie par Von Neumann, puisque l'opération n'est pas compensée.
 
En parallèle, Landauer a construit de vrais microprocesseurs et des circuits électroniques basés sur la logique du calcul réversible. La plupart des microprocesseurs rapides sont construits selon ce schéma et réduisent considérablement le gaspillage d'énergie auquel conduisaient les circuits plus conventionnels.

En 1973, Charles Bennett étendit le théorème de Landauer, et montra que tout calcul pouvait être effectué en utilisant uniquement des opérations logiques réversibles, sans exiger la consommation d'énergie, par conséquent. La propriété de réversibilité a été mise en œuvre dans les ordinateurs sous le nom de « logique adiabatique ». Rolf Landauer en 1980 affirma que l'information pouvait être considérée est une quantité physique et fait partie du monde. Cela aboutit à lui donner un statut ontologique. À sa suite, Antoine Danchin (2010) considère que l'information est le cinquième constituant du monde (après la matière, l'espace, le temps et l'énergie).

Bien que n'ayant pas la compétence nécessaire en physique, l'ensemble de ces  raisonnements est selon nous douteux. Les raisons en sont les suivantes.  Ce qui est appelé information dans le cas de l'informatique c'est la manipulation d'entités physiques, généralement des électrons qui, naturellement, obéissent aux lois de la physique. Par analogie ce serait affirmer que le temps est une entité physique parce que les horloges demandent de l'énergie pour fonctionner. La discussion sur le temps n'est pas de cet ordre. Dire que l'information est une entité physique est douteux. Il est plus raisonnable  de la considérer comme un concept d'ordre que comme une entité physique constitutive du monde.

5/ L'information dite quantique

C'est la théorie qui permet l’utilisation des spécificités de la physique quantique pour le traitement et la transmission de signaux correspondant à des valeurs numériques (information au sens informatique). La possibilité en a été ouverte début des années 1980, par la possibilité technique de manipuler et d’observer des objets quantiques individuels : photons, atomes, ions etc., (et pas seulement d’agir sur le comportement quantique collectif d’un grand nombre de tels objets).

Le bit de l’informatique classique prend les valeurs 0 ou 1. Le bit quantique, ou qu-bit, pourra non seulement prendre les valeurs 0 et 1, mais aussi, toutes les valeurs intermédiaires. Cela est dû à une propriété fondamentale des états quantiques : on peut fabriquer des superpositions linéaires de ces états, en superposant linéairement un état où le qu-bit a la valeur 0 et un état où il a la valeur 1. La seconde propriété à la base de l’informatique quantique est l’intrication : en mécanique quantique, il peut arriver que deux objets, éloignés l’un de l’autre ne constituent qu’une entité indissociable.

La combinaison de ces deux propriétés, superposition linéaire et intrication, est au cœur du parallélisme quantique, la possibilité d’effectuer en parallèle un grand nombre d’opérations. Cependant, le parallélisme quantique diffère fondamentalement du parallélisme classique : alors que dans un ordinateur classique on peut toujours savoir (au moins en théorie) quel est l’état interne de l’ordinateur, une telle connaissance est par principe exclue dans un ordinateur quantique.

Le parallélisme quantique demande le développement d’algorithmes entièrement nouveaux. Le nombre d’algorithmes existant est pour l’instant très limité. La seconde limite est que l’on ne sait pas s’il sera possible de construire un jour des ordinateurs quantiques de taille suffisante.  On ne sait, à  l’heure actuelle (en 2010/11),  manipuler que quelques qu-bits (sept au maximum)

La difficulté technique de l’ordinateur quantique est la décohérence, l’interaction des qu-bits avec l’environnement qui brouille les délicates superpositions linéaires. Cette décohérence introduit des erreurs, et idéalement, il faudrait que l’ordinateur quantique soit parfaitement isolé de son environnement.

Aucun changement de fond avec le passage au niveau quantique par rapport à la doctrine informatique de base. Il s'agit de reproduire physiquement des ordonnancements définis mathématiquement.

6/ L'information biologique

Par quels biais se fait l'introduction de l'information en biologie. Deux idées sont lancées par  Schrödinger dans son livre Qu'est-ce que la vie (1944) : celle d'un ordre au sein des gènes et celle d'un rapport entre ordre et entropie. L'élucidation de l'organisation moléculaire des gènes a montré qu'il y a un ordre moléculaire dans les gènes et que celui-ci se traduit par une organisation macroscopique. Comment cela se produit-il ?  Par un code et sa transcription. C’est Schrödinger qui lancé la notion de code génétique. Elle a fait fortune !

De plus dans son ouvrage Schrödinger fait un lien entre ordre et entropie. (qui rappelle les tentatives d'exorciser le démon de Maxwell). Concernant le rapport entre ordre, code et entropie, le raisonnement généralement repris est le suivant. S'il y a un ordre, il va contre le désordre et donc à l'encontre du principe d'augmentation constante et spontanée de l'entropie.  Produire de l'ordre implique donc une lutte contre l'entropie à un gain en information. Intuitivement on comprend bien le raisonnement qui est plausible. Toutefois que cela soit plausible ne veut pas dire que ce soit démontré. Cela se résume par les équations suivantes :
entropie croissante = désordre= perte d'information = baisse énergétique = équilibre
entropie diminuant = ordre = gain d'information = demande énergétique = déséquilibre

L'idée d'information s'est aussi introduite en biologie par le biais de la transmission.  Car il est évident qu'au sein d'un organisme vivant de nombreuses transmissions ont lieu. Du coup Wiener en 1950 compare les types de transmissions utilisées pour envoyer un télégramme à celles qui ont lieu dans un organisme vivant comme un être humain. L'analogie est faite entre la distribution des perforations sur une carte perforée et celle des acides nucléiques du gène qui peuvent toutes deux être considérées comme de l'information codée. (von Foerster 1952 introduction à la 18e conférence Macy).

La grosse avancée de l'information en biologie se fait par l'intermédiaire de l'élucidation des processus génétiques. La découverte de Crick et Watson de la composition chimique des chromosomes a ouvert la voie à l'élucidation de l'information génétique qui avait été supposée par les précurseurs que nous avons cité ci-dessus. On a découvert qu'au sein des chromosomes, ce sont les bases azotées (adénine guanine, thymine, cytosine) qui spécifient les gènes et plus particulièrement leur ordre. Cet ordre est constitué de triplets successifs, le départ étant marqué par un triplet « start » et la fin par un triplet « stop ». Il est possible de symboliser ces bases par leurs lettres (A,C,G,T) et donc de former un modèle simplifié du chromosome sous forme d'une liste de lettres ordonnées. Pour l'homme on estime leur nombre pour le génome entier à 3,4 . 109.

D'un point de vue pratique, après analyse chimique, le chercheur se retrouve devant des centaines de pages de symboles pourvus d'un ordonnancement mystérieux, avec à faire un travail équivalent au décryptage d'un code (ce qui été un des moteur de l'informatique pendant la seconde guerre mondiale). On a appelé cet ordre et ses effets "information", par analogie avec l'informatique. La modélisation donne une liste de lettres qui ressemble à un code. Ce code n'a aucune signification, il est seulement possible de le découper en des séquences pertinentes, c’est-à-dire auxquelles correspond un gène. (La partie du chromosome qui organise la synthèse d'une protéine).

L'information en informatique désigne un ordre abstrait qui puisse être concrétisé par un support physique. Ici, on a exactement la même chose inversée : un support qu'on peut se modéliser par un ordre abstrait. Autre analogie avec l’informatique,  l'ordonnancement est producteur de quelque chose : en informatique cet ordonnancement permet de commander une action et ici l'ordonnancement commande la production des protéines. On a bien là quelque chose de commun dans le concept d'information appliqué à deux domaines différents celui des artefacts et celui de la biologie. Par le biais de la mise en forme, ce qui rejoint l'aspect macroscopique. En reprenant la distinction classique entre forme et matière Danchin définit l'information comme étatn ce qui met en forme la matière. (voir Antoine Danchin : http://www.normalesup.org/~adanchin/). Nous ne sommes pas  d'accord sur ce point. Bien que défendant une ontologie de l'organisation, il nous semble que l'information au sens d'un ordonnancement n'est pas suffisante pour expliquer l'organisation. C'est l'une des explications, valide dans certains cas bien précis et non en général. Nous sommes réticent à cette extension du concept qui risque de masquer les problèmes plutôt que d'être heuristique.

7/ L'information dans les sciences humaines

La double assimilation cerveau-machine et pensée-information

Deux offensives complémentaires, que nous avons déjà vu dans l'article le cerveau-machine, sont lancées avec d'un côté l'assimilation du cerveau à une machine à calculer et, de l'autre, l'assimilation de la pensée à un traitement de l'information. C’est ce qui a donné la thèse « computationniste ». Après la publication en 1943 de l'article inaugural, un véritable modèle de raisonnement s'est formé à la suite de Pitts et McCulloch. Les neurones biologiques y sont assimilés à des portes électroniques fonctionnant en tout ou rien. De l'analogie supposée Pitts et McCulloch concluent que la logique serait inhérente au système nerveux, c’est-à-dire produite par sa structure et son fonctionnement.

Trois postulats sont présents :
1/ l'esprit  fonctionne de manière logique
2/ Le cerveau fonctionne comme machine électronique
3/ La relation entre les deux est la même que dans l'informatique

La conclusion est que la logique est implémentée par un calcul exécuté par la machinerie neuronale. L'aboutissement de ces thèses se trouve dans un article de 1949 publié dans la revue  Electrical Engineering, intitulé "The brain as a computing machine". Il y est explicitement affirmé "le cerveau est un machine logique". Nous avons là le fondement du computationnisme. Le cerveau serait une machine de traitement de l'information au sens informatique du terme. Von Neumann a pendant un temps emboîté le pas et repris ce modèle mais il a inversé la tendance : il s'en est servi pour construire des automates (utilisant par exemple la redondance pour palier aux éléments non fiables). Il s'est servi du modèle pour forger une technologie et non pour expliquer le cerveau et la pensée.

Corrélativement on trouve la proposition d'un modèle de la connaissance fondé sur la théorie de l'information. Le principe en est que toute pensée connaissante (cognitive) est fondée sur un calcul. Comme tout calcul peut être exécuté par une machine, notre connaissance peut être programmée sur une machine informatique. C'est la thèse computationniste de l'équivalence entre calcul et activité cognitive. Il s'ensuit deux conséquences importantes. La première est que les machines ne font pas que reproduire (mimer) "artefactuellement" l'activité cognitive, mais qu'elles pourraient en avoir une, comme l'homme. La seconde est l'analogie entre le cerveau et la machine sur la base d'un calcul qui leur serait commun. Elle conduit vers des tentatives pour montrer que le cerveau est une machine informatique (voir l'article Le cerveau machine). Globalement se fonde là une épistémologie, qui constitue un naturalisme informationnel. Toute connaissance est fondée sur le traitement de l'information, au sens informatique du terme. Elle peut être effectuée indifféremment par une machine biologique ou électronique. C'est la thèse expressément défendue par H. Simon.

Pour Herbert Simon, l’intelligence artificielle s'apparente au raisonnement humain parce que, comme le cerveau, un ordinateur combine des symboles et ces symboles sont liés à des formes physiques. On est bien, avec cette conception, au cœur de la théorie de l'information et d'ailleurs Simon proposera le terme "d'information processing paradigm". Il écrit : « au cœur du paradigme du traitement de l’information repose une hypothèse qu’Allen Newell et moi avons appelé l’hypothèse de symbole physique » (H. Simon 1981, "L’unité des arts et des sciences : la psychologie de la pensée et de la découverte", in Les Introuvables en langue française de H.A. Simon, p. 4). Ces symboles sont qualifiés de physiques parce qu’ils reposent sur des substrats physiques que ce soit dans les ordinateurs ou dans le cerveaux (H. Simon 1969, La science de l'artificiel Paris, Gallimard, 2004, p.59).

Ces éléments simples se composent en  "structures de symboles".  Ainsi, une structure de symboles, peut-être créée, stockée, mise en relation avec d’autres structures de symboles, transformée pour donner de nouvelles structures de symboles, etc.  « L’hypothèse du système de symbole physique a deux importants corollaires : Corollaire 1 : Un ordinateur, programmé de façon appropriée peut engager une action générale intelligente ; Corollaire 2 : Le cerveau humain est un système de symbole physique ». L'intelligence artificielle n'est pas pour Simon une reproduction artefactuelle de certains raisonnements logicisés, mais un équivalent de la pensée.

L’intelligence artificielle peut aussi être une description et une explication de la manière dont les individus pensent :  « aussi primitifs que les programmes de compréhension puissent être, ils fournissent vraiment un ensemble de mécanismes de base, une théorie, pour expliquer comment les êtres humains sont  capables de comprendre les problèmes, à la fois dans les nouveaux domaines auxquels ils ne connaissent rien et dans les domaines sur lesquels ils ont une plus ou moins grande quantité de connaissances sémantiques antérieures » (Simon 1969, p. 179). 

Le structuralisme et l'information

Une partie du structuralisme a repris à son compte le postulat informationnel d'un calcul symbolique autonome qui peut être une syntaxe langagière en lien avec un support (ici le cerveau humain). La référence explicite à la théorie de l'information n'est pas faite, mais on sent une forte influence. 

On la trouve d’abord en linguistique avec Roman Jackobson et la mise en avant de la phonologie. L’aspect le plus caractéristique de sa recherche est la décomposition de la langue en phonèmes et la recherche d'invariant relationnels entre eux. Il sera le précurseur qui influencera Lévi-Strauss et Lacan.

Pour Claude Lévi-Srauss la fonction symbolique peut être décrit selon des formes logiques qui  sont les opérations de la logique élémentaire et de la théorie des ensembles. Plusieurs essais de formalisation ont lieu sous forme de permutations de groupe. On trouve également énoncé un système d’opérations qui, schématisées, « se rapprocherait d’une algèbre de Boole ». Il semblerait que les groupes booléens s’appliquent aux mythes. 

Dans la psychanalyse avec Lacan cela atteindra un point caricatural. L'influence commence à se faire sentir vers les années 1950. En 1954-55 il fait une conférence et deux séminaires sur les machines (cybernétiques et informatiques). Un amalgame est fait entre structure, symbolique, machine et information (Séminaire 1954-55, Paris, Seuil, 1978). Il est fait allusion aux travaux de Shannon à la transmission téléphonique qui consiste à transmettre par un circuit des aspects matériels du langage. Le sens est détaché de son support (symbole ou signifiant). Le symbolique joue, indépendamment de son support humain. L'exemple en est donné par un calcul. Il est affirmé que le symbolique a ses propres structures de type mathématiques et qui sont autonomes  l'homme qui s'y insère.  L'inconscient freudien (c’est-à-dire la partie non consciente du psychisme), est déclaré structuré comme un langage, c'est-à-dire syntaxisable au travers des relations entre signifiants.


Globalement se dessine le projet  d'un cerveau traitant des informations qui se ramènent à des formes signifiantes et à une syntaxe que l'on prétend retrouver dans les différents compartiments de la vie humaine (même parmis les plus éloignés, comme celui les conduites affectives) grâce à l'analyse structurale.

Pour nous le concept d'information, en tant qu'il désigne et quantifie un ordonnancement remarquable, peut s'appliquer légitimement au niveau neurosignalétique, mais pas au niveau représentationnel (qu'il vient masquer). Le niveau représentationnel  fonde ce qui est communément nommé sens, signification. Par exemple, il paraît évident que ce que Herbert Simon nomme " la mise en relation entre structures de symboles," si on y inclut la dimension sémantique, prend une autonomie et forme une nouvelle couche organisationnelle, différente de celle l'information. C'est justement celle que l'on peut nommer représentationnelle.  En nier l'existence est un projet à la fois réducteur et réductionniste. Il rapetisse l'objet d'étude en laissant de côté la signification pour la seule syntaxe et il le réduit en ramenant l'étude au seul substrat informationnel. Citons Jérôme Segal à ce sujet.

Segal écrit " on peut se demander ce qui a poussé, surtout les philosophes et les divers représentants des sciences humaines, à vouloir utiliser la théorie de l'information dans les cas ou la signification de l'information est primordiale". La réponse qu'il donne est que "le problème posé concerne ... le réductionnisme  et même pour certains chercheurs un certain type de scientisme les amenant à croire que la théorie de l'information peut être la clé de toute la connaissance humaine. Toutefois, ... cette attitude réductionniste n'est pas consciente et on peut estimer avoir affaire à un phénomène de mode ..." (Le zéro et le un, Paris, Syllepse, 2003, p. 724)

8/ Confusion et généralisation

D'emblée les conditions de la confusion sont présentes. La transmission dans un canal bruité devient "communication" et l'évaluation statistique du résultat devient "théorie de l'information". Il n'est pas possible que cela soit un hasard ou un emprunt fait par inadvertance au langage courant. D'autant que le domaine considéré, la téléphonie concerne la transmission d'information au sens ordinaire et plein du terme qui est le transfert de connaissances entre des personnes humaines. Un peu tardivement, Shannon s'inquiéta de l'extension inconsidérée d'une notion qui n'était qu'un outil mathématique pour les ingénieurs en télécommunications. Certes, il n'a pas participé à cet abus, mais il n'a rien fait pour rectifier l'ambiguïté terminologique.

D'autre part Shannon nomma cette fonction Entropie terme déjà utilisé pour une fonction d'état parfaitement définie. Cette appellation laisse supposer que sa formule serait-elle reliée à l'entropie définie par Boltzman. Là encore une ambiguïté nullement anodine apparaît qui a favorisé l'extension physique de l'information.

Kolomorov et Shannon définissent l'information comme des mesures de la transmission ou de la complexité. On peut remarquer que toute mesure donne une idée sur ce qu'elle mesure, toute formule statistique donne une idée sur la répartition d'une distribution d'événements et  mériterait donc le titre d'information. Les développements sur le démon de Maxwell se fondent sur l'idée que celui-ci devrait mesurer les particules concernées. L'information comme mesure de quelque chose rejoint le sens ordinaire, car toute mesure n'a d'intérêt que si elle apporte une information sur le fait concerné. Mais bien sûr, la mesure demande à être lu et interprété conceptuellement par un être humain ce qui fait passer vers la notion ordinaire du terme. Or le passage de l'un à l'autre se fait par un changement de registre qui est gommée par l’utilisation du terme d'information.

"L'information [au sens courant] ne peut-elle être mesurée à la manière de Shannon ? On voit là s'esquisser, en filigrane, une théorie très générale de la connaissance qui devrait toucher aussi bien la pédagogie l'apprentissage, que la fonction mémoriale ..." écrit Claude Allègre (1995). Dans un compte rendu à l'Académie des sciences de novembre 2010, l'orateur nous dit que l'information rend compte autant d'une conversation, que du code génétique, ou du codage informatique. Il donne l'exemple d'un objet manufacturé (une barque) explicable grâce à l'information ou encore celui de la gestion du personnel dans une entreprise selon la théorie de l'information et de l'image de marque de ladite entreprise.

On arrive avec de tels propos au degré zéro de l'information. Appliquons la formule de Shannon à ce propos (comme il est légitime de le faire au vu de la généralisation admise) et l'on tombe sur zéro, puisque la probabilité d'une information sur l'information est nulle tant elle est vague et étendue. Tous ces jeux de mot sur l'information lui font perdre son sens scientifique et la transforment en slogan. La théorie de l'information devient idéologie de l'information, discours a finalité sociale, pour rassembler, faire du liant, faire mode, etc. La transformation d'un concept en slogan fait sortir du cadre scientifique pour entrer dans celui de l'idéologie. 

9/ Conclusion

L'essence de l'information

Il ressort quelque chose de central dans cet examen de la notion d'information que nous venons de faire. Historiquement c'est à partir du XVIe siècle, mais surtout au XIXe siècle, qu'on effectue la mise en relation entre des éléments concrets (roue dentée, signal électrique) et des symboles (chiffres, lettres) en notant la possibilité d'une concordance parfaite entre les deux. Au XXe siècle on comprend que c'est leur mise en ordre qui compte, ainsi que les manques pouvant affecter celle-ci. On a tenté d'énoncer cette mise en ordre et de chiffrer par des notions mathématiques et plus particulièrement statistiques.

Le centre de la découverte c'est la puissance de l'ordonnancement. Le point commun aux différentes formes d'information c'est l'existence d'un code, d'une manière d'ordonner les symboles qui puisse être réalisé concrètement. La réalisation concrète du code implique que les signaux soient distincts et distribués selon un ordre précis. S'il n'est pas respecté il se passe autre chose, le monde change, car c'est cet ordre qui produit un effet dans le monde (et non la présence des éléments qui le concrétisent). Cet ordre a un rôle de détermination dans le monde, une effectivité.

Par exemple que si des éléments A, B, C, se présentent dans ce ordre ou dans l'ordre inverse B, C, A, cela produira deux effets différents. Identifier cela et pouvoir le manipuler techniquement constitue quelque chose de spécifique et de nouveau dans l'histoire de la pensée. Il y a quelque chose de nouveau dans l'histoire de la pensée D'une manière générale dans l'étude des phénomènes, lorsque des faits sont identifiés comme conditions, on note l'effet de leur présence ou absence et si la présence de A ou B ou C a un effet, ils seront identifiés comme  causes. Ici il n'y a pas  un tel rapport causal car c'est l'ordre (ABC ou BCA) qui joue un rôle.

L'homme a obtenu une puissance technique sans précédent par le codage et le traitement du signal, ce qui permet de construire des machines d'une polyvalence extrême. On peut leur commander d'effectuer les tâches les plus diverses, y compris commander d'autres  machines, et même d'avoir une autonomie. En biologie la manipulation de l'ordre au sein du génome permet des transformations du vivant dont l'extension est immense et les conséquences majeures.

Le gros  problème est l'ontologisation de l'information qui a été située comme une entité existant dans le monde et pas seulement une grandeur théorique, instrumentale. L'information est ainsi pourvue d'une forme d'existence.  L'information est vue comme une entité perdurante et distribuée dans le monde. Rapporté à l'ordonnancement, comme nous le proposons, cette existence est très particulière. 

Un abus d'extension

L'énorme progrès théorique apporté par le concept d'information s'est accompagné d'un abus d'extension.

Du côté de la physique, c'est probablement l'exemple de l'énergie, dont l'extension a été universelle, qui a poussé à faire de même avec l'information donnant à espérer qu'elle puisse être une clé du même type tant pour la compréhension du monde que pour l'unification de la science. La tentative d'une extension comme constituant physique qui nous paraît douteux et nous sommes réservé à ce sujet. Cette extension a été favorisée par l'appellation d'entropie donnée à la fois à la mesure de transmission des signaux et de l'évolution des états dans les systèmes physico-chimiques.

Du côté de l'humain, la reprise d’un terme commun a provoqué une confusion dont nous subissons actuellement. L'extension du domaine de l'information masque un autre domaine, celui de la représentation. Derrière cette extension de l'information se tient masquée une visée réductionniste plus ou moins consciente : remplacer la représentation par le traitement de l'information. Dans cette optique l'homme est une machine émettant des signaux et la communication humaine un échange entre émetteur et récepteur. Le cerveau serait parcouru par des signaux électriques codés, permettant d'émettre des signaux communicationnels reçus par les organes des sens qui opèrent une transduction vers le cerveau et ainsi de suite. Cette hypothèse qui a une certaine validité à un niveau inférieur (à condition d'être complexifiée), ne doit pas servir à éliminer le niveau de complexité supérieur qui est représentationnel. C'est la thèse computationniste que nous avons critiquée ailleurs

Il peut être intéressant et heuristique de rassembler divers aspects du monde sous une même appellation en montrant ce qu'ils ont en commun. La démarche n'est nullement critiquable en soi, mais elle est parfois infondée. L'information si l'on s'en tient à son essence ordonnatrice possède déjà une extension considérable et actuellement il nous paraît hâtif d'aller au-delà.

Bibliographie :

Segal J., Le zéro et le un, Paris, Syllepse, 2003
Sendrier N., Théorie de l'information : http://sciences.ows.ch/informatique/TheorieInfo.pdf
Rechenmann F., L'information biologique et son analyse par des méthodes informatiqueshttp://www.ac-grenoble.fr/champo/spip.php?article501



Haut de page          voir aussi :  Le cerveau machine