Le langage naturel contient plusieurs types de mots. Dans la langue française, nous en dénombrons onze, que je classerai ici selon quatre grandes catégories:
Les entités: | noms communs, noms propres, pronoms |
Les relations: | verbes, prépositions, conjonctions |
Les attributs: | déterminants, adjectifs, adverbes |
Les perceptions: | interjections et onomatopées |
En fait, les trois premières catégories (entités, relations et attributs) sont aussi des perceptions, mais elles sont abstraites et doivent être combinées pour exprimer la percepton originale tandis que les interjections et les onomatopées sont la perception sans mentalisation. Ces perceptions amènent souvent de façon implicite une émotion ou sentiment propre à la situation, difficilement exprimable en d'autres mots des trois premières catégories.
De même, les langages informatiques utilisent des mots, le terme le plus souvent utilisé pour désigner ces objets étant donnée. Comme les mots, les données peuvent être regroupés en types genéraux dont je présente ici une catégorisation possible:
Les données texte: | caractères, chaînes de caractères, champs mémo |
Les données numériques: | octets, entiers, réels, booleéns |
Les données groupées: | listes, tableaux, tables, enregistrements, structures, objets |
Les expressions: | procédures, opérateurs, fonctions, algorythmes |
Les données sensorielles: | couleurs, images, sons |
Bien que les données sensorielles soient conservées dans un format de structure,
la sémantique de ces données n'est pas la même qu'une structure car elles
représentent directement une réalité extérieure à la structure informatique,
ce qui n'est pas le cas des données groupées dont chaque élément peut
conserver sa sémantique propre s'il est séparé de son groupe.
Autre fait à noter: les expressions ne sont généralement pas considérées
comme des données mais plutôt comme le programme lui-même. Pourtant, si
j'inscris dans un programme une expression telle que a = b + c,
tout le monde s'accordera pour dire que a, b et c sont des données
(probablement numériques, quoi que l'on pourrait vouloir joindre deux textes
ou listes). Cependant, les opérateurs = et + seront rarement considérés comme
des données. Il faut pourtant comprendre que les opérateurs sont
généralement implémentés en tant que fonction et peuvent jouer le même rôle.
En fait, un opérateur est une fonction à deux paramètres dont la syntaxe
diffère d'une fonction normale. On pourrait donc réécrire l'expression
ci-dessus de la façon suivante: egal(a, plus(b, c)). De plus,
l'expression pourrait être conservée sur disque ou dans une base de
données avec une structure comme (=,a,(+,b,c)).
Maintenant, faisons le parallèle entres les mots et les données. Il est certes évident que les données texte représentent une liste de mots qu'il faut pouvoir décomposer en plus petites unités sémantique. C'est le processus d'interprétation du langage naturel qui nous est si cher. Les données sensorielles quand à elles, nous donne le même genre d'information que les interjections et les onomatopées, une conscience pré-sémantique plus concréte et ancrée à la réalité, moins mentalisée. Les types de mots que sont les relations fonctionnent de la même façon en français et en anglais que les opérateurs des langages informatiques. Ils ont le même type de syntaxe et servent la même fonction sémantique de relier deux éléments pour en créer un troisième. Quand aux données groupées, elles représentent en général des entités dont les différents éléments sont les caractéristiques observables et distinctives de ces entités. ILs restent les données numériques qui sont certes très bien assorities aux attributs mais il demeure un très grave problème sémantique avec ce type de données que j'exposerai plus loin. Nous avons donc pour l'instant une correspondance entre mots de la langue et données informatique selon le tableau ci-bas:
Les données texte (langage) | tout type de mot | |
Les données numériques (attributs) | déterminants, adjectifs, adverbes | |
Les données groupées (entités) | noms communs, noms propres, pronoms | |
Les expressions (relations) | verbes, prépositions, conjonctions | |
Les données sensorielles (perceptions) | interjections et onomatopées |
Ce que les tableaux présentés nous suggérent, c'est que l'utilisation des mots/données peut se faire à un stade pré-sémantique, ou la conscience est encore une perception sans sémantique subsjective, à un stade post-sémantique, lorsque la conscience est entreposée dans ses véhicules que sont les mots, en plus du stade proprement sémantique ou les données s'élaborent et se complexifient pour créer la sémantique, principale activitée du mental. Et je vous ferai remarquer ici que la sémantique s'exprime généralement selon une même syntaxe générale:
La relation se retrouve toujours au milieu entre deux valeurs, que ce soit une entité ou un attribut. La valeur du résultat obtenu peut alors être utilisée avec un autre opérateur et une autre valeur (entité ou attribut) afin de produire un nouveau résultat. Et la chaîne des opérations peut se poursuivre ainsi à l'infini. Cette syntaxe est valable pour la plupart des langages de programmation, les langues latines et anglosaxonnes. D'autres langues et certains langages informatiques vont modifier l'ordre des types mais les groupements et les enchaînements garderont les mêmes principes. Par example, un langage informatique inscrira l'expression a = b + c de la façon suivante: a (b c +) =. Dans ce type de syntaxe, le verbe ou la relation se trouve après ses deux paramètres.
Quelque soit la syntaxe, c'est à dire l'ordre de paramètres et de la relation, nous avons cepepdant presque toujours cette constante: une relation et ses deux paramètres. Il y a bien quelques excpetion comme les opérateurs unitaires (négation logique et négatif mathématique) mais la majorité de la communication humaine se fait avec la triade présentée ci-haut. L'ordre n'a pas vraiment d'importance pourvu qu'on s'entende sur celui que l'on va utiliser.
Qu'est-ce que ça signifie un nombre? Si je dis le chiffre 3, tout le monde comprend qu'il faut compter jusqu'à trois pour exprimer cette quantité mais tous se demanderont trois quoi? Trois pommes ou 3 degrés celsius. 3 mètres de hauteur ou 3 secondes. Je viens d'énumérer quatres données numériques qui utilisent toutes le nombre 3 mais aucune n'a la même sémantique. En fait un nombre tout seul est une information coupée de son contexte qui n'a pas plus de sens qu'une phrase de politicien citée hors contexte. De l'autre côté, les adjectifs et les adverbes sont des données très contextuelles mais qui manquent de la précision des nombres. Il est grand, il agit rapidement, deux contextes d'adjectif et d'adverbe respectivement qui bien que notant précisément le contexte de hauteur et de temps, ne nous permette pas d'évaluer précisément l'étendue de l'objet perçu.
- conscience de perception à entité+relation+attribut à mots - le processus du mental - entité,relation,attribut est la triade de base du mental - application de la triade sur le réel devient ETS - application de la triade sur chacune des dimensions du réel devient position,direction,quantité - observation de la variation génère +,=,-Conclusion En décorticant la programmation informatique et le langage naturel, nous retrouvons: - les phases de la conscience adjacentes à la sémantique - les composantes de base du mental - la limite de la connaissance humaine