Combien de mots et de phrases connaissons-nous ?

🔥 Produits recommandés : Canon EOS R6 IIDJI Mini 4 ProMacBook Pro M4

Points clés

  • Combien de mots et de phrases connaissons-nous ? Il est difficile de répondre à cette question.
  • Certaines expériences astucieuses visent à estimer le nombre de mots que les gens connaissent. L’estimation est d’environ 45 000 à 60 000 mots.
  • Le nombre de phrases que nous connaissons est encore plus important : Sextillions de phrases.

Vous n’y prêtez probablement guère attention, car cela nous est naturel. Vous le faites en ce moment même et vous êtes très doué pour cela. Vous le faites aussi lorsque vous parlez au téléphone. Lorsque vous passez du temps avec vos amis. Lorsque vous lisez le journal. Quand vous regardez les informations. C’est ce talent surprenant que tout être humain acquiert à l’âge de quelques années seulement. À partir de ce moment-là, nous nous améliorons rapidement, jusqu’à ce que nous maîtrisions vraiment cette compétence.

Ce talent s’appelle le traitement du langage. Il s’agit du talent de parler, d’écouter, de lire et d’écrire. De nombreux articles et livres excellents ont été écrits sur ce talent. Pourtant, une question très simple – combien de mots et de phrases connaissons-nous – n’a pas encore trouvé de réponse, peut-être parce qu’elle s’avère très difficile.

Il y a, bien sûr, une série de facteurs à prendre en compte pour répondre à cette question. Vous pouvez poser la question suivante : S’agit-il d’une langue ou de plusieurs langues parlées par une personne ? S’agit-il de la production d’une langue à l’oral et à l’écrit ou de la compréhension d’une langue ? Et la réponse ne dépend-elle pas de l’âge ? Ce sont toutes des questions valables, mais simplifions la question autant que possible et concentrons-nous sur la quantité approximative de la langue anglaise que nous comprenons.

En 2016, des collègues ont conçu une expérience intelligente pour trouver la réponse. Ils ont donné à 221 268 participants à une expérience une liste de mots et leur ont demandé d’indiquer s’ils connaissaient ces mots. Bien entendu, ils voulaient éviter que les participants répondent qu’ils connaissaient tous les mots qui leur étaient présentés. Ils ont donc fait preuve d’ingéniosité. Soixante-six pour cent des mots étaient de véritables mots de la langue anglaise, mais 33 % étaient des non-mots. Des non-mots comme misk, molk et rontence. Ils ressemblaient à des mots anglais mais n’en étaient pas. Sur la base du taux d’erreur des participants, il a été possible de corriger les devinettes. Sur la base des résultats corrigés, ils ont estimé que les jeunes de 20 ans connaissaient environ 42 000 mots différents, et les personnes de 60 ans quelque 48 200 mots différents. D’autres ont estimé que ce nombre se situait plutôt autour de 60 000 mots.

l’article continue après l’annonce

Cependant, ces mots ne comprennent pas d’expressions à plusieurs mots comme beurre de cacahuète, parking et feu de circulation (et le fait de connaître ces mots individuellement ne vous permet pas tout à fait d’accéder à l’expression à plusieurs mots). Ils n’incluent pas non plus des noms comme Beyoncé, Facebook ou Washington.

Mais. Nous. Ne. Pas. Lire. Les mots. Nous lisons des phrases. Il est donc encore plus difficile de répondre à la question de savoir combien de mots et de phrases nous connaissons. Nous ne pouvons pas simplement supposer que la réponse à la question du nombre de phrases que nous connaissons est le nombre de combinaisons de tous les mots que nous connaissons, 60 000 x 60 000 = 3 600 000 000 de phrases. La phrase réponse nombre de combinaisons de mots, par exemple, n’est pas une phrase. Nous devons tenir compte de la grammaire, de la structure de la phrase qui permet certaines combinaisons de mots, mais pas toutes les combinaisons.

Essayons de calculer les chiffres (soyez patients). À titre d’expérience de pensée, supposons d’abord que nous ne connaissons que six mots, au lieu de ces 60 000 mots. Supposons que ces six mots se composent de trois noms(John, Mary et Jane) et de trois verbes(hits, beats et hugs). À partir de ce vocabulaire plutôt limité de six mots et d’une structure de phrase propre à l’anglais (nom-verbe-nom), nous pouvons générer 27 phrases différentes(Mary étreint Jane, Mary frappe John, Jane bat Mary étant trois d’entre elles). Comme la structure de la phrase peut également consister en une combinaison nom-verbe(John hugs), le nombre passe à 36.

D’accord, transposons cela à la langue anglaise dans son ensemble. Nous savons que la longueur moyenne d’une phrase est de 15 à 20 mots ; supposons que les phrases que nous connaissons peuvent avoir un maximum de 20 mots. Il n’est pas tout à fait vrai qu’une phrase compte 20 mots, car nous pouvons facilement créer des phrases beaucoup plus longues que 20 mots, comme celle-ci. Mais tenons-nous en à 20 mots par phrase et supposons que les phrases peuvent avoir trois mots, quatre mots, etc.

Nous savons également que dans la langue que nous utilisons, nous employons environ 19 % de noms, 27 % de verbes, 6 % d’adverbes, 3 % d’adjectifs, 21 % de pronoms, 7 % de prépositions, les 15 % restants étant constitués de déterminants, de coordonnateurs, de modaux, de subordonnants et de particules adverbiales. Nous pouvons maintenant estimer le nombre de noms, de verbes, d’adjectifs, d’adverbes et d’autres catégories dans une phrase de trois mots, une phrase de quatre mots, une phrase de cinq mots, jusqu’à une phrase de 20 mots, notre longueur de phrase maximale.

Ron Hyrons Shutterstock
Source : Ron Hyrons Shutterstock

Sur les 60 000 mots que nous connaissons, nous disposons d’environ 14 400 noms, 16 800 verbes et quelques pronoms, soit plus de 30 000 combinaisons de noms, de verbes et de pronoms. On estime donc qu’une phrase de 10 mots comporte deux noms, trois verbes, un adverbe, deux pronoms et une préposition. Cela signifie que les permutations possibles d’une phrase de 10 mots représentent plus de 4 741 000 000 000 de phrases. Si nous ajoutons maintenant le nombre de permutations d’une phrase de trois mots à une phrase de 20 mots, nous finissons par interpréter plus de 5 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 de phrases. Mais jusqu’à présent, nous avons supposé que l’ordre des classes de mots dans une phrase restait constant. Ce n’est évidemment pas le cas. Simplifions à nouveau la situation et supposons qu’il n’existe que deux variations de l’ordre des mots dans une phrase. Si nous ne prenons en compte que les variations de l’ordre des mots, nous pouvons supposer que nous connaissons au moins 10 000 000 000 000 000 000 000 000 de phrases, soit 10 sextillions de phrases.

Combien cela représente-t-il ? Supposons qu’un journal quotidien moyen contienne environ 120 000 mots et que nous estimions, à raison de 10 mots par phrase, à 12 000 le nombre de phrases. Le nombre de phrases que nous connaissons est le même que le nombre de phrases dont nous faisons l’expérience en lisant chaque seconde de notre vie, de la naissance à la mort, soit 8 500 journaux. La prochaine fois que vous serez à une fête et que les gens se vanteront de la dernière affaire qu’ils ont conclue, de la voiture qu’ils ont achetée ou des nombreux kilomètres qu’ils ont parcourus, vous pourrez vous vanter vous aussi. Vous connaissez autant de phrases que celles publiées dans 8 500 journaux à chaque seconde de votre vie, soit quelque 10 sextillions de phrases (ne leur dites pas qu’ils en connaissent autant eux aussi).

Avant d’objecter qu’il est injuste de compter le nombre de mots de cette manière, sans parler du nombre de phrases, parce qu’une fois que l’on connaît le système de règles qui sous-tend les mots et les phrases, on ne devrait pas compter les mots et les phrases individuellement, vous avez raison. Mais là n’est pas la question. Il s’agit ici de s’émerveiller du talent impressionnant que nous possédons et qui passe souvent inaperçu parce qu’il nous vient si naturellement. Se faire une idée du nombre de mots et de phrases que nous connaissons nous amène à la question suivante : Comment garder ces mots à l’esprit ? C’est une question que je garderai pour un prochain article (et pour un livre de vulgarisation scientifique qui sortira bientôt).

Références

Brysbaert, M., Stevens, M., Mandera, P. et Keuleers, E. (2016). Combien de mots connaissons-nous ? Estimations pratiques de la taille du vocabulaire en fonction de la définition du mot, du degré d’entrée dans la langue et de l’âge du participant. Frontiers in Psychology, 7, 1116.

Bryson, B. (1990). Mother tongue : L’anglais et son évolution. New York : William Morrow.

Nagy, W. E. et Anderson, R. C. (1984). How many words are there in printed school English ? Reading Research Quarterly, 304-330.