L’usage de la lexicométrie – Rap français et littérature

D‘après une idée originale américaine, le site Shakedatass s’est proposé d’analyser le vocabulaire des rappeurs français. Cette analyse lexicométrique permet de classer les rappeurs suivant le nombre de mots différents qu’ils utilisent. MC Solaar est largement en tête avec 7 691 mots utilisés, suivi par Alkpote avec 7 334 mots à son actif.

Le Top 50 des rappeurs les plus prolifiques lexicalement révèle une moyenne de 6 396 mots (précisément 6395,9 mots selon notre propre calcul). Les 18 premiers se placent donc au-dessus de la moyenne. Mais que représentent tous ces chiffres dans la langue française en général ?

 

LEXICOMÉTRIE ET LITTÉRATURE CLASSIQUE

Dans la linguistique française, le domaine d’étude des mots est la lexicologie. La langue française comporterait environ 60 000 mots différents. Le développement de l’outil informatique, devenu aujourd’hui indispensable, a permis l’ouverture du champ de la lexicométrie, science qui étudie statistiquement l’emploi des mots.

Pour Gustave Flaubert, « quelle que soit la chose qu’on veut dire, il n’y a qu’un mot pour l’exprimer, qu’un verbe pour l’animer et qu’un adjectif pour la qualifier. Il faut donc chercher, jusqu’à ce qu’on les ait découverts, ce mot, ce verbe et cet adjectif, et ne jamais se contenter de l’à-peu-près, ne jamais avoir recours à des supercheries, même heureuses, à des clowneries de langage pour éviter la difficulté ».

Tous les auteurs classiques ne sont pas d’accord avec cette vision des choses et certains prêchent plutôt la simplicité, à l’image de Guy de Maupassant. Flaubert se positionne dans le camp des écrivains de recherche, alors que Maupassant est qualifié d’écrivain d’instinct.

Une étude quantitative a justement  été menée concernant le vocabulaire de Guy de Maupassant et nous permet d’avoir un comparatif avec l’étude établie sur les rappeurs. L’étude sur Maupassant se base sur la totalité de son oeuvre, soit 306 contes et nouvelles, 6 romans, 3 récits de voyage et un peu plus de 200 chroniques journalistiques, théâtrales et poétiques; soit 5 000 pages de l’édition de la Pléiade (ayant un format particulier servant de mesure). Voici ce qui en a résulté :

Le nombre totale des mots utilisés par Guy de Maupassant, 18 256 mots, dépasse celui d’Émile Zola et de Marcel Proust, mais reste inférieur à celui de Gustave Flaubert (voir ce même article). Il est presque 3 fois supérieur à la moyenne de mots utilisés par les rappeurs français (rapport variant entre 2,3 et 3,18 suivant les artistes). Mais qu’en est-il vraiment des critères d’analyse pour nos artistes ?

LES MOTS DU RAP FRANÇAIS

Pour établir l’étude sur les rappeurs français, les instigateurs de celle-ci ont pu finaliser leur classement à l’issu de l’analyse des mots parmi un échantillon de 30 000 mots de chaque artiste. Les rappeurs pour lesquels un minimum de 30 000 mots n’a pas pu être obtenu ont donc été écartés. Les noms communs ont été singularisé et les verbes ont été conjugués à l’infinitif, pour éviter des doublons.

Des questions restent tout de même en suspens comme le sort réservé aux noms propres, aux abréviations ou encore à certains mots argotiques qui ne sont pas connus ni utilisés de tous. Le vocabulaire familier utilisé par Seth Gueko n’est pas du tout le même que celui employé par Oxmo Puccino par exemple.

La définition même d’un « mot » peut changer en fonction du chercheur ou du logiciel utilisé. La contraction de plusieurs mots tels que « J’suis », utilisé à l’oral et maintenue à l’écrit pour être plus fidèle à la réalité de la chanson, correspond -t-elle à 1 ou 2 mots ? Il en est de même pour les mots composés.

Il est également important d’en savoir un peu plus sur la taille du corpus total. Toutes les paroles analysées pour l’étude ont été trouvées sur le site de Rap Genius, mais combien de titres au final ? Pour prendre un exemple, lorsqu’on cherche les morceaux référencés pour l’artiste Médine, on tombe sur  123 résultats. Ce nombre comprend ses morceaux solos ainsi que des featurings, c’est-à-dire des collaborations sur lesquelles il a posé un seul ou plusieurs couplets. Il est important de prendre en compte ces considérations car elles influencent considérablement les résultats.

Car la lexicométrie possède cet avantage de permettre d’analyser le développement d’un discours (d’un énoncé). Les mots utilisés par les hommes politiques dans leurs discours sont de plus en plus étudiés. Grâce à cette méthode scientifique on peut comparer plusieurs discours d’un même politicien par exemple. Le champ lexical, l’occurrence des mots et la complexité syntaxique des phrases changent suivant la cible. Le discours n’est pas le même pour des parlementaires que pour des ouvriers.

CONCLUSION

La moyenne de 6 396 mots utilisés par les 50 rappeurs mis en avant par l’étude est plus qu’honorable. L’étude est à ses débuts et les paramètres, qui nous sont encore inconnus, peuvent être affinés et pourraient voir croître cette statistique. La moyenne nationale est de 5 000 mots différents utilisés par une personne, dont 1 000 quotidiennement. Les lycéens emploient entre 800 et 1 600 mots, alors qu’un universitaire peut en utiliser presque 30 000 (avec des champs lexicaux plus ou moins pointus). Ces derniers ont une moyenne élevée car ils utilisent plus de mots rares que la moyenne des Français, mots naturellement liés à leur domaine de recherche. Car ce n’est pas parce qu’un auteur ou un éditeur utilise le mot « palimpseste » qu’il est plus intelligent que les autres, il a simplement recours à des termes spécifiques à un domaine.

 

Bibliographie :

– LEIMDORFER, François, SALEM, André, « Usages de la lexicométrie en analyse de discours », Cahiers de sciences humaines, n°31/1,1995, p. 137-143.

– MATORÉ, Georges, « Lexicologie et littérature », Cahiers de l’Association internationale des études françaises, n°11, 1959, p. 301-306.

– SELVA, Thierry, « Une étude quantitative du vocabulaire de Guy de Maupassant », Angélus, n°12, déc. 2001-janv. 2002, p. 41-48.

– TOURNIER, Maurice, BONNAFOUS, Simone, « Analyse du discours, lexicométrie, communication et politique », Langages, v. 29, n°117, 1995, p. 67-81.

 

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *