Introduction
La communication par SMS (Short Message Service) est bien ancrée dans notre société, même si actuellement, les applications de messagerie instantanée, en particulier WhatsApp, ont pris le dessus surtout chez les jeunes utilisateurs. Néanmoins, dans les années 2009 et 2010, l’Office fédéral de la communication suisse (OFCOM) a enregistré environ 6 milliards d’échanges de SMS en Suisse (cf. Brambilla 2013 : 42). Le fait que cette technologie est très répandue et employée au quotidien la rend intéressante pour beaucoup de secteurs de l’économie, mais également pour des études scientifiques. Ainsi, les possibilités d’utilisation de la messagerie par SMS et son impact sur la société ont été analysés dans divers contextes scientifiques dès les années 2000 : en médecine, en commerce et marketing, en communication politique, dans les sciences des médias ou encore en psychologie (cf. Thurlow et Poff 2013 : 165).
La linguistique s’est également penchée sur les données SMS. Une des premières études à grande échelle a été réalisée dans le cadre du projet sms4science, lancé en 2004 à l’Université de Louvain en Belgique (cf. notamment Fairon, Klein et Paumier 2006 et Cougnon 2008). Depuis, plusieurs pays se sont ralliés à l’initiative et différents projets sms4science nationaux se sont formés. Des collectes de SMS ont été effectuées en Belgique (2004), sur l’île de La Réunion (2008), en Suisse (2009-2010), au Québec (2010) et dans certaines régions de la France (Hautes-Alpes et Isère 2010). De plus, le projet international coopère avec des universités en Grèce, en Italie, en Espagne et au Pays basque, en Italie, en Grande-Bretagne et en Roumanie. Des collectes de SMS dans ces pays et régions sont prévues ou déjà en cours (cf. www.sms4science.org). Le présent travail a été réalisé dans le cadre du projet sms4science suisse dont les données ont été collectées durant les années 2009 et 2010, donc en pleine période d’apogée des SMS (cf. www.sms4science.ch).
Jusqu’à présent, les études en linguistique portant sur des SMS se sont surtout concentrées sur des aspects relevant de la sociolinguistique ou de l’analyse discursive, tandis que les analyses morphosyntaxiques sont encore relativement rares (cf. Dürscheid et Stark 2011, Thurlow et Poff 2013), alors que les SMS offrent de précieux renseignements sur cet aspect. Car, en tant que moyen de communication souvent utilisé dans des contextes informels, les SMS ne sont pas a priori soumis à une norme prescriptive : tandis que la variété standard d’une langue suit obligatoirement une convention socioculturelle (cf. Thurlow et Poff 2013 : 177), les SMS, de leur côté, en sont libérés dans une certaine mesure. Par conséquent, ils montrent souvent des déviances par rapport à la variété standard – des déviances qui sont instructives au vu du système linguistique proprement dit : « […] beaucoup de pratiques typographiques de la messagerie offrent des représentations plus ‘correctes’, plus ‘authentiques’ du langage » (Thurlow et Poff 2013 : 177). Ces « représentations authentiques du langage » constituent l’intérêt de recherche principal de notre étude. Ainsi, les déviances, en particulier syntaxiques, par rapport au standard ne sont pas arbitraires, mais suivent des principes fondamentaux des langues naturelles. Précisons que par des déviances syntaxiques nous entendons des déviances dans la structure de la phrase, c’est-à-dire par rapport à la présence ou l’ordre linéaire des constituants. Cette délimitation est importante, car contrairement au choix lexical ou aux effets prosodiques, qui sont souvent utilisés à des fins stylistiques (cf. Ravid et Tolchinsky 2002 : 431), la syntaxe ne peut pas être manipulée de manière consciente. La créativité en syntaxe est restreinte par un noyau syntaxique constitutif du système linguistique, ce qui permet par exemple aux locuteurs natifs de se prononcer sur la grammaticalité d’une phrase dans leur variété sans pour autant pouvoir motiver leur jugement. À notre avis, les SMS nous aident donc à accéder à cette syntaxe fondamentale.
De plus, l’analyse de SMS peut également révéler des change-ments linguistiques en cours. Ces changements se manifestent d’abord à l’oral et ne sont pas (encore) tolérés par les normes diffusées par les institutions de référence. Les SMS, bien que relevant du code graphique, sont susceptibles de refléter dans leur graphie des changements en cours à l’oral. Les procédés typographiques créatifs ou, selon Béguelin (2012a : 53), les « tentatives de ‘réappropriation spontanée’ de la graphie par les sujets », ouvrent la possibilité d’imiter le code phonique (cf. p. ex. Anis 2007, Stark 2013). Or, une critique souvent émise par rapport à l’étude d’un corpus graphique est que ce dernier ne peut que partiellement refléter les tendances du français phonique. Ceci est vrai, mais notre étude ne se concentre pas sur le français phonique. Notre but est de décrire de manière détaillée les données du corpus et, dans une deuxième étape, nous pourrons formuler des conclusions relatives au français contemporain. D’ailleurs, Androutsopoulos (2007) remarque, à juste titre, que l’emploi de la langue dans la communication médiée par ordinateur (CMC) ne peut pas simplement être caractérisé comme une forme hybride se situant entre l’écrit et l’oral, car « ceci présente le risque de méconnaître le potentiel de l’écriture, [un potentiel, ART] indépendant de la phonie, que nous offre la représentation spatio-visuelle de la langue » (Androutsopoulos 2007 : 73). Les résultats obtenus à partir d’un corpus en code graphique sont donc tout autant valables que les résultats obtenus à partir de corpus oraux. Il ne s’agit, certes, pas du même objet d’étude, mais les deux sont légitimes.
Pour notre étude, nous avons choisi de nous concentrer sur un aspect morphosyntaxique de l’écrit SMS, à savoir la réalisation du sujet. En raison de la divergence constatée dans l’emploi des sujets entre le français standard et le français spontané, les propriétés morphosyntaxiques des sujets sont invoquées dans plusieurs approches de la variation en français. Ainsi, d’après le modèle de Koch et Oesterreicher (2001, 2011), les propriétés du sujet sont un indicateur pour la conception de la communication d’un énoncé.
Selon une autre approche, les sujets clitiques du français non standard n’ont pas le même statut que ceux du français standard : tandis que dans le premier cas il s’agit de vrais arguments sujets, dans les variétés plus familières les clitiques constitueraient plutôt des marqueurs d’accord sur le verbe (cf. p. ex. Culbertson 2010, Kaiser 1992, Auger 1995, Fonseca-Greber et Waugh 2003, Berrendonner 2007, et déjà Darmesteter 1877 contra p. ex. De Cat 2005, Rizzi 1986, Belletti 1999, Meisenburg 2000). Certains voient ici un changement en cours, un changement susceptible d’avoir des reflets dans un corpus de français écrit spontané. En effet, notre étude s’inscrit d’une part dans le cadre de la linguistique variationnelle puisque nous aimerions comprendre quels facteurs intra- et extralinguistiques déterminent la forme du sujet dans les SMS.
D’autre part, dans la littérature à propos de la CMC, il a souvent été affirmé que les ellipses sont typiques de ce genre de communication (cf. p. ex. Panckhurst 2009, Ledegen 2011). Notamment, Fairon, Klein et Paumier (2006 : 43) citent les exemples (1) et (2) avec des omissions de sujets comme représentants de leur catégorie « omission de mots grammaticaux » :
(1) Ai fait de la physique
(2) Pas eu mon exam… (Fairon, Klein et Paumier 2006 : 43)
L’analyse de l’omission d’arguments connaît une longue tradition dans la grammaire générative. Le phénomène du pro-drop par exemple a beaucoup été discuté dans les langues romanes (cf. en particulier Rizzi 1982 ou Burzio 1986). Pour les variétés non standard, l’omission d’arguments est moins bien documentée. Toutefois, l’ellipse du sujet a été constatée dans le langage des enfants qui acquièrent tous types de langue, y compris le français (cf. p. ex. Hyams 1986, Pierce 1989, Bloom 1990, Rizzi 1994, Jakubowicz et Rigaut 2000, Rasetti 2000, Schmitz, Patuto et Müller 2012). Pour le langage des adultes, l’omission d’arguments a été analysé dans la tradition des ‘registres abrégés’ comme les notes (cf. p. ex. Janda 1985), les manchettes de journaux (cf. p. ex. Stowell 1991, Chow et al. 2008), les recettes de cuisine (cf. p. ex. Massam et Roberge 1989) ou les journaux intimes (cf. p. ex. Haegeman 1997, 2000, 2007, 2013 ou Haegeman et Ihsane 1999, 2001). Pour la modélisation de nos données, nous adopterons ce même cadre théorique de la grammaire générative (récente) qui s’impose pour deux raisons : d’une part, la grammaire générative offre la possibilité de rendre compte d’éléments syntaxiquement actifs qui ne sont pourtant pas visibles (les catégories vides), dont le sujet omis est un représentant. Elle permet de modéliser les conditions sous lesquelles les catégories vides apparaissent. D’autre part, la grammaire générative suppose que des principes syntaxiques innés guident l’acquisition du langage. Et, sans de tels principes innés, il est difficile d’expliquer comment l’on parvient à acquérir le fonctionnement de catégories vides, ainsi que le fait remarquer Bickerton (2009 : 11) : « Comment peut-on apprendre un rien ? »
Dans cette introduction nous avons thématisé plusieurs domaines de la linguistique française actuelle. Nos questions de recherche sont déduites des approches variationnistes du français non standard ainsi que de l’analyse syntaxique formelle dans le cadre de la grammaire générative. Nous nous intéresserons aux variantes morphosyntaxiques du sujet dans le corpus et à leur fréquence relative. Ensuite, nous identifierons les contextes morphosyntaxiques dans lesquels le sujet peut être omis. Nous interpréterons nos résultats en tenant compte des facteurs intra- mais aussi extralinguistiques qui guident la rédaction de SMS. Finalement, ceci nous permettra de répondre à la question fondamentale de savoir en quoi la grammaire des SMS se différencie de celle du français ‘standard’ et de celle du français ‘parlé’. À partir de ces questions de recherche et des approches brièvement exposées ci-dessus, nous pouvons formuler trois hypothèses principales concrètes pour notre corpus, hypothèses que nous déclinerons plus en détail dans le chapitre 2 :
H1 :Les clitiques sujets sont des marqueurs d’accord affixaux sur le verbe.
H2 :Les sujets référentiels omis sont des topiques familiers nuls.
H3 :Les sujets explétifs sont omis quand le verbe impersonnel est topicalisé ou focalisé.
Anticipant les résultats, nous verrons que H1 ne pourra pas être confirmée, tandis que H2 et H3 seront corroborées par nos données.
Du point de vue méthodologique, nous aurons recours à des procédés quantitatifs et qualitatifs. Pour ce faire, nous avons annoté manuellement l’intégral de la partie française du corpus
sms4science.ch selon des directives bien précises. En nous basant sur les résultats quantitatifs issus de l’annotation, nous proposerons une modélisation probabiliste (donc purement statistique) qui révèle les facteurs (et leurs interactions) qui favorisent l’une ou l’autre forme du sujet dans les SMS. Les analyses qualitatives d’exemples révélateurs nous permettront ensuite de fournir une explication syntaxique pour les effets catégoriels de certains facteurs de notre modèle probabiliste. En particulier, nous élaborerons une modélisation dans le cadre de la grammaire générative qui est capable de rendre compte de l’omission du sujet. Nous plaiderons essentiellement en faveur de l’hypothèse selon laquelle l’omission du sujet référentiel est un type spécifique de topic-drop, à savoir l’effacement postsyntaxique du topique familier dans la périphérie gauche. Cet effacement est lié aux propriétés du système pronominal français. Ces propriétés seront également invoquées pour expliquer l’omission du sujet explétif.
En résumé, notre étude se veut à la fois empirique et théorique. Le procédé que nous avons adopté nous permettra de tester plusieurs hypothèses avancées pour le français contemporain dans le cadre de la linguistique variationnelle. De plus, notre analyse nous donnera des indications d’ordre plus général sur la syntaxe de l’écrit informel en français. Ainsi, nous nous détacherons de l’approche particulariste des débuts de la recherche sur le langage utilisé dans les nouvelles technologies (cf. Schlobinski 2014) et nous interpréterons nos résultats dans un cadre plus global, à savoir la grammaire du français.
Avant de passer à l’analyse des sujets de notre corpus, nous donnerons un aperçu de l’état de la recherche sur les SMS au début du chapitre 1. Dans ce même chapitre, nous donnerons également un aperçu de la recherche concernant le sujet (en français) et nous introduirons tous les concepts nécessaires pour les analyses que nous effectuerons dans les chapitres successifs. Nous y discuterons aussi pourquoi les modèles proposés pour l’omission du sujet ne sont pas adéquats pour nos données et nous préparerons l’argumentation de notre propre analyse. Le chapitre 2 résume les points les plus importants et présente les hypothèses de manière plus détaillée. Après la présentation du corpus et de la méthodologie dans le chapitre 3 nous passerons aux résultats de l’enquête dans le chapitre 4, résultats que nous discuterons aussitôt après. Le chapitre 5 sera dédié à l’analyse syntaxique des sujets omis. La conclusion résumera nos propos de manière concise et ouvrira quelques pistes pour de futures recherches.