© Getty Images

La science peut prédire le succès des livres. Vraiment?

Trois chercheurs du département des Sciences informatiques de l’université Stony Brook à New York ont présenté un algorithme capable, selon eux, de présager quels seront les futurs best-sellers. Ils affirment que cette méthode est fiable à 84%.

L’enquête, présentée fin 2013, avance que l’algorithme mis au point peut déceler les livres qui connaîtront le succès grâce au style de l’écrivain et non en fonction du thème, des personnages, des lieux ou des émotions décrits dans l’ouvrage. Ce modèle informatique a ainsi analysé la  » stylométrie  » – l’analyse statistique du lexique et de la syntaxe d’un auteur- de 800 livres les plus téléchargés sur la bibliothèque en ligne Gutenberg.org, d’oeuvres lauréates des prix Pulitzer ou des Nobel de littérature ou encore en fonction des ventes sur Amazon.


La clé du succès : mais où est donc or ni car

Dans ces futurs best-sellers, l’algorithme a décelé l’usage (très) fréquent de conjonctions de coordination (et, mais, or, car, ...) et de subordination (comme, quand, que, ...), ainsi que de verbes qui décrivent des processus psychiques (reconnaître, se souvenir, ...). Les auteurs à succès banniraient en revanche les verbes d’action (vouloir, aller, ...) ou les verbes trop émotifs (pleurer, crier, sauter, ...). Pour les auteurs de cette enquête, les lectures qui vont droit au but, tout en employant de nombreuses prépositions, seraient les plus populaires. Les mots clichés comme amour, coeur brisé ont également la cote.

Fiabilité ?

Actuellement, augurer de la réussite d’une sortie littéraire est une expérience basée sur le goût, la mode, la notoriété d’un auteur, etc. Bref, autant de facteurs humains qui ont parfois laissé dans l’ombre des futures Amélie Nothomb. Les chercheurs américains affirment pourtant que leur méthode est fiable à 84%, voire 89% quand il s’agit d’une adaptation cinématographique. Ce que dénoncent pour leur part des auteurs et des éditeurs qui estiment que le succès d’une oeuvre est davantage dû au sujet abordé plutôt qu’à des détails stylistiques.

Lisibilité vs complexité

Et les trois chercheurs de poursuivre que la littérature la plus lisible, c’est-à-dire la plus facile à lire, n’est pas spécialement celle qui rencontre toutes les faveurs du public. Parfois, plus elle est complexe, plus elle est appréciée.

En Espagne, des chercheurs de l’université de Grenade avaient déjà mis des bouquins en équation pour établir un logiciel susceptible de prédire leurs ventes futures. Cet outil, dénommé PreTEL, se basait sur des méthodes de programmation utilisée en intelligence artificielle, qui pouvait réaliser des simulacres de lancement et de tirage d’un point de vue statistique. Les Espagnols avaient toutefois reconnu que leur logiciel n’intégrait pas certaines données externes comme la conjoncture économique, les modes littéraires, l’intérêt thématique non fictionnel ou la réputation de l’auteur.

A quand un programme qui prédit l’avenir d’un livre au stade de manuscrit?

Contenu partenaire