Comment définir ce qu’on appelle aujourd’hui le Big Data ?

Le Big Data désigne la croissance exponentielle des données numériques. Ce phénomène n’est pas nouveau. Le volume considérable des données numériques produites a atteint un premier pic frappant, une sorte de record, en 2002. Cette année-là, nous avons créé un nombre de données dépassant celui recensé durant toute l’histoire de l’humanité ! Et la production de données n’a fait que s’accélérer. Autre constat : déjà en 2003, 94 % de l’information mondiale produite était d’origine numérique. 

On comprend l’enjeu énorme que cela représente. Le flux d’informations prend de telles proportions qu’il n’est plus possible de le stocker dans de « petites boîtes ». Il faut inventer de nouveaux silos : ce sont des serveurs qui ont la taille de gigantesques usines et sont repérés par les satellites du fait de la chaleur qu’ils dégagent. La mise au point de ces centres revient aux grands du Big Data : Google, Yahoo!, Facebook et dans une moindre mesure Amazon. Il faut savoir qu’ils consomment chaque année en énergie dépensée autant qu’un pays comme l’Allemagne. Le Big Data c’est écologique, mais pas tant que cela !

Depuis quand parle-t-on de Big Data ?

L’expression est née il y a deux ou trois ans et elle a immédiatement été adoptée. Cette dénomination a permis d’un coup de synthétiser le concept des « 3 V » d’Internet : la vitesse, le volume et la variabilité. La médiatisation des Big Data n’est pas innocente. Les entreprises spécialisées dans le hardware comme IBM, EMC, HP, Dell ont sauté sur l’occasion pour commercialiser leurs gros serveurs. Les sociétés de logiciels Microsoft et Oracle – les deux grands de la base de données – ont aussi intérêt à ce que l’on achète leurs moteurs pour gérer ces ensembles. Il y a un véritable enjeu économique derrière tout cela. Et un véritable marketing du Big Data. Ce marché de l’informatique en mal de croissance cherche des relais…

Le Big Data est-il la nouvelle manière de parler d’Internet ?

Oui, mais c’est une erreur. L’univers du numérique est bien plus large. Vous avez d’autres domaines comme les interfaces et les moyens de se connecter. Le Big Data est un champ spécifique, celui du stockage et de l’analyse des données. C’est la partie immergée, les coulisses, le back office du numérique, en bout de chaîne : une immense mémoire -tenta-culaire. 

Quels sont les grands acteurs du Big Data ? Peut-on les classifier ?

D’abord, les États avec leurs services de renseignement mais aussi leurs multiples bases de données statistiques. Ensuite les acteurs du Web comme Google, Yahoo! et les acteurs des télécoms. Et puis les grands de la distribution. Les États-Unis dominent largement mais la France a aussi une position intéressante.

Pouvez-vous décrire ce Big Data ? A-t-il plusieurs facettes ? 

Au moins trois ! La face blanche, la face noire et le côté gris. Commençons par le côté blanc, la personnalisation respectueuse des clients dans le commerce, qui peut facilement virer au gris. Facebook possède la base de visages la plus importante du monde et a créé le meilleur logiciel de détection des visages. Vous avez aussi des logiciels qui permettent aujourd’hui aux patrouilles de police aux États-Unis d’arriver sur les scènes de crimes avant qu’ils ne se produisent ! Ce n’est pas très compliqué ! Les statistiques peuvent avoir une dimension prédictive. Des informaticiens ont croisé des centaines de milliers de données sur les lieux, la météo, les horaires, les conditions économiques. Cela se révèle tout à fait efficace. Ces techniques permettent d’améliorer les performances de la police de 10 à 20 %. C’est une réalité dans les principales grandes villes américaines. Ces croisements d’informations sont également développés dans le cadre judiciaire : des logiciels permettent d’établir des connexions entre des criminels qui apparaissent dans des affaires éloignées. C’est aussi valable en matière fiscale, de blanchiment. C’est le cas en Belgique, probablement en France.

Grâce aux algorithmes, ce qu’on appelle le data mining, les États peuvent aujourd’hui détecter les appels téléphoniques, les courriels, les sms, les passages à la frontière, les mouvements de fonds qui les intéressent. Tant que les États agissent sur le terrain de l’anticriminalité, ça va, mais cela peut devenir intrusif et tourner à la captation généralisée d’informations privées. Comme dans toute innovation, il y a donc un côté noir et un côté blanc.

Alors, le côté noir ?

Le côté noir, ce sont les services de renseignement qui aspirent vos données sans votre autorisation. Les grandes puissances ont des moyens de « flicage » colossaux. Le Big Data peut devenir le premier État, le grand contrôleur et régulateur des populations ; cela fait penser aux analyses prémonitoires du philosophe Michel Foucault (1926-1984). Nous ne sommes pas obligés de croire à l’État-Léviathan, mais il ne faut pas l’écarter… 

Le but ultime n’est-il pas de développer le commerce ?

Les grands de la distribution cherchent à proposer toujours plus d’offres commerciales adaptées à vos besoins, à vos désirs. Elles tentent de vous cerner. Du marketing ciblé ! Elles veulent vous aider dans vos achats, vos déplacements, dans la gestion de votre argent, dans le soin que vous prenez de votre santé, c’est une réalité. C’est un secteur important du Big Data, mais il ne doit pas faire oublier les autres. Il ne faut pas devenir hyper-sollicitant, sinon on rentre alors dans le côté gris : le consommateur se sentant « agressé » plutôt que « mieux servi ». 

La notion de libertés publiques
est-elle durablement compromise
par le Big Data ? 

Il faut que le législateur soit conscient, comme les citoyens, de ces questions. Rien ne se perd sur la Toile : d’où l’importance d’être prudent. Le législateur veut créer un droit à l’oubli, c’est une nécessité. Mais on en est loin ; vos données vivent leur propre vie sur Internet sans que vous puissiez intervenir. Le phénomène Facebook est révélateur. Vos photos, vos images peuvent devenir une source d’information pour les grands groupes du e-commerce. Cela peut être très positif, mais poussé à l’extrême devenir trop intrusif. C’est tout l’enjeu : savoir modérer les usages commerciaux des data pour ne pas rendre leur collecte et leur utilisation impopulaires auprès du grand public. Le VRM (la monétisation des données personnelles) serait alors un risque plus qu’un atout. Je ne crois pas trop au VRM en fait.

En même temps, il faut relativiser. Très peu des données sur la Toile sont exploitées. Les agents du Big Data veulent nous faire croire que tout ce qui est stocké est pertinent. C’est très loin d’être le cas. 

Un seul exemple : 133 milliards de mails ont été envoyés l’année dernière en France ! 78 milliards n’ont jamais été ouverts. Le Big Data nous permet de revisiter l’éternelle question de l’opposition entre sécurité et liberté.

Le Big Data constitue-t-il une révolution ? 

Révolution ? C’est un mot que l’on galvaude. Nous vivons une avancée majeure. Une évolution qui ouvre d’immenses possibilités dans le domaine du commerce, de l’éducation, de la santé et bien d’autres. 

Propos recueillis par LAURENT GREILSAMER

 

Vous avez aimé ? Partagez-le !