Le numérique devient synthétique

Dans l’internet d’avant, les robots des moteurs de recherche naviguaient sur le web pour aspirer le contenu des sites, le conserver à des fins historiques, le rendre accessible aux chercheurs ou aux curieux.

Depuis quelques années, ces données « patrimoine commun » permettent d’alimenter les algorithmes gourmands des IA génératives. Et les propriétaires de ces données considèrent, souvent à juste titre, qu’elles représentent une valeur certaine. Conséquence directe, de plus en plus de sites ferment leurs accès aux robots référencés pour protéger leurs patrimoines.

Cette valeur, c’est essentiellement celle de pouvoir générer de la donnée synthétique à très grande échelle, ce que développe l’article d’Usbek et Rica.

« Créées artificiellement à partir de propriétés statistiques spécifiques », ces données sont utiles, car elles représentent une connaissance pratique pour entraîner les modèles génératifs. Ainsi, une entreprise qui dispose d’un patrimoine de données et qui sait le modéliser et le synthétiser, peut l’utiliser à ses propres fins ou le commercialiser. Ces données sont soumises à des règles moins restrictives que des vraies données, notamment si ces dernières sont personnelles. Plus chères à fabriquer, mais moins de contraintes, l’équation est alléchante. Ce marché devrait croître de 35% d’ici 2030 pour seulement 165 M€ à ce jour.

Cependant, la synthèse n’est pas l’apanage de la donnée. Il se développe également des capacités de stockages sur un autre volet du numérique synthétique : elles prennent le nom d’ADN synthétique.

Le principe est simple. Il s’agit d’utiliser les bases de l’ADN (adénine, thymine, cytosine et guanine) pour représenter des données plutôt que des 0 et des 1. « C’est une transcription du code binaire (0,1) à un code quaternaire (A, T, C, G) », explique Marc Antonini dans l’article qui met en en lumière la complexité et l’ingéniosité de cette technologie.

L’enjeu est de taille, il s’agit de conserver des informations sur des temporalités beaucoup plus importantes que les capacités d’un semi-conducteur. Sur plusieurs centaines d’années, nos entreprises et nos sociétés vont stocker des connaissances sur leurs histoires et leurs clients. L’offre de service, encore émergente, est à destination de secteurs spécialisés, et même si la technologie existe, les applications grand public sont encore lointaines.

Une nouvelle fois, l’univers des possibles en termes de données est abyssal.

Inscrivez-vous à notre newsletter DDET (Des Données et des Territoires), le média qui synthétise l’actualité du numérique et des données, produit par les praticiens de la transformation numérique.

David Bessot Directeur associé