DeepSeek, deep sick ?

Impossible de passer à côté, la fin du long mois de janvier 2025 a été marquée par la sortie d’un nouveau LLM venu de la Chine et porté par la start-up d’Hangzhou (la Silicon Valley chinoise): Deepseek. Ce n’est pas que la mise à disposition d’un nouveau modèle de langage sur le marché et son utilisation comme chatbot soit vraiment une révolution en tant que tel – mais plutôt son prix particulièrement bas qui a fait parler de lui. En effet, la start-up a déclaré avoir déboursé « seulement » 5,6 millions de dollars, contre plusieurs milliards dépensés par les géants américains, et semble être aussi performant que ses homologues bien connus.

Mais si le prix est significativement moins cher, qui paye la différence ?

D’après des premiers évènements récents après la sortie du LLM, il semblerait que ce soit l’utilisateur lui-même. Des chercheurs de l’entreprise Wiz spécialisée en cybersécurité et stockage de données a indiqué une fuite importante et un accès à des données personnelles et sensibles. Il n’est même pas question ici de hackers hyper-compétents attaquant la start-up et ses infrastructures car la base de données contenant les historiques de chat des utilisateurs était disponible via… un article de blog, sans même nécessité de login. Cet évènement fait suite à une cyberattaque dont a aussi été victime Deepeek. Les deux problèmes semblent avoir été résolus très rapidement.

Mais l’Europe se pose des questions, notamment quant à la responsabilité de la start-up chinoise face au RGPD, aux flux de données en jeu et à leur sécurité. L’Italie a même interdit le modèle, suivie par les autorités taïwanaises. Plus largement, il est légitime d’alerter les consommateurs sur les risques encourus par l’adoption d’un LLM moins cher.

Vous réglez comment ? J’ai de la donnée.

Inscrivez-vous à notre newsletter DDET (Des Données et des Territoires), le média qui synthétise l’actualité du numérique et des données, produit par les praticiens de la transformation numérique.