Vrac et obésité numériques : qu'est-ce que c'est ?

Rapports, présentations, tableaux de bord, études, guides, vidéos, photos... Le volume de fichiers stockés par les entreprises a explosé ces dix dernières années. Quelles en sont les conséquences ? Faisons un état des lieux de la situation actuelle.

7 min read

un vrac de documents
un vrac de documents

Obésité numérique

L'Obésité numérique est une expression qui est apparue ces dernières années pour faire référence à la surproduction et la surconsommation d'informations numériques. Appliquée au monde de l'entreprise, l'obésité numérique désigne notamment le volume de données stockées. Ces données sont souvent un mix de données dites "structurées" (organisées de manière systématique, comme par exemple dans un tableur), et de données "non structurées" telles que les documents (textes, présentations...), images, vidéos... Les données non structurées représenteraient 80% de la donnée stockée selon Gartner [1]. C'est à ce type de données que l'on s'intéresse sur ce site.

Combien le stockage numérique représente-t-il pour les entreprises aujourd'hui ?

Evidemment, cela dépend de la taille de l'entreprise, de la nature de son activité et encore d'autres facteurs. Pour donner un ordre de grandeur, les ETI et grandes entreprises ont généralement un stockage cloud qui représente entre plusieurs centaines de téraoctets (1 To = 1000 Go) jusqu'à plusieurs dizaines de pétaoctets (1 Po = 1000 To). Selon Qumulo en 2020 [2], une organisation de taille moyenne utiliserait 7,5 Po de stockage seulement pour les données non structurées, et les grandes entreprises se situeraient autour de 17,5 Po. En comparaison, il y a un peu plus de 10 ans les entreprises de plus de 1000 employés stockaient en moyenne 235 To [3] - soit 32 fois moins qu'aujourd'hui pour une entreprise de taille moyenne selon l'estimation de Qumulo, et 74 fois moins pour une grande entreprise !

D'où vient cette obésité ?

Si vous travaillez en entreprise depuis un certain temps, vous avez dû constater l'explosion du volume de documents stockés. Les modes de travail ont changé avec les avancées technologiques, et en 2019 on estimait que 79% des salariés utilisaient l'informatique dans leur travail, selon l'enquête "Conditions de travail", réalisée par l’INSEE et la Dares[4]. Il est devenu extrêmement simple de créer un fichier, de collaborer immédiatement dessus avec d'autres personnes, de le partager et de le stocker.

A propos du stockage, l'arrivée du "cloud" a drastiquement changé les choses pour les entreprises. Il leur a permis d'externaliser tout ou partie de la gestion du stockage numérique, de ne payer que pour l'utilisation faite du service, de bénéficier de plus de flexibilité (comme le travail à distance) et également d'une meilleure sécurité. Mais ce qui est surtout important à noter, c'est que le cloud a permis la scalabilité. La scalabilité est la capacité technique d'une infrastructure informatique à s'adapter à une forte croissance de la demande, en maintenant son niveau de service. Concrètement, cela signifie qu'il est devenu possible et extrêmement facile pour l'entreprise de stocker beaucoup plus de documents selon le besoin. Logiquement, les entreprises ont donc pu faire face à l'augmentation du volume de fichiers en stockant facilement - sans avoir trop à y penser.

Cependant, cette facilité de stockage n'a pas apporté que de bonnes choses. Si elle a permis de résoudre un problème sur le court terme (comment stocker le volume croissant de fichiers), elle en a créé un autre sur le long terme (comment exploiter les fichiers d'un cloud gigantesque). Si le stockage était resté contraignant, les entreprises auraient probablement été confrontées plus tôt à la problématique du volume : comment faire pour stocker tous nos fichiers ? Il aurait alors été rapidement question de tri : supprimer les fichiers qui ne servent pas et prennent de la place inutilement pour continuer à pouvoir stocker les fichiers qui ont de la valeur. Mais en permettant toujours plus de stockage, le cloud n'a pas permis cette prise de conscience nécessaire. Par la même occasion, il a fait oublier aux entreprises des questions essentielles : que va-t-il se passer quand l'entreprise aura stocké des centaines voire des milliers de téraoctets de données ? Comment va-t-elle gérer les fichiers à grande échelle ? Sans contrainte immédiate et évidente, les entreprises n'ont pas pu préparer leur stratégie pour prévenir l'avalanche de documents.

Pourquoi parle-t-on d'obésité ?

Le fait qu'il y ait beaucoup plus de données stockées est déjà un problème au niveau de la capacité de stockage mondiale : les ressources ne sont pas infinies ! Le stockage représente déjà un problème au niveau environnemental - mais ce sera le sujet d'un autre article. Si l'on en revient au sujet de l'obésité et que l'on réfléchit d'un point de vue purement opérationnel, le gros problème réside plutôt dans le traitement de ces données. Si une entreprise stocke 20 Po de données (ce qui est énorme) mais qu'elle gère et utilise ces 20 Po, alors on ne peut pas parler d'obésité. L'obésité est un problème lorsqu'il y a un surplus important, qui présente des risques. Le volume stocké devient un problème quand l'entreprise est dépassée et qu'elle n'est plus en mesure de le gérer, et encore moins de l'exploiter. C'est là où la notion de vrac numérique vient compléter le tableau.

Vrac numérique

Le vrac numérique fait référence au désordre qui règne dans les espaces de stockage des entreprises. Ce désordre se caractérise par un ensemble de fichiers hétérogènes, nommés de manière aléatoire, rangés de manière aléatoire avec une arborescence de dossiers inefficace. Dit simplement : un vrai bazar.

Quelle est la situation à ce sujet aujourd'hui ?

Le désordre aboutit à des résultats très concrets. La recherche d'information peut devenir un calvaire. Quand on ne retrouve pas un fichier, on peut vouloir le recréer (ou le ré-enregistrer) ce qui provoque des doublons. Quand on ne supprime pas les fichiers qui ne servent plus, et qu'on conserve des fichiers sans valeur pour le business, on se retrouve avec des fichiers qui polluent inutilement l'espace de stockage et ralentissent la recherche d'information. Un terme a d'ailleurs été créé pour désigner tout cela : les fichiers "ROT".

  • R : Redondant (doublons)

  • O : Obsolète (qui a eu une utilité mais qui n'en a plus)

  • T : Trivial (qui n'a pas de valeur pour le business)

Selon un rapport de Veritas publié en 2016 [5], les fichiers ROT représenteraient 30% du volume stocké par les entreprises. Mais ça ne s'arrête pas là. On parle désormais de la "Dark Data", qui fait référence aux données qui sont collectées et stockées par les employés, mais qui restent généralement inconnues, ne sont pas utilisées et qui peuvent donc tout autant être précieuses qu'être complètement inutiles voire même présenter des risques pour l'entreprise. En effet, si l'on ne sait pas ce que contiennent ces documents, on ne peut pas savoir s'ils ont des informations critiques ou soumises à des réglementations. Le même rapport de Veritas estime que les Dark Data représentent pas moins de 54% du volume de données stocké par les entreprises - un pourcentage colossal quand on considère le volume de stockage moyen.

Même les moins matheux d'entre nous aboutiront donc au résultat final : au moins 30% et jusqu'à 84% des données stockées pourraient donc être non seulement inutiles mais potentiellement préjudiciables au bon fonctionnement et au développement de l'entreprise. De quoi donner envie de régler le problème, et vite.

D'où vient ce vrac ?

Le vrac numérique nait de la conjonction de plusieurs choses : un manque de règles, un manque d'organisation et un manque d'attention. Sans règles de nommage ou de rangement et sans plan de classement pour gérer l'arborescence, comment s'attendre à ce que les fichiers soient "bien nommés" et "bien rangés" - et donc qu'ils soient facilement identifiables ? Sans organisation, comment s'attendre à ce que l'espace de stockage soit maintenu aux normes, correctement et régulièrement ? Enfin, sans attention, comment s'attendre à ce que le problème soit activement traité de façon pérenne ? Eh oui, car le désordre peut se reconstituer à tout moment sans un suivi attentif de l'évolution de la situation.

En conclusion

Les changements dans nos modes de travail, les avancées technologiques et notamment l'arrivée du cloud ont permis une croissance fulgurante et sans limite du volume de fichiers stockés par les entreprises. Dans un contexte "libertaire" sans aucun cadre, l'obésité et le vrac numériques se sont alors silencieusement développés, jusqu'à devenir un problème majeur pour les entreprises qui ne peuvent aujourd'hui plus l'ignorer. Alors que beaucoup de fichiers stockés n'ont véritablement plus aucune utilité pour l'entreprise, d'autres demeurent inconnus et inexploités, jetant un voile sur les opportunités et risques qu'ils représentent pour l'entreprise. Nous explorerons justement les impacts dans un prochain article.