Vrac et obésité numériques : quels impacts ?

Les entreprises croulent sous des montagnes de documents numériques, très souvent mal rangés et mal organisés, entrainant un cortège de problèmes opérationnels, financiers et même environnementaux. Passons en revue les différents impacts.

11 min read

découvrir les impacts
découvrir les impacts

Impacts opérationnels

Des difficultés à trouver l'information

Le premier point de douleur, et l'un des plus visibles, est la complexité de la recherche d'information dans le cloud de l'entreprise. Ce qui est paradoxal : malgré le fait qu'on accumule toujours plus d'information, on se retrouve démuni quand on cherche à en obtenir. Un passage d'un article de Pagefreezer sur la Gouvernance de l'Information [1] décrit parfaitement la situation : "Avec une surcharge d'information, essayer de prendre des décisions intelligentes ressemble un peu à jouer une partie d'échec au beau milieu d'un concert de rock - il est très difficile d'oublier le bruit et de se concentrer sur le signal.". Mais on ne cherche pas seulement l'information pour prendre des décisions. On cherche également des informations pour produire de la valeur, justifier une situation ou tout simplement pour comprendre un sujet. En soi, l'information est le "nerf de la guerre" dans le monde du travail.

Avec un énorme volume de fichiers désorganisés, chercher l'information devient un calvaire : il faut parcourir les dossiers, ouvrir plusieurs fichiers, voire contacter des personnes dans l'entreprise... parfois même sans finir par trouver ! Et que dire des situations où la personne qui cherche et qui ne trouve pas finit par recréer le fichier en question, participant malgré elle au problème des doublons. Les moteurs de recherche internes ont certes facilité la recherche mais n'ont pas résolu complètement le problème. En 2021, 60% des travailleurs à distance sondés par Elastic affirmaient qu'ils passaient plus de temps à chercher des documents qu'à répondre aux e-mails [2]. Selon les études, on perdrait en moyenne entre 1h30 et 9h par semaine à chercher l'information.

Ce qui est également à considérer c'est qu'au-delà de la perte de temps, il y a une véritable perte en efficacité. Chaque fois que l'on est bloqué dans son travail pour trouver une information et que la recherche s'éternise, on perd en efficacité. En effet, après chaque interruption - même courte - il nous faut du temps pour reconstituer la carte mentale du travail en cours de traitement. Par ailleurs, la confusion et la frustration que peuvent entrainer des recherches infructueuses répétées ne sont pas à ignorer car elles impactent négativement l'appréciation du fonctionnement de l'entreprise. Il ne devrait pas être normal de ne pas retrouver ce dont on a besoin pour travailler - surtout quand c'est dû à un problème interne.

Un autre impact de la difficulté à trouver l'information, un peu moins intuitif, c'est la perte en qualité. Si on ne trouve pas les fichiers qui pourraient nous aider dans notre travail, alors celui-ci perd potentiellement en niveau de qualité. Cette feuille Excel que vous n'avez pas trouvée l'autre jour, avec la répartition du budget d'un projet similaire au vôtre : peut-être aurait-elle pu vous aiguiller dans votre analyse de budget - qui sait ? Et que dire des fichiers dont vous ne connaissez même pas l'existence qui pourraient vous être précieux ? Le fait même de chercher à conserver toute l'information est d'ailleurs souvent motivé par l'idée que les fichiers pourraient se révéler utiles un jour - une ironie que ce soit finalement contre-productif.

Pour finir sur la même perspective, il y a également une perte d'opportunités. Parce que les informations ne sont pas facilement accessibles et donc exploitables, des opportunités sont potentiellement ratées. Quand on cherche à capitaliser sur les connaissances que l'on a (l'objectif du Knowledge Management), c'est aussi dans une ambition de créer de nouvelles opportunités. Un gâchis, donc, de passer à côté.

Salariée prenant sa tête entre ses mains devant son ordinateur
Salariée prenant sa tête entre ses mains devant son ordinateur
Des difficultés à maîtriser les risques

Un autre point de douleur dû à une gestion documentaire trop faible est la difficulté à maîtriser les risques. Dans le même sondage d'Elastic [2], on peut lire que 81% des professionnels sondés ont déjà eu des difficultés à trouver un document important quand leur supérieur ou un client l'attendait avec urgence. En cas de litige, voire de contentieux, la capacité de l'entreprise à retrouver (rapidement) les informations est pourtant cruciale. Mais pour les mêmes raisons qu'évoquées précédemment, cette recherche peut s'avérer particulièrement laborieuse. En découle le risque de ne pas pouvoir apporter de justificatifs dans ce genre de situation critique, ce qui peut avoir des conséquences préjudiciables pour l'entreprise.

Un pion rouge au milieu de pions blancs
Un pion rouge au milieu de pions blancs

Considérons maintenant le sujet sous l'angle de la réglementation. Une entreprise dont les fichiers sont difficiles à identifier et à retrouver est-elle fin prête pour tout type d'audit de conformité ? S'il n'y a pas d'importance portée aux procédures de stockage de l'information (dont le nommage et rangement des fichiers), est-ce possible qu'il y ait quand même une catégorisation sérieuse ? Sans une catégorisation systématique des fichiers soumis à des réglementations (à la maille unitaire), difficile d'avoir la certitude de n'avoir aucune non-conformité. Que pourrait-il se passer, par exemple, si un ancien employé demande un droit à l'oubli et que dans la masse documentaire se trouvent des fichiers avec ses données personnelles, passés "sous les radars" ? A ce propos, un point à avoir en tête : parmi les fichiers stockés sur le cloud de l'entreprise, certains peuvent tout à fait n'avoir rien à voir avec ladite entreprise. En 2016, selon le rapport Databerg de Veritas [3], la proportion d'employés américains utilisant le stockage de leur entreprise pour leur usage personnel (documents comme par exemple des pièces d'identité, photos voire même des logiciels) était en augmentation, ce qui soulève la question des risques posés par ces fichiers.

Les risques de fuite, perte ou d'altération des fichiers dans des incidents, accidents ou attaques (par ransomware par exemple) sont toujours possibles. Mais il est particulièrement complexe de prévenir les difficultés, et de s'en remettre rapidement, quand la masse documentaire est énorme et peu gérée. Tant que les fichiers ne seront pas traités individuellement et de manière systématique, il sera difficile de minimiser les conséquences négatives en cas d'occurrence d'un évènement malheureux.

Impacts financiers

L'obésité et le vrac numériques coûtent cher ! Chaque année, les entreprises évoquent les coûts croissants du stockage et leur part importante dans leur budget. La moitié des organisations auraient dépassé leur budget sur le stockage en ligne en 2022 selon un rapport du fournisseur de stockage cloud Wasabi [4]. L'optimisation des coûts liés au cloud fait donc naturellement partie des priorités des entreprises. Sachant qu'un stockage cloud pour une entreprise de taille intermédiaire ou pour une grande entreprise peut coûter plusieurs centaines de milliers voire quelques millions d'euros à l'année, on peut aisément comprendre cette priorité. Par ailleurs, dans l'intention de réduire les risques, beaucoup d'entreprises font le choix d'avoir de la redondance de donnée, ce qui implique un stockage multiple de chaque fichier, augmentant la facture par la même occasion. Là où le bât blesse, c'est quand on joint les estimations de stockage inutile au prix final : selon Veritas, pour une entreprise de taille moyenne avec un stockage de 1000 To, le coût annuel du stockage des données non critiques pour le business représenterait un gaspillage de plus de 650 000 dollars [5].

Si l'on considère maintenant la question du temps passé par les employés à rechercher les informations, et à réinventer la roue quand les fichiers sont introuvables, le gaspillage financier associé est également saisissant. Pour faire une estimation à la baisse, en reprenant une estimation basse du temps perdu par employé de 1h30 par semaine et en prenant un salaire moyen à 30k€/an, le temps passé à chercher représenterait pour l'entreprise environ 1 800 € / an / salarié [6]. Pour une entreprise ayant 500 salariés travaillant sur ordinateur, ce gaspillage de temps aurait un coût de l'ordre de 900 000 euros.

Enfin, il y a aussi les coûts invisibles mais potentiels associés aux risques évoqués précédemment. Entre les coûts des procédures juridiques et des potentielles sanctions, les coûts associés à une remise sur pied après une attaque ou après un incident, il devient essentiel de chercher à prévenir les risques pour éviter des dépenses supplémentaires. De plus, c'est sans mentionner l'atteinte à l'image de l'entreprise qui, elle aussi, aura un coût indirect (réputation auprès des clients, partenaires et candidats).

Une main tenant des billets en feu
Une main tenant des billets en feu

Impacts environnementaux

Les effets du dérèglement climatique ne peuvent plus être niés et les entreprises ont désormais la responsabilité de réduire leur empreinte carbone*. Outre les émissions de gaz à effet de serre de scope 1 et 2 (émissions directes, ou indirectes liées à l'énergie utilisée), les émissions de GES de scope 3 peuvent représenter une part importante du bilan total d'une entreprise - notamment pour les entreprises du tertiaire. En effet, ce scope inclut toutes les autres émissions indirectes comme par exemple le stockage en ligne. Eh oui, car qui dit stockage sur le cloud dit recours aux data centers, avec leur multitude de serveurs et leur consommation phénoménale d'énergie.

Rentrons un peu dans les détails pour comprendre dans quelle mesure le stockage en ligne alourdit l'empreinte carbone de l'entreprise. Les data centers sont des infrastructures informatiques massives qui peuvent contenir plusieurs milliers voire jusqu'à plusieurs centaines de milliers de serveurs. La consommation en énergie d'un data center est naturellement importante au vu de la nature de son activité : les serveurs ont besoin d'énergie pour fonctionner, ainsi que les systèmes de refroidissement (permettant aux serveurs de ne pas surchauffer). Pour l'année 2022, on estime que ceux-ci ont représenté un peu plus d'1% de la consommation mondiale d'électricité selon l'Agence Internationale de l'Energie [7] et on prévoit que la consommation continuera d'augmenter - ce qui pose des questions vis-à-vis de la tension actuelle sur l'énergie. Par ailleurs, encore trop de data centers tournent avec des énergies non-renouvelables malgré les progrès réalisés en la matière.

A eux seuls, les data centers seraient à l'origine de 2% des émissions carbones mondiales [8]. La phase de fabrication est toujours la plus polluante, même si l'utilisation des serveurs et des systèmes de refroidissement ont également un impact (sans parler des équipements réseaux). Cependant, quand on sait que les serveurs ont besoin d'être changés tous les 5 ans environ, la réalité devient tout de suite moins reluisante. Enfin, il reste la problématique trop souvent oubliée des e-déchets : seulement 20% d'entre eux sont officiellement recyclés, le reste s'accumulant principalement dans des décharges [9].

Maintenant faisons le lien avec l'entreprise qui stocke ses données en ligne. Evidemment, le stockage cloud ne concerne pas uniquement le stockage des fichiers des entreprises, mais celui-ci n'en est pas moins négligeable. Quand on met en regard les volumes des données stockées par les entreprises, la proportion importante de fichiers inutiles avec les impacts négatifs des data centers, il devient évident qu'une action est nécessaire. De plus, l'un des arguments au stockage en ligne est l'aspect sécuritaire. Dans cet esprit, beaucoup d'entreprises font le choix de la redondance de données, c'est-à-dire que pour prévenir les risques de pertes (par exemple suite à un incendie dans un data center) les mêmes fichiers sont stockés à plusieurs endroits dans le monde. Cela signifie que tous ces fichiers inutiles prennent encore plus de place et polluent donc encore plus, puisqu'ils sont répliqués.

Des data centers continuent à être construits à un rythme soutenu parce que la demande est élevée, continuant à augmenter la part du secteur dans les émissions mondiales (et contribuant toujours plus au dérèglement climatique). Mais chaque espace inutilement occupé par une entreprise pourrait être utilisé par une autre. Une entreprise qui stocke des volumes considérables de fichiers inutiles contribue alors indirectement à cette prolifération de centres de données polluants et énergivores.

Pour conclure et donner un chiffre à avoir en tête, en utilisant le calculateur de l'Institut du Numérique Responsable [10] on trouve qu'un stockage de 1000 To sur le cloud (un volume souvent atteint aujourd'hui) a un impact sur un an d'environ 210 tonnes CO2eq, soit presque 100 vols aller/retour Paris - New York. De quoi donner envie de faire du tri, et vite.

*Pour rappel, l'empreinte carbone d'une entreprise mesure la quantité totale de GES (principalement le CO2) émise directement ou indirectement par les activités et individus de l'entreprise sur une période donnée, permettant ainsi d'évaluer son impact sur l'environnement.

Une forêt en feu
Une forêt en feu

Penser au futur

Nous avons porté jusqu'ici un regard sur la situation immédiate. Mais quelles sont les perspectives ?

  • Les coûts du stockage ont très peu de chances de drastiquement baisser si l'on considère les problématiques actuelles liées à l'énergie et aux métaux précieux (pénuries) - bien au contraire.

  • Chaque jour où rien n'est fait pour gérer le volume de fichiers stockés, celui-ci croît, complexifiant chaque jour davantage la résolution du problème et augmentant la facture par la même occasion.

  • L'empreinte carbone des entreprises va être de plus en plus scrutée et sanctionnée.

Une route avec de la brume
Une route avec de la brume

Conclusion

L'obésité et le vrac numériques ont de nombreux impacts qui ne sont pas forcément intuitifs à première réflexion. Au niveau opérationnel, les difficultés à trouver l'information induisent pertes de temps, perte en efficacité, pertes en qualité et potentiellement pertes d'opportunités. Moins évidents, les risques apportés par ce manque de contrôle sur les fichiers stockés ne sont pas à écarter : risques de non-conformité aux exigences réglementaires, risques de ne pas pouvoir se défendre en cas de litige, risques de pertes ou fuites d'information. Du côté financier, le tableau n'est pas plus positif : le stockage coûte cher, encore plus quand il est inutile. Les pertes de temps à chercher les informations voire à recréer les fichiers ont un prix d'autant plus intolérable quand on pense qu'elles proviennent d'un problème interne. Par ailleurs, certains coûts sont invisibles mais prévisibles : ceux associés aux risques. Enfin, stocker en ligne des centaines de téraoctets de données inutiles est un véritable non-sens écologique. En définitive, contrôler son volume de fichier, et gérer ses fichiers, sont deux projets dont le succès pourra solutionner un cortège de problèmes évitables.