Why 2025 will redefine data infrastructure: 11 expert predictions

MT HANNACH
16 Min Read
Disclosure: This website may contain affiliate links, which means I may earn a commission if you click on the link and make a purchase. I only recommend products or services that I personally use and believe will add value to my readers. Your support is appreciated!

Rejoignez nos newsletters quotidiennes et hebdomadaires pour les dernières mises à jour et du contenu exclusif sur la couverture de l’IA de pointe. Apprendre encore plus


Si 2023 était entièrement consacrée aux chatbots et à la recherche génératifs basés sur l’IA, 2024 a introduit l’IA agentique — des outils capables de planifier et d’exécuter des actions en plusieurs étapes dans des environnements numériques. Depuis Devin avancées technologiques dans les premiers essais de Microsoft avec Vision copiloteles innovations étaient diverses, mais une constante restait : la nécessité de maintenir une infrastructure de données organisée et fiable.

Alors que les entreprises se sont tournées vers des initiatives avancées d’IA, plusieurs tendances ont remodelé la manière dont les données sont gérées, sécurisées et utilisées. Les entreprises sont de plus en plus adoptées multicloud, données ouverteset des stratégies de gouvernance ouvertes pour éviter la dépendance vis-à-vis des fournisseurs et gagner en flexibilité. Ils se sont également concentrés sur données non structuréestransformant les marchés de données en hubs fournissant des modèles d’IA pré-entraînés avec des ensembles de données et des applications propriétaires. Simultanément, les progrès des bases de données vectorielles et graphiques ont ajouté de nouvelles possibilités, jetant les bases de l’avenir.

Aujourd’hui, alors que l’histoire de l’IA continue de se dérouler, les leaders de l’industrie partagent leurs prévisions sur la façon dont l’infrastructure de données qui la sous-tend évoluera en 2025.

1. Les données multimodales en temps réel alimenteront un volant de données intelligent

« En 2025, les entreprises adopteront pleinement les données multimodales et l’IA, transformant ainsi leur façon de fonctionner et de fournir des services.[ing] valeur. Au cœur de ce changement se trouve le « volant de données intelligent » : un cycle dynamique dans lequel les données en temps réel alimentent les informations basées sur l’IA, alimentant ainsi l’innovation et l’amélioration continues. Les données sombres d’aujourd’hui (images, vidéos, audio et sorties de capteurs) deviendront essentielles pour débloquer des prédictions plus précises, des automatisations plus intelligentes et une adaptabilité en temps réel, conduisant à terme à une compréhension plus riche et plus nuancée de la réalité commerciale.

« Avec le volant de données en temps réel en place, l’IA diagnostiquera les problèmes de manière autonome, optimisera les processus et générera des solutions innovantes. Les entreprises s’appuieront sur des agents d’IA pour garantir qualité des donnéesdécouvrez des informations et élaborez des stratégies permettant aux talents humains de se concentrer sur des tâches de niveau supérieur. Cela redéfinira l’efficacité, accélérera l’innovation et transformera les entreprises en organisations plus dynamiques et intelligentes.

– Yasmeen Ahmad, directeur de la stratégie et de la gestion des produits sortants pour les données, l’analyse et l’IA chez Google Cloud

2. Facteur de refroidissement : centres de données refroidis par liquide

« Alors que les charges de travail d’IA continuent de stimuler la croissance, les organisations pionnières passeront au refroidissement liquide pour maximiser les performances et l’efficacité énergétique. Les fournisseurs de cloud hyperscale et les grandes entreprises ouvriront la voie en utilisant le refroidissement liquide dans les nouveaux centres de données d’IA qui hébergent des centaines de milliers d’accélérateurs, de réseaux et de logiciels d’IA.

« Les entreprises choisiront de plus en plus de déployer une infrastructure d’IA dans des installations de colocation plutôt que de construire les leurs – en partie pour alléger le fardeau financier lié à la conception, au déploiement et à l’exploitation de la fabrication d’intelligence à grande échelle. Ou bien, ils loueront la capacité selon leurs besoins. Ces déploiements aideront les entreprises à exploiter les infrastructures les plus récentes sans avoir besoin de les installer et de les exploiter elles-mêmes. Ce changement accélérera l’adoption plus large du refroidissement liquide par l’industrie en tant que solution grand public pour les centres de données IA.

– Charlie Boyle, vice-président des plateformes DGX chez Nvidia

3. Explosion mondiale des données pour créer une pénurie de stockage

« Le monde crée des volumes de données sans précédent. En 2028, jusqu’à 400 zettaoctets sera généré, avec un taux de croissance annuel composé (TCAC) de 24 %. Cependant, la base installée de stockage devrait avoir un TCAC de 17 % – donc [growing] à un rythme nettement inférieur à la croissance des données générées. Et il faut une année entière pour construire un disque dur. Cette disparité des taux de croissance perturbera l’équilibre mondial entre l’offre et la demande de stockage. À mesure que les organisations deviennent moins expérimentales et plus stratégiques dans l’utilisation de l’IA, elles devront créer des plans de centre de données physiques plus spacieux et plus grands pour garantir l’approvisionnement en stockage et monétiser pleinement les investissements dans l’IA et l’infrastructure de données, tout en équilibrant les préoccupations financières, réglementaires et environnementales. .»

– BS Teh, vice-président exécutif et directeur commercial chez Seagate Technology

4. Les usines d’IA évolueront vers le PaaS

« En 2025, les usines d’IA évolueront au-delà de leur phase initiale consistant à fournir une infrastructure en tant que service, offrant des services de calcul, de réseau et de stockage, pour proposer des capacités de plateforme en tant que service. Si les services fondamentaux ont été essentiels pour relancer l’adoption de l’IA, la prochaine vague d’usines d’IA donnera la priorité aux plates-formes qui favorisent l’affinité des données et offrent une valeur durable. Ce changement sera essentiel pour rendre les usines d’IA durables et compétitives à long terme. »

– Rajan Goyal, cofondateur et PDG de DataPelago

5. Les entreprises utiliseront leurs énormes ensembles de données mais exigeront de la fiabilité

« Pour la plupart, les premières applications de l’IA utilisaient simplement des modèles de base formés sur d’énormes quantités de données publiques. Avec la généralisation des applications RAG sophistiquées et la maturité rapide des produits permettant de produire des données structurées, les applications qui exploitent les énormes réserves de données des entreprises privées commenceront à créer une véritable valeur. Mais la barre pour ces applications sera haute : les entreprises exigeront de la fiabilité des applications d’IA, et pas seulement des démonstrations géniales.

« De plus, les sociétés d’IA fournissant ces modèles devront jouer gentiment avec les éditeurs et les fournisseurs de contenu pour préserver l’avenir du développement de l’IA. Ils devront conclure des accords de licence avec les fournisseurs de contenu pour s’assurer qu’ils seront rémunérés pour les données extrêmement précieuses qu’ils proposent. Cela doit arriver bientôt, avant que tout ne se transforme en un enchevêtrement de poursuites judiciaires et de blocage des robots d’exploration de l’IA.

– Sridhar Ramaswamy, PDG de Snowflake

6. Les agents d’entreprise dévoreront les données de communication

« En 2025, les entreprises exploiteront des téraoctets de données de communication, telles que les e-mails, les messages Slack et les transcriptions Zoom, à l’aide d’agents qui fournissent des informations analytiques, des tableaux de bord et des outils d’aide à la décision exploitables.

« Cela entraînera des améliorations significatives de la productivité dans tous les secteurs. »

– Nikolaos Vasiloglou, vice-président de la recherche et du ML chez RelationalAI

7. La gouvernance et la qualité des données seront les principaux obstacles à une adoption réussie et éthique de l’IA.

« En 2025, la gouvernance, l’exactitude et la confidentialité des données apparaîtront comme les obstacles les plus importants à l’adoption efficace de l’IA. Alors que les organisations cherchent à faire évoluer l’IA, elles se rendront compte que les résultats réussis de l’IA dépendent entièrement de données fiables. Gérer et préparer d’énormes quantités de données, garantir la conformité et maintenir l’exactitude constitueront des défis complexes. Les entreprises devront surmonter ces obstacles en investissant dans plateformes de données fondamentales qui permettent une gestion unifiée sur diverses sources de données.

« En conséquence, nous verrons un accent accru sur les rôles de gestion des données et les cadres de gouvernance qui s’alignent sur les initiatives d’IA, à mesure que les entreprises reconnaissent que des données peu fiables ont un impact direct sur l’efficacité de l’IA. »

Jeremy Kelway, vice-président de l’ingénierie pour l’analyse, les données et l’IA chez EDB

« En 2025, les plates-formes unifiées d’observabilité des données deviendront des outils essentiels pour les grandes entreprises, permettant une visibilité complète sur les performances, la qualité, l’état du pipeline, la gestion des coûts et le comportement des utilisateurs de l’infrastructure de données pour relever les défis complexes de gouvernance et d’intégration. En automatisant la détection des anomalies et en permettant des informations en temps réel, ces plates-formes soutiendront la fiabilité des données et rationaliseront les efforts de conformité dans tous les secteurs.

– Ashwin Rajeeva, cofondateur et CTO chez Acceldata

9. Tous saluent le nuage souverain

« En 2025, nous allons assister à une véritable poussée vers les cloud souverains et privés. Nous voyons déjà les plus grands hyperscalers investir des milliards de dollars dans la construction de centres de données partout dans le monde pour offrir ces capacités. Cette… capacité mettra un certain temps à se mettre en ligne ; entre-temps, la demande va monter en flèche, alimentée par une vague de législation venant principalement de l’UE. Ceux qui disposent d’une infrastructure cloud flexible, évolutive et élastique pourront adopter rapidement des approches souveraines ou privées. Ceux qui disposent d’une infrastructure monolithique et rigide se mettront à la traîne.

Kevin Cochrane, directeur marketing de Vultr

10. Montée de traitement des données à la périphérie

« Je garde un œil sur le développement potentiel du Edge Computing, porté par la prolifération de la 5G, qui rapproche le traitement des données de la source et réduit la latence. Cela pourrait contribuer à démocratiser l’IA. La question est la suivante : pouvons-nous créer des applications d’IA efficaces qui s’exécutent sur des appareils mobiles, éventuellement sans recourir aux ressources du cloud ?

« Si la 5G est disponible pour les techniciens de terrain, ils pourraient tirer parti de l’IA pour les aider dans leur travail – qu’il s’agisse de professionnels de la santé fournissant des diagnostics et des traitements dans les zones sinistrées où la 5G est disponible mais où le Wi-Fi ne l’est pas, ou d’ingénieurs et de scientifiques travaillant sur site. décisions grâce à la recherche assistée par l’IA et aux calculs en temps réel.

– Jerod Johnson, évangéliste technologique senior chez CData

11. La protection des données non structurées deviendra plus urgente

« Traditionnellement, la protection des données se concentre sur les données critiques, car ce sont ces données qui nécessitent des restaurations plus rapides. Pourtant, le paysage a changé, les données non structurées représentant désormais 90 % de toutes les données générées au cours des 10 dernières années. La grande surface de pétaoctets de données non structurées, associée à leur utilisation généralisée et à leur croissance rapide, les rend très vulnérables aux attaques de ransomwares. Les cybercriminels peuvent utiliser les données non structurées comme cheval de Troie pour infecter l’entreprise. La protection rentable des données non structurées contre les ransomwares deviendra une tactique de défense essentielle, à commencer par le déplacement des données froides et inactives vers un stockage objet immuable où elles ne pourront pas être modifiées.

« À cette fin, les directeurs informatiques et de stockage rechercheront des solutions de gestion de données non structurées offrant des capacités automatisées pour protéger, segmenter et auditer l’utilisation des données sensibles et internes dans l’IA – un cas d’utilisation qui est appelé à se développer à mesure que l’IA évolue. En outre, ils devront créer des moyens systématiques permettant aux utilisateurs de rechercher dans les magasins de données de l’entreprise, de conserver les bonnes données, de vérifier les données sensibles et de transférer les données vers l’IA avec des rapports d’audit.

– Krishna Subramanian, cofondateur de Komprise

En résumé, 2025 promet des avancées significatives dans l’infrastructure de données d’entreprise, allant des volants de données multimodaux aux cloud souverains. Toutefois, des défis tels que la gouvernance des données et les pénuries de stockage persisteront. Le succès dans cet espace dynamique dépendra de l’équilibre entre innovation, confiance et durabilité, transformant les données en un avantage concurrentiel durable.

Share This Article
Leave a Comment

Leave a Reply

Your email address will not be published. Required fields are marked *