Test-driving Google’s Gemini-Exp-1206 model in data analysis, visualizations

MT HANNACH
15 Min Read
Disclosure: This website may contain affiliate links, which means I may earn a commission if you click on the link and make a purchase. I only recommend products or services that I personally use and believe will add value to my readers. Your support is appreciated!

Rejoignez nos newsletters quotidiennes et hebdomadaires pour les dernières mises à jour et du contenu exclusif sur la couverture de l’IA de pointe. Apprendre encore plus


L’un des Les derniers modèles expérimentaux de Google, Gemini-Exp-1206, montre le potentiel d’atténuer l’un des aspects les plus épuisants de tout d’analyste travail : synchroniser parfaitement leurs données et leurs visualisations et fournir un récit convaincant, sans avoir à travailler toute la nuit.

Les analystes d’investissement, les banquiers juniors et les membres d’équipes de conseil aspirant à des postes de partenariat assument leur rôle en sachant que de longues heuresles week-ends et passer des nuits blanches occasionnelles pourrait leur donner un avantage sur une promotion.

Ce qui leur prend une grande partie de leur temps, c’est d’effectuer une analyse avancée des données tout en créant des visualisations qui renforcent un scénario captivant. Ce qui rend la tâche encore plus difficile est que chaque société bancaire, de technologie financière et de conseil, comme JP Morgan, McKinsey et PwC, a des formats et des conventions uniques pour l’analyse et la visualisation des données.

VentureBeat a interrogé des membres d’équipes de projet internes dont les employeurs avaient embauché ces entreprises et les avaient affectées au projet. Les employés travaillant dans des équipes dirigées par des consultants ont déclaré que la production de visuels condensant et consolidant une quantité massive de données constitue un défi persistant. L’un d’entre eux a déclaré qu’il était courant que les équipes de consultants travaillent du jour au lendemain et effectuent au moins trois à quatre itérations des visualisations d’une présentation avant d’en choisir une et de la préparer pour les mises à jour au niveau du conseil d’administration.

Un cas d’utilisation convaincant pour tester le dernier modèle de Google

Le processus sur lequel les analystes s’appuient pour créer des présentations qui prennent en charge un scénario avec des visualisations et des graphiques solides comporte tellement d’étapes manuelles et de répétitions qu’il s’est avéré un cas d’utilisation convaincant pour tester le dernier modèle de Google.

En lançant le modèle plus tôt en décembre, Patrick Kane de Google a écrit“Que vous releviez des défis de codage complexes, résolviez des problèmes mathématiques pour des projets scolaires ou personnels, ou fournissiez des instructions détaillées en plusieurs étapes pour élaborer un plan d’affaires sur mesure, Gemini-Exp-1206 vous aidera à naviguer dans des tâches complexes avec plus de facilité.” Google a noté les performances améliorées du modèle dans des tâches plus complexes, notamment le raisonnement mathématique, le codage et le suivi d’une série d’instructions.

VentureBeat a testé le modèle Exp-1206 de Google cette semaine. Nous avons créé et testé plus de 50 scripts Python dans le but d’automatiser et d’intégrer des analyses et des visualisations intuitives et faciles à comprendre qui pourraient simplifier les données complexes analysées. Étant donné la domination actuelle des hyperscalers dans les cycles d’actualité, notre objectif spécifique était de créer une analyse d’un marché technologique donné tout en créant des tableaux de support et des graphiques avancés.

Grâce à plus de 50 itérations différentes de scripts Python vérifiés, nos conclusions incluent :

  • Plus une requête de code Python est complexe, plus le modèle « réfléchit » et tente d’anticiper le résultat souhaité. Exp-1206 tente d’anticiper ce qui est nécessaire à partir d’une invite complexe donnée et fera varier ce qu’il produit en fonction du moindre changement de nuance dans une invite. Nous l’avons vu dans la manière dont le modèle alternait entre les formats de types de tableaux placés directement au-dessus du graphique en araignée de l’analyse de marché hyperscaler que nous avons créée pour le test.
  • Forcer le modèle à tenter une analyse et une visualisation de données complexes et à produire un fichier Excel donne une feuille de calcul à plusieurs onglets. Sans jamais qu’on lui demande une feuille de calcul Excel avec plusieurs onglets, Exp-1206 en a créé une. L’analyse tabulaire principale demandée se trouvait sur un onglet, les visualisations sur un autre et un tableau auxiliaire sur le troisième.
  • Demander au modèle d’itérer sur les données et de recommander les 10 visualisations qu’il juge les mieux adaptées aux données donne des résultats bénéfiques et perspicaces. Dans le but de réduire le temps nécessaire à la création de trois ou quatre itérations de diapositives avant une révision par le jury, nous avons forcé le modèle à produire plusieurs itérations conceptuelles d’images. Ceux-ci pourraient être facilement nettoyés et intégrés dans une présentation, économisant ainsi de nombreuses heures de travail manuel pour créer des diagrammes sur des diapositives.

Pousser l’Exp-1206 vers des tâches complexes et superposées

L’objectif de VentureBeat était de voir jusqu’où le modèle pouvait être poussé en termes de complexité et de tâches superposées. Ses performances dans la création, l’exécution, l’édition et la mise au point de 50 scripts Python différents ont montré à quelle vitesse le modèle tente de détecter les nuances du code et de réagir immédiatement. Le modèle s’adapte et s’adapte en fonction de l’historique rapide.

Le résultat de l’exécution du code Python créé avec Exp-1206 dans Google Colab a montré que la granularité nuancée s’étendait à l’ombrage et à la translucidité des couches dans un graphique en araignée à huit points conçu pour montrer comment six concurrents hyperscalers se comparent. Les huit attributs que nous avons demandé à Exp-1206 d’identifier parmi tous les hyperscalers et d’ancrer le graphique en araignée sont restés cohérents, tandis que les représentations graphiques variaient.

Bataille des hyperscalers

Nous avons choisi les hyperscalers suivants à comparer dans notre test : Alibaba Cloud, Amazon Web Services (AWS), Digital Realty, Equinix, Google Cloud Platform (GCP), Huawei, IBM Cloud, Meta Platforms (Facebook), Microsoft Azure, NTT Global Data. Centres, Oracle Cloud et Tencent Cloud.

Ensuite, nous avons rédigé une invite en 11 étapes de plus de 450 mots. L’objectif était de voir dans quelle mesure l’Exp-1206 pouvait gérer la logique séquentielle et ne pas perdre sa place dans un processus complexe en plusieurs étapes. (Vous pouvez lire l’invite dans l’annexe à la fin de cet article.)

Nous avons ensuite soumis l’invite dans Google IA Studioen sélectionnant le modèle Gemini Experimental 1206, comme indiqué dans la figure ci-dessous.

Test de Google Gemini-Exp-1206

Ensuite, nous avons copié le code dans Google Colab et l’avons enregistré dans un notebook Jupyter (Hyperscaler Comparison – Gemini Experimental 1206.ipynb), puis avons exécuté le script Python. Le script s’est exécuté parfaitement et a créé trois fichiers (indiqués par les flèches rouges en haut à gauche).

Analyse comparative Hyperscaler et graphique — en moins d’une minute

La première série d’instructions de l’invite demandait à Exp-1206 de créer un script Python qui comparerait 12 hyperscalers différents en fonction de leur nom de produit, de leurs caractéristiques et différenciateurs uniques et de l’emplacement des centres de données. Vous trouverez ci-dessous le résultat du fichier Excel demandé dans le script. Il a fallu moins d’une minute pour formater la feuille de calcul afin de la réduire pour qu’elle tienne dans les colonnes.

Feuille de calcul du test de Google Gemini-Exp-1206

La série de commandes suivante demandait un tableau des six principaux hyperscalers comparés en haut d’une page et le graphique en araignée ci-dessous. Exp-1206 a choisi seul de représenter les données au format HTML, créant ainsi la page ci-dessous.

Graphique du test de Google Gemini-Exp-1206

La séquence finale de commandes d’invite était centrée sur la création d’un graphique en araignée pour comparer les six principaux hyperscalers. Nous avons chargé Exp-1206 de sélectionner les huit critères de comparaison et de compléter le tracé. Cette série de commandes a été traduite en Python, et le modèle a créé le fichier et l’a fourni dans la session Google Colab.

Un modèle spécialement conçu pour faire gagner du temps aux analystes

VentureBeat a appris que dans leur travail quotidien, les analystes continuent de créer, partager et affiner des bibliothèques d’invites pour des modèles d’IA spécifiques dans le but de rationaliser le reporting, l’analyse et la visualisation au sein de leurs équipes.

Les équipes affectées à des projets de conseil à grande échelle doivent réfléchir à la manière dont des modèles tels que Gemini-Exp-1206 peuvent améliorer considérablement la productivité et réduire le besoin de semaines de travail de plus de 60 heures et de nuits blanches occasionnelles. Une série d’invites automatisées peut effectuer le travail exploratoire consistant à examiner les relations entre les données, permettant aux analystes de produire des visuels avec une bien plus grande certitude sans avoir à passer un temps excessif à y parvenir.

Appendice:

Test d’invite expérimental 1206 de Google Gemini

Écrivez un script Python pour analyser les hyperscalers suivants qui ont annoncé une présence mondiale d’infrastructure et de centre de données pour leurs plates-formes et créez un tableau les comparant qui capture les différences significatives dans chaque approche en matière de présence mondiale d’infrastructure et de centre de données.

Demandez à la première colonne du tableau d’être le nom de l’entreprise, la deuxième colonne les noms de chacun des hyperscalers de l’entreprise qui ont une infrastructure mondiale et une présence dans les centres de données, la troisième colonne ce qui rend leurs hyperscalers uniques et une plongée approfondie dans les plus différenciés. caractéristiques, et la quatrième colonne représente les emplacements des centres de données pour chaque hyperscaler au niveau de la ville, de l’État et du pays. Incluez les 12 hyperscalers dans le fichier Excel. Ne grattez pas le Web. Produisez un fichier Excel du résultat et formatez le texte dans le fichier Excel de manière à ce qu’il soit exempt de crochets ({}), de guillemets (‘), de doubles astérisques (**) et de tout code HTML pour améliorer la lisibilité. Nommez le fichier Excel Gemini_Experimental_1206_test.xlsx.

Ensuite, créez un tableau de trois colonnes de large et sept colonnes de profondeur. La première colonne est intitulée Hyperscaler, la deuxième Caractéristiques uniques et différenciateurs et la troisième, Emplacements de l’infrastructure et des centres de données. Mettez en gras les titres des colonnes et centrez-les. Mettez également en gras les titres des hyperscalers. Vérifiez à nouveau pour vous assurer que le texte dans chaque cellule de ce tableau s’enroule et ne passe pas dans la cellule suivante. Ajustez la hauteur de chaque ligne pour vous assurer que tout le texte peut tenir dans la cellule prévue. Ce tableau compare Amazon Web Services (AWS), Google Cloud Platform (GCP), IBM Cloud, Meta Platforms (Facebook), Microsoft Azure et Oracle Cloud. Centrez le tableau en haut de la page de sortie.

Ensuite, prenez Amazon Web Services (AWS), Google Cloud Platform (GCP), IBM Cloud, Meta Platforms (Facebook), Microsoft Azure et Oracle Cloud et définissez les huit aspects les plus différenciants du groupe. Utilisez ces huit aspects différenciateurs pour créer un graphique en araignée qui compare ces six hyperscalers. Créez un seul grand graphique en araignée qui montre clairement les différences entre ces six hyperscalers, en utilisant différentes couleurs pour améliorer sa lisibilité et la capacité de voir les contours ou les empreintes de différents hyperscalers. Assurez-vous de titrer l’analyse, Qu’est-ce qui différencie le plus les hyperscalers, décembre 2024. Assurez-vous que la légende est entièrement visible et non au-dessus du graphique.

Ajoutez le graphique de l’araignée au bas de la page. Centrez le graphique en forme d’araignée sous le tableau sur la page de sortie.

Voici les hyperscalers à inclure dans le script Python : Alibaba Cloud, Amazon Web Services (AWS), Digital Realty, Equinix, Google Cloud Platform (GCP), Huawei, IBM Cloud, Meta Platforms (Facebook), Microsoft Azure, NTT Global Data. Centres, Oracle Cloud, Tencent Cloud.

Share This Article
Leave a Comment

Leave a Reply

Your email address will not be published. Required fields are marked *