10 mises à jour passionnantes sur Gemini de Google et d'autres outils d'IA

·
17 mai 2024
·
5 min read

Le 14 mai 2024, Google a tenu sa conférence annuelle des développeurs, intitulée Google I/O, annonçant plus de 100 nouveaux matériels, logiciels et diverses mises à jour liées à ses produits et services. 

Des présentations principales aux sessions techniques et ateliers conçus pour les développeurs, les technologues et les passionnés, le géant mondial de la recherche a profité de l'occasion pour dévoiler l'avenir de la recherche basée sur l'IA. 

Les participants à Google I/O ont eu l'occasion de découvrir par eux-mêmes les derniers développements de l'écosystème de Google, notamment l'intelligence artificielle (IA).

Il y a eu au moins 100 annonces clés, mais voici dix innovations intéressantes en matière d'IA de Google I/O 2024 que vous devriez connaître : 

Publicité

1. Gemini 1.5 Pro est là

Google a annoncé que Gemini 1.5 Pro, son puissant modèle d'IA avec une fenêtre contextuelle d'un million de jetons, est désormais disponible dans plus de 35 langues. Selon Google, le Gemini 1.5 Pro peut non seulement traiter de grandes quantités de données comme une vidéo d'une heure ou un PDF de 1,500 XNUMX pages, mais il peut également répondre à plusieurs requêtes complexes sur le matériel source. 

L'entreprise technologique américaine a lancé le Gémeaux 1.5 Flash, un modèle moins cher développé à partir des commentaires des utilisateurs, et Projet Astra, un assistant IA avancé capable de saisir et de réagir de manière appropriée au contexte des conversations. 

2. La recherche Google bénéficie d'un coup de pouce pour l'IA générative Gemini

Google intégrera Gemini dans la recherche pour améliorer sa capacité à comprendre et à répondre aux requêtes sophistiquées. Par conséquent, vous pouvez désormais poser des questions complexes en plusieurs étapes et effectuer des requêtes de recherche à l'aide de vidéos rapides, permettant ainsi d'obtenir des résultats de recherche plus pertinents. 

Gemini 1.5 Pro de Google

Google a indiqué qu'il lancerait d'abord cette fonctionnalité aux États-Unis, puis la déploierait dans d'autres régions au fil du temps. 

3. Gemini arrive sur Android

Au-delà de la simple recherche, Google a également annoncé l'intégration de Gemini dans Android, où il exécutera les fonctionnalités suivantes telles que « Cercle pour rechercher », qui vous permet de rechercher tout ce que vous voyez sur votre écran. Google assure que la fonctionnalité sera bientôt disponible sur les ordinateurs de bureau et les tablettes Chrome.

Soyez le plus intelligent de la pièce

Rejoignez les 30,000 5 abonnés qui reçoivent Techpoint Digest, un tour d'horizon hebdomadaire et quotidien amusant de XNUMX minutes des événements technologiques africains et mondiaux, directement dans votre boîte de réception, des heures avant tout le monde.
Abonnement au résumé

Essayez-le, vous pouvez vous désinscrire à tout moment. Politique de confidentialité.

L’IA générative alimentera également Réagissez Caractéristiques, Le lecteur d'écran d'Android permet aux personnes malvoyantes de naviguer plus facilement sur leurs appareils et d'accéder plus facilement aux informations, et améliore la détection des escroqueries en direct, en repérant les appels téléphoniques frauduleux en temps réel. Les fonctionnalités seront disponibles d’abord sur les appareils Pixel plus tard en 2024, avant d’être étendues à d’autres appareils. 

Enfin, Gemini alimentera Assistant sur Android, et il sera accessible sur les appareils Android 10+ et 2 Go+ de RAM sur lesquels l'application Gemini est déjà disponible. 

4. Google Workspace ne sera pas en reste 

L’IA générative trouve de plus en plus d’applications utiles. Rien qu'au cours de la dernière année, Google a enregistré plus d'un million de personnes et des dizaines de milliers d'entre elles ont déployé l'IA générative dans Workspace. 

Gemini for Workspace vous aide à utiliser au maximum les applications Google telles que Gmail, Docs et Sheets. 

Google a annoncé quelques mises à jour dans Gemini for Workspace, telles que les nouvelles fonctionnalités Gemini dans Gmail qui fournissent des brouillons automatiques de réponses par e-mail que vous pouvez modifier ou simplement envoyer. De plus, l'IA peut résumer les fils de discussion directement dans l'application Gmail. 

Ces fonctionnalités seront disponibles pour les clients Gemini for Workspace et les abonnés Google One AI Premium plus tard dans l'année. 

5. Vous pouvez désormais poser des questions à Google Photos

Une fonctionnalité appelée « Ask Photos », qui utilise Gemini pour répondre à toutes sortes de questions sur les photos et les vidéos, arrive sur Google Photos. Grâce à cette fonctionnalité, vous pourrez facilement parcourir d'innombrables médias visuels pour trouver des images spécifiques ou rappeler avec précision des événements passés. 

Demandez des photos à Google avec Gemini

La fonctionnalité commencera à être déployée aux États-Unis et sera bientôt disponible dans d’autres régions. 

6. Imagen 3 transformera votre texte en images

Imagen 3 est le dernier effort de Google visant à utiliser l'IA générative pour transformer du texte en modèles d'images. Disponible uniquement pour certains créateurs en aperçu privé pour l'instant, il sera disponible en trois variantes de modèle : la première donnera la priorité à la vitesse, la seconde équilibrera la vitesse et la qualité, et la dernière optimisera les images de la plus haute qualité avec le meilleur texte. alignement. 

Imagen 3 générera des images incroyablement détaillées et de haute qualité, avec un éclairage exceptionnel et moins d'anomalies gênantes. En outre, des progrès notables seront réalisés dans la capacité de l'outil à restituer du texte. 

Imagen 3 sera disponible via la liste d'attente. Les mises à niveau de génération d'images seront bientôt disponibles pour les utilisateurs de Workspace et de l'application Gemini.

7. Veo vous aidera à créer des vidéos à la demande

Le Veo de Google est un modèle de génération vidéo qui vous permet de créer des vidéos de haute qualité jusqu'à 60 secondes ou plus. En réponse à vos invites, Veo proposera des résultats avec la preuve de contrôles créatifs, tels qu'un zoom rapide ou des prises de vue de grue au ralenti. 

Comme les prises de vue humaines, Veo maintiendra la cohérence entre les invites complexes et capturera les nuances et le ton émotionnel des détails fournis, en fonction des styles visuels, allant du photoréalisme à l'animation. 

Google prévoit d'intégrer les capacités de Veo dans YouTube Shorts à l'avenir. Pour l'instant cependant, l'outil est disponible pour sélectionner les créateurs en avant-première privée dans VideoFX via une liste d'attente. 

8. Lyria contribuera à améliorer la musique

Google collabore avec des musiciens, des auteurs-compositeurs et des producteurs pour mieux comprendre comment l'IA peut aider à la création musicale. L'une des inventions clés de cette collaboration est Lyria, la famille de modèles la plus avancée de Google pour la génération de musique par l'IA. 

La musique expérimentale créée avec Lyria est disponible sur les chaînes YouTube sur I/O. Certains musiciens notables incluent le rappeur lauréat d'un Grammy, Wyclef Jean ; le musicien électronique et YouTuber Marc Rebillet ; et l'auteur-compositeur Justin Tranter. 

9. Vous pouvez utiliser SynthID pour détecter les textes et vidéos créés par l'IA

Le SynthID de Google filigrane et identifie le contenu généré par l'IA. Ses fonctionnalités ont désormais été étendues pour inclure le texte et la vidéo. Synth intègre un filigrane numérique directement dans les images, l'audio, le texte ou la vidéo générés par l'IA. Vous pouvez faire la distinction entre ce qui a été créé par les humains et l'IA avec le SynthID.

Google intègre l'outil dans Gemini et Search pour améliorer les requêtes créatives. 

10. AI Test Kitchen améliore l'expérience d'apprentissage de l'IA 

AI Test Kitchen de Google est une plateforme où vous pouvez rejoindre d'autres personnes pour découvrir et donner votre avis sur les dernières technologies d'IA de l'entreprise, comme ImageFX et MusicFX. Selon le géant de la technologie, AI Test Kitchen est un moyen permettant aux parties intéressées d'apprendre, de s'améliorer et d'innover ensemble de manière responsable en matière d'IA. Tout sur la plateforme est un travail en cours et est ouvert aux premiers commentaires.

Aujourd'hui, Google étend sa plateforme pour toucher davantage de personnes dans plus de 100 pays et territoires, y compris des pays d'Afrique subsaharienne, comme le Nigeria, le Kenya et l'Afrique du Sud. Il est disponible en 37 langues.


Vous avez un pourboire? Nos journalistes sont prêts à creuser plus profondément. S'il vous plaît partager vos idées et informations et aidez-nous à découvrir les histoires qui comptent.

Abonnez-vous à Techpoint Digest
Rejoignez des milliers d'abonnés pour recevoir notre tour d'horizon hebdomadaire et quotidien de 5 minutes des événements technologiques africains et mondiaux, directement dans votre boîte de réception, des heures avant tout le monde.
Il s'agit d'un tour d'horizon quotidien de 5 minutes des événements technologiques africains et mondiaux, envoyé directement dans votre boîte de réception, entre 5 h et 7 h (WAT) tous les jours de la semaine ! 
Abonnement au résumé

Essayez-le, vous pouvez vous désinscrire à tout moment. Politique de confidentialité.

Autres histoires

43b, Emina Cres, Allen, Ikeja.

 Techpremier Media Limited. Tous les droits sont réservés
loupe