l’IA générative au centre des innovations annoncées par NVIDIA

0



A l’occasion du CES 2024, qui se déroule actuellement à Las Vegas, NVIDIA a dévoilé les nouveaux GPU de bureau GeForce RTX SUPER, annoncé des ordinateurs portables IA de nouvelle génération et une suite de logiciels et d’outils accélérés par NVIDIA RTX, à la fois pour les développeurs et les consommateurs.

Selon Jensen Huang, Fondateur et PDG de NVIDIA :

“L’IA générative est la transition la plus significative de l’histoire de l’informatique et va transformer toutes les industries, y compris les jeux. Avec plus de 100 millions de PC et de stations de travail RTX AI, NVIDIA constitue une base d’installation massive pour que les développeurs et les joueurs puissent profiter de la magie de l’IA générative.”

NVIDIA étend les GPU RTX pour améliorer les expériences sur PC avec l’IA générative

L’exécution locale de l’IA générative sur un PC est considérée comme cruciale pour les applications sensibles à la confidentialité, à la latence et aux coûts. NVIDIA répond à ces besoins en apportant des innovations à l’ensemble de sa pile technologique, s’appuyant sur plus de 500 applications et jeux pour PC déjà pris en charge par la technologie NVIDIA RTX.

Les GPU RTX de NVIDIA, capables de propulser une large gamme d’applications haute performance, libèrent tout le potentiel de l’IA générative sur les PC. Les Tensor Cores de ces GPU accélèrent considérablement les performances de l’IA dans les applications les plus exigeantes pour le travail et les loisirs.

Les GPU GeForce RTX 40 SUPER

Jeff Fisher, vice-président senior de GeForce chez NVIDIA, a présenté les nouvelles cartes graphiques de la série GeForce RTX 40 SUPER, les GeForce RTX 4080 SUPER, 4070 Ti SUPER et 4070 SUPER, basés sur l’architecture NVIDIA Ada Lovelace.

Selon lui, La GeForce RTX 4080 SUPER peut alimenter des jeux entièrement en ray-tracing en 4K et est 1,4 fois plus rapide que la RTX 3080 Ti sans génération d’images dans les jeux les plus gourmands en graphismes. Avec 836 AI TOPS, NVIDIA DLSS Frame Generation offre une amélioration supplémentaire des performances, rendant la RTX 4080 SUPER deux fois plus rapide qu’une RTX 3080 Ti.

Les créateurs peuvent générer des vidéos avec Stable Video Diffusion 1,5 fois plus rapidement et des images avec Stable Diffusion XL 1,7 fois plus rapidement. La RTX 4080 SUPER dispose de plus de cœurs et d’une mémoire plus rapide, ce qui lui donne un avantage en termes de performances. Elle sera disponible à partir du 31 janvier au prix de 1109 euros.

Pour la RTX 4070 Ti SUPER, NVIDIA a ajouté plus de cœurs et augmenté la mémoire tampon à 16 Go et le bus mémoire à 256 bits. Il est 1,6 fois plus rapide qu’une 3070 Ti et 2,5 fois plus rapide avec DLSS 3. Elle sera disponible à partir du 24 janvier au prix de 889 euros.

Jeff Fisher a également présenté la RTX 4070 SUPER. NVIDIA a ajouté 20% de cœurs en plus, ce qui la rend plus rapide que la RTX 3090 tout en utilisant une fraction de la puissance. Elle sera disponible à partir du 17 janvier au prix de 659 euros.

Des ordinateurs IA et des stations de travail équipés des GPU RTX

Les principaux fabricants, Acer, ASUS, Dell, HP, Lenovo, MSI, Razer et Samsung, déploient une nouvelle vague d’ordinateurs portables RTX AI, offrant aux utilisateurs un ensemble complet de capacités d’IA générative. Ces nouveaux systèmes, offrant jusqu’à 60 fois d’amélioration des performances par rapport à l’utilisation d’unités de traitement neuronal, commenceront à être expédiés ce mois-ci.

Les stations de travail mobiles équipées de GPU RTX peuvent exécuter le logiciel NVIDIA AI Enterprise, notamment TensorRT et NVIDIA RAPIDS, facilitant le développement simplifié et sécurisé de l’IA générative et de la science des données. Une licence de trois ans pour NVIDIA AI Enterprise est incluse avec chaque GPU NVIDIA A800 40GB Active, offrant une plateforme de développement de station de travail idéale pour l’IA et la science des données.

Nouveaux outils de développement pour PC pour la modélisation de l’IA

Pour aider les développeurs à créer, tester et personnaliser rapidement des modèles d’IA génératifs pré-entraînés et des LLM en utilisant des performances et une empreinte mémoire de classe PC, NVIDIA a introduit NVIDIA AI Workbench, une boîte à outils unifiée et facile à utiliser. Prévu en version bêta plus tard ce mois-ci, AI Workbench offre un accès simplifié à des référentiels populaires tels que Hugging Face, GitHub et NVIDIA NGC, ainsi qu’une interface utilisateur simplifiée pour reproduire, collaborer et migrer facilement des projets.

Les projets développés avec AI Workbench peuvent être mis à l’échelle pratiquement n’importe où, que ce soit dans le centre de données, un cloud public ou NVIDIA DGX Cloud, puis ramenés sur des systèmes RTX locaux sur un PC ou une station de travail pour l’inférence et la personnalisation légère.

En collaboration avec HP, NVIDIA simplifie également le développement de modèles d’IA en intégrant les modèles et les interfaces de NVIDIA AI Foundations dans HP AI Studio, une plateforme centralisée pour la science des données. Cela permet aux utilisateurs de rechercher, d’importer et de déployer facilement des modèles optimisés sur les PC et le cloud.

Après avoir construit des modèles d’IA pour les cas d’utilisation sur PC, les développeurs peuvent les optimiser à l’aide de NVIDIA TensorRT pour tirer pleinement parti des Tensor Cores des GPU RTX. NVIDIA a récemment étendu TensorRT aux applications textuelles avec TensorRT-LLM pour Windows, une bibliothèque open-source conçue pour accélérer et optimiser les performances d’inférence des derniers grands modèles de langage, celle-ci prend désormais en charge une gamme plus large de modèles pré-optimisés pour les PC, notamment Phi-2.

Accéléré par TensorRT-LLm, “Chat with RTX“, une démo technique, permet aux passionnés d’IA d’interagir avec leurs notes et documents en utilisant la génération augmentée par la recherche (RAG).

NVIDIA a également annoncé l’accélération de Stable Diffusion XL grâce à NVIDIA TensorRT, la plateforme RTX Remix pour transformer les textures de base des jeux classiques en matériaux de rendu modernes, en résolution 4K et basés sur la physique,les microservices NVIDIA ACE, pour ajouter des avatars numériques intelligents et dynamiques aux jeux et une gamme de jeux utilisant la technologie DLSS 3 avec Frame Generation.



Source link

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.