NVIDIA bringt generative AI zu Millionen, mit Tensor-Core-GPUs, LLMs, Tools für RTX-PCs und -Workstations
Führende AI-Plattform erhält RTX-beschleunigten Boost von neuen GeForce-RTX-SUPER-GPUs, AI-Laptops von jedem Top-Hersteller und mehr
Las Vegas - CES, 8. Januar 2024 - NVIDIA hat heute GeForce-RTX(™)-SUPER Desktop-GPUs für höchste generative AI-Leistung, neue AI-Notebooks aller führenden Hersteller sowie neue NVIDIA-RTX(™)-beschleunigte AI-Software und -Tools für Entwickler und Endkunden angekündigt.
Aufbauend auf der jahrzehntelanger Führungsposition im PC-Bereich und über 100 Millionen RTX-Grafikprozessoren, die die Ära der künstlichen Intelligenz auf dem PC vorantreiben, bietet NVIDIA jetzt diese Tools an, um PC-Erlebnisse mit generativer AI zu verbessern: NVIDIA-TensorRT™-Beschleunigung des beliebten Stable-Diffusion-XL-Modells für Text-zu-Bild-Workflows, NVIDIA RTX Remix mit generativen AI-Texturtools, NVIDIA-ACE-Microservices und weitere Spiele, die DLSS-3-Technologie mit Frame Generation nutzen.
Darüber hinaus unterstützt NVIDIA TensorRT-LLM (TRT-LLM) jetzt weitere voroptimierte Modelle für PCs. NVIDIA TensorRT-LLM ist eine Open-Source-Bibliothek, die die Inferenzleistung der neuesten großen Sprachmodelle (LLMs) beschleunigt und optimiert. Beschleunigt durch TRT-LLM ermöglicht Chat with RTX, eine ebenfalls in diesem Monat erscheinende NVIDIA-Tech-Demo, AI-Fans die Interaktion mit ihren Notizen, Dokumenten und anderen Inhalten.
"Generative AI ist der bedeutendste Plattformwechsel in der Geschichte der Computertechnik und wird jede Branche verändern, auch die Spieleindustrie", sagt Jensen Huang, Gründer und CEO von NVIDIA. "Mit über 100 Millionen RTX-AI-PCs und -Workstations bietet NVIDIA eine massive Installationsbasis für Entwickler und Gamer, um die Magie der generativen AI zu genießen."
Die lokale Ausführung generativer AI auf einem PC ist entscheidend für Datenschutz-, Latenz- und kostensensitive Anwendungen. Dies erfordert eine große Anzahl von AI-fähigen Systemen sowie die richtigen Entwickler-Tools, um AI-Modelle für die PC-Plattform abzustimmen und zu optimieren.
Um diesen Anforderungen gerecht zu werden, liefert NVIDIA Innovationen über den gesamten Technologie-Stack, die neue Erfahrungen ermöglichen und auf den über 500 AI-fähigen PC-Anwendungen und Spielen aufbauen, die bereits von der NVIDIA RTX-Technologie beschleunigt werden.
RTX-AI-PCs und -Workstations
NVIDIA-RTX-GPUs, die eine breite Palette von Anwendungen mit höchster Leistung ausführen können, erschließen das volle Potenzial der generativen AI auf PCs. Die Tensor Cores in diesen Grafikprozessoren beschleunigen die AI-Leistung in den anspruchsvollsten Anwendungen für Arbeit und Spiel dramatisch.
Die neuen Grafikkarten der GeForce-RTX-40er-SUPER-Serie, die ebenfalls heute auf der CES angekündigt wurden, umfassen die GeForce RTX 4080 SUPER, 4070 Ti SUPER und 4070 SUPER für höchste AI-Leistung. Die GeForce RTX 4080 SUPER erzeugt AI-Videos 1,5-mal schneller - und Bilder 1,7-mal schneller - als die GeForce-RTX-3080-Ti-GPU. Die Tensor Cores in den SUPER-GPUs liefern bis zu 836 Billionen Daten pro Sekunde und bringen transformative AI-Fähigkeiten für Spiele, Kreation und tägliche Produktivität.
Führende Hersteller - darunter Acer, ASUS, Dell, HP, Lenovo, MSI, Razer und Samsung- bringen eine neue Reihe von RTX-AI-Notebooks auf den Markt, die den Anwendern direkt nach dem Auspacken eine ganze Reihe von generativen AI-Funktionen bieten. Die neuen Systeme, die eine 20- bis 60-fache Leistungssteigerung im Vergleich zur Verwendung neuronaler Verarbeitungseinheiten bieten, werden ab diesem Monat ausgeliefert.
Auf mobilen Workstations mit RTX-Grafikprozessoren kann die NVIDIA-AI-Enterprise-Software ausgeführt werden, darunter TensorRT und NVIDIA RAPIDS™ für eine vereinfachte, sichere generative AI- und Data-Science-Entwicklung. Eine Dreijahreslizenz für NVIDIA AI Enterprise ist im Lieferumfang enthalten. Jede NVIDIA-A800-40GB-Active-GPU enthält und bietet eine ideale Workstation-Entwicklungsplattform für AI und Data Science.
Neue PC-Entwickler-Tools für die Erstellung von AI-Modellen
Um Entwicklern das schnelle Erstellen, Testen und Anpassen von vortrainierten generativen AI-Modellen und LLMs mit der Leistung und dem Speicherbedarf eines PCs zu erstellen, kündigte NVIDIA kürzlich NVIDIA AI Workbench an, ein vereinheitlichtes, einfach zu bedienendes Toolkit.
AI Workbench, das noch in diesem Monat als Beta-Version veröffentlicht wird, bietet einen optimierten Zugriff auf beliebte Repositories wie Hugging Face, GitHub und NVIDIA NGC™ sowie eine vereinfachte Benutzeroberfläche. Diese ermöglicht es Entwicklern, Projekte einfach zu reproduzieren, gemeinsam zu bearbeiten und zu migrieren.
Projekte können praktisch überall skaliert werden - ob im Rechenzentrum, in einer öffentlichen Cloud oder in der NVIDIA DGX™ Cloud - und dann auf lokale RTX-Systeme auf einem PC oder einer Workstation zurückgebracht werden, um Inferenzen zu erstellen und leichte Anpassungen vorzunehmen.
In Zusammenarbeit mit HP vereinfacht NVIDIA auch die Entwicklung von AI-Modellen durch die Integration von NVIDIA AI Foundation Models and Endpoints, die RTX-beschleunigte AI-Modelle und Software Development Kits enthalten, in das HP AI Studio, eine zentrale Plattform für Data Science. Dies ermöglicht es Anwendern, optimierte Modelle auf PCs und in der Cloud einfach zu suchen, zu importieren und bereitzustellen.
Nach der Erstellung von AI-Modellen für PC-Anwendungsfälle können Entwickler diese mit NVIDIA TensorRT optimieren, um die Vorteile der Tensor-Cores der RTX-GPUs voll auszuschöpfen.
NVIDIA hat kürzlich TensorRT mit TensorRT-LLM für Windows, einer Open-Source-Bibliothek zur Beschleunigung von LLMs, auf textbasierte Anwendungen erweitert. Das neueste Update von TensorRTLLM, das jetzt verfügbar ist, fügt Phi-2 der wachsenden Liste von voroptimierten Modellen für den PC hinzu, die im Vergleich zu anderen Inferenz-Backends bis zu 5x schneller laufen.
RTX-beschleunigte generative AI sorgt für neue PC-Erlebnisse
Auf der CES stellen NVIDIA und die Entwicklerpartner neue generative AI-gestützte Anwendungen und Dienste für PCs vor, darunter:
● NVIDIA RTX Remix, eine Plattform zur Erstellung beeindruckender RTX-Remaster von Spieleklassikern. Sie wird noch in diesem Monat als Beta-Version veröffentlicht und bietet generative AI-Tools, die grundlegende Texturen aus klassischen Spielen in moderne, physikalisch basierte Rendering-Materialien mit 4K-Auflösung verwandeln können.
● NVIDIA ACE Microservices, einschließlich generativer AI-gestützter Sprach- und Animationsmodelle, die es Entwicklern ermöglichen, intelligente, dynamische digitale Avatare in Spiele einzubauen.
● TensorRT-Beschleunigung für Stable Diffusion XL (SDXL) Turbo und latente Konsistenzmodelle, zwei der beliebtesten Stable Diffusion-Beschleunigungsmethoden. TensorRT verbessert die Leistung für beide um bis zu 60 % im Vergleich zur vorherigen schnellsten Implementierung. Eine aktualisierte Version der Stable Diffusion WebUI TensorRT-Erweiterung ist nun ebenfalls verfügbar, einschließlich Beschleunigung für SDXL, SDXL Turbo, LCM - Low-Rank Adaptation (LoRA) und verbesserter LoRA-Unterstützung.
● NVIDIA DLSS 3 mit Frame Generation, das mithilfe von AI die Framerates im Vergleich zum nativen Rendering um das Vierfache steigert, wird in einem Dutzend der 14 angekündigten neuen RTX-Spiele zum Einsatz kommen, darunter Horizon Forbidden West, Pax Dei und Dragon's Dogma 2.
● Chat with RTX, eine NVIDIA Tech-Demo, die noch in diesem Monat verfügbar sein wird, ermöglicht es AI-Enthusiasten, PC-LLMs auf einfache Weise mit ihren eigenen Daten zu verbinden und dabei eine beliebte Technik zu verwenden, die als Retrieval-Augmented Generation (RAG) bekannt ist. Die durch TensorRT-LLM beschleunigte Demo ermöglicht es Benutzern, schnell mit ihren Notizen, Dokumenten und anderen Inhalten zu interagieren. Sie wird auch als Open-Source-Referenzprojekt verfügbar sein, so dass Entwickler die gleichen Fähigkeiten leicht in ihre eigenen Anwendungen implementieren können.
Mehr über die neuesten Durchbrüche in der generativen AI gibt es unter diesem Link: NVIDIA at CES.
GeForce-RTX-40er-SUPER-Serie: Neue Helden debütieren im Gaming- und Kreativ-Universum mit AI als Superkraft
Gaming-GPUs mit noch mehr Leistung und generativen AI-Fähigkeiten, beginnend bei 599 US-Dollar
Las Vegas - CES, 8. Januar 2024 - NVIDIA hat heute die GeForce-RTX(™)-40er-SUPER-GPUs angekündigt - darunter die GeForce RTX 4080 SUPER, GeForce RTX 4070 Ti SUPER und GeForce RTX 4070 SUPER, die die neuesten Spiele und den Kern von AI-gesteuerten PCs bilden.
Diese neueste Iteration der auf der NVIDIA-Ada-Lovelace-Architektur basierenden GPUs liefert bis zu 52 Shader TFLOPS, 121 RT TFLOPS und 836 AI TOPS, um die Leistung von Spielen und Kreationen zu steigern - und bieten eine Leistung, um neue Unterhaltungswelten und -erlebnisse zu entwickeln. Die GeForce RTX 4070 SUPER ist ab 599 US-Dollar erhältlich.
PC-Spieler verlangen nach der allerbesten Grafikqualität, und AI-gestützte NVIDIA Deep Learning Super Sampling (DLSS) Super Resolution, Frame Generation und Ray Reconstruction verbinden sich mit Raytracing, um atemberaubende Welten zu bieten - nur einen Klick entfernt in Titeln wie Diablo IV, Pax Dei und Horizon Forbidden West. Mit DLSS können sieben von acht Pixeln über AI generiert werden. Vollständiges Raytracing wird um bis zu 4x bei besserer Bildqualität beschleunigt.
"Für jeden, vom Spiele-Enthusiasten bis zum Kreativprofi, sind die GeForce-RTX-SUPER-GPUs einfach großartige Upgrades", sagt Matt Wuebbling, Vice President of Global GeForce Marketing bei NVIDIA. "GeForce-RTX-SUPER-GPUs unterstützen über 500 RTX-Spiele und -Anwendungen und bereiten die Nutzer auf die Welle von generativen AI-Apps vor, die auf den PC kommen."
Ein AI-gestützter Sprung im PC-Computing
Die neuen GeForce-RTX-SUPER-GPUs sind die ultimative Möglichkeit, AI auf dem PC zu erleben. Spezialisierte AI Tensor Cores liefern bis zu 836 AI TOPS, um transformative Fähigkeiten für AI in Spielen, bei der Erstellung von Inhalten und bei der täglichen Produktivität zu ermöglichen. Die umfangreiche Software-Stack, der auf den RTX-GPUs aufbaut, beschleunigt die AI weiter.
NVIDIA TensorRT (™) ist eine Software für leistungsstarke Deep-Learning-Inferenz, die einen Deep-Learning-Optimierer und eine Laufzeitumgebung mit niedriger Latenz und hohen Durchsatz für Inferenzanwendungen bietet. TensorRT-LLM für Windows ist eine Open-Source-Bibliothek, die die Inferenzleistung für die neuesten großen Sprachmodelle beschleunigt. Bei AI-Workloads generiert die GeForce RTX 4080 SUPER Videos über 1,5 Mal schneller und Bilder über 1,7 Mal schneller als die RTX 3080 Ti.
Bei Spielen sorgt das AI-gestützte DLSS für ein besseres Spieleerlebnis. Währenddessen nutzen generative AI-Anwendungen wie Adobe Photoshop die Tensor Cores, um die Produktivität zu beschleunigen und kreative Workflows in Gang zu halten. Und für die Produktivität kann NVIDIA Broadcast Hintergrundgeräusche entfernen und nahtlose virtuelle Hintergründe bereitstellen.
Mit den GeForce-RTX-SUPER-GPUs können Anwender das volle Potenzial von AI auf
Windows-PCs entfesseln.
Ein 4K-Monster: Die GeForce RTX 4080 SUPER
Die GeForce RTX 4080 SUPER ermöglicht vollständig ray-traced Spiele in 4K-Auflösung. Bei traditioneller Rasterisierung bietet die RTX 4080 SUPER ohne DLSS Frame Generation eine bis zu 1,4x schnellere Leistung als die GeForce RTX 3080 Ti. Mit 836 AI TOPS liefert DLSS Frame Generation einen zusätzlichen Leistungsschub und macht die RTX 4080 SUPER doppelt so schnell wie die RTX 3080 Ti. Die RTX 4080 SUPER bietet mehr Kerne und schnelleren Speicher für einen Leistungsvorsprung. Erhältlich ist sie ab dem 31. Januar ab einem Preis von 999 US-Dollar.
Präzises Spielen: Die GeForce RTX 4070 Ti SUPER
Die RTX 4070 Ti SUPER ist die ideale GPU, um sehr hohe Bildwiederholraten in Auflösungen von 1440p bis 4K zu erzielen. Im Vergleich zur RTX 4070 Ti hat sie mehr Kerne, einen auf 16 GB vergrößerten Framebuffer und einen 256-Bit-Speicherbus, bietet somit also eine deutliche Steigerung der Speicherbandbreite auf 672 GB/Sekunden. Sie ist 1,6x schneller als eine RTX 3070 Ti und 2,5x mit DLSS 3. Die GeForce RTX 4070 Ti SUPER wird ab dem 24. Januar zum Preis von 799 US-Dollar erhältlich sein.
Perfekt ausbalanciert: Die GeForce RTX 4070 SUPER
Die RTX 4070 SUPER verfügt über 20 % mehr Kerne als die RTX 4070 und ist damit schneller als eine RTX 3090 bei einem Bruchteil der Energie. Mit DLSS 3 vergrößert sich der Vorsprung auf das 1,5-fache. Sie wird ab dem 17. Januar zum Preis von 599 US-Dollar erhältlich sein.
Wo man sie kaufen kann
Für die GeForce RTX 4080 SUPER und 4070 SUPER wird eine NVIDIA Founders Edition direkt auf NVIDIA.com und bei ausgewählten Händlern erhältlich sein. Kundenspezifische Boards, einschließlich standardmäßig getakteter und ab Werk übertakteter Modelle für alle GeForce-RTX-40er-SUPER-GPUs, werden von führenden Anbietern von Add-in-Karten wie ASUS, Colorful, Gainward, GALAX, GIGABYTE, INNO3D, KFA2, MSI, Palit, PNY und ZOTAC erhältlich sein.
NVIDIA und Entwickler schaffen lebensechte digitale Charaktere für Spiele und Anwendungen mit NVIDIA ACE, Avatar Cloud Engine
NVIDIA ACE Microservices präsentieren erstmals generative AI-Modelle, die die Art und Weise der Interaktion mit digitalen Avataren verändern werden
Las Vegas - CES, 8. Januar 2024 - NVIDIA hat heute Produktions-Microservices für die NVIDIA Avatar Cloud Engine (ACE) vorgestellt, mit denen Entwickler von Spielen, Tools und Middleware modernste generative AI-Modelle in die digitalen Avatare ihrer Spiele und Anwendungen integrieren können.
Die neuen ACE-Microservices ermöglichen Entwicklern die Erstellung interaktiver Avatare mit AI-Modellen wie NVIDIA Audio2Face™ (A2F), das ausdrucksstarke Gesichtsanimationen aus Audioquellen erzeugt, und NVIDIA Riva Automatic Speech Recognition (ASR) für die Erstellung anpassbarer mehrsprachiger Sprach- und Übersetzungsanwendungen mit generativer AI.
Zu den Herstellern, die ACE nutzen, gehören Charisma.AI, Convai, Inworld, miHoYo, NetEase Games, Ourpalm, Tencent, Ubisoft und UneeQ.
"Generative AI-Technologien verändern praktisch alles, was wir tun, und das gilt auch für die Entwicklung von Spielen und das Gameplay", sagt Keita Iida, Vice President of Developer Relations bei NVIDIA. "NVIDIA ACE eröffnet Spieleentwicklern neue Möglichkeiten, indem es ihre Welten mit realistischen digitalen Charakteren bevölkert und gleichzeitig den Bedarf an vorformulierten Dialogen beseitigt, was zu einer größeren Interaktion im Spiel führt."
Top-Entwickler von Spielen und interaktiven Avataren setzen auf NVIDIA ACE
Die führenden Entwickler von Spielen und interaktiven Avataren leisten Pionierarbeit, indem sie ACE- und generative AI-Technologien einsetzen, um die Interaktion zwischen Spielern und nicht spielbaren Charakteren (NPCs) in Spielen und Anwendungen zu verbessern.
"Dies ist ein Meilenstein für AI in Spielen", sagte Tencent Games. "NVIDIA ACE und Tencent Games werden dazu beitragen, den Grundstein zu legen, um digitale Avatare mit individuellen, lebensechten Persönlichkeiten und Interaktionen in Videospielen zu integrieren."
NVIDIA ACE erweckt Spielcharaktere zum Leben
In der Vergangenheit wurden NPCs mit vorgegebenen Reaktionen und Gesichtsanimationen entworfen. Dies schränkte die Interaktionen zwischen den Spielern ein, die in der Regel transaktional und kurzlebig waren und daher von der Mehrheit der Spieler übersprungen wurden.
"Generative AI-gesteuerte Charaktere in virtuellen Welten ermöglichen eine Vielzahl von Anwendungsmöglichkeiten und Erfahrungen, die bisher nicht möglich waren", sagt Purnendu Mukherjee, Gründer und CEO von Convai. "Convai nutzt Riva ASR und A2F, um lebensechte NPCs mit niedrigen Reaktionszeiten und naturgetreuer Animation zu ermöglichen."
Um zu zeigen, wie ACE NPC-Interaktionen verändern kann, hat NVIDIA mit Convai zusammengearbeitet, um die NVIDIA-Kairos-Demo, die auf der Computex erstmals vorgestellt wurde, mit einer Reihe neuer Funktionen und der Einbeziehung von ACE-Microservices zu erweitern.
In der neuesten Version von Kairos werden Riva ASR und A2F umfassend eingesetzt, um die Interaktivität der NPCs zu verbessern. Convai's neues Framework erlaubt es den NPCs nun, sich untereinander zu unterhalten und gibt ihnen die Möglichkeit, Objekte zu erkennen, um sie aufzusammeln und an die gewünschten Orte zu bringen. Darüber hinaus erhalten NPCs die Fähigkeit, Spieler zu Zielen zu führen und Welten zu durchqueren.
Die Microservices Audio2Face und Riva Automatic Speech Recognition sind ab sofort verfügbar. Entwickler interaktiver Avatare können die Modelle individuell in ihre Entwicklungspipelines einbinden.
About NVIDIA
Since its founding in 1993, NVIDIA (NASDAQ: NVDA) has been a pioneer in accelerated computing. The company's invention of the GPU in 1999 sparked the growth of the PC gaming market, redefined computer graphics, ignited the era of modern AI and is fueling industrial digitalization across markets. NVIDIA is now a full-stack computing company with data-center-scale offerings that are reshaping industry. More information at https://nvidianews.nvidia.com/.
For further information:
Certain statements in this press release including, but not limited to, statements as to: the benefits, impact, performance, and availability of our products, services, and technologies, including NVIDIA Avatar Cloud Engine (ACE), NVIDIA Audio2Face (A2F), and NVIDIA Riva Automatic Speech Recognition (ASR); generative AI technologies transforming game creation and gameplay; and our collaborations with third parties are forward-looking statements that are subject to risks and uncertainties that could cause results to be materially different than expectations. Important factors that could cause actual results to differ materially include: global economic conditions; our reliance on third parties to manufacture, assemble, package and test our products; the impact of technological development and competition; development of new products and technologies or enhancements to our existing product and technologies; market acceptance of our products or our partners' products; design, manufacturing or software defects; changes in consumer preferences or demands; changes in industry standards and interfaces; unexpected loss of performance of our products or technologies when integrated into systems; as well as other factors detailed from time to time in the most recent reports NVIDIA files with the Securities and Exchange Commission, or SEC, including, but not limited to, its annual report on Form 10-K and quarterly reports on Form 10-Q. Copies of reports filed with the SEC are posted on the company's website and are available from NVIDIA without charge. These forward-looking statements are not guarantees of future performance and speak only as of the date hereof, and, except as required by law, NVIDIA disclaims any obligation to update these forwardlooking statements to reflect future events or circumstances.
© 2024 NVIDIA Corporation. All rights reserved. NVIDIA, the NVIDIA logo,are trademarks and/or registered trademarks of NVIDIA Corporation in the U.S. and other countries. Other company and product names may be trademarks of the respective companies with which they are associated. Features, pricing, availability and specifications are subject to change without notice.