NVIDIA bietet ab sofort Version 6 seiner CUDA-Architektur für parallele Berechnungen als kostenlosen Download auf der CUDA-Website für Entwickler an. Die neue Version wurde in allen Bereichen verbessert
Die Versions-Highlights im Überblick:
- Unified Memory – Die wichtigste Neuerung ermöglicht CUDA-Applikationen den Zugriff auf CPU und GPU, ohne dass Daten manuell hin und her kopiert werden müssen. Dies bringt eine enorme Zeitersparnis mit sich und macht es Programmierern einfacher, GPU-Beschleunigung in Applikationen zu integrieren.
- Drop-in Libraries – Ermöglichen einfaches Beschleunigen von Applikationen bis zum Faktor 8x. Die neuen Drop-in Libraries beschleunigen automatisch BLAS- und FFTW-Kalkulationen, indem sie existierende CPU-only BLAS oder FFTW Libraries durch neue, GPU-beschleunigte Äquivalente ersetzen.
- Multi-GPU Scaling – Re-designte BLAS und FFT GPU Libraries skalieren Leistung automatisch über bis zu acht GPUs in einer einzelnen Node. Dadurch erhält eine Node bis zu neun Teraflops Double-Precision-Rechenleistung und unterstützt größere Workloads als je zuvor (bis zu 512GB).