GPUs Pro Reviews Studio Workstations

AMD Radeon AI R9700 aka RX 9070XT in the big workstation graphics card test – What are the benefits of double the memory when working?

The UL Procyon benchmarks for AI are designed to map different real-world workloads. They cover classic computer vision tasks, image generation with stable diffusion and text generation with large language models. The particular value of this suite lies in the fact that identical models are executed using different inference stacks. This makes it clear whether performance advantages come from optimized runtimes, from the hardware itself or simply from available VRAM. This limit is quickly reached in memory-intensive benchmarks, especially for cards with only 8 GB of memory, meaning that measurements are either severely limited or can no longer be carried out at all.

Interfaces and implementations

Windows ML is a generic inference API integrated into Windows. It uses DirectML and distributes operators to the CPU and GPU. The results are stable and manufacturer-independent, but in benchmarks they usually lag behind specialized runtimes. For example, the Intel Arc Pro B50 with Windows ML achieved 527 points in the Vision test, while the RTX A1000 fell behind with 311 points and the W7500 with 238 points. Especially with memory-hungry models such as LLaMA 2, bottlenecks quickly occur with 8 GB cards, making a run impossible.

TensorRT is NVIDIA’s engine for optimized inference, which merges operators and uses GPU memory efficiently. It achieves the best results on RTX cards in many cases, as long as there is enough VRAM available. In the Stable Diffusion test, the RTX A1000 with TensorRT scored 564 points – well ahead of its performance with ONNX Olive, which was only 174 points due to memory bottlenecks. However, with large language models such as LLaMA 2, the memory was no longer sufficient, so the test was aborted.

OpenVINO is Intel’s inference stack, which streamlines models via the Model Optimizer and distributes them to XMX units as well as CPU and GPU. The Arc Pro B50 regularly achieved the best results in the benchmarks: 609 points in Computer Vision FP32, 757 points in Stable Diffusion FP16 and top scores in text generation with Phi 3.5 (2589 points), Mistral 7B (2479 points), LLaMA 3.1 (2446 points) and LLaMA 2 (2402 points). The decisive factor here was not only the optimization, but also the larger VRAM of 16 GB, which made the difference with complex language models.

ONNX Olive optimizes models within the ONNX Runtime and runs vendor-neutral. Olive achieved solid results on the Arc Pro B50, such as 547 points with Stable Diffusion, or 1768 points with Phi 3.5. Compared to OpenVINO, however, the gap remained visible because Olive is more dependent on generic kernels. With the 8 GB models from AMD and NVIDIA, the memory limited the results: the W7500 only achieved 467 points with Stable Diffusion, the RTX A1000 174 points, while more complex language models such as LLaMA 2 could no longer be run at all with NVIDIA. The AMD-optimized ONNX runtime specifically addresses RDNA GPUs, but also remains dependent on memory.

AI Computer Vision FP32

In the area of general AI acceleration based on FP32, the cards show clear differences in the interpretation and calculation pipeline, which are closely related to the respective framework support. The two Radeon models RX 9070XT and AI R9700 use Microsoft ML very efficiently and therefore take the lead. NVIDIA benefits from TensorRT, but falls behind AMD, while Intel delivers solid but not leading values with OpenVINO with limited VRAM. The early limit of the RTX A1000 is striking, as it fails even before the actual computing pipeline due to insufficient memory.

Stable Diffusion 1.5 (FP16)

The calculations in FP16 mode benefit greatly from optimized ONNX implementations of the Radeon cards, which achieve a clear lead here in all variants. AMD’s efficient implementation of the diffusion pipelines via ONNX AMD scales better than TensorRT at NVIDIA and also more clearly than OpenVINO at Intel. The Intel Arc Pro B60 and B50 nevertheless remain respectably in the race and do not fall short of the relevant performance targets, but are more limited by bandwidths and internal memory latencies as the model size increases.

Text generation PHI 3.5

The autoregressive large-language model tasks show a clearly different picture, as Intel shows its greatest strength with OpenVINO. The Arc Pro B60 and B50 take the lead by a wide margin. NVIDIA benefits less clearly from TensorRT in this scenario and has to take a back seat to AMD, as pure matrix multiplications and token throughput are more important here. AMD performs stably in this test, but does not achieve the throughput characteristics of the Intel implementation.

Text generation Mistral 7B

The Mistral 7B model places higher demands on memory organization and parallel matrix processing, which again favours the Arc cards. Intel clearly takes the lead and maintains this position by a wide margin. AMD follows with decent performance, while NVIDIA slips to the back of the pack in TensorRT configurations and is sometimes slowed down by VRAM limits or memory accesses. The very early limit of the RTX A1000, which cannot perform complete model runs due to its low memory, is particularly noticeable.

Text generation LLAMA 3.1

LLAMA 3.1 once again confirms the leading efficiency of the Intel implementation. The Arc Pro B60 achieves a clear top position as the fastest card, followed by the Arc Pro B50. AMD’s cards follow with harmonious but noticeably lower values. NVIDIA is positioned behind both manufacturers, as TensorRT cannot scale as well with this model as it can with CNN-heavy or diffusion workloads. The RTX A1000 and other models with limited memory clearly fall behind in this test.

Text generation LLAMA 2

The order remains largely identical in LLAMA 2, as the requirements and pipeline structure are similarly distributed. Intel once again leads by a wide margin, AMD is positioned in the solid midfield and NVIDIA remains in the second half of the field despite TensorRT optimizations. The memory pressure of this model once again ensures that the small AMD variants reach their limits and cannot fully display the result.

Interim conclusion

The results so far show very clearly how strongly the performance characteristics of the tested GPUs differ from each other in AI workloads and how decisive the respective software and framework optimization is. While AMD takes a leading position in FP16-based diffusion models and classic image generation tasks, the balance of power in autoregressive language models shifts considerably in favor of Intel in some cases. The Arc-Pro models benefit in particular from OpenVINO, which provides a very efficient execution chain in these scenarios and generates an unexpectedly clear dominance in PHI 3.5 as well as in Mistral 7B and LLAMA variants. NVIDIA cannot exploit its strength in the AI ecosystem to the same extent here, as TensorRT is particularly convincing in inference-optimized CNN architectures, but is more limited by memory bandwidth, VRAM capacity and internal scheduling paths in larger autoregressive models.

The performance profile can therefore not be evaluated monolithically. Each manufacturer achieves clear strengths in different areas, but these are not equally transferable to other model classes. AMD impresses with a robust and broad-based FP16 pipeline, Intel demonstrates exceptionally high efficiency in token-based text models and NVIDIA benefits from TensorRT in selected configurations, but remains visibly limited by the VRAM equipment of the smaller professional models. Overall, a very differentiated but at the same time technically consistent picture emerges, which underlines the importance of software stacks and model optimizations in professional AI applications.

Kommentar

Lade neue Kommentare

e
eastcoast_pete

Urgestein

3,083 Kommentare 2,046 Likes

Danke, interessanter und ausführlicher Test!
Das mit der eher dekorativen Backplate bei ziemlich hohen VRAM Temperaturen ist allerdings unschön, und, auch Deiner Analyse nach, wahrscheinlich unnötig. Ist ASRock hier der Ausreißer, und machen das andere Boardpartner besser? Schon etwas schräg, daß ASRock hier nicht die paar Euro oder Dollar für okay brauchbares Putty und einer verrippten Aluminium Backplate zwischen den Sofakissen finden konnte.

Antwort 1 Like

T
Thomas2605

Mitglied

53 Kommentare 30 Likes

Danke an den ausführlichen Test... finde die Karte schon seit der Ankündigung sapnnend da sie für die Leistung im Marktumfeld ja fast "günstig" ist!
Nur schade das sie recht Laut ausgefallen ist!
Meines Wissens gibt es, für die AI Modelle, aber keine zertifizierten Workstation Treiber oder?
Mich wundern auch die guten Werte in Solidworks...vor allem in RealView.
Seit wann kann man das ohne Zertifizierte Treiber überhaupt aktivieren?
Früher mussten wir noch Quadro Mods durchführen damit SW überhaupt einigermaßen lief...:unsure:

Antwort Gefällt mir

RazielNoir

Urgestein

791 Kommentare 384 Likes

Eine 9070XT im Workstation-Gewand.
Bei mehr Speicher und geringfügig mehr Boost-Takt als eine reguläre 9070XT war ja eigentlich zu erwarten, das der Strombedarf mehr als die 300W aus der Werksangabe sein wird. Aber Lautstärke und Wärmeentwicklung ist dann doch eher mau...
Die Frage ist eben wie immer: Welche Software setze ich ein und braucht die die Zertifizierten Treiber?

Antwort 1 Like

Igor Wallossek

1

13,159 Kommentare 26,153 Likes

Doch, ich hab den blauen Treiber genommen, nicht Adrenaline.

Antwort 1 Like

Alkbert

Urgestein

1,311 Kommentare 1,087 Likes

[...] Die Karte durfte ausschließlich im unversehrten Zustand getestet werden, was sowohl eine vollständige Demontage als auch weiterführende Analysen der verbauten Komponenten, der Materialien und der Leiterplattenstruktur ausschließt. [...]

Finde ich aber auch völlig legitim. Ich würde der Konkurrenz auch nicht alle Details VOR der offiziellen Markteinführung auf Igor´s Silbertablett serviert haben wollen.

Antwort 3 Likes

T
Thomas2605

Mitglied

53 Kommentare 30 Likes

Oh Interessant... der ist zwar auf der AMD Seite nicht mit der Karte verlinkt aber die AI PRO ist zumindest als Kompatibel gelistet.
Die 9070XT hatte dann aber den Adrenalin oder? Trotzdem sehr verwunderlich das Sie da mit dem Adrenaline so nah dran ist...
Waren Früher echt welten dazwischen!

View image at the forums

Antwort Gefällt mir

Igor Wallossek

1

13,159 Kommentare 26,153 Likes

Die gibts doch schon offiziell, auch in Shops, zu kaufen.

Antwort 1 Like

J
Joseph Mutzenbacher

Mitglied

28 Kommentare 13 Likes

Schon lustig eigentlich, was heutzutage noch alles als Karte durchgeht.. :p

Bis vor einem halben Jahr habe ich noch mit einer passiven hd5450 gewerkelt, vermutlich habe ich etwas an Entwicklung versäumt, lol. Langsam könnten die Grafikkarten-Hersteller aber umdenken und ein noch größeres Gehäuse verwenden, dann könnte man den Rest da reinbasteln.

Antwort Gefällt mir

T
Thomas2605

Mitglied

53 Kommentare 30 Likes

Wobei die hier gezeigt Karte ja eher noch "kompakt" ist...

Antwort 1 Like

P
Pokerclock

Urgestein

978 Kommentare 959 Likes

Die Grafikkarte kann seit Wochen frei bestellt werden. U.a. auch für SI wie Krotus Computer. Woher die Karte stammt und was die danach machen, sei mal dahingestellt. Würde ich böse sein wollen, so müsste ich sagen, dass die Karte in einer Workstation landet und verkauft wird. Ob als Neuware oder nicht, wird wohl kaum einer hinterfragen in der Erwartung Ersteres zu erhalten. In den kommenden Monaten ist ein 1000er mehr oder weniger sehr essenziell für die kleineren PC-Schrauberbuden.

Ganz ehrlich, entweder man stellt Dinge vollumfänglich zur Verfügung oder lässt es eben sein. Wenn man seine Firma nicht genannt haben möchte, dann heißt es halt "aus der Community". Aber dann hat man halt nicht einmal den geringsten Werbeeffekt zum Mitnehmen. Tja, blöd was?

Ich sehe schon, dass ich beim nächsten Mal wieder einspringe, dann bekommt man als Tester wenigstens keine einschränkenden Bedingungen diktiert und die Leser nur das Halbe vom Ganzen dank SI-Geiz.

Antwort Gefällt mir

Igor Wallossek

1

13,159 Kommentare 26,153 Likes

Ich versuche, eine von Sapphire zu bekommen. Die hat garantiert eine leisere Kühlung und läuft auch nicht ins thermische Limit. Und Sapphire lässt mich auch alles zerlegen. Das hat bisher noch keiner verboten.

Aber für alle AMD'ler: Mitwoch ist dann der Big-Bang-Nachmittag ;)

Antwort 2 Likes

e
eastcoast_pete

Urgestein

3,083 Kommentare 2,046 Likes

Auch weil die Intel Pro GPUs einigermaßen gute Leistungen hingelegt haben (wer hätte das noch vor einem Jahr gedacht?), fand ich die heutige Meldung, daß die B31 A.K.A. "große Battlemage" jetzt doch erscheinen soll interessant. Spekulatius meinerseits: die B31 wird, wenn überhaupt, v.a. als professionelle GPU gelauncht. Einfacher Grund: man kann für "Pro" GPUs höhere Preise verlangen. Außerdem würde sich so auch die Arbeit lohnen, die Intels Grafik Abteilung in die Treiber für Anwendungen gesteckt hat.
Wär doch interessant, wenn AMD und Intel im Mittelklasse "Pro" Segment Nvidia vom Sockel schubsen würden 😄.

Antwort 1 Like

Igor Wallossek

1

13,159 Kommentare 26,153 Likes

Mit FSR4 hat AMD mittlerweile mehr als nur ein heißes Eisen im Feuer. Das wird noch spannend, wenn NV sich noch weiter ausruht. Teaser... ;)

Antwort 3 Likes

e
eastcoast_pete

Urgestein

3,083 Kommentare 2,046 Likes

Ein guter Tritt in den Grafik-Hintern macht müde Jensens munter😁!
Im Ernst, gerade Häuptling Noch 'ne Neue Lederjacke ist ja sehr bekannt dafür, daß er es überhaupt nicht mag, wenn Nvidia irgendwo Marktanteile und Vergleichstests verliert.

Antwort Gefällt mir

M
Mudsee

Veteran

156 Kommentare 103 Likes

Nun sich ausruhen, denken man ist unaufholsam weit vorne usw. das ist bei so vielen Firmen/ Organisationen usw. die Hybris
Siehe Unterhaltungsmedien ala Grundig usw., Autos wie VW, Tesla, CPU siehe Intel.

Und darum ist es ja auch so wichtig das es Konkurrenz/ Alternativen gibt, denn damit schreitet die Innovation voran. Und Ja das mit Intel ein dritter dabei ist, finde ich gut und auch wie Schritt für Schritt sie an dem Platzhirsch herankommen bzw. schon eingeholt haben.

Und Danke für den Test, und ja das nicht aufmachen und so schon zu merkenden "Wärmeprobleme" gibt mir so das Gefühl von Geschmäckle, als ob sie von der "Macke " was wüssten.
Und der Test zeigt aber auch wunderbar das man eigentlich 3 Karten bräuchte, wenn man diese Bandbreite an Programmen verwendet. Denn es zeigt sich ja echt gut welche Karte wo welche Stärken hat und man sich wenn benötigt vorher auch Gedanken darüber machen sollte. Und so was ist gerade im Produktiven Bereich nicht unerheblich.

Antwort Gefällt mir

Igor Wallossek

1

13,159 Kommentare 26,153 Likes

Wenn ich Solidworks im normalen Umfeld nutzen müsste, würde ich mir definitiv eine AMD-Karte in den PC stecken. Die B60 ist gnadenlos unterschätzt, aber da muss intel noch mal an die Treiber und Zertifizierungen ran. Ansonsten sind die Teile durchaus Alternativen.

Antwort Gefällt mir

Metallsonic

Veteran

392 Kommentare 32 Likes

Hi lieber Igor,

welchen Treiber meinst du du genau?
Ich habe mir diese Karte von Gigabyte gekauft.
Ich habe es satt Speichermangel zu haben.
Und nutze diese Karte dann zum spielen.
Auch wenn die Bandbreite eher Durchschnittlich ist.

Man muss 32 GB VRAM erst einmal voll bekommen.
3500 € für eine RTX 5090 sah ich als wahnsinig und verrückt an.
Zudem glaube ich das die Preise der Ai 9700 Pro noch steigen werden.

Ich hätte gerne Fotos von der PCB gesehen.

Ist es technisch möglich auf meiner 9700 ai pro von Gigabyte das Bios einer Gigabyte RX 9070 XT drauf zu flashen?🤔

Immerhin ist der Chip beider Karten identisch.

Antwort Gefällt mir

Metallsonic

Veteran

392 Kommentare 32 Likes

🥵
Wegen der Thermik, werde ich mir dann Kupfer Ramkühler besorgen, Dicke 2,5 mm.
So das alle Rams damit bestückt sind.
Entweder ein sehr großes Wärmeleitpad was in etwa so gross wie die gesamte Backplplate ist, oder ich stopfe richtig viel Thermamalpudding hinein habe genug davon da.

Antwort Gefällt mir

RazielNoir

Urgestein

791 Kommentare 384 Likes

Frage an die Profis:

Wenn ich in einem WS-System 2 oder mehrere Grafikkarten mit jeweils 2 angeschlossenem Monitor betreibe, benötige ich dann zwingend sowas wie Nvidia Sync (II) für die Syncronisierte-Darstellung der Monitore als 1 Großen über Mosaic? Gibt's was vergleichbares bei AMD oder funktioniert das Sync out of the Box?

Antwort Gefällt mir

Danke für die Spende



Du fandest, der Beitrag war interessant und möchtest uns unterstützen? Klasse!

Hier erfährst Du, wie: Hier spenden.

Hier kannst Du per PayPal spenden.

About the author

Igor Wallossek

Editor-in-chief and name-giver of igor'sLAB as the content successor of Tom's Hardware Germany, whose license was returned in June 2019 in order to better meet the qualitative demands of web content and challenges of new media such as YouTube with its own channel.

Computer nerd since 1983, audio freak since 1979 and pretty much open to anything with a plug or battery for over 50 years.

Follow Igor:
YouTube Facebook Instagram Twitter

Werbung

Werbung