16

Neuer Artikel: Launch-Analyse: AMD Trinity (Mobile) Meldung im Forum kommentieren

Wie angekündigt hat AMD am 15. Mai den ersten Teil seiner neuen Mainstream-Prozessoren auf Basis der Trinity-Architektur mit Bulldozer-Unterbau vorgestellt. Damit löst Trinity die bisherigen Llano-Prozessoren ab, welche AMDs ersten Versuch einer (hochwertigen) Kombination von ausreichender Prozessoren-Power mit (für integrierte Verhältnisse) gutklassiger Grafik-Power darstellen und diesbezüglich durchaus zu überzeugen wussten, auch wenn deren Stand am Markt aufgrund der Übermacht Intels niemals einfach war. Mittels Trinity versucht AMD dieses Konzept weiterzutreiben, indem einfach mehr CPU- und Grafik-Power geliefert wird und damit diese Alles-in-einem-CPUs noch attraktiver gemacht werden sollen.

Nachteiligerweise liefert AMD zum jetzigen Zeitpunkt allerdings nur die Mobile-Modelle aus, welche sich üblicherweise schwerer vergleichen lassen – einmal abgesehen davon, daß von diesen sowieso nur eher schwer ein Schluß auf die Performance der Desktop-Modelle gezogen werden kann. Diese werden für OEM-Bedürfnisse schon im Juni (wahrscheinlich ja nach Verfügbarkeit in der Produktion) ausgeliefert werden, der offizielle Retail-Launch der Desktop-Modelle von Trinity soll dagegen erst im August erfolgen. Zu diesem Zeitpunkt dürften sich diese Desktop-Modelle dann allerdings schon mit den Zweikerner von Intels Ivy Bridge duellieren müssen, muß die ganze Situation dann höchstwahrscheinlich komplett neu betrachtet werden. Daher werden wir uns an dieser Stelle primär darum kümmern, was AMDs Trinity derzeit für den Mobile-Bereich zu bieten hat ... zum Artikel.

16

nVidias GK110-Chip mit 2880 Shader-Einheiten - im Gamer-Bereich aber erst im Jahr 2013 Meldung im Forum kommentieren

Zwar ist nVidia neueste Tesla-Lösung nur auf Basis des GK104-Chips erstellt wurden, dennoch hat nVidia auf seiner GPU Technology Conference nachfolgend dann doch weitere Einzelheiten zum später erscheinenden HighEnd-Chip GK110 bekanntgegeben. Danach verfügt dieser über satte 2880 Shader-Einheiten an einem allerdings weiterhin "nur" 384 Bit DDR breitem Speicherinterface. Dabei scheint nVidia weiterhin die Shader-Cluster der bisherigen Kepler-Chips zu verwenden, da pro Shader-Cluster auch beim GK110-Chip 192 Shader-Einheiten verbaut sind. Dies läßt vermuten, daß es auch beim GK110-Chip die bisher üblichen 16 Textureneinheiten pro Shader-Cluster gibt, der GK110-Chip würde somit auf insgesamt 240 Textureneinheiten kommen. Dieser Punkt ist natürlich noch nicht gänzlich sicher, denn letztlich werden so viele Textureneinheiten heutzutage im Gaming-Bereich nicht wirklich benötigt, im professionellen Bereich schon gar nicht.

    nVidia GK110

  • Chipfläche ~550mm² (in 28nm-Fertigung bei TSMC)
  • 7,1 Milliarden Transistoren
  • DirectX 11.1 Kepler-Architektur
  • augenscheinlich 6 Raster Engines (GPC)
  • 15 Shader-Cluster (SMX) mit je 192 Shader-Einheiten und (wahrscheinlich) 16 TMUs pro SMX
  • 2880 (1D) Shader-Einheiten
  • wahrscheinlich 240 Textureneinheiten (TMUs)
  • wahrscheinlich 48 Raster Operation Units (ROPs)
  • 384 Bit DDR Speicherinterface
  • Speicherbestückung wahrscheinlich 3 GB GDDR5
  • Taktraten derzeit noch unbekannt, aber sicherlich unterhalb des GK104-Niveaus
  • Spiele-Stromverbrauch Richtung 300 Watt
  • Launch im Tesla-Segment im Q4/2012, im GeForce-Segment erst im Q1/2013

Zu den Taktfrequenzen wurde bislang noch gar nichts gesagt, aber diese dürften doch niedriger als beim GK104-Chip ausfallen, da der GK110-Chip ziemlich exakt die doppelte Transistorenmenge aufbietet und daher ein sehr großes Die (~550mm²) ergeben wird. Zudem muß nVidia mit diesem Riesenchip aufpassen, nicht jede TDP-Grenze zu sprengen – selbst die auf dem GK110-basiertenden Tesla-Karten ("Tesla K20") sollen schon eine TDP von 300 Watt ermöglichen, obwohl jene Tesla-Karten nicht mit den vollen 2880 Shader-Einheiten antreten werden. Dieses Schicksal könnte im übrigen auch die Gamer-Lösungen treffen: Angesichts der Größe des Dies kann man generell davon ausgehen, irgendwo einen Produktionsfehler zu haben und damit einen der Shader-Cluster deaktivieren zu müssen, womit der GK110-Chip im Markt womöglich nie mit den vollen 2880 Shader-Einheiten antreten wird.

nVidia Kepler GK110 Die-Shot
nVidia Kepler GK110 Die-Shot
nVidia Kepler GK110 Die-Shot (mit Markierungen)
nVidia Kepler GK110 Die-Shot (mit Markierungen) (© Beyond3D Forum)

Aber auch mit "nur" 2688 Shader-Einheiten (ein Shader-Cluster deaktiviert) auf angenommen 800 MHz Chiptakt würde man einer GeForce GTX 680 mit einem Plus von ca. 39 Prozent bei der Rechen- und Texturierleistung klar davonsegeln, das breitere Speicherinterface dürfte hierzu auch entsprechend beitragen. Eine Gamer-Lösung auf GK110-Basis kann daher derzeit auf mindestens 30 Prozent Mehrleistung gegenüber der GeForce GTX 680 geschätzt werden – potentiell gesehen sogar noch mehr, ja nach Taktraten und Anzahl der freigeschalteten Shader-Einheiten. Einziger Wermutstropfen: Gamer-Lösungen auf GK110-Basis wird es erst Anfang 2013 geben, nachdem nVidia ab dem vierten Quartal mit dem GK110-Chip erst einmal das professionelle Segment beliefern wird. Radeon HD 7970 (eventuell noch in einer "GHz Edition") und GeForce GTX 680 dürften also für dieses Jahr die Top-Modelle der SingleChip-Grafikkarten bleiben, der GK110 ist Gamer-technisch eine Angelegenheit des Jahres 2013.

16

nVidia bringt GeForce GT 610/620/630 (Retail) als weiterhin Fermi-basierte Rebrandings Meldung im Forum kommentieren

Nachdem nVidia sich schon im Mobile-Segment sowie im OEM-Bereich des Desktop-Segments der Rebranding-Strategie bedient hat, um Angebotslücken zu füllen, ist nunmehr leider auch der Retail-Bereich des Desktop-Segments dran: Die nVidia-Seite GeForce.com listet Spezifikationen für GeForce GT 610, GeForce GT 620 sowie GeForce GT 630, sämtlich für den Retail-Handel und nicht für OEM-Bedürfnisse gedacht. Bei allen drei Karten handelt es sich allerdings weiterhin um Fermi-basierte Lösungen: GeForce GT 620 & 630 basieren auf dem GF108-Chip von GeForce GT 430/440 und weisen die nahezu selben Hardware-Spezifikationen und Taktraten auf – die "neue" GeForce GT 630 ist sogar ein exakter Wiedergänger der GeForce GT 440. Die GeForce GT 610 basiert dagegen auf dem GF119-Chip der GeForce GT 520 und bietet exakt deren Hardware-Daten. Alle drei neuen Retail-Karten lassen sich schon in Preisvergleichen finden und dürften mittelfristig das bisherige nVidia-Angebot im Preisbereich von GeForce GT 520, 430 und 440 ablösen.

Retail-Angebot OEM-Angebot
GeForce GT 645 OEM
40nm GF104-Chip (Fermi), 288 Shader-Einheiten, 48 TMUs, 192 Bit DDR Speicherinterface, 776/1552/1914 MHz -> nicht unähnlich einer GeForce GTX 460 SE, aber mit höheren Taktraten und kleinerem Speicherinterface
GeForce GT 640 OEM 192-Bit
40nm GF106-Chip (Fermi), 144 Shader-Einheiten, 24 TMUs, 192 Bit DDR Speicherinterface, 720/1440/900 MHz -> klar langsamer als eine GeForce GTX 550 Ti, da ein Drittel weniger Shader-Einheiten und deutlich weniger Takt
GeForce GT 640 OEM 128-Bit
28nm GK107-Chip (Kepler), 384 Shader-Einheiten, 32 TMUs, 128 Bit DDR Speicherinterface, 797/900 MHz (DDR3) bzw. 950/2500 MHz (GDDR5) -> schwer einschätzbar, da noch keine seriösen Performance-Daten zum GK107 vorliegen
GeForce GT 630
40nm-Chip GF108 (Fermi), 96 Shader-Einheiten, 16 TMUs, 128 Bit DDR Speicherinterface, 810/1620/900 MHz (DDR3) bzw. 810/1620/1600 MHz (GDDR5) -> exakter Wiedergänger der GeForce GT 440
GeForce GT 630 OEM
28nm GK107-Chip (Kepler), 192 Shader-Einheiten, 16 TMUs, 128 Bit DDR Speicherinterface, 875/900 MHz -> schwer einschätzbar, da noch keine seriösen Performance-Daten zum GK107 vorliegen
GeForce GT 620
40nm-Chip GF108 (Fermi), 96 Shader-Einheiten, 16 TMUs, 64 Bit DDR Speicherinterface, 700/1400/900 MHz -> wie die GeForce GT 430, allerdings mit halbiertem Speicherinterface
GeForce GT 620 OEM
40nm GF119-Chip (Fermi), 48 Shader-Einheiten, 8 TMUs, 64 Bit DDR Speicherinterface, 810/1620/900 MHz -> exakter Wiedergänger der GeForce GT 520
GeForce GT 610
40nm GF119-Chip (Fermi), 48 Shader-Einheiten, 8 TMUs, 64 Bit DDR Speicherinterface, 810/1620/900 MHz -> exakter Wiedergänger der GeForce GT 520
GeForce GT 605 OEM
40nm GF119-Chip (Fermi), 48 Shader-Einheiten, 8 TMUs, 64 Bit DDR Speicherinterface, 523/1046/900 MHz -> wie die GeForce GT 520, aber mit deutlich niedrigerem Chiptakt

Richtig problematisch an der ganzen Anlegenheit ist jedoch, daß es zusätzlich noch gleichnamige Karten für das OEM-Segment mit völlig abweichenden Hardware-Spezifikationen gibt: Die GeForce GT 620 OEM ist eine viel kleinere Lösung basierend auf dem GF119-Chip, die GeForce GT 630 OEM dagegen eine Kepler-basierte Lösung mit einem abgespecktem GK107-Chip. Es ist unerklärlich, weshalb es nVidia nicht schafft, wenigstens jeder von der Hardware bzw. den Taktraten her unterschiedlichen Grafikkarte eine extra Nummer zuzuweisen, so daß nicht gerade dieselben Grafikkarten-Namen völlig unterschiedliche Spezifikationen enthalten können. Mit der GeForce GT 640 OEM schafft man es schließlich sogar, drei verschiedene Lösungen basierend auf sogar zwei verschiedenen Chips verschiedener Architekturen unter demselben Namen zu vermarkten.

16

nVidia stellt Tesla K10 für CloudGaming vor Meldung im Forum kommentieren

Breit war darüber gerätselt worden, was nVidia nun mit seiner neuen Tesla-Karte vorstellen wird: Den dafür eigentlich gedachten GK110-Chip – oder doch nur eine Sparlösung auf Basis zweier GK104-Chips. Leider ist es nun doch letztere Auflösung geworden – ein Tesla-Board Namens "K10" mit zwei GK104-Chips und zweimal 4 GB Speicher, eine GeForce GTX 690 2x4GB in Tesla-Verkleidung sozusagen. Die angegebene SinglePrecision-Rechenleistung von nur 4,58 TeraFlops sieht zuerst nach einem Schreibfehler aus, denn dies ergeben nur 745 MHz Chiptakt – allerdings hat diese DualChip-Lösung auch nur eine TDP von 225 bis 250 Watt (laut nVidia je nach Anbieter), was deutlich unterhalb der 300 Watt TDP der GeForce GTX 690 liegt. In diesem Punkt musste nVidia sich wohl an die PCI-Express-Regularien halten, welche keine 8poligen Stromstecker vorsehen und daher die TDP einer PCI-Express-Karte auf maximal 225 Watt begrenzen.

Andererseits darf durchaus die Frage aufgestellt werden, ob man nicht eine ähnliche Rechenleistung mit weit geringerem Aufwand unter Verwendung einer hochgetakteten SingleChip-Lösung hätte erreichen können – eine GeForce GTX 680 auf 1200 MHz Chiptakt würde sich wohl auch noch in diese TDP-Klasse pressen lassen und kommt auf immerhin 3,68 TeraFlops SinglePrecision-Rechenleistung. Die größere Frage ist aber sowieso, wie nVidia mit der äußerst schlechten DoublePrecision-Rechenleistung (nur 1:24 gegenüber SinglePrecision) zurechtkommt – doch augenscheinlich versucht nVidia die neue Tesla-Karte nicht als Lösung für wissenschaftliche Berechnungen, sondern als Lösung für CloudGaming im Rahmen des GeForce Grid Projekts zu positionieren, wo DoublePrecision in der Tat nicht benötigt wird. Mittels den der Tesla K10 spendierten Virtualisierungsfunktionen sollen damit dutzende Gaming-Streams gleichzeitig abgearbeitet werden können.

Diese Lösung ist in jedem Fall effektiver, als die entsprechende Anzahl an Gamer-PCs mit entsprechenden Grafikkarten auszustatten – ob es auch für nVidia umsatztechnisch besser ist, wäre dagegen die eigentliche große Frage. Zwar haben die Tesla-Karten durchaus ihren höheren Preispunkt (1500 bis 2500 Dollar), aber ob dies den Masseverlust an Gamer-Grafikkarten ausgleichen kann, wäre zu bezweifeln. Kurz- und mittelfristig ist hier natürlich noch kein Kannibalisierungseffekt zu befürchten, da "normales" Gaming und CloudGaming erst einmal schlicht nebeneinander her existieren werden – langfristig gesehen ist CloudGaming jedoch die wesentlich effektivere Lösung aus Sicht des Hardware-Einsatzes und kann daher die Umsätze der Grafikchip-Entwickler durchaus abschmelzen lassen.

Noch ist es aber lange nicht so weit und derzeit dürfte CloundGaming aufgrund seiner Nachteile auch kaum ernsthafte Gamer anziehen – einmal abgesehen von der klar unterdurchschnittlichen Grafikqualität gibt es ja immer noch den Punkt der höheren Latenzen. nVidia will in dieser Frage mittels "GeForce Grid" einige Fortschritte erzielt haben, allerdings wird die insgesamte Latenz immer noch mit ca. 150 Millisekunden angegeben – und dies ist im Fall von CloudGaming ja nicht nur die Anzeigelatenz, sondern auch noch die Steuerungslatenz, was jegliche schnelle Spiele ziemlich mühsam bis unmöglich macht. Wenigstens ist die Aussage jener 150 Milisekunden ziemlich ehrlich im Gegensatz zu dem, was OnLive & Co. zu diesem Thema herumfabulieren. Vor wirklich bahnbrechenden Fortschritten in dieser Frage wird CloudGaming kaum die Gruppe der Core-Gamer begeistern können – bei den Causual-Gamern sieht dies naturgemäß anders aus, hier dürfte CloudGaming wohl das nächste große Ding werden.

15

Hardware- und Nachrichten-Links des 15. Mai 2012 Meldung im Forum kommentieren

Expreview vermelden eine erste GeForce GTX 670 mit gleich 4 GB Grafikkartenspeicher seitens EVGA, welche für einen Mehrpreis von ca. 70 Dollar in den Handel gehen soll. Unter normalen Auflösungen bis hinauf zu 2560x1600 8x Multisampling Anti-Aliasing bewegt sich gemäß den bisherigen Testberichten zu diesem Thema (No.1 & No.2) bekannterweise nichts, so daß diese 4GB-Grafikkarte eher nur etwas für Gamer ist, welche Supersampling Anti-Aliasing bis an seine Grenzen treiben wollen. Da aus dieser Ansetzung heraus nur ein sehr überschaubares Zielpublikum resultieren wird, ist leider auch nicht zu erwarten, daß der Mehrpreis der 4GB-Ausführungen von GeForce GTX 670 & 680 demnächst mal auf ein vernünftiges Maß absinken könnte.

15

Wie reagiert Ivy Bridge auf verschiedene Speichermengen und Speichertaktungen? Meldung im Forum kommentieren

Die ComputerBase hat einen hübschen Speichervergleich für Ivy-Bridge-Prozessoren erstellt, welcher aufzeigt, mit welcher Speichersorte man diese neuen Intel-Prozessoren am besten paart. Wie bekannt unterstützte Sandy Bridge offiziell nur DDR3/1333 und Ivy Bridge offiziell nur DDR3/1600, auf vernünftigen Mainboards sind aber natürlich weit höhere Speichertaktungen problemlos betreibbar. Allerdings hatte sich spätestens mit Sandy Bridge schon herausgestellt, daß heutige Prozessoren nicht mehr so stark auf höhere Speichertaktungen reagieren wie früher noch – andererseits wachsen die Software-Anforderungen auch immer mit der vorhandenen Hardware und so lohnt es durchaus, diesen Punkt bei Ivy Bridge erneut zu kontrollieren.

Anwendungen Spiele 640x480 Spiele 1920x1080 Kostenpunkt
4GB DDR3/1066 7-7-7-18 97,1% 87,6% 93,2% ca. 23€
4GB DDR3/1333 7-7-7-20 98,8% 94,8% 98,8% ca. 26€
4GB DDR3/1866 9-9-9-27 99,3% 98,2% 98,9% ca. 30€
4GB DDR3/2133 9-11-9-27 99,7% 100% 100% ca. 42€
8GB DDR3/1333 9-9-9-24 98,6% 91,9% 96,9% ca. 30€
8GB DDR3/1333 7-7-7-20 99,4% 95,2% 97,9% ca. 44€
8GB DDR3/1600 9-9-9-24 100% 97,3% 97,2% ca. 39€
8GB DDR3/1600 8-8-8-24 100% 97,1% 97,9% ca. 45€
16GB DDR3/1333 9-9-9-24 99,1% 93,8% 96,7% ca. 73€

Speziell für die Anwendungs-Performance gibt es wohl wenig zu beachten bezüglich der Speicherauswahl – man könnte für ein Office-System selbst noch DDR3/1066 nehmen, der Nachteil ist marginal, ab DDR3/1333 verschwindet er nahezu gänzlich. Interessant ist daher der Speichertyp wohl nur für ein schnelles Gaming-System, wobei sich hier auch größere aka beachtenswerte Performance-Unterschiede offenbarten: Dabei läßt sich erst einmal klar sagen, daß bezüglich der reinen Performance derzeit immer noch nicht mehr als 4 GB Speicher benötigt werden, von der reinen Performance her zeigten 8 GB und 16 GB überhaupt keinen Ausschlag an. Natürlich kann man mehr als 4 GB Speicher verbauen – dies ist aufgrund der aktuellen Speicherpreise sogar äußerst beliebt – aber dies bleibt eine Luxusanschaffung ohne direkten Performance-Einfluß.

Bei der Speichertaktung zeigten sich im Spieleinesatz dann deutlichere Ausschläge: Zwischen DDR3/1066 und DDR3/2133 liegen unter der CPU-nahen Auflösung von 640x480 immerhin gute 14 Prozent Performance. Allerdings muß man nicht zwingend gleich zum allerschnellsten Speicher greifen (zumindest nicht aus dem Grund der Spiele-Performance), denn DDR3/1866 (-1,8%) und DDR3/1600 CL9 (-2,8%) zeigen doch absolut tolerierbare Performanceabschläge gegenüber DDR3/2133. Selbst DDR3/1333 CL7 liegt nur 5,5% hinter DDR3/2133 zurück, was im Sinne dessen, daß der Speicher ja auch nur Unterstützung für eine bestmögliche CPU-Leistung liefert und eine maximale CPU-Leistung unter Spielen nur eher selten abgefragt wird, sicherlich auch noch gangbar ist. Angesichts der Preislage liegt aber in jedem Fall DDR3/1600 CL9 vorn – ob mit "nur" 4 GB oder gleich 8 GB, sei jedem selbst überlassen.

Inhalt abgleichen