|
Az AMD újitásai
A múlt héten felvázoltuk a PC-s processzorkínálat jelenlegi helyzetét, ezért most úgy illik, hogy a hozzájuk való chipkészletekkel és alaplapokkal folytassuk. Hogy ne legyen vita abból, melyik gyártóval kezdünk, ma néhány inteles újdonságot mutatunk be, és részletesebben kivesézzük az AMD-s felhozatalt.
Néhány hete két újabb, Fatal1ty nevével fémjelzett Abit alaplap érkezett meg hozzánk. Az FP-IN9 SLI – ahogyan a nevéből is sejteni lehet – az NVIDIA nForce 600i sorozatú chipkészleteinek egyikére, mégpedig az nForce 650i SLI-re épül. Az NVIDIA két videokártyás technológiája ebben az esetben kétszer 8 sávot biztosít a megfelelő GeForce-oknak. Az nForce 650i egyik nagy előnye, hogy még mindig két IDE csatornája van, tehát négy IDE eszközt lehet rákötni, amit még négy SATA egészít ki. A lapon nyolccsatornás hangkodek és egy gigabites hálózati vezérlő van, FireWire nincs. A Fatal1ty termékeknél megszokhattuk már a fekete-piros színvilágot. A mai trenddel ellentétben a FP-IN9 SLI-n egy fia heat-pipe sincs; szerintünk ez egyáltalán nem baj. Az nForce 650i-s alaplapok nem túl drágák, a fatális változat ára 32 300 forint.

Érdekes vegyület az Abit Fatal1ty F-I90HD. Intel processzorok mennek bele, de a chipkészlet, amely alattuk dolgozik, az AMD-től származik. Az ATI Radeon Xpress 1250-ről van szó, melynek AMD processzorok mellé szánt párját 690G-nek hívják. Nemrégiben AMD platformon teszteltük ezt az integrált GPU-s megoldást, melynek fő specialitása, hogy HDMI kimenetet is kezel. Az F-I90HD érdekessége, hogy az első microATX formátumú Fatal1ty lap. Megtartotta a klasszikus színezést, de a 80 nm-es csíkszélességgel készülő chipkészleten sincs heat-pipe. A processzor tápfeszültségét szilárdelektrolitos kondenzátorok segítségével állítják elő. A négy memóriafoglalatba összesen 16 GB memóriát telepíthetünk. A kis méret miatt csak egy hosszú és két rövid PCI Express, valamint egy hagyományos PCI aljzat várja a bővítőkártyákat. A hangrendszer nyolccsatornás, a hálózat gigabites, de FireWire itt sincs. Az elsősorban HTPC felhasználásra ajánlott exkluzív Abit lap vételára 28 900 Ft.

Az Albatron jóvoltából újabb, eddig hiányzó chipkészlet érkezett a hazai piacra. Az nForce 650i Ultra alulról bővíti az nForce 600i kínálatot. Lényegében megegyezik a 650i SLI-vel, csak a két videokártyás lehetőséget hagyták el. Az Albatron NF 650i Ultra minden bizonnyal az NVIDIA referenciatervére épül. Érdekes, hogy a déli hídra csupán két IDE eszközt (egy csatorna) köthetünk, holott az SLI-s lapnál még négy volt. Minden bizonnyal ezen a lapon is az eredetileg négy ilyen meghajtót kezelő nForce 430-as déli híd van, csak költségkímélés miatt hagyták le a második csatlakozót. Azért az egy IDE csatorna és a négy SATA port elég szokott lenni, ahogyan az egyetlen gigabites hálózati vezérlő és a nyolccsatornás hangkodek is. Az egyszerű Albatronért csupán 26 400 forintot kell fizetni. Aki valamivel komolyabbra vágyik, az 48 000 forint környékén megveheti az Albatron NF 680i LT SLI-t vagy 63 000 forintért a Albatron NF 680i SLI-t.

Az AMD AM2-es foglalatba illeszkedő processzorainak bevezetésével egy időben az ATI és az NVIDIA is újdonságokat jelentett be; az ATI a hosszú idő óta várt SB600-as déli híddal lepte meg a közönséget, az NVIDIA pedig egy teljes termékcsaláddal (nForce 500 széria) bővítette kínálatát, elvégre egy új chipset bemutatására egy új processzor bejelentése a legjobb időpont.
Az NVIDIA az nForce 500 családban ismét egy sor újítást eszközölt. Erre szükség is volt, hiszen az Athlon 64 processzorokban található memóriavezérlő következménye, hogy a chipsetek ezen a platformon már csak extráikkal tudnak ellenfeleik fölé nőni. Az nForce 500 nem túl meglepő módon rengeteg ponton az nForce4 család vonásait hordozza magán, és csak a legigényesebbek számára lesz feltűnő az a néhány plusz funkció, melyek az új lapkakészletcsaládot (azon belül is a csúcsmodellt) megkülönböztetik az előző generációtól. Összegezve az nForce 500-as sorozat lényegében felturbózott nForce4, mely négy tagot számlál; a csúcskategóriát az nForce 590 SLI névre keresztelt chipset képviseli, mely 2 x 16 PCIe sávot kínál fel két VGA számára. Az SLI-támogatással felvértezett felsőkategóriában az nForce 570 SLI indul a csatába, mely funkcionalitás szempontjából pár ponton eltér a nagyobbik bátyótól, és csak 2 x 8 PCIe sávval rendelkezik a grafikus alrendszer. Az nForce 570 Ultra az SLI utótaggal ellátott felsőkategóriás chipset egychipes változata, mely nem támogatja az SLI-t, az nForce 550 pedig a középkategória számára lett kifejlesztve, ez a „legbutább” lapka. Kicsit visszatekintve a chipsettörténelemben: nForce4-ből létezik SLI x16, SLI, Ultra és nForce4-4x, kísérteties a hasonlóság.
| Chipset |
NVIDIA nForce4 SLI X16
| NVIDIA nForce 590 SLI
| NVIDIA nForce 570 SLI
| NVIDIA nForce 570 Ultra
| NVIDIA nForce 550 |
| Processzortámogatás |
AMD Athlon 64 X2, AMD Athlon 64, Athlon 64 FX és AMD Sempron processzorok |
| HyperTransport |
1000 MHz |
| Foglalat |
Socket 939 |
Socket AM2 |
| Memóriatípus |
DDR400 |
DDR2-800 / DDR2-667 / DDR2-533 |
| Maximális memóriakapacitás |
4 GB |
8 GB |
| PCI Express sávok |
38 |
46 |
28 |
20 |
| PCI Express linkek száma |
8 |
9 |
6 |
5 |
5 |
| SLI |
igen (2x16) |
igen (2x8) |
nem |
| NVIDIA LinkBoost |
nem támogatott |
támogatva |
nem támogatott |
| NVIDIA FirstPacket |
nem támogatott |
támogatva |
nem támogatott |
| NVIDIA DualNet |
nem támogatott |
támogatva |
nem támogatott |
| natív Gigabit Ethernet |
2 (külső chippel) |
2 |
1 |
| Port Teaming |
nem támogatott |
támogatva |
nem támogatott |
| TCP/IP Acceleration |
támogatva (ActiveArmor) |
támogatva |
nem támogatott |
| NVIDIA MediaShield |
támogatva |
| SATA/PATA eszközök |
4/4 |
6/2 |
4/2 |
| NVIDIA RAID |
0, 1, 0+1 |
0, 1, 0+1, 5 |
0, 1, 0+1 |
| USB-portok száma |
10 |
| Integrált audio |
AC'97 |
HDA (Azalia) |
Lássuk az újításokat. Az nForce 590 SLI privilégiuma a LinkBoost funkció; ha a chipset egy vagy több, a technológiát támogató grafikus kártya jelenlétét érzékeli (az első ilyen típus a GeForce 7900 GTX), akkor automatikusan megnöveli 25 százalékkal a PCI Express busz és a chipset két tagja közötti HyperTransport link sebességét, ami egy SLI-konfigurációnál már jól jöhet. A gyakorlatban nem valószínű, hogy érezhető gyorsulást eredményezne, de papíron persze jól mutat.
A DualNet címszó két beépített Gigabit Ethernet közeghozzáférés-vezérlőt (MAC) takar, melyek képesek a port teaming néven is ismert linkaggregációra. Ez lehetővé teszi, hogy a két fizikai interfész egymástól függetlenül, külön IP címmel működjön, de módot ad arra is (ha a túloldali eszköz ezt támogatja), hogy egyetlen IP címen, sávszélességüket összeadva dolgozzanak. A vezérlő mindeközben terhelésmegosztást végez, és ha az egyik link megszakadna, a forgalmat automatikusan a másik portra irányítja. És ez még korántsem minden: a chipsetek (az nForce 550-et kivéve) TCP/IP gyorsítót is tartalmaznak, amely bizonyos műveleteket (a már meglévő TCP-kapcsolatok azonosítását, az ACK csomagok kezelését és a csomag ellenőrző összegének [checksum] számítását) önállóan, a CPU igénybevétele nélkül képes elvégezni. Az intelligens vezérlő nemcsak a rendszerterhelés csökkentésében segédkezik, hanem a kimenő adatforgalom zökkenőmentes lebonyolításában is, így például előnyben részesítheti játékok csomagjait egy FTP alkalmazáshoz tartozó adatokkal szemben; a First Packet technológiát is csak az nForce 550 kénytelen nélkülözni.
Az nForce 500 család tagjai mindezeken felül több SATA-eszköz csatlakoztatását teszik lehetővé, és az IDE-vezérlő már támogatja a RAID 5-öt is. Az USB-portok száma nem nőtt tovább, viszont a chipsetek immár High Definition Audio (Azalia) támogatással lettek felvértezve. Csak az nForce 500-as alaplapok támogatják az nTune 4.0 szoftvert, mellyel Windows alatt lehetőség nyílik a rendszer igen aprólékos túlhajtására, finomhangolására.
| Chipset / északi híd |
NVIDIA nForce 590 SLI
| ATI CrossFire Xpress 3200 |
| Blokkdiagramm |
 |
 |
| Északi és déli híd megnevezése |
NVIDIA MCP55XE és C51XE |
ATI RD580 és SB600 |
| Északi és déli hidat összekötő link |
16 bites, 1 GHz-es HyperTransport link (8 GB/s) |
Négy PCI Express x1 sáv (2000 MB/s) A-Link Xpress II |
| Déli híd |
NVIDIA nForce 590 SPP |
ATI SB600 |
| Integrált hang |
- NVIDIA nForce média- és kommunikációs processzor (MCP) - High Definition Audio |
- Intel HD Audio-kompatibilis vezérlő |
| Integrált hálózati vezérlő |
- 2 db 10/100/1000 Gigabit Ethernet - NVIDIA hardveres tűzfal és ActiveArmor) |
- nincs (külső MAC-en keresztül 10/100/1000 Mbit Ethernet) |
| Serial / Parallel ATA / RAID |
- Két Parallel ATA 33/66/100/133, illetve hat SATA300-eszköz támogatása RAID 0, 1, 0+1 és 5 támogatással, ezeket kombinálva is. Native Command Queuing (NCQ) támogatva. (Összesen 2 PATA-meghajtó és 6 SATA-meghajtó) |
- Két Parallel ATA 33/66/100/133, illetve négy SATA300-eszköz támogatása RAID 0, 1, 0+1 és 5 támogatással. Native Command Queuing (NCQ) támogatva. (Összesen 2 PATA-meghajtó és 4 SATA-meghajtó) |
| USB |
10 port |
10 port |
Gyártó honlapja Termék leírása |
- NVIDIA - nForce 500 |
- ATI - Radeon CrossFire Xpress 3200 |
Az ATI az NVIDIA-val egyidőben mutatta be a CrossFire Xpress 3200 chipset AM2-es variánsát, melyhez az igen régóta várt ATI SB600-as déli híd párosult. Igazság szerint az „új” chipkészlet csak emiatt számít újdonságnak, az északi hidat korábban már be is mutattuk. A direkt az X1900-as kártyák kiszolgálására kifejlesztett (ettől függetlenül persze ennél lassabb ATI kártyákkal is működő) CrossFire chipset jól szerepelt, de már akkor tudni lehetett, hogy az ATI a déli híd kérdésében lépéskényszerbe került, mivel az NVIDIA felvásárolta az ULI-t, az ATI chipsetek déli hídjait szállító partnerét. Az ATI az RD580 kódnéven futó északi hidat nem véletlenül fejlesztette igen rugalmasan kezelhetővé, PCI Express sávok felhasználásával tetszőleges, szintén PCI Express sávon keresztül kommunikáló déli híddal párosítható (A-Link Express II), így egy déli híd cseréje egyáltalán nem fájdalmas a gyártó számára. Az SB600 azzal a nem titkolt szándékkal jelent meg, hogy az SB400, majd az SB450-es I/O-vezérlők (az USB-vezérlő gyengesége miatti) igen csúfos szereplésén, és ezáltal az ATI chipkészletek romló renoméján valamit javítson.
Az SB600 tíz USB 2.0 porttal szolgál, hasonlóan az nForce 500-as család tagjaihoz. A déli híd két Parallel ATA és négy Serial ATA eszköz csatlakozását teszi lehetővé (tehát egy PATA csatorna van), itt lemaradásban van az nForce-hoz képest, ugyanakkor támogatja a RAID 0, 1, 0+1 és 5 módokat, az NCQ-t, és mind IDE, mind AHCI üzemmódban működhet; itt egál az állás. A hálózati vezérlő kérdését az ATI továbbra is az alaplapgyártókra bízza, ezzel a költségcsökkentés a kanadaiak célja, hiszen egy PCIe x1 sáv által nyújtott sávszélesség bőven elegendő egy gigabites hálózati vezérlő adatforgalmának lebonyolításához. Ugyanakkor az audiovezérlő kompatibilis az Intel-féle HDA Audióval.
Az ATI a játékgépek számára a CrossFire Xpress 3200-at kínálja, mint 2 x 16 PCIe-sávot támogató északi hidat. A CrossFire Xpress 1600, mely csak 2 x 8 PCIe-sávval rendelkezik, szintén a játékgépek szíve lehet, de olcsóbb alaplapokon kap helyet, míg belépőszinten az integrált grafikus vezérlővel felszerelt Radeon Xpress 1100 és 1150 lapkák állnak az érdeklődés középpontjában.
Összegezve az elmondottakat, az nForce 500-as chipsetek a funkcionalitást tekintve előrébb járnak az ATI Xpressnél, ugyanakkor egy átlagos felhasználó számára teljesen megfelelő lehet egy ATI chipkészlettel felszerelt alaplap is, a kérdés inkább az, hogy melyikhez milyen áron jutunk hozzá, és mely funkciókra van szükségünk a mindennapi használat során. Mert például nem tartjuk valószínűnek, hogy túl sok embernek van szüksége otthon két gigabites hálózati vezérlőre, hat SATA-portra vagy egyáltalán az SLI/CrossFire-kiépíthetőségre.
Nos, az elmúlt kb. egy hét folyamán kiderült, hogy az AMD új generációs desktop processzorának a neve Phenom lesz. Tipikus AMD-s név, jól beilleszkedik a sorba. Másik hír a hétről hogy Charlie Demerjian az Inquirer-en írta, hogy a B0 steppingje az új processzornak nagyon jól sikerült, a tervezők a B0 gyártásból történő visszajövetele után "táncoltak" és "nagyon-nagyon boldolgok" voltak. A hír szerint kb. 500 MHz-et nyertek az órajelen, így várhatóan a 4-magos desktop processzor 2.5, 2.7 és 2.9 GHz-en fog megjelenni valamikor év vége felé.
A harmadik hír az AMD-vel kapcsolatban az, hogy úgy néz ki, hogy a borzalmas 4. negyedév és a tragikus 1. negyedév után egy szimplán csak nagyon rossz 2. negyedéve lesz a cégnek. Úgy tűnik, hogy a cégek év vége felé (vélhetőleg a 3. negyedév folyamán) túl sok készletet halmoztak fel AMD processzorokból és ezeket nem tudták egész mostanáig eladni. Az azóta eltelt időszakban nagyon keveset rendeltek, emiatt az AMD bevétele nagyon alacsony volt, ami aztán nagy veszteséget produkált. Mostanra viszont a készletek kiürültek, így megindultak a rendelések és ebben a negyedévben - legalábbis a processzor üzletágnál - kisebb veszteségre lehet számítani.
Táborverés a szerverfronton
Van ez a hír, ami szerint az IBM Power 7 kompatibilis lesz az Opteron foglalatával, azaz fizikailag bele lehet helyezni majd egy Opteronos foglalatba. Persze nem valószínű, hogy ez minden Power 7-re igaz lesz, szinte biztos, hogy csak az alsóbb szerverkategóriákba szánt verziók lesznek ilyenek. Miért jó ez az IBM-nek? Egyszerű: csökkenti a költségeket és a szerverek tervezési és validálási idejét. Ráadásul a hírek szerint a SUN is tervezi, hogy jövőbeli processzorainak legalább egy része szintén Opteron-foglalat kompatibilis lesz.
Mikor lesz ebből valami? Nos, biztos nem az elkövetkező 1-2 évben. A Power 6 idén nyáron jelenik meg 65 nm-en, a Power 6+ valamikor 2008 végén várható 45 nm-en, míg a Power 7 2010 folyamán fog valamikor érkezni (de lehet, hogy átcsúszik 2011-re). Tehát legalább 1200-at kell aludnunk, míg ez bekövetkezik. A SUN-nál is hasonló időt kell kivárni, bár ott talán már kicsit korábban is várható fejlemény. Az biztos tehát, hogy ez nem a jelenlegi 1207 tűs foglalatba fog illeszkedni, hanem valamilyen jövőbeli még nem ismert verzióba.
De eközben az Intel sem tétovázik. Az Itanium és a Xeon sorozat szintén közös foglalatot és buszrendszert kap valamikor 2008/2009 folyamán. Ezzel szeretnék megkönnyíteni az Itanium lefelé történő elterjesztését és több - elsősorban kis - szervergyártót rávenni Itanium szerverek gyártására és forgalmazására. Hogy vajon a végén csak két platform marad-e állva, az még egyelőre egyáltalán nem letisztázott.
Az Inquirer információkat közölt a Barcelona chip (K10, régebbi nevén K8L) fogyasztáscsökkentő képességeiről. Az első és egyik legfontosabb újítása a K10-nek, hogy mind a 4 (illetve 2 a kétmagos verzióban) processzormag frekvenciája külön-külön állítható egymástól függetlenül. Így könnyen elképzelhető, hogy ha egyszálú, de nagy terhelést jelentő program fut a 4 magos processzoron (pl. egy több magra nem optimalizált játékprogram), akkor egy mag maximális órajelen, a többi pedig mondjuk csak 1 GHz-en fut, sőt akár le is állíthatja a nem használt magokat. A magok tápfeszültsége nem állítható függetlenül, emiatt az órajel skálázódásból jövő energiamegtakarítás nem akkora, mint amennyi lehetne. A memóriavezérlő kétféleképpen képes energiát spórolni, egyrészt a feszültsége a processzor többi részétől függetlenül állítható (korábbi hírek szerint, de ebben a hírben ez nem szerepel), másrészt képes lekapcsolni az olvasási vagy az írási csatornát attól függően, hogy melyik nem használt éppen. Ha tehát a memóriából csak olvas a processzor, akkor lekapcsolja az írási csatornát és persze fordítva is igaz ez.
A K10 chip mindezeken felül képes kisebb és nagyobb nem használt tranzisztorcsoportokat lekapcsolni, amivel jelentős mennyiségű energia spórolható meg. A kis méretű tranzisztorcsoportok lekapcsolásáért felelős rész agresszíven szabályoz, azaz gyakran avatkozik közbe, míg a nagy területek lekapcsolásáért felelős áramkör kevésbé agresszívra van hangolva. További újdonság, hogy eddig a PowerNow üzemmódok bekapcsolásáért az operációs rendszer volt felelős, mostantól ezt a chip végzi, így akkor is spórolja az energiát, ha mi azt nem állítjuk be a BIOS-ban.
A triviális kérdésre, miszerint hol lesz ennek nagy haszna, triviális a válasz is: a laptopoknál. Az AMD-nek végre tényleg energiatakarékos chipjei lesznek, amellyel eredményesebben tudja felvenni a versenyt az Intel megoldásával. A proceszorok TDP-je nem fog csökkenni ezektől az új képességektől, viszont az átlagfogyasztása igen. Az Intel mobil chipjei épp ebben voltak jók: maximális fogyasztásban nem voltak lényegesen jobbak az AMD-nél, az átlagfogyasztásuk azonban sokkal jobb volt.
Más téma, de szintén K10. Az L1 cache méretéről továbbra is találgatások folynak. Egy eredeti tavaly júniusi AMD-s prezentációban még 64 kbyte L1 cache szerepelt, amit sokan úgy értelmeztek, hogy 2x32 kbyte. Ez fele akkora, mint a jelenlegi Athlon64 és Opteron processzorokban lévő 2x64 kbyte (adat- és utasítás cache). Ezután azonban kvázi közmegegyezés született arról, hogy ez elírás lehet és nem csökkent a mérete. A legújabb pletykák szerint azonban az L1 cache késleltetése 3 ciklusról 2 ciklusra csökken a K10-ben, és ennek elérése változatlan cache méret esetén nagyon erősen kétséges. Két scenárió tűnik reálisnak: vagy csökken a késleltetés is, de akkor csökken a méret is, vagy pedig marad a méret, de akkor nem csökken a késleltetés.
Több minden szól amellett, hogy az első verzió igaz. Először is a prezentációban fele akkora méret szerepelt, ami ugyan lehet elírás, de ennek kisebb az esélye. A másik pedig az, hogy a lépés logikusnak tűnik. Ha az L1 cache késleltetése csökken egy órajellel, akkor az L2 és az L3 cache (sőt, a memória) hozzáférésének ideje is csökken ugyanennyivel, mivel először mindig az L1 cache-ben keresi az adatott a processzor (aztán az L2-, majd az L3 cache-ben és csak végül a memóriában). A K8-nál nincs L3 cache, így annak hozzáférését sem csökkentette ez, tehát eggyel kevesebb helyen számított, így itt még jobban megérhette a nagyobb L1 cache. Ráadásul az L3 cache miatt az L2 cache maximális méretét levihette (és le is vitte) az AMD 1 megabájtról 512 kbyte-ra. Emiatt az L2 késleltetése is csökkent, legalábbis a legújabb infók szerint. Így a Barcelona cache felépítése sokat gyorsult a K8-hoz képest. Az L2 cache tudtommal jelenleg 12 és 17 között változó késleletetéssel dolgozik (a K8-ban), a Barcelonánál ez szerintem akár 10-14 között változóra is levihető (beleszámítva az L1 cache-t is). Persze van egy fontos megjegyzendő ehhez a verzióhoz: az L1 cache méretének lecsökkentése nagy hatással van a processzor magjának felépítésére, így a Barcelona e szerint tényleg alaposan átdolgozott K8 lesz. Ezt amúgy az AMD is kijelentette, ők a K10-et új chipnek számolják, hasonlóan a K7->K8 (magyarán az Athlon -> Athlon64) váltáshoz.
K8L teljesítmény előrejelzés
Vajon mire lesz elég a felkelők titkos fegyvere a Halálcsillag ellen? A tavalyi év legnagyobb durranása processzorfronton egyértelműen a Core 2 volt, ezzel a processzorral az Intel egy csapásra visszavette a teljesítményelsőséget az AMD-től. 2007 legnagyobb durranása viszont kétségtelenül a K8L lesz (vagy ahogy mostanában az AMD hívja: Star - amúgy a K8L elnevezést az AMD soha nem használta, azt állítólag az Intel találta ki), ez az amivel az AMD-nek vissza kell vágnia az Intelnek és meg kell állítania a piaci térvesztést. A cikk két részből fog állni, az elején az órajelekről fogok értekezni, a második felében pedig az egy órajelre eső teljesítményről (IPC), ami a processzor hatékonyságát mutatja meg, a kettő együtt meg a várható teljesítményét. Akiket érdekel az Intel és az AMD jövőbeli terveik, azok nézzenek rá a régebbi blogbejegyzéseimre (itt, itt és itt).
Sokan temették az AMD-t amikor megjelentek az első 65 nm-es processzoraik, mivel azok nem hoztak túl nagy újdonságot a 90 nm-es verziókhoz képest. A processzor hőtermelése sem csökkent a várható mértékben, a teljesítménye - még ha minimálisan is -, de kisebb lett azonos órajelen, az L2 cache késleltetése is megnőtt minimálisan, ráadásul még a lapkák mérete sem csökkent a kisebb gyártástechnológiának köszönhetően az elvárt mértékben. Amikor az AMD bevezette a 90 nm-es processzorait 2004 végén, akkor a processzorok fogyasztása drámaian kisebb lett és méretük is nagy mértékben csökkent. Vajon most miért nem sikerült ez?
Az ok egyszerű: nem volt elég embere az AMD-nek (és valószínűleg túl sok pénzt sem akart rá áldozni), hogy a processzor új gyártástechnológiára való áttervezését ugyanolyan részletekbe menően és optimalizáltan hajtsa végre. Egy ilyen csíkcsökkentés esetén ugyanis a processzort optimalizálni kell az új csíkszélességre, ami komoly erőforrás igénybevételével jár. Most viszont jön a K8L és annak leszármazott generációi, ráadásul a mobil processzor (Bulldozer) fejlesztése is gőzerővel folyik, ott van a Fusion projekt is, egyszóval nem maradt elegendő ember a 65 nm-es K8 tervezéséhez. Az ésszerű érvek pedig azt diktálták, hogy az új termékekre koncentráljanak, ne pedig a régi "foltozgatására". Tehát a 65 nm-es Athlon 64-ek paramétereiből nem tudunk túl sok következtetést levonni a 65 nm-es gyártástechnológia jóságára. Az eddig kiderült infók alapján azonban megközelítőleg akkora javulás várható, mint a 130->90 nm váltás esetén.
A K8L tervezése ugyan kisebb, de nem lényegesen kisebb változtatást jelent, mint amekkora az eredeti Athlonok és az Athlon 64 (azaz a K7 és a K8) között volt. Részleteiben itt is nagyon sok minden változott, noha az alapfelépítés közel változatlan maradt. A K8L-et a 65 nm-es és a 45 nm-es technológia paramétereinek figyelembevételével tervezték, így várhatólag sokkal jobban megfelel ezeknek. Ezenkívül a memóriavezérlő feszültsége függetlenül változtatható lesz a mag feszültségétől, ami a hírek szerint eddig visszafogta a skálázódást. Ezek miatt mind órajelben, mind fogyasztásban várhatólag jobb lesz, mint a K8 65 nm-hez idomított verziója (figyelembe véve persze a többletfunkciókat). A neten 2.5-2.9 GHz közötti változatok megjelenését jósolják (mind 4-, mind 2-magos esetben), én ezt nem tartom valószínűnek. A 4 magos verzióra reális ez az órajelbecslés (talán inkább 2.7-2.8 lehet a maximum), de a dual-core verziónál elég irreális az, hogy míg 90 nm-en 3 GHz-es verzió is kijött már, addig 65 nm-en csak 2.9 GHz-es jelenik meg. Még ha esetleg így is lenne, akkor is várható év végéig minimum a 3 GHz-es, nagyon valószínűleg a 3.2 Ghz-es változat, de a 3.4 GHz-es sem kizárt. Addigra ugyanis a 65 nm beérik és minden paraméterében sokkal jobb lesz a 90 nm-nél.
A K8L várható IPC-je a K8-nál mindenképp nagyobb lesz, a kérdés csak az, hogy mennyivel. Abban mindenki egyetért, hogy lebegőpontos esetben hatékonyabb lesz mint a Core 2, az egész műveletvégző képességéről már megoszlanak a vélemények. Nézzük meg, hogy a K8L-nek milyen újdonságai vannak a K8-hoz képest! Elnézést kérek, hogy gyakran az angol elnevezést használom, ha nem találok megfelelő magyart.
- Instruction fetching: Ez egy átmeneti buffer, amibe az L1 cache-ből kerülnek az utasítások, majd innen továbbmennek a dekóderbe. 16 bájtról 32-ről növelik meg a méretét. A lebegőpontos utasítások esetén az utasítás hossza akár 7-9 bájtos is lehet, márpedig 3 ilyen utasítás már nem fér be a 16 bájtba. A K8L - a K8-al szemben - órajelenként elvileg már 3 lebegőpontos utasítás kibocsátására is képes, így fontos, hogy már az elején ne ütközzön szűk keresztmetszetbe. Ettől a módosítástól önmagában csak minimálisan gyorsul, viszont lehetővé teszi a lebegőpontos egység fejlesztését (lásd következő pont).
- SSE egység szélességének duplázása: Az SSE összeadó- és szorzó egység 64 bites volt a K8-ban, pontosabban egy órajel alatt egy 64 bites müveletet tudott végrehajtani mindegyik, a 128 bites SSE utasításvégrehajtásához tehát 2 órajelre volt szükség (bár ez így kicsit pongyola megfogalmazás, mert nem 1 órajel alatt hajtja végre, hanem 1 órajelenként kezdi el a végrehajtást). A 128 bitesre növelés miatt most már órajelenként tud mindkét egység 1-1 ilyen utasítást végrehajtani, duplájára növelve így az elvi teljesítményt. Van még egy lebegőpontos egység, ami az egyéb lebegőpontos utasításokat hajtja végre (pl. tárolás, betöltés, ...), erről nincs információ, de vélhetőleg ez is dupla széles lett. A lebegőpontos teljesítmény növekedése jelentős lesz, gyakorlati esetben várhatóan +15-25% plusz teljesítményt fog jelenteni. Ettől a módosítástól gyorsul az egész SSE végrehajtás is, nem csak a lebegőpontos.
- Javított elágazásbecslés: Amikor a processzor egy feltételes elágazáshoz ér, akkor megnézni, hogy szerepel-e ez az elágazás az elágazásbecslőben, ha igen, akkor megpróbálja megjósolni a végkimenetelét a tárolt adatok alapján, így időt takarítva meg. Az elágazásbecslő fejlettségétől függően különböző mintákat tud felismerni, ha például egy számlálót növelünk egy ciklusban ami után a számláló páros/páratlan mivoltától függően egyik vagy másik ágban folyatjuk a program futását, akkor ez egy 1010101010... mintát rajzol ki. Ez egy egyszerű minta, ezt minden elágazásbecslő felismeri. Az elágazásbecslők hatékonysága attól függ, hogy milyen sok elágazásra emlékeznek, meg attól, hogy mennyire bonyolult (hosszú) mintákat tudnak felismerni. A K8L mindkettőben előrelépés lesz a K8-hoz képest, nagyobb bufferrel fog rendelkezni és hosszabb mintákat tud felismerni. Optimális esetben akár 4-5%-ot is gyorsulhat, de reálisabb az 1-3%-os gyorsulás (különösen mivel nincs információ a pontos részletekről :-) ).
- Out-of-order beolvasás átrendezés: A processzor az utasításokat nem feltétlenül olyan sorrendben hajtja végre, mint ahogy azt a program előírja. Először úgynevezett macro utasításokra fordítja le őket (egy utasításnak általában 1-2 macro utasítás felel meg, a bonyolultabbaknál több). Majd átrendezi azokat olyan sorrendűre, hogy a leghatékonyabban hajthassa végre, de közben persze vigyáznia kell, hogy a program működése ne sérüljön. A Core 2 nagyon agresszíven tudja átrendezni az olvasó és tároló utasításokat, a K8 ettől nagyon elmarad. A K8L sokat fog fejlődni ezen a téren, bár a javulás mértéke még nem tisztázódott. Teljesítményben nagyon szép javulás várható, 1-5% közötti érték reálisnak tűnik.
- Egyéb kisebb módosítások a magon: A műveletvégző egységek egyéb kisebb jelentőségű módosításon is átesnek. Lesz néhány új utasítás, módosul a stack kezelése és optimalizálják a TLB-t (translation lookaside buffer) is. És persze biztosan van jónéhány olyan módosítás is, ami túl kicsi ahhoz, hogy felsorolják, de összességében mégis javítanak a hatákonyságon. Ezek szerepe azonban nem jelentős, összességében 1-2% teljesítménynövekedést okozhatnak.
- Javított L1 és L2 cache-ek: Mind az L1 és az L2 cache sávszélességét duplájára emelték. Erre mindenképpen szükség volt a lebegőpontos módosítások miatt, de az integer kódok végrehajtására is jelentős hatást gyakorol. Ebből a cikkből kiderül, hogy az alacsonyabb órajelű processzoroknál az L2 cache sávszélessége (ne felejtsük el, hogy az L1/L2 cache-ek a processzor órajelén járnak) kicsi ahhoz, hogy a főmemória teljes sávszélességét ki tudják használni. Összességében akár 5-10% teljesítménynövekedés is várható lehet a javított cache-ek miatt (különösen memóriaigényes programoknál, pl. Quake fog sokat jelenteni).
- L3 cache: A 4 magos példányokon lesz minimum 2 megabájt L3 cache is, a dual-core verziókon azonban ez hiányozni fog. Asztali gépek esetén a hatása nem lesz túl jelentős, talán 1-3% plusz teljesítményt fog jelenteni, bár nehéz mihez viszonyítani, hiszen 4 magos processzorokat nehéz (nam fair) 2 magosokhoz viszonyítani. A szerverekben azonban ennél sokkal többet dobhat a teljesítményen.
- Javított (crossbar) memóriavezérlő: A memóriavezérlő nem egyként fogja kezelni a két 64 bites csatornát, hanem külön-külön címezhető lesz a két memóriaterület. Emiatt - különösen több taszk egyidejű futtatásakor és különösen a 4 magos verzióban - a memóriahozzáférés késleltetése sokat javulhat. A gyorsulás mértéke nem igazán becsülhető, bár biztosan egyszámjegyű.
A többi módosításnak (pl. javított HT) nem lesz teljesítménynövelő szerepe a desktop verziókban, az Opteronok esetén pedig nehezen becsülhető pluszt hoznak (ott is elsősorban a több utas szerverekben). Lebegőpontos esetben összességében akár 35-50%-os teljesítménynövekedés sem kizárt, bár átlagosan inkább csak 25-30% várható. Egész műveletvégzés esetén átlagosan 12-18% lesz az IPC növekedés, egyes esetekben akár 20% is lehet, más esetekben azonban csak 4-5%. Az én jóslatom az, hogy a Core 2 hatékonyságát egész műveletvégzés esetén alulról fogja súrolni, lebegőpontos esetben lényegesen jobb lesz annál. Sok fog múlni tehát az órajelen, én személy szerint nem hiszek a majdnem az idei év végére jósolt 3.5-3.8 GHz-es 4 magos Ccore 2-ben. Szerintem a K8L jobban fog órajelben skálázódni mint a K8, a nagy kérdés, hogy vajon fel tudja-e venni a versenyt ebben a Core 2 architektúrával. Szerintem kicsit elmarad mögötte (mondjuk 200 MHz-el), ennek ellenére a szerverpiacon visszaszerzi elsőségét (különösen a 4-8-utas szervereknél), a HPC szegmensben pedig egyértelműen jobb lesz versenytársánál. Az asztali gépeknél a teljesítmény korona szerintem megmarad az Intelnél, de a mostani nagy különbség nagyon le fog csökkenni.
4x4 versus V8
Az Intel bemutatta a CES-en a V8 platformot, amelyet válasznak szánnak az AMD 4x4 (vagy Quad FX) platformjának. Már az eredeti AMD-s verzió is nagy hülyeség volt, de az Inteles megoldás még rajta is túltesz. Hogy miért?
Az AMD 4x4 ugye egy 2 processzoros rendszer, ami képes 4 grafikus kártyát meghajtani, továbbá normál DDR-2 memóriákkal működik, nem pedig regiszteressel. Nyilván egy ilyen rendszer még a játékosok 99.99%-ának is tök felesleges és abszolút kidobott pénz, de van egy olyan nagyon-nagyon szűk réteg, akinek ez a befektetés logikus döntésnek tűnhet. Ez az a réteg, aki hajlandó egy high-end játékgép 5-6 ezer dolláros árához hozzácsapni még 2-3 ezret, hogy az övé legyen a leggyorsabb gép a városban. Minden területen vannak fanok és gyűjtők, az ő igényük kielégítésére ez a rendszer többé-kevésbé megfelel (mondjuk a rendszernek komoly hátrányai is vannak, így csak fentartásokkal).
Az Intel verziója azonban gyakorlatilag senkinek nem jó. Még egy ilyen szűk rétegnek sem. A legnagyobb baja az, hogy csak egy azaz egy darab videókártya tehető be, ez összevetve a 4x4 4 videókártyájával édeskevés. Tehát top-szuper-high-end játékos gépnek alkalmatlan a cucc. Úgy nagy hirtelen egyetlen olyan célcsoport sem jut eszembe, akiknek ez a gép megfelelő lenne. Az már csak hab a tortán, hogy ez a gép tényleg abszolút nem más, mint egy 2 proceszoros munkaállomás. Még a processzorok is FB-DIMM memóriát igényelnek. Az AMD gépén legalább látszik az erőfeszítés, hogy némileg különbözzenek egy 2 Opteronos munkaállomástól (nem kell regisztrált memória, 4 grafikus kártya lehetősége), az Intel V8 azonban az eddigi hírek alapján semmiben nem nyújt újat.
Kihalnak a dínoszauruszok?
Michael Feldman a HPCwire oldalon az X86-os architektúra kihalását vízionálja. Azt mondja, hogy az X86 processzorok a sokmagos processzorok idején (több száz magos processzorokról beszélünk) már bonyolult utasításkészletük és az emiatt jelentkező nagy fogyasztásuk miatt nem lesznek versenyképesek. További gond lesz szerinte az alacsony hatékonyságuk a tranzisztorszámra vetítve, mivel 8-10 éven belül az egy chipen lehelyezhető tranzisztorok számának növekedése meg fog állni (magyarán nem lesz többé igaz a Moore törvény). Ezzel szemben a RISC alapú processzorok és ezek közül is az egyszerű felépítésű verziók nagyon jó watt/teljesítmény mutatókkal fognak rendelkezni (ilyen processzorra példa a SUN Niagara), továbbá a tranzisztorokkal is sokkal gazdaságosabban bánnak. Így természetesen szerinte ebből következően ezen processzorok le fogják győzni az X86-os processzorokat és azok 30 éves egyeduralmára csak a korai évek kisiklásaként fogunk gondolni.
Van azonban egy kifogásom a fenti gondolatmenet ellen. Az X86 halálát jósólók szinte mindegyike elfelejtkezett eddig egy fontos dologról: a kompatibilitásról és a piac konzervatizmusáról. Hogy csak a közelmúltból vegyünk egy példát, ez volt az egyik oka az Itanium relatív sikertelenségére. Egy másik példa az 80386-os proceszor volt, aminek muszáj volt 8086 kompatibilisnak maradnia (és persze utódainak is: a Pentiumnak és a mai prociknak is). Vajon a hatalmas felhalmozott szoftverkincs képes lesz megmenteni az X86-ot? Nem biztos. Elképzelhető ugyanis, hogy egy új architektúrára épülő processzor olyan teljesítményfölénnyel rendelkezik, hogy bőven képes emulálni úgy az X86-os processzorokat, hogy azokat teljesítményben még így is megelőzze. Ha ez nem teljesül, akkor a piaci konzervativizmus miatt nem fogják tudni legyőzni az X86-ot.
Van még egy gond a gondolatmenettel: felteszi, hogy a Moore törvény 8-10 éven belül sérülni fog, azaz 1.5-2 évenként nem leszünk képesek az egy lapkára integrált tranzisztorok számát duplázni. Ez könnyen igaz lehet, de azért fentartásokkal kell kezelnünk ezt a feltevést, mivel a Moore törvény halálát már sokan és sokszor megjósolták. És eddig még nem vált be ez a jóslat.
A cikkben úgy vélem, hogy a szerző túlságosan a HPC piac igényei felöl közelíti meg a kérdést. A HPC piacon ugyanis valóban nem komoly tényező az architektúrák kompatiblitása, az új utasításkészletű processzorok talán itt terjednek el leghamarabb. De a szerver és különösen az asztali gépek piacán (beleértve a lapotpokat is) ez nagyon komoly tényező. A HPC piacon teljesen egyértelműen jó esély van rá, hogy az X86 mellett más processzorok is elterjedjenek (eddig is a sokszínűség volt jellemző erre a piacra), sőt az X86 processzorok teljes eltűnése is kizárt, még ha a jelenlegi tendenciák nem is erre utalnak. De 8-10 éves távlatban sok minden változhat.
Még egy fontos ellenérv eszembe jutott. A processzorgyártás nagyon komoly pénzügyi hátteret igényel. Egy gyár felépítési költsége jelenleg 4-5 milliárd dollár (és ez drámaian emelkedhet a jövőben), és egy gyárral csak a piaci igények töredékét lehet kielégíteni. Ráadásul nagyon sok felhalmozott tudás van a processzorok tervezésében, nagyon sok a szabadalom, így egy új sikeres szereplő színrelépése kizárt. Gyakorlatilag 3 jelölt van: Intel, AMD, IBM. Az IBM sikeres szinrelépésében nem hiszek (de azért adok nekik egy egész kicsi esélyt), szinte 100%-ig biztos, hogy az Intel vagy az AMD lép színre majd egy ilyen processzorral (vagy mindkettő). Azonban várhatóan 2012-2015 környékén a két nagy processzorgyártó már fej-fej mellett lesz, vélhetőleg az Intel nagyobb részesedéssel és nagyobb pénzügyi háttérrel fog rendelkezni mint az AMD, de nem lényegesen nagyobbal (reálisan 40-60 vagy 45-55 százalékos piaci megosztás várható). Ha a két gyártó két teljesen inkompatibilis úton indul el, akkor a kimenetel megjósólhatatlan. Könnyen lehet, hogy összefognak, de ez a múltban nem volt jellemző. Az biztos, hogy összefogásuk esetén komoly esély lenne az X86 processzorok leváltására (bár kezdetben persze szükség lenne az X86 emulációra), ha külön utakon indulnak el, akkor viszont kétséges a siker.
Teljesítményhajsza - kell-e ez nekünk?
Erre van egy nagyon közkedvelt válasz (miszerint nem, nincs szükség rá), ami után bőszen helyeselnek az emberek. De most ne akarjunk csordaként együttbólogatni és járjuk körül egy kicsit alaposabban a témát.
Érveljünk először a közkeletű válasz mellett. Bizonyára emlékszünk, hogy 2003 táján, ha valaki vett egy közel csúcskategóriás processzort (mondjuk egy FX-51-et vagy egy P4 EE-t), akkor 1.5-2 évig azzal majdnem a csúcskategória közelében maradt. Ennyi idő alatt a processzorok kb. 20-25%-ot gyorsultak, ami a 2000-es évekbeli gyorsuláshoz képest semmiség. De ez persze nem csak a csúcskategóriára volt igaz, ha 2004 első felében vett valaki egy A64 3200+-t, akkor azzal két évig még mindig a középkategóriában maradt. És mindezek ellenére valahogy senki nem panaszkodott a processzorok teljesítményére. Ebből tehát triviálisan következik, hogy bizony nincs szükségünk az őrült sebességű fejlődésre és az állandó váltásra.
De ez csak látszólag következik belőle. Hiszen a programozók is látták, hogy az órajel jelentős emelése nem lehetséges, így látták azt is, hogy teljesítménymegtorpanás lesz. Mivel olyan programokat írnak, amit mindig az akkori gépek valamilyen átlagos szintjéhez lőnek be, bár persze alkalmazásfüggő, hogy ez az átlag hol van (játékprogramoknál ez átlagos közepes teljesítményű gépet, irodai progiknál meg átlagos alsókategóriás gépet jelent). De a lényeg az, hogy az átlag évekig alig változott, ergo olyan progikat írtak, amik nem igényeltek lényegesen erősebb processzort, mint a két évvel korábbi programok.
Processzorteljesítményre szükség van. Lásd pl. a Vista hangfelismerő képességét, vagy éppen a fizikai gyorsítók iránti igényt, a multimédiás igényeket, a játékok MI igényét, stb. Ezek mind-mind egyre nagyobb processzorteljesítményt igényelnek (vagy speciális gyorsítókártyát). De ott van az az ellenérv, hogy "de hát én jól megvagyok a 3 éves 2.4 GHz-es P4-emmel vagy 2500+-os Bartonommal". Így van, de egy 2000 elején vásárolt P3-500-al már 2002-ben nem volt meg az ember, az már akkor tetű lassú volt. Épp azért, mert akkor baromi gyorsan fejlődtek a processzorok.
Az igazság valahol a két szélsőséges vélemény között van. Szükség van a gyorsabb procikra, szükség van a nagyobb teljesítményre, hiszen akkor végre normális MI-k lesznek a játékokban, normálisan használható felhasználó interfészünk lesz (tényleg emberbarát, nem csak nevében az). Az elmúlt néhány év állóvize tehát nem volt jó, ugyanakkor nyilván nem volt jó az 5-6 évvel ezelőtti szituáció, amikor 1 év alatt elavult a gépünk.
De jó hírem van, az elkövetkező néhány év meghozza a várva várt kánaánt: fejlődni is fognak a processzorok, ugyanakkor nem kell évente gépet cserélnünk. Ez fából vaskarikának tűnik, de így van. Ha valaki ma vesz egy Core 2 Duo-t vagy vesz egy X2-t, akkor jól látszik, hogy ezekkel a procikkal még 2008-ban is elég jól el fog evickélni. De eközben a processzorok teljesítménye drámaian meg fog nőni, nem 15-20%-os emelkedés lesz, mint 2004-2005 környékén volt, hanem 50-60%-os vagy akár még több is. Mert ugye a magok száma duplázódni fog mostantól kb. 2 évente, csakhogy a szoftverek fejlődése ezt csak elmaradva fogja követni. Jelenleg éljük a 4 magos procik bevezetését, de még a 2 magosok kihasználtsága is elég alacsony mértékű. Ha tehát ma veszünk egy kétmagost, akkor az jövőre gyorsulni fog(!), hiszen képességeit egyre jobban kihasználó programok jelennek meg. Ez a megahertz verseny idején nem így volt, ott a magasabb órajelet a programok rögtön kihasználták. A processzorok tehát olyanok lesznek, mint a bor: idő kell a beérésükhöz. És mivel órajelben a következő generáció nem hoz drámai javulást, ráadásul a következő generáció előnyének (több mag) kihasználása eltolódik az időben 1-2 évvel, így megvalósul a fából vaskarika: a processzorok teljesítménye megint gyorsan nő, ennek ellenére a processzorok csak lassan avulnak el, azaz a számítógépünk csak hosszabb idő alatt lesz elavult.
CPUGPU koncepció
Az előző bejegyzésemben szereplő K8L moduláris felépítését taglaló részt szeretném egy kicsit körüljárni. Az AMD a CPU-ra integrált többprocesszoros technológiának a Fusion nevet adta. Egyre több infó lát napvilágot erről, így egy kicsit körbejárnám a témát.
Na, szóval a Fusion nagyon blokvvázlatosan így néz ki. A felső része a képnek teljesen normálisnak tűnik. CPU-cache-corssbar-memória vezérlő négyes most is jelen van, csak éppen most ehhez csatlakozik a GPU rész. A GPU is a crossbar-on keresztül éri el a memóriavezérlőt, bár a GPU és a crossbar között ott van egy buffer. Ez a buffer vélhetőleg Z-RAM technológiánm alapuló memória lesz, meglehetősen nagy méretű (szvsz minimum 16 mbyte-os lesz, de inkább 32), aránylag lassú a cache-ekhez képest, bár a normál memóriához képest nagyon gyors lesz. Elsősorban a memória sávszélesség lesz az ami nagy mértékben jobb lesz annál, akár 30-40 GByte/sec is elképzelhető.
Teljesen bizonyos, hogy nem egy normál GPU lesz a magra integrálva, hanem az ezekhez az igényekhez speciálisan hozzáigazított processzorrol lesz szó. Részletek persze még nem ismertek, de 2008 végéig még bőven van idő. Akkora várható ugyanis az első Fusion technológiára épülő GPU-CPU.
Mint az az alábbi képről kiderül, a Fusion név nem csak CPU-ra integrált GPU-t takar, hanem egy annál általánosabb koncecpiót. Jár hozzá egy X86 kiegészítés is, amellyel az integrált grafikus processzort (és vélhetőleg más segédprocesszorokat is) lehet programozni. Részletek természetesen még erről sincsenek.
AMD roadmap: APU, hibrid grafika, ...
Így legyen ötösöm a lottón, amit nem is olyan régen megjósoltam, azt most a hírek (és egy másik cikk) megerősítették. Az AMD tényleg a kevesebb X86 mag + néhány speciális segédprocesszor híve.
Miről is van szó? Az AMD új processzorát (a K8L-t) rendkívül rugalmasnak tervezte. Ők az objektumorientált processzortervezést használták, ami azt jelenti, hogy a processzor részei (memóriavezérlő, mag, cache-ek, HT linkek, ...) mind jól definiált ki- és bemenettel rendelkeznek és számuk a processzoron közel szabadon variálható (*). A magas szintű elhatároltság miatt egy új, más objektumokat tartalmazó processzor kifejlesztése lényegesen gyorsabb. Mostanra már ki is derült, hogy miért is volt erre szükség. Egy ábra többet mond el, mint ezer kép, nézzünk tehát egyet:
A modell az, hogy van néhány X86 mag és néhány más típusú mag is a CPU-n. Ráadásul ezek száma szabadon konfigurálható. Így lehet olyan CPU-t csinálni, amiben mondjuk 2 X86, egy fizikai gyorsító és egy multimédiás gyorsító van. Ez ideális egy multimédiás játékgép számára, hiszen pont azokat a funkciókat gyorsítja legjobban. Így egy ilyen processzor ezeken a területeken gyorsabb lesz, mintha 4 X86 mag lenne benne. És persze mindenki igényeinek megfelelő processzort vehet: XML feldolgozást gyorsítót, fizikai vagy mesterséges intelligenciát gyorsítót, stb... Az első ilyen processzor vélhetőleg a mobil piacra szánt Bulldozer lesz, ami integrált grafikus chipet fog tartalmazni. 2009 folyamán meg jönnek az egyéb xPU-val szerelt verziók is.
Persze sok minden egyéb is kiderül a cikkből. A low-end chipekben nem lesz L3 cache (egy és kétmagos chipekhez nincs is rá szükség). Az első ilyen K8L alapú chipek valamikor 2007 végén várhatóak. Ugyanekkor jelenik meg a DX10-es integrált grafika is. 2008 közepén pedig érkezik a DDR3-as memória. A mobil fronton 2007 elején mutatkoznak be a 65 nm-es chipek, amelyek persze még nem K8L alapúak lesznek. Ugyanekkor érkezik egy nagyon érdekes újítás is, az úgynevezett hibrid grafika. Ez azt jelenti, hogy a laptopban lesz integrált és diszkrét grafikus kártya is és ha hálózatról megy a gép, akkor a diszkrét grafikus chip megy, ha meg aksiról, akkor az integrált. Az átváltáshoz nem kell újrabootolni a gépet. Ezen megoldással nagy teljesítményű grafikát is kapunk, de ugyanakkor a gép üzemideje nem csökken le. Ez vajon platformfüggetlen megoldás lesz? Vagy csak AMD-s gépekbe lesz elérhető? Tud valaki erről valamit? 2007 végén érkezik a K8L mobil verziója, itt a fogyasztás csökkenése lesz a legfontosabb újítás, mert lekapcsolhatóak lesznek az egyes magok, ráadásul a HT frekvenciája is menet közben lesz állítható (persze automatikus állítgatásról van szó).
(*): Íme egy kép a K8L moduláris felépítéséről.
Az AMD jelene és jövője
A rossz hírek
Kezdjük rögtön a rossz hírrel: az AMD nyilvánvalóan bajban van. Termékvonalának döntő része teljesítmény szempontjából nem versenyképes az Intel termékeivel (egyetlen kivétel a 4+ utas szerverek), a most kihozott 4x4-es (illetve QuadFX) rendszer jelenlegi verziója egy vicc, ráadásul egy pénzügyileg is nagyon megterhelő lépést hajtott végre a közelmúltban: megvette az ATI-t. Mindeközben ugyan nyereséges tudott maradni, viszont a nyeresége nem túl izmos, általában 100 millió USD körül mozog negyedévente, ez nagyon könnyen átválthat veszteségbe. Ráadásul most az ATI esetleges sikertelensége is a saját tőkéjét csökkenti, így egyszerre két területen kellene megállnia a helyét.
A jó hírek
Persze ilyenek is vannak és nem is kevesen. Nemrégiben megkezdte a világ legnagyobb PC forgalmazója, a Dell az AMD-s gépek forgalmazását. Az AMD még mindig nyereséges, dacára az Intel erőteljes akcióinak (új termékek piacra dobása, agresszív árverseny indítása). Továbbá az AMD kezében még mindig egy nagyon ütőképes architektúra van: ez a Direct Connect, aminek újabb verziója kb. egy év múlva érkezik, miközben az Intel hasonló megoldása csak közel két év múlva várható. Mindezeken felül körülbelül fél év múlva érkezik a K8L, amely lényegesen nagyobb teljesítményt nyújt mind lebegőpontos, mind egész müveletek esetén (azonos órajelen), mint a jelenlegi K8 architektúra, ráadásul több újdonságot hoz a mobil szegmens számára és lehetővé teszi a szerver processzorok lényegesen jobb skálázódását is.
A közelmúlt
Az AMD az elmúlt néhány évben hatalmas sikereket ért el: piaci részesedését a szerver piacon közel nulláról 20% fölé emelte, de a mobil és az asztali gépek szegmensében is jelentősen feljebb tornázta, ráadásul a szuperszámítógépes piacon is nagy menetelésbe kezdett: jelenelgi részesedése a TOP500-as listán 20% feletti (3 éve még 1.8% volt csak). Ennél is fontosabb, hogy számtalan komoly számítógép forgalmazó kezdett el AMD-s gépeket forgalmazni, ma gyakorlatilag minden komoly iparági szereplő forgalmaz ilyen gépeket. Az utolsó nagy cég aki eddig nem forgalmazott AMD processzoros gépeket a Dell volt, aki az elmúlt szűk félév folyamán teljes szélességgel kiállt az AMD mellett és mindhárom szegmensben (PC-k, laptopok és szerverek) komoly gépválasztékot mutatott be. A vásárlók körében is sikert sikerre halmozott, ma már a TOP 100 cég több mint 90%-a használ AMD-s gépeket.
Vajon az AMD előretörése minek volt köszönhető, mitől nőtt meg ennyire a piaci részesedése? A döntő ok az volt, hogy egyre több cég kezdett forgalmazni ilyen gépeket és emiatt ezen cégek ügyfelei is elkezdtek ilyen gépeket vásárolni. Ez igaz volt mind az otthoni, mind a céges vásárlókra. Nyilván az egész sikersztori nem jöhetett volna létre, ha az AMD nem tud sikeres terméket gyártani, az Opteron/Athlon 64 tehát kulcsszerepet játszott a folyamatban. Mindehhez kellett az Intel bénázása is, ami a Prescottal kezdődött és a Core 2 Duo bemutatásáig tartott (kivétel volt ez alól a mobil szegmens). Végül kellett az AMD taktikája, az, hogy a technikai felsőbbrendűségét képes volt kihasználni. Mindez a taktika megnyilvánult a Stable Image Platform bevezetésében, az Intel elleni perben és a számítógépgyártók és szállítók ügyes meggyőzésében.
A jelen és a közeljövő
A fent tárgyalt nehézségek miatt az AMD-nak jelenleg nem áll nyerőre a szénája. A Core 2 Duo és a Wooscrest erősen tör előre, teljesítményben ezek a chipek felülmúlják az AMD-s versenytársaikat, ami miatt az AMD-nek jelentősen csökentenie kellett az árait. Ez persze azt eredményezte, hogy erősen leesett az AMD ASP-je (average selling price, azaz átlagos eladási ár), ami miatt több processzort kell eladnia azonos bevétel produkálásához, emiatt pedig csökken a megszerezhető profitja. Viszont pozitív az, hogy még ebben a félévben is képes volt új számítógépgyártókat megnyerni (Dell), illetve a jelenlegi forgalmazói közül több is megújította termékpalettáját és új termékeket is bejelentettek (többek között az IBM, SUN, HP és Lenovo). Ezek eredményeképpen az AMD jelenleg kapacitáshiánnyal küszködik, azaz nem képes elég processzort gyártani. Ez azt mutatja, hogy az elkövetkező 1-2 negyedévben az általa eladott processzorok darabszáma jelentősen nem fog változni, mivel a versenyképesség csökkenését a forgalmazók fokozott jelenléte kompenzálja. Hosszabb távon ez azonban nem fenntartható, ehhez sikeres és versenyképes termék kell, mivel versenyképtelen termékkel az eladott processzorok száma és ára erőteljesen esni kezd.
Ez a versenyképes termék lenne a K8L. Lebegőpontos teljesítményével nem lesz gond, az több mint elegendő lesz a konkurencia ellen. A kérdés inkább az egész műveletvégző teljesítmény, mivel ebben van a legjobban jeleleg elmaradva a konkurenciától. Az már látszik, hogy ebben nem fogja tudni megverni az Intelt, viszont egálra még hozhatja a meccset. Fontos az új processzor esetén a mobil lehetőségek bővülése: külön lekapcsolható magok, külön állítható órajelek, ez mind a mobil piacon annyira fontos fogyasztási adatok javulását szolgálják.
Fontos látni azt, hogy az AMD jelenlegi nehézségei nem mérhetőek a 2002 folyamán bekövetkezett válsághoz. Akkoriban az AMD iparági elfogadottsága a béka feneke alatt volt, alig valaki állt a nagy piaci szereplők közül az AMD mögött, az is inkább csak félszívvel. Most viszont az összes nagy szereplő aktívan forgalmazza az AMD processzoros gépeit, ráadásul érdekes módon az Intel nagyon ütős új processzorgenerációjának bemutatása környékén számtalan AMD-s konfigurációt mutattak be a partnerei, azaz jól látszik, hogy mindezen nehézségek ellenére is hosszabb távon terveznek az AMD-vel.
A távolabbi jövő
2008 során az AMD számos újdonsággal fog jelentkezni. Először is bemutatja a Direct Connect architectúra újabb verzióját, ami lehetővé teszi, hogy az Opteronra alapuló szerverek minden további speciális külső chip nélkül is 8 processzor fölé skálázódjanak, így várhatólag 8 és 16 processzoros, nagyon jó teljesítményt nyújtó, relatíve olcsó gépek jelenhetnek meg a piacon (a 8 és 16 processzor mindegyikében persze 4 magos chipek lesznek, így összesen 32-64 processzor magot tartalmazó gépekről beszélünk). Ezenkívül a chipek biztonsági és megbízhatósági képességei is javulni fognak, ami az ilyen szerverek esetén már nagyon fontos tulajdonság. A mobil piacon is várható újdonság, megjelenik a Bulldozer chip, ami a mobil és az alsó kategóriás desktop piacra szánt vadiúj chip lesz. Részleteket még nem lehet róla tudni, de az már köztudott, hogy lesz belőle processzorra integrált grafikus processzort tartalmazó verzió is, ami ezen a piacon különösen fontos.
Lesz azonban az AMD-nek további fejlesztése is, mégpedig a Torrenza platform, illetve az erre alapuló későbbi fejlesztések. A Torrenza platform körülbelül egy év múlva várható, segítségével újabb processzorokkal (elsősorban speciális koprocesszorokkal) bővíthető a rendszer, mégpedig olyan módon, hogy ezzel az új csatolóval (HTX) az ilyen kártyák "közelebb" kerülnak a főprocesszorhoz és a memóriához. Ez lényegesen gyorsabb és interaktívabb kapcsolatot jelent mint a PCI Express, ami elsősorban teljesítményelőnyben, másodsorban egyszerűbb fejlesztésben jelenik meg. Az Intel hasonló megoldása egy év késéssel érkezik, ha az ilyen megoldások fontosak lesznek a jövőben, akkor ez az egy év előny sokat számíthat.
Összefoglalva, az AMD techológiai oldalról nézve a processzorplatform tekintetében lényegesen előrébb tart az Intelnél, a processzor teljesítmény szempontjából azonban hátrányban van. A kérdés, hogy el tudják-e ezt a hátrányt tüntetni az újabb processzorok és meg tudja-e őrizni az előnyét a processzorplatformok (Direct Connect, HT, HTX és Torrenza) tekintetében az Intellel szemben. Piaci oldalról nézve elkerülhetetlen az AMD átmeneti visszaesése, hiszen újabb számítógépgyártókat és forgalmazókat már nem tud megnyerni magának (ezzel a legfontosabb növekedési faktort elveszíti), viszont még bő fél évig nem lesz igazán megfelelő versenyképes terméke. A pénzügyi mélypont várhatóan a jövő év 2. negyedévében következik b |