Dacă vă voi spune că întreaga retorică a Nvidia e pe cale să se dizolve mă veți crede? Dacă vă voi spune că Nvidia deja a fost îngropată de un jucător tăcut, iar acel jucător nici măcar nu-i unul chinez, vă veți trezi din sevraj? Dar dacă vă voi spune că acel jucător a dezvoltat fără conferințe de presă zgomotoase cea mai avansată soluție AI a momentului mă veți crede? Relaxați-vă pentru că azi vă voi spune o poveste care mi se pare extrem de interesantă. Și promit să folosesc un limbaj cât mai facil, astfel încât totul să fie înțeles și de cei care nu au idee de sectorul tehnologic.
Tot omul știe că succesul Nvidia vine de la sectorul AI, mai precis de la hype-ul generat de acest sector. Când OpenAI a ieșit cu al său GPT lumea a înlemnit. Performanțele au fost atât de halucinante încât Google și-a convocat consiliul de administrație. Nu e ciudat? În 2017 Google punea bazele tehnologiei Transformer, prin lucrarea științifică „Attention Is All You Need”. Tehnologia este preluată de OpenAI care, în 2018 dezvoltă Generative Pre-trained Transformer 1(GPT-1). Explozia s-a produs în 2022, odată cu lansarea GPT-3.
Toți algoritmii de inteligență artificială, pentru a funcționa optim, au nevoie de puteri mari de calcul, puteri pe care le puteau asigura plăcile grafice. Aici a apărut Nvidia ca soluție. Ca să mai fac un ocol, vă voi reaminti că Nvidia a mai fost odată în zona de hype, când cu explozia criptomonedelor. Și-atunci, ca și acum, au vândut „minele de aur” sub forma plăcilor grafice care minau rapid bitcoini. Pentru cei care nu știu, algoritmul de generare a bitcoinilor(minare în termeni de specialitate) este unul suficient de inteligent încât să facă față evoluției tehnicii. Astfel, în momentul în care se ajunge la un anumit timp de minare al unui bitcoin, problema care trebuie rezolvată se complică, astfel încât, pentru a mina eficient, ai nevoie de mai multă putere de calcul. Părea job-ul ideal pentru Nvidia: ei făceau cip-uri din ce în ce mai rapide, astfel încât aveau piața asigurată pe măsură ce isteria criptomonedelor creștea.
Doar că atunci a apărut un alt jucător, anume China cu ale ei ASIC-uri(circuite integrate specializate). Zhang NanGeng, puțin cunoscut acum, a avut ideea construirii unor cipuri concepute special pentru a executa doar algoritmul de hashing SHA-256 al Bitcoin-ului(folosit pentru minare). Ce sens mai avea să cumperi plăci grafice scumpe, când cu ASIC-urile viitoarei companii Canaan Creative îți făceai minarea ieftin și rapid? Așa au picat în dizgrație cei de la Nvidia, reîntorcându-se la activitatea lor de bază, anume grafica. Este însă o diferență între atunci și acum deoarece atunci nebunia crypto nu era atât de mare pe cât de mare este nebunia AI de acum.
Și, după micul ocol, să ne întoarcem în prezent. Cei care mă citesc știu bine că, la un moment dat, am spus că tot un echivalent al ASIC-ului va detrona Nvidia, indicând China ca principală piață care va sparge dominația americanilor. Chinezii însă au luat-o pe o cale greșită întrucât marii lor producători au încercat să reproducă tehnologia Nvidia(cel mai avansat e Huawei, cu o întârziere față de Nvidia de 1,5 ani). Asta în ciuda celor de la vârful asociației producătorilor ce cip-uri din China, care sugerau să se meargă pe o abordare similară cu cea a ASIC-urilor. Se merge inclusiv în acea direcție, dar destul de modest.
Lovitura însă a venit de la jucătorul tăcut, Google. După ce și-a convocat consiliul de administrație, nu prea ați mai văzut evenimente mirobolante de-ale Google. A tăcut și a făcut. Au lansat Gemini, care n-a rupt gura târgului, dar a fost suficient de performant încât să se mențină în linie. Dar ceea ce au făcut cel mai mult cei de la Google a fost să meargă asumat pe direcția integrării verticale a AI-ului. Astfel, dincolo de zona soft, au făcut cercetări aprofundate în zona hard, mergând pe calea proprie în ceea ce privește cip-urile. Așa a rezultat Ironwood.
Ce e Ironwood? Este un cip extrem de specializat, conceput de Google pentru a rula sarcini de Inteligență Artificială(AI), în special modele lingvistice mari(LLM) precum Gemini sau Claude. Designul se concentrează pe eficiența energetică și pe performanța maximă per watt pentru operațiunile de antrenare și, mai ales, de inferență(rularea modelului după antrenare). Este construit pe arhitectura systolic array, care excelează la înmulțirile de matrici. De fapt aici e cheia întregii tehnologii. În timp ce în cazul Bitcoin operația principală era cea de execuție a algoritmului de hashing(în fapt o serie de operații aritmetice și logice la nivel de bit), inima AI-ului constă în operații repetitive pe matrici. Și aici excelează cip-ul Ironwood. În plus, cip-urile produse de Google sunt proiectate să se scaleze în "poduri" imense și uniforme de până la 9.216 cipuri, eliminând blocajele de date pentru antrenarea celor mai mari modele de limbaj și punând accentul pe costul total al antrenării la scară foarte mare.
Ce ne rezultă de aici? Fix motivele care l-au făcut pe Warren Buffett să intre masiv la cumpărare de Google(Alphabet). În primul rând independența de cipuri(Chip Sovereignty), adică ideea de independență computațională. În timp ce majoritatea companiilor AI(OpenAI, Anthropic, Meta, Microsoft) depind de cipurile Nvidia și plătesc costuri enorme pentru a le închiria sau cumpăra, Google deține controlul asupra propriei infrastructuri de cipuri(TPU-uri) - inclusiv Ironwood. De aici rezultă costuri mai mici de antrenare întrucât Ironwood este optimizat pentru a rula sarcini AI la o eficiență cost-performanță mult mai mare decât cipurile generice. Se speculează că Google poate antrena modele gigantice(precum Gemini) la un cost semnificativ mai mic(unele estimări sugerează chiar și cu 75-80% mai puțin) decât competitorii săi. Nu în ultimul rând avem avantajul infrastructurii(The Picks and Shovels). Filosofia lui Buffett este aceea de a investi în "lopeți și târnăcoape"(infrastructură) în timpul unei "goane după aur" precum cea a AI-ului. Alphabet nu este doar un producător de modele AI(Gemini), ci și un furnizor de infrastructură (Google Cloud) care deține tehnologia de bază (Ironwood/TPU).
Vă spun sincer că, în fața acestor elemente tind să cred că Google de acum este Microsoft din trecut. Oare ați uitat cum Microsoft intra într-o zonă atunci când era suficient de matură, dar și înainte de explozie, pentru ca apoi să-și strivească toți competitorii? Așa a fost cu Windows vs Apple, cu Office vs competitorii și chiar cu Internet Explorer vs Netscape. Nu-mi place Google, este o companie woke-istă, care a făcut doar nenorociri în pandemie. Dar nu pot să nu observ modul în care, printr-o integrare verticală, Google a ieșit în față. Și se află foarte aproape de strivirea competitorilor. În timp ce OpenAI tot lansează produse inutile, Google și-a integrat extrem de bine soluțiile din jurul AI-ului său, făcându-le extrem de coerente și funcționale.
Există, desigur, și competitori în zona hardware-ului specializat. Toți marii ofertanți din zona cloud au propriile cercetări. Așa avem Maia 100 de la Microsoft, Trainium de la Amazon sau MTIA de la Meta, dar toate acestea nu au ajuns la performanța Ironwood. Inclusiv AMD are MI300X/MI350(Seria Instinct), iar Intel Gaudi 2/3(Habana Labs). Lumea nu stă în loc și, treptat, cota de piață a Nvidia se va eroda, în ciuda tuturor suveicilor pe care le pune la cale.
Concluzia? Una singură: atunci când e ceață încetiniți și folosiți luminile speciale, neîncrezându-vă în formele care, adesea, apar deformate. Așteptați să se facă lumină și abia atunci veți avea imeginea corectă.

Niciun comentariu:
Trimiteți un comentariu
Atenție! Comentariile sunt supuse moderării și vor fi vizibile după o perioadă cuprinsă între 1 și 4 ore. Sunt permise doar comentariile care au legătură cu subiectul.
Pentru discuţii mai flexibile folosiţi canalul de Telegram Dan Diaconu(t.me/DanDiaconu)