BMS, busz, ipari, műszeres kábelhez.

Elon Musk és az XAI csapata hivatalosan elindította a Grok3 legújabb verzióját, a Grok3 -t egy élő közvetítés során. Az esemény előtt jelentős mennyiségű kapcsolódó információ, a Musk 24 órás promóciós hype -jével párhuzamosan, a Grok3 globális elvárásait példátlan szintre emelte. Alig egy héttel ezelőtt Musk magabiztosan kijelentette egy élő közvetítés során, miközben kommentálta a DeepSeek R1 -et: "Xai hamarosan elindít egy jobb AI modellt." Az élő adatokból a Grok3 állítólag meghaladta a matematika, a tudomány és a programozás referenciaértékeiben szereplő összes jelenlegi mainstream modellt, a Musk azt is állítva, hogy a GROK3 -ot a SpaceX Mars misszióival kapcsolatos számítási feladatokhoz használják, és előrejelzik a "áttöréseket a Nobel -díj szintjén". Ezek azonban jelenleg csak Musk állításai. A bevezetés után teszteltem a Grok3 legújabb béta verzióját, és feltettem a klasszikus trükk kérdést a nagy modellek számára: "Melyik nagyobb, 9.11 vagy 9.9?" Sajnálatos módon selejtezők vagy jelölések nélkül az úgynevezett legokosabb GROK3 még mindig nem tudott helyesen megválaszolni ezt a kérdést. A GROK3 nem tudta pontosan azonosítani a kérdés jelentését.
Ez a teszt gyorsan nagy figyelmet fordított sok baráttól, és véletlenszerűen a tengerentúli különféle hasonló tesztek azt mutatták, hogy a Grok3 az alapfizika/matematikai kérdésekkel küzd, mint például: "Melyik labda esik először a Pisa ferde toronyból?" Így humorosan úgy jelölték, hogy "olyan zseni, amely nem hajlandó megválaszolni az egyszerű kérdéseket".

A Grok3 jó, de nem jobb, mint az R1 vagy az O1-Pro.
A GROK3 a gyakorlatban sok közismert teszten "kudarcokat" tapasztalt. Az XAI indító rendezvénye során a Musk bebizonyította, hogy a GROK3 -at használja a karakterosztályok és a 2. száműzetés játék útjának hatásainak elemzésére, amelyet állítólag gyakran játszott, de a Grok3 által nyújtott válaszok többsége helytelen volt. Musk az élő közvetítés során nem vette észre ezt a nyilvánvaló kérdést.
Ez a hiba nemcsak további bizonyítékokat szolgáltatott a tengerentúli netizensek számára, hogy gúnyolódjanak a pézsmán, hogy "helyettesítést találjanak" a játékban, hanem jelentős aggodalmakat is felvetettek a Grok3 megbízhatóságával kapcsolatban a gyakorlati alkalmazásokban. Egy ilyen "zseni" esetében, függetlenül annak képességeitől, megbízhatósága rendkívül összetett alkalmazási forgatókönyvekben, például a Mars feltárási feladatokban, továbbra is kétséges.
Jelenleg sok olyan tesztelő, aki hete 3 hete kapott hozzáférést a GROK-hoz, és azok, akik tegnap csak néhány órán keresztül tesztelték a modell képességeit, mind a közös következtetésre utalnak: "A Grok3 jó, de ez nem jobb, mint az R1 vagy az O1-Pro."

A "nvidia" megzavarásának kritikus perspektívája
A hivatalosan bemutatott PPT-ben a kiadás során a GROK3 „messze előre” volt a chatbot arénában, de ez az okosan használt grafikus technikák: A ranglistán lévő függőleges tengely csak az 1400-1300 pontszám tartományban szerepel, és az eredeti 1% -os különbség a teszt eredményeiben kivételesen szignifikánsnak tűnik ebben a bemutatóban.

A tényleges modell pontozási eredményeiben a GROK3 mindössze 1-2% -kal haladja meg a DeepSeek R1 és a GPT-4.0-t, ami számos felhasználó tapasztalatának felel meg a gyakorlati tesztekben, amelyek "nincs észrevehető különbség". A GROK3 csak 1%-2%-kal haladja meg utódjait.

Noha a GROK3 magasabb pontszámot kapott, mint az összes jelenleg nyilvánosan tesztelt modell, sokan nem veszik ezt komolyan: elvégre a XAI -t korábban a Grok2 -korszakban a "pontszám -manipuláció" kritikájáért kritizálták. Ahogy a ranglistán bünteti a válaszhossz stílusát, a pontszámok jelentősen csökkentek, az iparág bennfentesek gyakran kritizálják a "magas pontozás, de alacsony képesség" jelenségét.
Akár a ranglistán a "manipuláció", akár az illusztrációk tervezési trükkjei révén feltárják Xai és Musk megszállottságát a "csomag vezetésének" fogalmáról a modell képességeiben. Musk meredek árat fizetett ezekért a haszonkulcsokért: A bevezetés során 200 000 H100 GPU -t ("több mint 100 000" -et igényelt az élő közvetítés során), és teljes edzési időt ért el 200 millió órán keresztül. Ez arra késztette néhányat, hogy azt hitte, hogy ez egy újabb jelentős áldást jelent a GPU -ipar számára, és a DeepSeek ágazatra gyakorolt hatását "ostobaságnak" tekinti. Nevezetesen, néhányan úgy vélik, hogy a puszta számítási erő lesz a modellképzés jövője.
Néhány netizens azonban összehasonlította a 2000 H800 GPU -k két hónapos fogyasztását a DeepSeek V3 előállításához, kiszámítva, hogy a GROK3 tényleges edzési energiafogyasztása 263 -szoros a V3. A DeepSeek V3 közötti különbség, amely 1402 pontot szerzett, és a GROK3 alig 100 pont. Ezen adatok közzétételét követően sokan gyorsan rájöttek, hogy a Grok3 címe, mint a "világ legerősebb" egyértelmű marginális hasznossági hatása van - az erősebb teljesítményt generáló nagyobb modellek logikája megkezdi a csökkenő hozamot.

Még a "magas pontozással, de alacsony képességgel" is, a Grok2 óriási mennyiségű kiváló minőségű első fellendülési adatot tartalmazott az X (Twitter) platformon a használat támogatása érdekében. A Grok3 képzésében azonban Xai természetesen találkozott a "mennyezet" -nel, amellyel az Openai jelenleg szembesül - a prémium edzési adatok hiánya gyorsan feltárja a modell képességeinek marginális hasznosságát.
A Grok3 és a Musk fejlesztői valószínűleg az elsők, akik mélyen megértik és azonosítják ezeket a tényeket, ezért a Musk folyamatosan megemlítette a közösségi médiában, hogy a verziófelhasználók most már "még mindig csak a béta", és hogy "a teljes verzió az elkövetkező hónapokban jelenik meg". Musk vállalta a Grok3 termékmenedzserének szerepét, és azt sugallja, hogy a felhasználók visszajelzést adnak a megjegyzések szakaszában felmerült különféle kérdésekről.
Ugyanakkor egy napon belül a Grok3 teljesítménye kétségtelenül riasztást emelt azok számára, akik azt remélik, hogy a "hatalmas számítási izomra" támaszkodnak az erősebb nagy modellek kiképzésére: A nyilvánosan elérhető Microsoft-információk alapján az Openai GPT-4 paramétermérete 1,8 trillió paraméter, a GPT-3 tízszeresére. A pletykák azt sugallják, hogy a GPT-4.5 paramétermérete még nagyobb lehet.
Ahogy a modellparaméter -méretek szárnyalnak, a képzési költségek is gyorsan növekednek. A Grok3 jelenlétével a GPT-4.5-hez hasonló versenyzőknek és másoknak, akik folytatni akarják a „pénz égetését” a jobb modell teljesítményének elérése érdekében a paraméter méretén keresztül, figyelembe kell venniük a mennyezetet, amely most egyértelműen látható, és elgondolkodni kell, hogyan lehet legyőzni. Ebben a pillanatban Ilya Sutskever, az Openai volt fő tudósa korábban tavaly decemberben kijelentette: "Az általunk ismert előzetes képzés véget ér", amely újjáéledt a megbeszélések során, és arra ösztönözte az erőfeszítéseket, hogy megtalálja a nagy modellek kiképzéséhez való valódi utat.

Ilya nézőpontja az iparágban riasztást hangzott. Pontosan előre látta a hozzáférhető új adatok küszöbön álló kimerültségét, és olyan helyzethez vezet, amikor a teljesítményt nem lehet tovább javítani az adatgyűjtés révén, összehasonlítva azt a fosszilis tüzelőanyagok kimerülésével. Azt jelezte, hogy "mint az olaj, az ember által generált tartalom az interneten korlátozott erőforrás". A Sutskever előrejelzéseiben a modellek következő generációja, az edzés utáni edzés után "valódi autonómia" és érvelési képességekkel "hasonló az emberi agyhoz".
A mai előre kiképzett modellekkel ellentétben, amelyek elsősorban a tartalom megfelelőségére támaszkodnak (a korábban megtanult modelltartalom alapján), a jövőbeli AI rendszerek képesek lesznek megtanulni és létrehozni a problémák megoldására szolgáló módszereket az emberi agy „gondolkodásához”. Az ember alapvető jártasságot érhet el egy olyan témában, amelyben csak alapvető szakmai irodalom van, míg az AI nagy modellnek több millió adatpontra van szüksége a legalapvetőbb belépési szintű hatékonyság eléréséhez. Még akkor is, ha a megfogalmazás kissé megváltozik, ezeket az alapvető kérdéseket nem lehet helyesen megérteni, szemléltetve, hogy a modell az intelligenciában valóban nem javult: a cikk elején említett alapvető, mégis megoldhatatlan kérdések egyértelmű példát mutatnak ennek a jelenségnek.

Következtetés
A brutális erőn túl, ha a Grok3-nak valóban sikerül felfedni az iparágot, hogy "az előre képzett modellek közelednek a végükhöz", akkor ez jelentős következményekkel jár a területre.
Lehet, hogy miután a Grok3 körülvevő őrület fokozatosan elmúlik, több olyan esetet fogunk tanúi vagyunk, mint a Fei-Fei Li példája a "nagy teljesítményű modellek hangolása egy adott adatkészleten mindössze 50 dollárért", végül felfedezve az AGI-hez vezető valódi utat.
Vezérlő kábelek
Strukturált kábelrendszer
Hálózat és adatok, száloptikai kábel, javítózsinór, modulok, előlapok
2024. április 16.-18.
2024. április 16-án, 1824-ben Securika Moszkvában
2024. május 9 -én új termékek és technológiák indító rendezvénye Sanghajban
2024. október 22., 25., Biztonsági Kína Pekingben
2024. november 19.20. Csatlakoztatott világ KSA
A postai idő: február 19-25.