Ag tástáil an “Is Cliste ar Domhan” Grok3

GRÚPA AIPU WATON (1)

Réamhrá

An gceapann tú gurb é Grok3 an "deireadhphointe" do mhúnlaí réamh-oiliúna?

Sheol Elon Musk agus foireann xAI an leagan is déanaí de Grok, Grok3, go hoifigiúil le linn craolta beo. Roimh an ócáid ​​seo, mhéadaigh méid suntasach faisnéise gaolmhaire, mar aon le borradh bolscaireachta 24/7 Musk, ionchais dhomhanda do Grok3 go leibhéil gan fasach. Díreach seachtain ó shin, dúirt Musk go muiníneach le linn craolta beo agus é ag trácht ar DeepSeek R1, "tá xAI ar tí samhail AI níos fearr a sheoladh." Ó na sonraí a cuireadh i láthair beo, tuairiscítear gur sháraigh Grok3 na samhlacha príomhshrutha reatha go léir i dtagarmharcanna don mhatamaitic, don eolaíocht agus don chláreagrú, agus mhaígh Musk fiú go n-úsáidfear Grok3 le haghaidh tascanna ríomhaireachtúla a bhaineann le misin SpaceX ar Mhars, ag tuar "dul chun cinn ag leibhéal Dhuais Nobel laistigh de thrí bliana." Mar sin féin, níl iontu seo ach dearbhuithe Musk faoi láthair. Tar éis an tseolta, rinne mé tástáil ar an leagan béite is déanaí de Grok3 agus chuir mé an cheist chlasaiceach cleas do mhúnlaí móra: "Cé acu is mó, 9.11 nó 9.9?" Ar an drochuair, gan aon cháilitheoirí ná marcanna, ní raibh an Grok3 is cliste fós in ann an cheist seo a fhreagairt i gceart. Theip ar Grok3 brí na ceiste a aithint go cruinn.

 

Tharraing an tástáil seo aird mhór ó go leor cairde go gasta, agus de thaisme, léirigh tástálacha éagsúla comhchosúla thar lear go raibh Grok3 ag streachailt le ceisteanna bunúsacha fisice/matamaitice ar nós "Cén liathróid a thiteann ar dtús ó Thúr Claonta Pisa?" Dá bhrí sin, lipéadaíodh go greannmhar é mar "géineas nach bhfuil sásta ceisteanna simplí a fhreagairt."

640

Tá Grok3 go maith, ach níl sé níos fearr ná R1 ná o1-Pro.

Bhí "teipeanna" ag Grok3 ar go leor tástálacha eolais choitinn i gcleachtas. Le linn ócáid ​​lainseála xAI, léirigh Musk conas Grok3 a úsáid chun na ranganna carachtar agus na héifeachtaí ón gcluiche Path of Exile 2 a anailísiú, a mhaígh sé a imríonn sé go minic, ach bhí formhór na bhfreagraí a thug Grok3 mícheart. Níor thug Musk faoi deara an fhadhb shoiléir seo le linn an chraolta bheo.

 

Ní hamháin gur thug an botún seo tuilleadh fianaise do lucht siúil thar lear chun magadh a dhéanamh faoi Musk as "ionadaí a aimsiú" i gcúrsaí cearrbhachais ach chuir sé imní mhór chun cinn freisin maidir le hiontaofacht Grok3 in iarratais phraiticiúla. I gcás "géineas" den sórt sin, is cuma cén chumais iarbhír atá aige, tá amhras fós faoina iontaofacht i gcásanna feidhmchláir thar a bheith casta, amhail tascanna taiscéalaíochta Mars.

 

Faoi láthair, tá go leor tástálaithe a fuair rochtain ar Grok3 seachtainí ó shin, agus iad siúd a rinne tástáil ar chumais an mhúnla ar feadh cúpla uair an chloig inné, ag teacht ar chonclúid choiteann: "Tá Grok3 go maith, ach níl sé níos fearr ná R1 ná o1-Pro."

640 (1)

Léargas Criticiúil ar "Nvidia a Chur isteach"

Sa PPT a cuireadh i láthair go hoifigiúil le linn an scaoilte, léiríodh go raibh Grok3 “i bhfad chun tosaigh” i Réimse Chatbot, ach úsáideadh teicnící grafacha go cliste sa chur i láthair seo: níor liostáil an ais ingearach ar an gclár ceannairí ach torthaí sa raon scór 1400-1300, rud a fhágann go bhfuil an difríocht bhunaidh 1% i dtorthaí na tástála thar a bheith suntasach sa chur i láthair seo.

640

I dtorthaí scórála iarbhír na samhla, níl Grok3 ach 1-2% chun tosaigh ar DeepSeek R1 agus GPT-4.0, rud a fhreagraíonn do thaithí go leor úsáideoirí i dtástálacha praiticiúla nár aimsigh "aon difríocht suntasach". Ní sháraíonn Grok3 a chomharbaí ach faoi 1%-2%.

640

Cé gur scóráil Grok3 níos airde ná na samhlacha uile atá tástáilte go poiblí faoi láthair, ní thógann go leor daoine é seo dáiríre: tar éis an tsaoil, cáineadh xAI roimhe seo as "ionramháil scóir" i ré Grok2. De réir mar a chuir an clár ceannaireachta pionós ar stíl fad freagraí, laghdaigh na scóir go mór, rud a d'fhág go mbíonn daoine istigh sa tionscal ag cáineadh an feiniméan "scóráil ard ach cumas íseal" go minic.

 

Cibé acu trí "ionramháil" ar chlár ceannairí nó cleasanna dearaidh i léaráidí, léiríonn siad xAI agus an dúil atá ag Musk sa choincheap "ceannródaíocht a dhéanamh" i gcumas samhail. D'íoc Musk praghas géar as na corrlaigh seo: le linn an tseolta, rinne sé gaisce as 200,000 GPU H100 a úsáid (ag éileamh "os cionn 100,000" le linn an tsrutha bheo) agus am oiliúna iomlán de 200 milliún uair an chloig a bhaint amach. Mar thoradh air seo, chreid cuid gur buntáiste suntasach eile é don tionscal GPU agus gur mheas siad tionchar DeepSeek ar an earnáil mar "amaideach". Go háirithe, creideann cuid gurb í an chumhacht ríomhaireachta íon todhchaí na hoiliúna samhail.

 

Mar sin féin, rinne roinnt úsáideoirí idirlín comparáid idir tomhaltas 2000 GPU H800 thar dhá mhí chun DeepSeek V3 a tháirgeadh, agus ríomh siad go bhfuil tomhaltas cumhachta oiliúna iarbhír Grok3 263 uair níos mó ná tomhaltas cumhachta V3. Tá an bhearna idir DeepSeek V3, a scóráil 1402 pointe, agus Grok3 díreach faoi bhun 100 pointe. Tar éis scaoileadh na sonraí seo, thuig go leor go gasta go raibh éifeacht fóntais imeallach shoiléir taobh thiar de theideal Grok3 mar an "an ceann is láidre ar domhan" - tá loighic na samhlacha níos mó ag giniúint feidhmíochta níos láidre ag tosú ag taispeáint torthaí laghdaitheacha.

640 (2)

Fiú le "scóráil ard ach cumas íseal," bhí méideanna ollmhóra sonraí ardchaighdeáin ón gcéad pháirtí ag Grok2 ón ardán X (Twitter) chun tacú leis an úsáid. Mar sin féin, in oiliúint Grok3, bhuail xAI go nádúrtha leis an "uasteorainn" atá roimh OpenAI faoi láthair - nochtann an easpa sonraí oiliúna préimhe go tapa úsáideacht imeallach chumais an mhúnla.

 

Is dócha gurb iad forbróirí Grok3 agus Musk na chéad daoine a thuigeann agus a shainaithníonn na fíricí seo go domhain, agus is é sin an fáth a bhfuil Musk ag rá i gcónaí ar na meáin shóisialta nach bhfuil sa leagan atá á fháil ag úsáideoirí faoi láthair ach "an béite" agus go "scaoilfear an leagan iomlán sna míonna amach romhainn." Tá Musk tar éis ról bhainisteoir táirgí Grok3 a ghlacadh air féin, ag moladh d'úsáideoirí aiseolas a thabhairt ar shaincheisteanna éagsúla a bhíonn le sárú sa chuid tuairimí. B'fhéidir gurb é an bainisteoir táirgí is mó a leanann daoine ar Domhan é.

 

Ach laistigh de lá amháin, gan dabht, chuir feidhmíocht Grok3 imní ar dhaoine a bhí ag súil le brath ar "matán ríomhaireachtúil ollmhór" chun samhlacha móra níos láidre a thraenáil: bunaithe ar fhaisnéis atá ar fáil go poiblí ó Microsoft, tá méid paraiméadair 1.8 trilliún paraiméadar ag GPT-4 OpenAI, níos mó ná deich n-uaire níos mó ná GPT-3. Tugann ráflaí le fios go bhféadfadh méid paraiméadair GPT-4.5 a bheith níos mó fós.

 

De réir mar a mhéadaíonn méideanna paraiméadair na samhla, tá costais na hoiliúna ag ardú go mór freisin. Le láithreacht Grok3, ní mór d’iomaitheoirí cosúil le GPT-4.5 agus daoine eile ar mian leo leanúint ar aghaidh ag “dó airgid” chun feidhmíocht níos fearr samhail a bhaint amach trí mhéid paraiméadair an uasteorainn atá le feiceáil go soiléir anois a mheas agus machnamh a dhéanamh ar conas í a shárú. Ag an nóiméad seo, dúirt Ilya Sutskever, iar-phríomheolaí ag OpenAI, roimhe seo i mí na Nollag seo caite, “Tiocfaidh deireadh leis an réamh-oiliúint a bhfuil taithí againn uirthi,” rud atá tagtha chun cinn arís i bplé, rud a spreag iarrachtaí chun an bealach ceart a aimsiú chun samhlacha móra a oiliúint.

640 (3)

Tá dearcadh Ilya tar éis rabhadh a thabhairt don tionscal. Thuar sé go cruinn go mbeadh ídiú sonraí nua inrochtana ag bagairt, rud a fhágfadh staid nach féidir leanúint ar aghaidh ag feabhsú feidhmíochta trí bhailiú sonraí, ag déanamh comparáide idir é agus ídiú breoslaí iontaise. Thug sé le fios "cosúil le hola, gur acmhainn theoranta í ábhar a ghintear ag an duine ar an idirlíon." I réamhinsintí Sutskever, beidh "fíor-neamhspleáchas" agus cumais réasúnaíochta "cosúil leis an inchinn dhaonna" ag an gcéad ghlúin eile de shamhlacha, tar éis na réamh-oiliúna.

 

Murab ionann agus samhlacha réamh-oiliúna an lae inniu a bhraitheann go príomha ar mheaitseáil ábhair (bunaithe ar ábhar an mhúnla a foghlaimíodh roimhe seo), beidh córais AI amach anseo in ann modheolaíochtaí a fhoghlaim agus a bhunú chun fadhbanna a réiteach ar bhealach cosúil le "smaointeoireacht" inchinne an duine. Is féidir le duine inniúlacht bhunúsach a bhaint amach in ábhar le litríocht ghairmiúil bhunúsach amháin, ach teastaíonn na milliúin pointí sonraí ó mhúnla mór AI chun an éifeachtúlacht iontrála is bunúsaí a bhaint amach. Fiú nuair a athraítear an fhoclaíocht beagán, b'fhéidir nach dtuigfear na ceisteanna bunúsacha seo i gceart, rud a léiríonn nach bhfuil feabhas fíor tagtha ar an tsamhail ó thaobh faisnéise de: is sampla soiléir den feiniméan seo iad na ceisteanna bunúsacha ach dodhéanta a luadh ag tús an ailt.

微信图片_20240614024031.jpg1

Conclúid

Mar sin féin, thar an bhfórsa brúidiúil, má éiríonn le Grok3 a nochtadh don tionscal go bhfuil "samhlacha réamh-oilte ag druidim lena ndeireadh," bheadh ​​​​impleachtaí suntasacha aige don réimse.

B’fhéidir tar éis don círéib a bhaineann le Grok3 maolú de réir a chéile, go bhfeicfimid níos mó cásanna cosúil le sampla Fei-Fei Li maidir le “samhlacha ardfheidhmíochta a choigeartú ar shraith sonraí ar leith ar $50 amháin,” agus an bealach ceart chuig AGI á aimsiú againn sa deireadh.

Aimsigh Réiteach Cábla ELV

Cáblaí Rialaithe

Le haghaidh BMS, BUS, Tionsclaíoch, Cábla Ionstraimíochta.

Córas Cáblála Struchtúrtha

Líonra & Sonraí, Cábla Snáithín-Optúil, Corda Paiste, Modúil, Pláta Aghaidhe

Athbhreithniú ar Thaispeántais & Imeachtaí 2024

16-18 Aibreán, 2024 Fuinneamh an Mheánoirthir i Dubai

16-18 Aibreán, 2024 Securika i Moscó

9 Bealtaine, 2024 IMEACHTA SEOLTA TÁIRGÍ AGUS TEICNEOLAÍOCHTAÍ NUA i Shanghai

22-25 Deireadh Fómhair, 2024 SLÁNDÁIL NA CÍNE i mBéising

19-20 Samhain, 2024 DOMHAN CEANGLAITHE KSA


Am an phoist: 19 Feabhra 2025