Vendosni fjalën kyçe....

Në Kinë shpërthen kërkesa për mallin më të kërkuar, Token-at e Inteligjencës Artificiale


Kina po fiton terren në mallin më të nxehtë të industrisë globale të AI: token-at.

Që nga shkurti, modelet kineze të AI të krijuara nga grupe të tilla si DeepSeek dhe MiniMax kanë parakaluar rivalët amerikanë në konsumin e token-ave, sipas të dhënave të OpenRouter, i cili gjurmon këto njësi teksti, kodi ose të dhënash të përpunuara nga modelet e mëdha gjuhësore.

Ky ndryshim tregon për një ndryshim më të thellë në garën e AI, me Jensen Huang të Nvidia-s që tha këtë muaj se prodhimi dhe përdorimi i njësive dixhitale do udhëheqë ekonominë e AI. Për shkak se zhvilluesit tarifohen për token, ai shërben si një tregues për përshtatjen e modeleve dhe si një fushëbetejë çmimesh mes kompanive të AI-së.

Ndërsa agjentët e AI, si ata të ndërtuar mbi platformën me burim të hapur OpenClaw, konsumojnë shumë më tepër token sesa chatbot-et e hershëm, aftësia për të prodhuar token të lirë po riformëson konkurrencën globale dhe po i jep Kinës një avantazh të ri.

“Nëse agjenti juaj po djeg miliona token në ditë, edhe një dallim i vogël çmimi për token bëhet një zë i rëndësishëm shpenzimesh,” tha Will Liang, drejtor ekzekutiv i Amplify AI Group, një firmë konsulence teknologjike me bazë në Sidnej.

“Ky është një stimul strukturor për laboratorët kinezë, dhe ai vetëm rritet ndërsa përshtatja e agjentëve zgjerohet.”

Avantazhi i kostos i grupeve kineze të AI rrjedh nga energjia më e lirë dhe modelet më efiçente, duke lejuar kompani të tilla si MiniMax dhe Moonshot të tarifojnë 2 deri në 3 dollarë për milion token output, krahasuar me rreth 15 dollarë për Claude Sonnet 4.5 të Anthropic, një hendek gati gjashtëfish.

Dallimi bëhet i theksuar me agjentët e AI, të cilët konsumojnë shumë më tepër token sesa chatbot-et. Përmbledhja e Hamletit të Shekspirit mund të marrë rreth 30,000 token për një chatbot, por një agjent AI mund të kërkojë deri në 20 milionë për një detyrë të vogël kodimi.

Kjo po ndryshon mënyrën se si zhvilluesit e AI zgjedhin t’i shpenzojnë paratë e tyre. Terry Zhang, një zhvillues me bazë në Hong Kong, tha se ai tani shpenzon rreth 50 dollarë në ditë duke përdorur modelin Kimi të Moonshot për rreth 80 për qind të punës së tij, duke e rezervuar Claude të Anthropic për detyra më komplekse.

“Më parë thirrja vetëm Claude, por tani me rritjen e vëllimit të punës, përdorimi i vetëm Claude do më kushtonte rreth 900 dollarë në ditë,” tha ai.

“Është shumë, dhe përdorimi i kombinuar i Kimi dhe Claude funksionon mirë për mua.”

Trendi po pasqyrohet edhe në të ardhura. MiniMax, modeli M2.5 i të cilit tani renditet ndër më të përdorurit në nivel global sipas konsumit të tokeneve, ka parë një rritje të përdorimit të tokeneve me 476 për qind nga një muaj më parë që prej 20 marsit, sipas OpenRouter.

Ndërsa OpenRouter përfaqëson vetëm një pjesë të konsumit global të modeleve, ai përdoret gjerësisht si një tregues i industrisë, pasi të dhëna të tilla janë të pakta kudo tjetër.

Grupet amerikane po rriten ende me shpejtësi ndërsa tregu i përgjithshëm zgjerohet, me OpenAI, Anthropic dhe Google që raportojnë rritje të fortë të të ardhurave dhe adoptimit. Por modelet kineze me kosto më të ulët kanë gjetur një hapësirë për të fituar terren mes përdoruesve në mbarë botën.

Avantazhi i çmimit të tokeneve në Kinë rrjedh pjesërisht nga investimi i madh i vendit në energjinë e rinovueshme. Qeveria kineze këtë muaj përcaktoi “sinergjinë llogaritje-energji elektrike” si një prioritet kombëtar në raportin e saj të punës për vitin 2026, duke lidhur në mënyrë eksplicite politikën energjetike me konkurrencën në AI.

Në anën e softuerit, grupet kineze kanë përqafuar arkitektura efiçente të AI, si dizajnet “mixture-of-experts” që ulin kërkesën llogaritëse, ndonjëherë në kurriz të saktësisë. Kjo shtysë për efiçencë llogaritëse është nxitur nga mungesa e çipave të përparuar në Kinë për shkak të kontrolleve të eksportit të SHBA-së.

Ka kufizime teknike. Modeli GLM-5 i Zhipu AI kryesoi shkurtimisht listat e OpenRouter në shkurt përpara se përdorimi të rritej përtej kapacitetit të tij llogaritës, duke shkaktuar vonesa dhe degradim të shërbimit.

Kompania, e cila u desh të kërkonte falje dhe të rriste çmimet, pa aksionet e saj të bien me 22 për qind brenda ditës, duke fshirë më shumë se 10 miliardë dollarë në vlerë tregu.

“Aftësia e modelit ka rëndësi, por llogaritja dhe shërbimi i qëndrueshëm janë njëlloj të domosdoshme,” tha një zhvillues veteran në Google. Gemini 3 Flash i Google renditet i dyti ndër pesë modelet më të përdorura këtë muaj, pas Minimax, shkruan Financial Times.

Gjigantët teknologjikë të Kinës kanë lëvizur shpejt për të shfrytëzuar avantazhin e tyre. Në fillim të këtij muaji, Alibaba njoftoi krijimin e Alibaba Token Hub, një grup i ri biznesi që do drejtohet nga drejtori ekzekutiv Eddie Wu. Njësia sinjalizon pikëpamjen e Alibabës se ekonomia e tokeneve do të përcaktojë fazën e ardhshme të konkurrencës në AI.

“Ne po qëndrojmë në pragun e një pike kthese të AGI (Inteligjencës Artificiale të Përgjithshme),” shkroi Wu në një memo të brendshme javën e kaluar.

“Miliarda agjentë të AI janë gati të marrin një pjesë gjithnjë e më të madhe të punës dixhitale, secili i fuqizuar nga tokenat e gjeneruar nga modelet, dhe këta agjentë do të bëhen gjithnjë e më shumë ndërfaqja kryesore midis njerëzve dhe botës dixhitale.”

Nëse avantazhi i tokeneve të Kinës mund të vazhdojë mbetet e paqartë, veçanërisht pasi disa kompani mbeten të kujdesshme ndaj mbështetjes në modele që operojnë në qendrat kineze të të dhënave.

“Pengesat gjeopolitike janë të rëndësishme, veçanërisht për qeveritë dhe industritë e rregulluara,” tha Liang i Amplify.

“Rregullatorët po bëjnë pyetje më të vështira se ku përpunohen të dhënat dhe nën juridiksionin e kujt bien ato.”