“Modelet gjuhësore rrugë pa krye, e ardhmja modelet që arsyetojnë”

Divizioni i inteligjencës artificiale i Meta-s po përballet me tronditje të mëdha pasi Yann LeCun, një nga studiuesit më me ndikim të AI në botë, po përgatitet të largohet nga kompania pas më shumë se një dekade për të themeluar një startup të fokusuar te “modelet globale”, një qasje konkurruese ndaj modeleve të mëdha gjuhësore që aktualisht drejtojnë industrinë.

LeCun, 65 vjeç, i njohur gjerësisht si një nga “tre kumbarët e AI” së bashku me Geoffrey Hinton dhe Yoshua Bengio, ka filluar bisedimet e para për grumbullimin e fondeve për sipërmarrjen e re, sipas Financial Times dhe raporteve të mediave amerikane. Pritet që startup-i të sfidojë strategjinë mbizotëruese të përdorur nga firmat e mëdha të teknologjisë.

Largimi i tij vjen në një kohë kur kreu i Meta-s, Mark Zuckerberg, po e shtyn kompaninë drejt zhvillimit të shpejtë, të orientuar nga produkti, të modeleve të mëdha gjuhësore, si familja e saj Llama. Kjo qasje fitoi vrull pas ngritjes së ChatGPT, por është në kontrast të fortë me pikëpamjet e mbajtura prej kohësh nga LeCun.

LeCun ka argumentuar në paraqitjet e fundit publike, përfshirë konferencat e AI në Paris dhe Seul, se modelet gjuhësore të stërvitura me tekst nuk kanë aftësinë të kuptojnë botën fizike, të planifikojnë veprime të ndërlikuara ose të bëjnë gjykime shkakësore në nivel njerëzor. Ai i ka krahasuar kufizimet e tyre me inteligjencën e përditshme të kafshëve, duke thënë se një mace shtëpie mund të planifikojë detyra të ndërlikuara dhe të ndërtojë një pamje shkakësore të mjedisit të saj në mënyra që sistemet e tanishme nuk munden.

Sipas LeCun, një fëmijë katërvjeçar thith shumë më shumë informacion shqisor përmes shikimit dhe prekjes sesa ka hasur ndonjë model ekzistues përmes tekstit, madje edhe ato të stërvitura me të dhëna të barasvlershme me qindra mijëra vjet lexim njerëzor. Detyrat e thjeshta për njerëzit, të tilla si përfytyrimi i një kubi që rrotullohet, mbeten përtej aftësive të sistemeve vetëm me tekst.

Startup-i do përqendrohet te “modelet globale” një qasje e krijuar për t’i dhënë sistemeve të AI një përfaqësim të brendshëm të strukturës fizike, dinamikës dhe marrëdhënieve shkak-pasojë. Mbështetësit thonë se modele të tilla mund t’i lejojnë AI-së të parashikojë rezultatet e veprimeve përpara se të ndodhin, ngjashëm me mënyrën se si njerëzit dhe kafshët planifikojnë sjelljen. Fusha mbështetet në të dhëna të mishëruara, si video, informacione hapësinore dhe prekje, dhe kërkon arkitektura të reja njohëse që janë më të ngadalta për t’u tregtuar.

LeCun nuk është i vetëm në mbrojtjen e kësaj metode. Profesorja e Stanfordit, Fei-Fei Li, e cila drejton startup-in ëorld Labs, ka bërë thirrje për ndërtimin e “inteligjencës hapësinore” në vend që të mbështetet vetëm te të dhënat gjuhësore. Google DeepMind dhe Nvidia kanë investuar gjithashtu në kërkime afatgjata për modelet e botës.

Largimi i tij pason një ristrukturim brenda Meta-s. Zuckerberg kohët e fundit formoi divizionin Mega Superintelligence Labs dhe emëroi Alexander Wang, 28-vjeçarin themelues të Scale AI, për ta udhëhequr atë. Ndryshimi përfshiu shkurtime në FAIR, grupin e kërkimit afatgjatë që LeCun themeloi, duke e vendosur atë nën një udhëheqje të re të përqendruar në vendosjen e shpejtë të modeleve gjuhësore. Lëvizja kontribuoi në atë që burimet e përshkruan si një ndarje ideologjike në rritje.

LeCun ka thënë se krijimi i modeleve globale të afta për arsyetim të vërtetë fizik mund të marrë një dekadë ose më shumë. Vendimi i tij për t’u larguar nga Meta pasqyron një ndarje në rritje në industrinë e AI midis komercializimit të shpejtë të produkteve të bazuara në LLM në Shtetet e Bashkuara, Evropë dhe Kinë dhe përpjekjeve afatgjata që synojnë zhvillimin e inteligjencës së gjerë, të nivelit njerëzor, shkruan Ynet.

“Modelet gjuhësore rrugë pa krye, e ardhmja modelet që arsyetojnë” – Kumbari i inteligjencës artificiale

RAJON & KOSOVË

SPORT

Related Posts

Facebook

BORDI

KONTAKT