Vendosni fjalën kyçe....

Rimodelimi i Internetit: Agjentët e rinj të AI sjellin një kthesë të madhe në kërkim dhe punën online


Tregu i agjentëve inteligjentë po nxehet dhe Google nuk ka ndërmend të mbetet pas. Në konferencën e tij vjetore të zhvilluesve, Google I/O 2026, të mbajtur javën e kaluar në selinë e kompanisë në Mountain View, Kaliforni, gjiganti teknologjik zbuloi një sërë njoftimesh që sinjalizojnë një ndryshim dramatik: një largim nga era e bisedave (chatbots) të tre viteve të fundit drejt një ere të re të agjentëve të AI që punojnë në mënyrë të pavarur gjatë gjithë kohës dhe kryejnë detyra të plota nga fillimi në fund.

Shefi i Google, Sundar Pichai, dhe drejtues të lartë folën gjerësisht për agjentët e AI gjatë aktivitetit, por tre njoftime spikatën mbi të tjerat. Këto nuk ishin thjesht përditësime graduale, por një pikë kthese që shënon fazën tjetër të inteligjencës artificiale.

Nga “të pyesësh” në “të bësh”

Tre vjet pasi ChatGPT shkaktoi një revolucion duke vërtetuar se makineritë mund të zhvillojnë biseda të rrjedhshme, e gjithë industria ndodhet tashmë në mes të hapit të radhës. Nëse në erën e kaluar ne flisnim me chatbot-et dhe merrnim përgjigje, në erën e re ne caktojmë një detyrë dhe agjenti e kryen atë vetë.

Kuptimi praktik është i qartë: në vend që të kërkojnë “më shkruaj një email për shefin tim”, përdoruesit mund të thonë “gjej tre ofrues të shërbimeve të pastrimit në Tel Aviv, krahasoji ata dhe cakto një takim me më të lirin”. Agjenti do ta bëjë këtë në mënyrë të pavarur, madje edhe ndërsa përdoruesit flenë. Kjo ishte mantra e përsëritur përgjatë gjithë konferencës dhe konteksti kyç për të kuptuar njoftimet që pasuan.

Agjenti që punon edhe kur kompjuteri është i fikur

Njoftimi kryesor i konferencës ishte Gemini Spark, një agjent personal i AI që funksionon në serverët e Google dhe vepron 24/7, madje edhe kur telefoni dhe kompjuteri i përdoruesit janë të fikur. Përdoruesit i caktojnë një detyrë dhe ai e ekzekuton atë nga fillimi në fund: hulumton, krahason opsionet, lundron në faqe, lidhet me mjete të jashtme si Gmail dhe Calendar, dhe madje kryen rezervime në emër të përdoruesit.

Çfarë e bën atë ndryshe?

Deri më tani, bisedat me Gemini ishin të vazhdueshme. Çdo kërkesë kërkonte pritjen e një përgjigjeje në ekran, përgjigjen përsëri dhe përsëritjen e ciklit. Spark e thyen këtë lak. Përdoruesit japin udhëzimet një herë, mbyllin pajisjen e tyre dhe kthehen më vonë për të gjetur rezultatin e përfunduar.

Çfarë ndodh me të dhënat personale?

Sa i përket sigurisë së të dhënave, Google ishte i qartë në konferencë: të dhënat personale nga aplikacionet si emailet, dokumentet dhe ngjarjet e kalendarit nuk përdoren për të trajnuar modelet dhe nuk lexohen nga njerëzit. Agjenti akseson vetëm aplikacionet që përdoruesit autorizojnë në mënyrë eksplicite dhe ndjek udhëzime të përcaktuara ngushtë, në vend që të bëjë skanime të gjera. Çdo veprim i ndjeshëm, si pagesat, dërgimi i emaileve ose fshirja e skedarëve, kërkon një konfirmim të veçantë.

Editori i parë i videove që në të vërtetë është një agjent

Njoftimi i dytë i madh ishte Gemini Omni. Ajo që e veçon Omni-n nuk është vetëm aftësia e tij për të gjeneruar video, por arkitektura e tij. Ai nuk është thjesht një model tjetër videoje, por ajo që mund të përshkruhet si një “meta-model” – një sistem që mund të orkestrojë modelet e tjera të AI të Google dhe t’i kombinojë ato në kohë reale.

Kur Omni ka nevojë për një imazh statik të një personazhi, objekti ose sfondi, ai thërret Nano Banana, modelin e Google për gjenerimin e imazheve. Kur ka nevojë të kuptojë se çfarë duhet të ndodhë më pas në një skenë, ose si duhet të sillet realiteti fizik, apo cili kontekst historik, shkencor ose kulturor është i rëndësishëm, ai i drejtohet Gemini-t.

Duke kombinuar modele të ndryshme, Omni siguron konsistencë: personazhet mbeten të njëjtë përgjatë skenave, ligjet fizike respektohen dhe çdo modifikim ndërtohet mbi atë parashikues pa humbur kontekstin.

Kjo është efektivisht hera e parë që një model i gjenerimit të videove funksionon si një agjent i plotë i AI. Në vend që të prodhojë një klip gjenerik dhe të ndalojë aty, Omni funksionon si një montazhier digjital: ai kupton kërkesën, hulumton se çfarë nevojitet, gjeneron elementet që mungojnë dhe monton një video përfundimtare koherente.

Omni mund të përfaqësojë një ndryshim më të gjerë nga përdorimi i mjeteve te përdorimi i agjentëve, ose “punëtorëve”, që kryejnë detyra në mënyrë të pavarur nga fillimi në fund.

Duke qenë se një aftësi e tillë kërkon masa të forta sigurie, Google theksoi mekanizmat e sigurisë të ndërtuar brenda Omni-t. Çdo video e gjeneruar ose e modifikuar merr një shenjë uji të fshehur (SynthID) dhe një certifikatë të autentifikimit të përmbajtjes (C2PA), duke mundësuar identifikimin e përmbajtjes së krijuar nga AI.

Sistemi bllokon përmbajtjet që përfshijnë të mitur ose figura publike, është i kufizuar për përdoruesit e moshës 18 vjeç e lart dhe parandalon keqpërdorimin për shkelje të të drejtave të autorit, mashtrim ose ngacmim. Krijimi i avatarëve është gjithashtu i kufizuar, kështu që përdoruesit mund të gjenerojnë vetëm pamjen e tyre.

Pas 25 vitesh, kërkimi po ndryshon

Kutia e njohur e kërkimit të Google ka mbetur gjerësisht e pandryshuar që nga themelimi i kompanisë në vitin 1998. Drejtkëndëshi i thjeshtë me butonin e tij blu u bë pjesë e vetë internetit. Në konferencë, Google njoftoi se kërkimi po përgatitet të kalojë një nga transformimet e tij më domethënëse.

Përvoja e re e kërkimit bëhet një sistem hibrid që kombinon kërkimin tradicional me një bisedë të vazhdueshme të mundësuar nga Gemini. Përdoruesit mund të ngarkojnë skedarë, video ose madje të hapin dritare të Chrome dhe të bëjnë pyetje rreth tyre në gjuhë natyrale.

E thënë thjesht, në vend që të kërkojnë “si të rregulloj një rubinet që pikon”, përdoruesit do të mund të filmed rubinetin, të ngarkojnë videon dhe të marrin udhëzime të sakta bazuar në atë që identifikon Gemini.

Përveç kësaj, Google prezantoi një aftësi të re që e quan Generative UI (Ndërfaqe Gjenerative). Një kërkesë si “më planifiko një rutinë fitnesi” nuk do të kthejë më një listë me linqe, por në vend të kësaj do të gjenerojë një mini-aplikacion me një kalkulator ndërveprues, një plan javor të personalizuar dhe grafika vizuale.

Kërkimi i ri përfshin gjithashtu një shtresë sigurie. Funksionet që lidhin të dhënat personale si Gmail ose Google Photos – ajo që Google e quan Personal Intelligence (Inteligjenca Personale) – janë të fikura si parazgjedhje (default) dhe kërkojnë leje të qartë nga përdoruesi, me mundësinë për të zgjedhur se cilat aplikacione të lidhen ose të shkëputen në çdo kohë.

Mjetet e Google për zbulimin e përmbajtjes do të integrohen direkt në kërkim, duke u mundësuar përdoruesve të kontrollojnë nëse një imazh është gjeneruar nga AI, ndërsa përmbajtjet deepfake dhe ato mashtruese do të ulen automatikisht në renditje (rankings).

Ky njoftim është gjithashtu strategjikisht i rëndësishëm. Google po minon efektivisht modelin e tij të të ardhurave: më pak klikime në linqe nënkuptojnë më pak shikime të reklamave. Kompania ka zgjedhur të marrë përsipër rrezikun, duke e pranuar se nëse nuk lëviz e para, konkurrentët si OpenAI dhe Perplexity do ta bëjnë këtë.

Disponueshmëria është e menjëhershme. Këto funksione janë tashmë të qasshme falas për përdoruesit përmes “AI Mode” në Google, përfshirë edhe në Izrael. Funksionet e Generative UI do të mbërrijnë në verë, po ashtu falas.

Vlen të përmendet se pas një prej njoftimeve kryesore të konferencës qëndronte një studiues izraelit, Profesor Yossi Matias, Zëvendëspresident dhe Drejtues i Google Research. Matias udhëhoqi njoftimin e Gemini for Science, një suitë mjetesh e krijuar për të përshpejtuar kërkimin shkencor, nga gjenerimi i hipotezave deri te kryerja e eksperimenteve.

Çfarë do të thotë e gjitha kjo në praktikë?

Së pari, përfundimi i qartë është se era e “thjesht të kërkuarit” ka mbaruar dhe kërkimi po kthehet në një shtresë veprimi. Në vend të një liste me linqe, përdoruesit marrin rezultate të gatshme dhe herë pas here madje edhe shërbime të automatizuara.

Së dyti, ngushtica (bottleneck) po zhvendoset nga makineritë te njerëzit. Me fjalë të tjera, agjentët mund të ekzekutojnë detyra, por sfida qëndron në atë se çfarë mund të kërkojnë njerëzit në të vërtetë. Aftësia për të formuluar qartë detyrat po kthehet në një aftësi profesionale më vete.

Pichai e përshkroi këtë moment duke thënë: “Ndërsa hymë në këtë erë agjentësh, Kërkimi do të jetë më i dobishëm dhe më i fuqishëm se kurrë.” Dhe ndoshta kjo është pika më e rëndësishme nga të gjitha: pas tre vitesh premtime dhe demonstrime, e gjithë industria, përfshirë Google, tani e kupton se duhet të japë rezultate konkrete, shkruan Ynet.