Kineska kompanija uspjela je napraviti AI model DeepSeek koji može parirati najboljim američkim jezičnim modelima, tako i Chat GPT-u. Kinezi su zbog nedostatka najboljih čipova, jer ih ne mogu uvoziti, koristili slabije čipove, a njihov se veliki jezični model (LLM) model može danas besplatno skinuti s mreže. Na taj je način započeo tehnološki rat između Amerike i Kine koji doduše traje već duže vremena i podsjeća na nekadašnje utrku u svemiru između SSSR-a i Amerike, a da ne spominjemo utrku u naoružanju. Osim toga, možda se još netko uključi u tu utrku, možda nećemo dugo čekati, favorit je Indija.
Posljedica slijepog vjerovanja u američku tehnološku nadmoć je stvarni šok na američkim burzama. Dionice najveće kompanije na svijetu Nvidie koja proizvodi sofisticirane čipove pale su za 17 posto ili ogromnih 600 milijardi dolara u jednom danu, što je svjetski rekord, no već se polako oporavljaju. Sem Altman iz Open AI-a odmah je reagirao na konkurenciju, rekavši da će isporučiti dodatne usluge ChatGPT-a koje se doduše plaćaju. To je tek početak natjecanja, koje će utjecati na cijeli svijet i sve ulagače u tehnološke tvrtke.
No što je to toliko novo da je prestrašilo američke ulagače na burzama i izazvalo paniku? Najprije cijena, Kinezi su objavili da je napravili svoj model po cijeni od oko 6 milijuna dolara, dok američki stoji oko 500 milijuna dolara, dakle gotovo je sto puta jeftiniji i besplatan. To znači da nisu potrebni skupi i napredni čipovi da bi se to postiglo, a kapital bježi kad osjeti strah da će vrijednost dionica pasti i to je razlog prvotnog šoka u Americi.
Znalci i stručnjaci koji se bave umjetnom inteligencijom tvrde da su Kinezi koristili manje skupog hardvera, a više optimizaciju algoritama, dakle poboljšali su softersku tehniku i onda im je to ispalo jeftinije. Je li baš to sto puta jeftinije i ima li na kineskoj strani neka dodatna priča o cijeni za koju ne znamo, nije za sada jasno.
Kineski softver ne nudi ništa bitno različito, samo pokazuje da se to može napraviti i jeftinije. Konkretno, korišteno je čisto pojačano učenje, odnosno metoda pokušaja i pogrešaka kod uvježbavanja algoritama, ali i ekspertno učenje, takozvana MoE arhitektura, koja za odgovore koristi specijalizirane stručnjake iz pojedinih područja, a ne istražuje široko područje. To znatno pojeftinjuje model, a uz to koristi već obrađena znanja svojih „učitelja“ odnosno prijašnjih svjetskih modela (neki bi rekli da krade), kao i sposobnost višestruke pažnje, takozvane MLA, zbog nijansiranja odgovora.
Ova će godina biti posebno zanimljiva za potrošače, dobit će niz noviteta, kao da prošla godine nije bila dovoljna, a granice tehnološke nadmoći sve su tanje.







