tirsdag 28. januar 2025

Kinas KI-sjokk

Nyheter om større og bedre versjoner av språkmodeller og chatbotter har kommet tett som hagl de siste to årene, og det har vært vanskelig å følge med på alt. men den siste uken kom nyheten som virkelig fikk fart i aksjekursen på amerikanske teknologiaksjer. Nedover.  

Nyheten om at den kinesiske AI-selskapet DeepSeek har utviklet en språkmodell som er nesten like bra som de amerikanske kom samtidig som Trump ble insatt som president, og fikk noen til å beskrive det som vårt tids "Sputnik-moment", sjokket da Sovjetunionen i 1957 sendte verdens føste satelitt ut i verdensrommet, før USA. Og DeepSeek er ikke den eneste kinesiske AI-modellen. Det kommer flere.

The Economist hadde en edruelig lederartikkel i helgen om hva dette betyr, der de skriver at:

"Even as Mr Trump was giving his inaugural oration, a Chinese firm released the latest impressive large language model (LLM). Suddenly, America’s lead over China in ai looks smaller than at any time since ChatGPT became famous. China’s catch-up is startling because it had been so far behind—and because America had set out to slow it down.(...) Yet China’s most recent progress is upending the industry and embarrassing American policymakers. The success of the Chinese models, combined with industry-wide changes, could turn the economics of AI on its head. America must prepare for a world in which Chinese AI is breathing down its neck."

Men akkurat hva er det disse industrielle endringene i KI-bransjen The Economist bekriver handler om? Det dreier seg blant annet om forholdet mellom proprietære modeller og modeller med åpen kildekode, der de proprietære riskierer å få sin forretningsmodell undergravd av de som deler progravaren sin. Men enda viktigere handler det om at trening av språkmodeller med høye hardwarekostnader og lave driftskostnader blir snudd på hodet. Det er slett ikke sikkert at DeepSeek vinner denne konkurrransen, men de viser hvordan ting kan gjøres langt billigere enn vi trodde (og billigere enn de store hardwareselskapenes forretningsmodeller krever). The Economist beskriver det slik:

"If good-enough AI models can be trained relatively cheaply, then models will proliferate, especially as many countries are desperate to have their own. And a high cost-per-query may likewise encourage more built-for-purpose models that yield efficient, specialised answers with minimal querying. The other consequence of China’s breakthrough is that America faces asymmetric competition. It is now clear that China will innovate around obstacles such as a lack of the best chips, whether by efficiency gains or by compensating for an absence of high-quality hardware with more quantity."

The Economist følger opp denne høyttenkingen om hvordan Kinas gjennombrudd kan åpne opp for andre forretningsmodeller i en lengre breifing med overskriften "Why Chinese AI has stunned the world". Her beskrives ulike kinesiske KI-initiativer som har vært pågående de siste årene, og hva slags opphav og utvikling DeepSeek har hatt før de brått dukket opp på radaren nå. Artikkelen sammenligner ytelsen til DeepSeek med modeller som OpenAI, Gemini og Llama, de beste amerikanske modellene, og kostnadene for å bruke dem, som er langt lavere for DeepSeek. Jeg tror artikkelen er bak en betalingsmur for de som ikke abonnerer på The Economist. Men en liten smakebit om at det til tross for "DeepSeek-sjokket" ikke er gitt at Kina vil passere USA når det gelder KI-kappløpet:

"This does not necessarily mean that Chinese models will sweep the world. American AI still has capabilities that its Chinese rivals cannot yet match. A research programme from Google hands a user’s web browser over to its Gemini chatbot, raising the prospect of AI “agents” interacting with the web. Chatbots from Anthropic and OpenAI won’t just help you write code, but will run it for you as well. Claude will build and host entire applications. And step-by-step reasoning is not the only way to solve complex problems. Ask the conventional version of ChatGPT the maths question above and it writes a simple program to find the answer. More innovations are in the pipeline, according to Mr Altman, who is expected to announce soon that OpenAI has built “PhD-level super-agents” which are as capable as human experts across a range of intellectual tasks. The competition nipping at American AI’s heels may yet spur it to greater things."

Sjokk kan noen ganger være innovasjonsutløsende, og dermed ganske sunne. Og disruptive innovasjoner som gjør mer eller mindre samme nytten for kunden, men til en langt lavere pris er teknologihistorien full av ekspler på. Jeg tenker at professor Clayton Christensen ville nikket annerkjennende hvis han fortsatt var blant oss.

Ingen kommentarer :

Legg inn en kommentar