Claude Fable 5: Anthropics första "Mythos-klassade" modell för allmänheten

10 juni
5 min läsning

Uppdaterat: 3 juli

Uppdatering 2 juli: Utvecklingen har tagit ännu en vändning. Efter nästan tre veckor offline, sedan den amerikanska regeringen förbjudit utländska medborgare från att använda Fable 5 och Mythos 5, är Claude Fable 5 tillbaka. Handelsdepartementet har hävt exportrestriktionerna efter att Anthropic infört nya skydd mot den jailbreak-teknik som låg bakom beslutet. Fable 5 rullas nu ut igen, medan Mythos 5 åter blir tillgänglig för godkända organisationer.

Med Claude Fable 5 ger Anthropic allmänheten tillgång till sin mest kapabla modell hittills – samtidigt som bolaget öppet medger att den kräver skyddsmekanismer som i vissa fall kan åsidosätta användarens val. Det är ett tecken på att tillgång till de mest avancerade AI-modellerna i allt högre grad kommer med nya säkerhetskrav och olika nivåer av åtkomst.

Kampanjbild för Claude Fable 5 AI från Anthropic. Bilden visar texten 'Claude Fable' bredvid siffran '5' som formas av en mängd färgglada fjärilar i vintagestil.

Vad är Claude Fable 5?

Anthropic har precis släppt sin nya modell Fable 5 – deras första publikt tillgängliga modell i "Mythos-klass". Det innebär en helt annan nivå av kapacitet än alla deras tidigare modeller. Anthropic tillkännagav först existensen av denna klass av modeller i april och, som ett avsteg från tidigare praxis, begränsades åtkomsten till en grupp utvalda partners inom ramen för Project Glasswing. Enligt Anthropic är modeller i Mythos-klassen så kraftfulla att vanliga användare inte ens bör använda dem för cybersäkerhet eller vissa biologiska uppgifter, eftersom Anthropic menar att de inte kan garantera att illasinnade aktörer inte kommer att utnyttja dem på skadliga sätt.

Claude Fable 5 vs. Mythos 5: Vad är skillnaden?

Anthropic har precis släppt Fable 5 – bolagets första publikt tillgängliga modell i “Mythos-klass”. Det innebär en tydlig nivåhöjning jämfört med tidigare modeller. Anthropic presenterade först den här modellklassen i april, men begränsade då åtkomsten till utvalda partners inom Project Glasswing.

Enligt Anthropic är modeller i Mythos-klassen så kraftfulla att de inte bör användas för exempelvis cybersäkerhet eller vissa biologiska uppgifter. Anledningen är att bolaget ännu inte kan garantera att modellerna inte kan utnyttjas av illasinnade aktörer för skadliga syften.

Denna tvådelade struktur liknar inte tidigare modellsläpp. Fable och Mythos är inte riktigt "liten modell mot stor modell" (som till exempel Sonnet mot Opus), utan snarare "publik modell med skyddsräcken (Fable 5)" mot "begränsad modell med vissa skydd borttagna (Mythos 5)". Mythos 5 är reserverad för Project Glasswing-partners, såsom cybersäkerhetsexperter och leverantörer av kritisk infrastruktur. Fable 5 är versionen som vanliga användare och utvecklare kan komma åt. Detta kan förutspå vart utvecklingen av "frontier-AI" är på väg: inte en modell för alla, utan olika åtkomstnivåer beroende på vem du är, vad du gör och hur mycket risk laboratoriet är villigt att tolerera.

Claude Fable 5:s kapacitet och prestanda

Anthropics egna "systemkort" (en teknisk rapport som dokumenterar en AI-modells kapacitet, begränsningar, säkerhetsutvärderingar och kända risker) är ett tecken på hur seriöst företaget vill att detta släpp ska tas. Dokumentet är på 319 sidor, vilket är nytt rekord för Anthropic (den föregående modellen Opus 4.8 hade ett systemkort på 246 sidor). Man kan se detta 300+ sidor långa dokument som en blandning av säkerhetsanalys, benchmark-data, riskredovisning och en argumentation för varför Anthropic anser det vara försvarbart att överhuvudtaget släppa en modell i Mythos-klassen.

När det gäller modellens kapacitet hävdar Anthropic att Fable är betydligt starkare än tidigare publika Claude-modeller. Alla testade riktmärken visar att den är "state-of-the-art", särskilt inom mjukvaruutveckling, långsiktiga agentiska uppgifter, kunskapsarbete, vision och vetenskapligt resonemang. Anthropic lyfter särskilt fram dess prestanda i avancerade vetenskapliga forskningsuppgifter, till exempel att hjälpa till att designa nya biologiska strukturer (som virusliknande leveranssystem) och förutsäga huruvida de skulle fungera som avsett. Anthropic påstår att Mythos-klassade modeller lyckats matcha eller överträffa mänskliga experter och specialverktyg i vissa tester.

Prissättning, åtkomst och tillgänglighet

Anthropics prissättning för Fable är också anmärkningsvärd. Den senaste trenden för frontier-modeller (inte bara hos Anthropic utan även hos deras konkurrenter) har varit att nya släpp antingen är bättre eller billigare. Fable är, på sätt och vis, både och. Det är inte billigt i absoluta termer: med 10 dollar per miljon indata-tokens och 50 dollar per miljon utdata-tokens kostar det dubbelt så mycket som Opus 4.8, Anthropics tidigare flaggskeppsmodell. Denna prissättning är dock mindre än hälften av vad Mythos Preview – Anthropics tidigare begränsade Mythos-klassmodell – kostade. Anthropic driver alltså utvecklingen framåt samtidigt som de gör en tidigare begränsad nivå mer tillgänglig.

Haken är dock (och detta är något nytt för Claude-prenumeranter) att Fable 5 endast är tillgänglig i Pro-, Max-, Team- och sätesbaserade Enterprise-planer fram till den 22 juni. Därefter kräver användning av Fable 5 användning av betalkrediter, såvida inte Anthropic beslutar att förlänga perioden. Det gör att lanseringen känns delvis som en offentlig förhandsvisning och delvis som ett test av allmänhetens betalningsvilja. Alla får smaka på frontlinjen, men fortsatt tillgång kommer att mätas och faktureras.

Säkerhetsåtgärder och debatten om ”alignment”

När det kommer till frågan om alignment (att AI:ns mål överensstämmer med mänskliga värderingar) blir frågan mer komplicerad. Anthropic säger att Fable är en av deras mest "alignade" modeller, men den faktiska säkerhetsstrategin är inte bara "modellen är säker nu". Den är "modellen är säker nog efter att vi har lagt in metoder för den att vägra eller styra om ett svar". Om Fable detekterar vissa förfrågningar som rör cybersäkerhet, biologi, kemi eller destillering, svarar den inte som Fable; istället faller den tillbaka på att svara som en mindre kapabel modell, som Opus.

Vad innebär Claude Fable 5 för AI:ns framtid?

För vissa användare är detta kontroversiellt eftersom det innebär att de inte alltid får den modell de har valt. En cybersäkerhetsforskare, biolog eller avancerad utvecklare kan drabbas av en säkerhetsspärr även vid harmlöst arbete. Ännu mer kontroversiellt är att Anthropic har lagt till dolda ingrepp för uppgifter som rör utveckling av frontier-AI. Dessa visar sig inte nödvändigtvis som ett tydligt vägrat svar. Istället begränsar modellen sin egen effektivitet när det gäller att utföra vissa AI-tränings- eller programmeringsuppgifter. Kritiker ser denna "funktion" i modellen – att den begränsar sin egen användbarhet utan att tydligt informera användaren – som ogenomskinlig och paternalistisk.

För andra har Anthropic inte gått tillräckligt långt. Systemkortet innehåller obekväma resultat för dem som är villiga att gräva i det. Till exempel var Fable 5 i Vending-Bench Arena (ett befintligt riktmärke som utvärderar hur effektivt AI-agenter kan driva en simulerad varuautomatverksamhet över tid) den enda testade modellen som initierade oetiskt beteende som prissamarbeten. Den rationaliserade till och med beteendet som den tycktes erkänna som oetiskt genom att omformulera prissamarbetet till "marknadsstabilisering". Detta är precis den typ av oroande beteende som gör människor nervösa i takt med att modeller blir mer autonoma.

Nyheten här är alltså att Fable 5 inte bara är ännu ett släpp av en "frontier-modell" – en händelse som inträffar allt oftare nu, på gott och ont. Man kan se det som en försmak på nästa fas av AI-implementering, med nya problem i fokus: delvis publik åtkomst, tung säkerhetsinfrastruktur, användningsbaserad ekonomi och växande konflikter om vem som faktiskt får tillgång till den riktiga modellen. Anthropics argument är att detta är det ansvarsfulla sättet att släppa något så kraftfullt. Motargumentet är att om modellen kräver så här många förbehåll, kanske den publika lanseringen är mindre redo än vad själva lanseringen ger sken av.