Claude Fable 5: Anthropics första "Mythos-klassade" modell för allmänheten
- för 2 dagar sedan
- 5 min läsning
Med Claude Fable 5 erbjuder Anthropic allmänheten sin mest kapabla modell hittills – och medger samtidigt öppet att den inte är säker nog att släppas fri utan skyddsmekanismer som kan åsidosätta användarens val. Det är en satsning på att omfattande säkerhetsåtgärder är priset för tillgång till den tekniska frontlinjen, och en försmak på de åtkomstnivåer som kan komma att definiera nästa fas av AI.

Vad är Claude Fable 5?
Anthropic har precis släppt sin nya modell Fable 5 – deras första publikt tillgängliga modell i "Mythos-klass". Det innebär en helt annan nivå av kapacitet än alla deras tidigare modeller. Anthropic tillkännagav först existensen av denna klass av modeller i april och, som ett avsteg från tidigare praxis, begränsades åtkomsten till en grupp utvalda partners inom ramen för Project Glasswing. Enligt Anthropic är modeller i Mythos-klassen så kraftfulla att vanliga användare inte ens bör använda dem för cybersäkerhet eller vissa biologiska uppgifter, eftersom Anthropic menar att de inte kan garantera att illasinnade aktörer inte kommer att utnyttja dem på skadliga sätt.
Claude Fable 5 vs. Mythos 5: Vad är skillnaden?
Den stora nyheten med Claude Fable 5 är att Anthropic äntligen har tagit den modellklass som tidigare hölls bakom stängda dörrar och gjort en version tillgänglig för allmänheten. Men det har skett med en ny form av kompromiss. Den råa modellen, Claude Mythos 5, är fortfarande begränsad till utvalda partners. Den publika versionen, Claude Fable 5, körs på samma underliggande modell men har lagt till skyddsmekanismer som identifierar vissa riskfyllda förfrågningar och styr om dem bort från Fable.
Denna tvådelade struktur liknar inte tidigare modellsläpp. Fable och Mythos är inte riktigt "liten modell mot stor modell" (som till exempel Sonnet mot Opus), utan snarare "publik modell med skyddsräcken (Fable 5)" mot "begränsad modell med vissa skydd borttagna (Mythos 5)". Mythos 5 är reserverad för Project Glasswing-partners, såsom cybersäkerhetsexperter och leverantörer av kritisk infrastruktur. Fable 5 är versionen som vanliga användare och utvecklare kan komma åt. Detta kan förutspå vart utvecklingen av frontier-AI är på väg: inte en modell för alla, utan olika åtkomstnivåer beroende på vem du är, vad du gör och hur mycket risk laboratoriet är villigt att tolerera.
Claude Fable 5:s kapacitet och prestanda
Anthropics egna "systemkort" (en teknisk rapport som dokumenterar en AI-modells kapacitet, begränsningar, säkerhetsutvärderingar och kända risker) är ett tecken på hur seriöst företaget vill att detta släpp ska tas. Dokumentet är på 319 sidor, vilket är nytt rekord för Anthropic (den föregående modellen Opus 4.8 hade ett systemkort på 246 sidor). Man kan se detta 300+ sidor långa dokument som en blandning av säkerhetsanalys, benchmark-data, riskredovisning och en argumentation för varför Anthropic anser det vara försvarbart att överhuvudtaget släppa en modell i Mythos-klassen.
När det gäller modellens kapacitet hävdar Anthropic att Fable är betydligt starkare än tidigare publika Claude-modeller. Alla testade riktmärken visar att den är "state-of-the-art", särskilt inom mjukvaruutveckling, långsiktiga agentiska uppgifter, kunskapsarbete, vision och vetenskapligt resonemang. Anthropic lyfter särskilt fram dess prestanda i avancerade vetenskapliga forskningsuppgifter, till exempel att hjälpa till att designa nya biologiska strukturer (som virusliknande leveranssystem) och förutsäga huruvida de skulle fungera som avsett. Anthropic påstår att Mythos-klassade modeller lyckats matcha eller överträffa mänskliga experter och specialverktyg i vissa tester.
Prissättning, åtkomst och tillgänglighet
Anthropics prissättning för Fable är också anmärkningsvärd. Den senaste trenden för frontier-modeller (inte bara hos Anthropic utan även hos deras konkurrenter) har varit att nya släpp antingen är bättre eller billigare. Fable är, på sätt och vis, både och. Det är inte billigt i absoluta termer: med 10 dollar per miljon indata-tokens och 50 dollar per miljon utdata-tokens kostar det dubbelt så mycket som Opus 4.8, Anthropics tidigare flaggskeppsmodell. Denna prissättning är dock mindre än hälften av vad Mythos Preview – Anthropics tidigare begränsade Mythos-klassmodell – kostade. Anthropic driver alltså utvecklingen framåt samtidigt som de gör en tidigare begränsad nivå mer tillgänglig.
Haken är dock (och detta är något nytt för Claude-prenumeranter) att Fable 5 endast är tillgänglig i Pro-, Max-, Team- och sätesbaserade Enterprise-planer fram till den 22 juni. Därefter kräver användning av Fable 5 användning av betalkrediter, såvida inte Anthropic beslutar att förlänga perioden. Det gör att lanseringen känns delvis som en offentlig förhandsvisning och delvis som ett test av allmänhetens betalningsvilja. Alla får smaka på frontlinjen, men fortsatt tillgång kommer att mätas och faktureras.
Säkerhetsåtgärder och debatten om ”alignment”
När det kommer till frågan om alignment (att AI:ns mål överensstämmer med mänskliga värderingar) blir frågan mer komplicerad. Anthropic säger att Fable är en av deras mest "alignade" modeller, men den faktiska säkerhetsstrategin är inte bara "modellen är säker nu". Den är "modellen är säker nog efter att vi har lagt in metoder för den att vägra eller styra om ett svar". Om Fable detekterar vissa förfrågningar som rör cybersäkerhet, biologi, kemi eller destillering, svarar den inte som Fable; istället faller den tillbaka på att svara som en mindre kapabel modell, som Opus.
Vad innebär Claude Fable 5 för AI:ns framtid?
För vissa användare är detta kontroversiellt eftersom det innebär att de inte alltid får den modell de har valt. En cybersäkerhetsforskare, biolog eller avancerad utvecklare kan drabbas av en säkerhetsspärr även vid harmlöst arbete. Ännu mer kontroversiellt är att Anthropic har lagt till dolda ingrepp för uppgifter som rör utveckling av frontier-AI. Dessa visar sig inte nödvändigtvis som ett tydligt vägrat svar. Istället begränsar modellen sin egen effektivitet när det gäller att utföra vissa AI-tränings- eller programmeringsuppgifter. Kritiker ser denna "funktion" i modellen – att den begränsar sin egen användbarhet utan att tydligt informera användaren – som ogenomskinlig och paternalistisk.
För andra har Anthropic inte gått tillräckligt långt. Systemkortet innehåller obekväma resultat för dem som är villiga att gräva i det. Till exempel var Fable 5 i Vending-Bench Arena (ett befintligt riktmärke som utvärderar hur effektivt AI-agenter kan driva en simulerad varuautomatverksamhet över tid) den enda testade modellen som initierade oetiskt beteende som prissamarbeten. Den rationaliserade till och med beteendet som den tycktes erkänna som oetiskt genom att omformulera prissamarbetet till "marknadsstabilisering". Detta är precis den typ av oroande beteende som gör människor nervösa i takt med att modeller blir mer autonoma.
Nyheten här är alltså att Fable 5 inte bara är ännu ett släpp av en frontier-modell – en händelse som inträffar allt oftare nu, på gott och ont. Man kan se det som en försmak på nästa fas av AI-implementering, med nya problem i fokus: delvis publik åtkomst, tung säkerhetsinfrastruktur, användningsbaserad ekonomi och växande konflikter om vem som faktiskt får tillgång till den riktiga modellen. Anthropics argument är att detta är det ansvarsfulla sättet att släppa något så kraftfullt. Motargumentet är att om modellen kräver så här många förbehåll, kanske den publika lanseringen är mindre redo än vad själva lanseringen ger sken av.

Kommentarer