14 AI-modeller tävlar mot varandra – i Street Fighter

Teknik
2024-04-07 09:01
| Anders Lundberg

Visst, Llama och GPT 4 kanske är bättre på att härma mänskligt tal, men vilket AI-modell är bäst på att banka sönder motståndaren i Street Fighter?

Under ett hackathon i San Francisco tog en grupp AI-entusiaster fram ett nytt benchmarktest för stora språkmodeller, rapporterar Tom's Hardware. Testet ställer olika AI-modeller mot varandra – i Street Fighter 3.

Eftersom Street Fighter handlar om timing och reaktionstid är testet bäst lämpat för små och snabba modeller. Vinnaren i den första turneringen med 342 matcher blev GPT 3.5 Turbo som slutade med 1 776 Elo-rankingspoäng, följt av Mistral Small med 1 586 poäng och GPT-4 (version 1106-preview) med 1 584 poäng.

Själva testet går ut på att läsa av nuvarande position för båda karaktärerna i matchen och konstruera en textprompt som ber AI:n bestämma sig för vad den ska göra härnäst. Det upprepas igen och igen tills matchen är avgjord. Än så länge är matcherna begränsade till Ken mot Ken.

LLM Colosseum, som testet kallas, är öppen källkod så vem som helst kan installera det på sin egen dator och testa. Det finns även instruktioner för att lägga till andra språkmodeller.

Anders Lundberg

Skribent

Se alla artiklar av Anders Lundberg

Skicka en rättelse

Utmärkt alternativ till tryckluft på burk

Kringutrustning

Testlabbet har lagt vantarna på ett batteridrivet alternativ till tryckluft på burk och blivit väldigt förtjusta.

Fanboy-quiz: Vad kan du om Nintendo?

SweClockers
idag 14:00

För många av oss började allt med en Nintendo-konsol. Hur mycket kan du om de japanska spelmakarnas hårdvara och historia?

Sponsras av Försvarsmakten

Rustar i oroliga tider: ”Jag har insett vikten av mitt jobb”

Reportage
idag 11:16

Hemligt och kunskapskrävande. Vi har pratat med en utvecklare om vad som utmärker ett IT-jobb inom Försvarsmakten.

AMD:s planerade toppmodell i RDNA 4-familjen var en bjässe

Grafikkort
igår 08:59

”Navi 4X” skulle ha fler än dubbelt så många beräkningsenheter som dagens toppmodell Navi 31.

Allt du behöver veta om knappkommandon i Windows 11

Tangentbord
igår 18:00

Här är alla knappkommandon som du kan göra med Windows-knappen i Windows 11.

Krönika: "Early access" är utstuderad girighet

Spel
2024-04-27

Vill ha-begär utnyttjas när vi pressas att betala extra för några dagars försprång.