Så verifieras datan
Varje tisdag kl 06:00 UTC hämtar en autonom pipeline om 17 svenska egenanställningsbolag och verifierar avgift, försäkring, pension och villkor mot bolagens publika sidor. Inget värde går till databasen om det inte har en ordagrann källspans. Det här är hur det fungerar.
Trovärdighetskedjan
Fyra steg per bolag, alla deterministiska eller verifierade. Inget steg litar på modellens egna ord — varje extraherat värde måste finnas ordagrant i källtexten.
- Hämtning (TinyFish Fetch + Firecrawl fallback). Sidan renderas i en riktig Chromium-browser så JavaScript-heavy SPA-sajter fungerar. Cloudflare och liknande bot-protection hanteras transparent. User-Agent identifierar oss:
FrilanspengenResearch/1.0 (+mailto:partners@frilanspengen.se). - Deterministisk extraktion (Tier 1). Reguljära uttryck fångar tydliga numeriska värden — basavgift som procent eller minimibelopp i kr. Inga LLM-anrop. ~50 % av fält löses här.
- LLM-extraktion (Tier 2 — Gemini 2.5 Flash-Lite). Återstående fält (booleska förmåner, fritext-villkor) extraheras med ett bulk-LLM. Varje värde måste komma med en ordagrann källspans — modellen får inte uppfinna text.
- Autonom AI-judge (Tier 3 — Claude Opus 4.7). De tre fält som ranking bygger på (avgift, minimi, snabbutbetalningsavgift) körs alltid genom Opus 4.7 som en second-opinion. Om Opus inte hittar ett tydligt värde i källtexten — exempelvis om sidan blandar arbetsgivaravgift (~31 %) med bolagets egen avgift — vägrar Opus extrahera, och fältet skrivs som ej fastställd. Det är den här refusal-as-feature-mekanismen som gör datat trovärdigt.
- Cross-page contradiction-check (PolicyGapper). Tre parallella Opus-prompts analyserar avgiftsstruktur, förmåner och villkor på sidan för interna motsägelser (t.ex. hero säger "5,98 %" men kalkylator visar "från 1,95 %"). En deterministisk arbiter avgör om körningen ska blockeras — kontradiktioner inom avgift ger alltid manuell granskning.
Span-validering — varför ingen confidence-poäng
Forskning från maj 2026 visar att verbaliserad confidence (modellen säger "jag är 92 % säker") har ~7 % avvikelse från faktisk accuracy även med bästa prompting. Vi använder inte verbaliserad confidence. Istället måste varje extraherat värde komma med en ordagrann textspans från källan, och en deterministisk check ser att spans:en faktiskt finns i markdown från sidan. Om matchen failar — värdet publiceras inte.
Konsekvens: bättre tystnad än felaktiga siffror. 1 av 17 bolag saknar publik avgift just nu (visas som "–"). Det är inte ett fel — det är systemet som vägrar gissa.
Reglerstyrda funktioner som inte rankas
Vissa funktioner är reglerstyrda och fungerar i princip likadant hos alla 17 bolag — en jämförelsekolumn med 17/17 ✓ skulle ge noll informationsvärde. Två exempel:
Utlägg och skattefri kostnadsersättning. Alla bolagen är arbetsgivare i egenanställningsupplägget och måste följa Skatteverkets regler. Skattefri ersättning för uppdragskopplade utlägg styrkta med kvitto är standardiserat, inte produktdifferentierat — och rankas därför inte.
ROT/RUT-fakturering annonseras däremot specifikt av 5 av 17 bolag i maj 2026 (Invozio, Pay2me, SAMpoolen, TWA Salary, Utbetalning.com) — primärt relevant för hantverkare och städ-frilansare. Övriga 12 bolag nämner det inte på sina publika sidor men kan ha stöd ändå; mönstret följs upp via en återanvändbar recon-körning (scripts/recon-utlagg.ts).
Oberoende
Frilanspengen ägs uteslutande av Gustaf Garnow som privatperson. Inga externa investerare, ingen ägarbindning till egenanställningsbolag, redovisningsbyråer eller fintechs. Avgiftsrankingen sätts endast av verifierad data. Det finns inga affiliate-pengar, ingen sponsring och inga betalda placeringar — ingen betalning påverkar någonsin ordningen. Mer om finansiering och driftkostnad: Transparens.
Eftersom AI-judgen (Claude Opus 4.7) är en oberoende modell som anyone kan inspektera, och hela extraktionskedjan är publik, går det att reproducera verifieringen själv. Det är moaten.
Rapportera felaktig data
Om en siffra eller ett påstående om ett specifikt bolag inte stämmer mot bolagets publika sida, mejla partners@frilanspengen.se med (1) URL till sidan, (2) det aktuella citatet, och (3) vad du tror är rätt. Verifieringen körs om manuellt och korrigering sker inom en vecka.
Maskin-läsbara format
Data är publik och versionerad. AI-assistenter och utvecklare kan konsumera den via:
- /llms-full.txt — BLUF + full CSV med ETag conditional GET
- /llms.txt — discovery-fil per llms.txt-spec
- /api/mcp — Model Context Protocol-server (Streamable HTTP). Server-card: /.well-known/mcp/server-card.json
- /api/data — JSON, alla bolag. Per bolag:
/api/data/{id} - /api/status — pipeline-hälsa, senaste körning, antal bolag, granskningskö
License för returnerad data: CC-BY-4.0 med källattribuering ("Källa: frilanspengen.se").