Efter at have set mit hold blive smurt rundt i Manchester, er der småfuld motivation til at finde et par enkelte tåbelige spørgsmål vedr. den…
Tag: SQL
Alle registrede divisionsspillere i DK
Jeg satte mig for at have navn, klub, position og fødselsdato på samtlige divisionsspilere i Danmark. Da Divisionsforeningen ikke lige deler denne data, måtte jeg…
Superliga-Datahoarding
I dette blogindlæg vil jeg tage jer med på min lidt nørdede rejse ind i fodboldstatistikkers verden, hvor jeg med et snert af autisme i forhold til data, besluttede mig for at downloade resultaterne for alle 4300 fodboldkampe i Superligaen siden 2001. Dette projekt blev udført via R-studio og Rscripts, med lidt hjælp fra mine digitale hjælpere, ChatGPT og Bard.
Jeg dykker ned i, hvordan jeg brugte Rstudio til at automatisere indsamlingen af data fra Superliga.dk, hvor kampe siden 2001 kan tilgås via sæson- og event-identifikatorer. Trods nogle strukturelle udfordringer med mappenavne, som krævede manuel efterbehandling, vil jeg dele, hvordan jeg navigerede i datamanipulation og endte med at anvende Excel til yderligere databehandling på grund af de udfordringer, som jeg stødte på i R.
Jeg vil også dele mine erfaringer med at importere data til en MySQL database, hvilket gav mig en praktisk måde at filtrere og sortere data på – ideelt til fodboldstatistik under sociale sammenkomster. Læs med og find ud af, hvordan en kombination af nygerrighed og datadrevet dedikation kan lede til både frustration og triumf i jagten på den perfekte statistikoversigt.