Alle registrede divisionsspillere i DK

Author:

Jeg satte mig for at have navn, klub, position og fødselsdato på samtlige divisionsspilere i Danmark. Da Divisionsforeningen ikke lige deler denne data, måtte jeg i stedet hente alt data fra Superliga.dk, 1-division.dk, 2-division.dk og 3-division.dk.
Jeg benyttede at man kan få alle teamsID via stillingen for hver division, hvorfor jeg hentede disse ned. Disse samlede jeg i vektor i R, og benyttede flg. script til at få 48 json filer med samtlige spillere i de 4 danske divisioner. 1 fil pr klub/teamid.

library(httr)
library(jsonlite)


# Opret en mappe til at gemme JSON filerne, hvis den ikke allerede eksisterer
if (!dir.exists("Spillerliste")) {
  dir.create("Spillerliste")
}

for (team_id in team_ids) {
  url <- paste0("https://api.superliga.dk/teams/", team_id, "/members-v2?appName=superligadk&access_token=5b6ab6f5eb84c60031bbbd24&env=production&locale=da")
  
  response <- GET(url)
  if (status_code(response) == 200) {
    content <- content(response, "text", encoding = "UTF-8")
    
    # Gem responsen som en JSON-fil
    file_name <- paste0("Spillerliste/", team_id, ".json")
    write(content, file = file_name)
  }
}

I de 48 filer var der tilsammen 1201 fodboldspillere. hvoraf de 129 er registreret som målmænd. Det passer meget godt med næsten 3 målmænd pr klub. Horsens er som altid foran alle andre med 5 målmænd, mens en del klubber i del laveste rækker kun har 2.

Der er 23 spillere som hedder Emil til foran. Mest populære spillernavn pt.

Jeg brugte 2½ time på at prøve at få R til at køre gennem filerne, men de er for forskellige i opbygninger, med stor variation i statsmængde og flere andre parametre som tilføjes/justeres uden konsekvens datasættet igennem. Jeg greb derfor fat i chatgtp og bad om at få kørt de 48 filer igennem, få udtrukket ID, Navn, Position, Fødselsdato og Klubnavn på samtlige spillere.
Dette skulle skrives til en csv-fil, som jeg efterfølgende smed ind i MySQL.
Hvis man er mere tålmodig end mig, eller bare rent faktisk kan programmere, er der nedenunder link til json-datasættet pakket i rar, og et enkelt link til den importerede csv-fil.

Fejl og mangler: 48 spillere har ingen fødselsdato. Enkelte spillere står i forkert klub fordi de har spillet på et andet niveau i første halvdel af sæsonen, og der mangler helt sikkert marginalspiller ved alle de lavere rangerende klubber. Dog finder jeg alligevel at det er et sjov datastørrelse at lege med.

Link til omtalte filer:

Json_Spillerliste_som_zip/rar-fil