Le site arthur.bebou.netlib.re - retour accueil
git clone git://bebou.netlib.re/arthur.bebou
Log | Files | Refs |
commit 233d95a2eef279371e28e69c7706648ed47f99b0 parent 6b65aff318b692b6b026b4e0553ff8a3609177ab Auterice: Arthur Pons <arthur.pons@unistra.fr> Date: Wed, 21 Aug 2024 18:01:43 +0200 Ajout d'une autre page de stats sur les JO Diffstat:
M | contents/jo-stats/index.sh | | | 6 | ++++-- |
A | contents/jo-stats/stats.sh | | | 116 | +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ |
2 files changed, 120 insertions(+), 2 deletions(-)
diff --git a/contents/jo-stats/index.sh b/contents/jo-stats/index.sh @@ -1,7 +1,7 @@ #! page title: Des données, des stats et un jeu sur les JO d\'été author: Arthur Pons -description: Des données, des statistiques et un jeu sur les JO d\'été +description: L\'escrime ou le judo, quel est le meilleur sport pour la France aux JO d\'été ? publication: 2024-08-21 sectionmd: main @@ -260,6 +260,8 @@ Autrement dit la France est effectivement plus dominante en escrime qu'en judo même si le second apporte peu ou prou le même nombre de médaille que le premier depuis son existence. +Je mets d'autre stats sympas au fur et à mesure [ici](stats.html). + ## Un jeu Toute personne qui regarde les JO, ou qui a lu cet article jusque là, sait que @@ -282,4 +284,4 @@ Alternativement il est installé sur le serveur. Le lancer avec `oly`. Il n'a [^4]: Parce que trois faits listés précédemment ne sont pas des faits isolés. Ce genre de choses (et parfois plus grave) surviennent systématiquement à tous les JO. [^5]: Réalisé avec [ce script](cumul.gp) [^6]: sauf au moins une exception que j'ai repéré dans des vieux JO des US qui avaient investis **13** équipes pour une compétition de gymnastiques. -[^7]: Si ça vous intéresse c'est survenu 111 fois de 1948 à 2020. Vous pouvez avoir la liste en tapant cette magnifique commande : `< all.tsv awk -F'\t' '$4>1944' | cut -f1,7 | sort -u | cut -f1 | sort | uniq -c | sort -n | grep -E "^ *1 " | cut -f2 | xargs -I{} grep "^{}" all.tsv`. Evidemment c'est les Etats-Unis et l'URSS qui mènent la danse des cartons pleins avec 20 podiums complets chacun. +[^7]: Si ça vous intéresse c'est survenu 111 fois de 1948 à 2020. Vous pouvez avoir la liste en tapant cette magnifique commande : `< all.tsv awk -F'\t' '$4>1944' | cut -f1,7 | sort -u | cut -f1 | sort | uniq -c | sort -n | grep -E "^ *1 " | cut -f2 | xargs -I{} grep "^{}" all.tsv`. Evidemment c'est les Etats-Unis et l'URSS qui mènent la danse des cartons pleins avec respectivement 47 et 20 podiums complets chacun. diff --git a/contents/jo-stats/stats.sh b/contents/jo-stats/stats.sh @@ -0,0 +1,116 @@ +#! page +title: Plus de stats sur les JO +author: Arthur Pons +description: Plus de stats sur leso +publication: 2024-08-22 + +sectionmd: main + +**Article non relu** + +## Les cartons pleins depuis 1948 + +Comme écrit dans la note de bas de page dans l'article principale c'est les US +et l'URSS qui en on fait le plus[^1] : + + < all.tsv awk -F'\t' '$4>1944' | tail -n+2 | #retrait header et vieilles épreuves + cut -f1,7 | sort -u | cut -f1 | occu | grep -E "^1" | cut -f2 | #on ne garde que les épreuves avec un seul pays vainqueur + xargs -I{} grep "^{} " all.tsv | #on rerécupère toutes les infos dessus + cut -f1,7 | uniq | cut -f2 | occu | sort -rn #et on compte les occurences des pays + + 47 USA + 20 URS + 8 GDR + 5 JPN + 5 CHN + 3 JAM + 3 ITA + 2 SUI + 2 RUS + 2 KOR + 2 KEN + 2 EUN + 2 AUS + 1 SWE + 1 IRI + 1 HUN + 1 GER + 1 GBR + 1 FRG + 1 FIN + 1 AUT + +Dans quelles épreuves cela s'est fait ? + + for country in USA URS JPN CHN JAM KOR;do + echo "$country" + < all.tsv awk -F'\t' '$4>1944' | tail -n+2 | + cut -f1,7 | sort -u | cut -f1 | occu | grep -E "^1 " | cut -f2 | + xargs -I{} grep "^{} " all.tsv | + cut -f1,5,7 | uniq | + grep -w "$country" | cut -f2 | occu | sort -rn + echo + done + + USA + 24 Athletics + 16 Swimming + 6 Diving + 1 Fencing + + URS + 8 Athletics + 8 Artistic Gymnastics + 3 Swimming + 1 Fencing + + JPN + 4 Artistic Gymnastics + 1 Athletics + + CHN + 3 Table Tennis + 1 Badminton + 1 Athletics + + JAM + 3 Athletics + + KOR + 2 Archery + +On sait qu'en 2024 on peut ajouter le BMX masculin pour la France. On peut +également se demander quand est-ce qu'on eu lieu ces podiums : + + < all.tsv awk -F'\t' '$4>1944' | tail -n+2 | + cut -f1,7 | sort -u | cut -f1 | occu | grep -E "^1" | cut -f2 | + xargs -I{} grep "^{} " all.tsv | + cut -f1,4 | uniq | cut -f2 | occu | sort -t' ' -nk2 | + awk '{print $2" "$1}' + + 1948 11 + 1952 10 + 1956 10 + 1960 8 + 1964 4 + 1968 7 + 1972 6 + 1976 9 + 1980 11 + 1984 1 + 1988 8 + 1992 5 + 2000 2 + 2004 5 + 2008 7 + 2012 4 + 2016 1 + 2020 2 + +On voit que ces podiums étaient un peu plus fréquents par le passé, j'imagine du +fait qu'aujourd'hui un plus grand nombre de pays sont compétitifs. A noter que +le pic de 1980 s'explique en partie par le boycott des Etats-Unis des JO de +Moscou, l'URSS ayant ainsi raflé un paquet de podium, et le pic relatif de 2008 +par d'excellentes performances de la Chine à Pékin. + +[^1]: Derrière la commande `occu` se cache se bout de code que j'utilise fréquemment : `sort | uniq -c | sort -n | sed -E 's/^ *//' | sed -E 's/ / /'`