arthur.bebou

Le site arthur.bebou.netlib.re - retour accueil

git clone git://bebou.netlib.re/arthur.bebou
Log | Files | Refs |

stats.sh (2729B)


      1 #! page
      2 title: Plus de stats sur les JO
      3 author: Arthur Pons
      4 description: Plus de stats sur leso
      5 publication: 2024-08-22
      6 
      7 sectionmd: main
      8 
      9 **Article non relu**
     10 
     11 ## Les cartons pleins depuis 1948
     12 
     13 Comme écrit dans la note de bas de page dans l'article principale c'est les US
     14 et l'URSS qui en on fait le plus[^1] :
     15 
     16     < all.tsv awk -F'\t' '$4>1944' | tail -n+2 | #retrait header et vieilles épreuves
     17         cut -f1,7 | sort -u | cut -f1 | occu | grep -E "^1" | cut -f2 | #on ne garde que les épreuves avec un seul pays vainqueur
     18         xargs -I{} grep "^{}	" all.tsv | #on rerécupère toutes les infos dessus
     19         cut -f1,7 | uniq | cut -f2 | occu | sort -rn #et on compte les occurences des pays
     20 
     21     47	USA
     22     20	URS
     23     8	GDR
     24     5	JPN
     25     5	CHN
     26     3	JAM
     27     3	ITA
     28     2	SUI
     29     2	RUS
     30     2	KOR
     31     2	KEN
     32     2	EUN
     33     2	AUS
     34     1	SWE
     35     1	IRI
     36     1	HUN
     37     1	GER
     38     1	GBR
     39     1	FRG
     40     1	FIN
     41     1	AUT
     42 
     43 Dans quelles épreuves cela s'est fait ?
     44 
     45     for country in USA URS JPN CHN JAM KOR;do
     46     echo "$country"
     47     < all.tsv awk -F'\t' '$4>1944' | tail -n+2 |
     48         cut -f1,7 | sort -u | cut -f1 | occu | grep -E "^1	" | cut -f2 |
     49         xargs -I{} grep "^{}	" all.tsv |
     50         cut -f1,5,7 | uniq |
     51         grep -w "$country" | cut -f2 | occu | sort -rn
     52     echo
     53     done
     54 
     55     USA
     56     24	Athletics
     57     16	Swimming
     58     6	Diving
     59     1	Fencing
     60 
     61     URS
     62     8	Athletics
     63     8	Artistic Gymnastics
     64     3	Swimming
     65     1	Fencing
     66 
     67     JPN
     68     4	Artistic Gymnastics
     69     1	Athletics
     70 
     71     CHN
     72     3	Table Tennis
     73     1	Badminton
     74     1	Athletics
     75 
     76     JAM
     77     3	Athletics
     78 
     79     KOR
     80     2	Archery
     81 
     82 On sait qu'en 2024 on peut ajouter le BMX masculin pour la France. On peut
     83 également se demander quand est-ce qu'on eu lieu ces podiums :
     84 
     85     < all.tsv awk -F'\t' '$4>1944' | tail -n+2 |
     86         cut -f1,7 | sort -u | cut -f1 | occu | grep -E "^1" | cut -f2 |
     87         xargs -I{} grep "^{}	" all.tsv |
     88         cut -f1,4 | uniq | cut -f2 | occu | sort -t'	' -nk2 |
     89         awk '{print $2"	"$1}'
     90 
     91     1948	11
     92     1952	10
     93     1956	10
     94     1960	8
     95     1964	4
     96     1968	7
     97     1972	6
     98     1976	9
     99     1980	11
    100     1984	1
    101     1988	8
    102     1992	5
    103     2000	2
    104     2004	5
    105     2008	7
    106     2012	4
    107     2016	1
    108     2020	2
    109 
    110 On voit que ces podiums étaient un peu plus fréquents par le passé, j'imagine du
    111 fait qu'aujourd'hui un plus grand nombre de pays sont compétitifs. A noter que
    112 le pic de 1980 s'explique en partie par le boycott des Etats-Unis des JO de
    113 Moscou, l'URSS ayant ainsi raflé un paquet de podium, et le pic relatif de 2008
    114 par d'excellentes performances de la Chine à Pékin.
    115 
    116 [^1]: Derrière la commande `occu` se cache se bout de code que j'utilise fréquemment : `sort | uniq -c | sort -n | sed -E 's/^ *//' | sed -E 's/ /	/'`