Le site arthur.bebou.netlib.re - retour accueil
git clone git://bebou.netlib.re/arthur.bebou
Log | Files | Refs |
index.sh (15129B)
1 #! page 2 3 title: Benchmark de Catium 4 author: Arthur Pons 5 publication: 2023-03-11 6 description: Quelques statistiques sur le site de Katzele 7 sectionmd: main 8 9 # Benchmark et critique des performances de Catium 10 11 ## Le benchmark 12 13 J'ai eu l'idée d'écrire cette note en entendant parler d'11ty, un générateur de 14 site statique. Il est écrit sur leur site 15 16 > Fast Builds and even Faster Web Sites 17 18 Et on trouve une petite animation qui présente qu'11ty construit 4000 19 fichiers markdown en 2s, plus rapide que qu'Astro en 20 secondes, Gatbsy en 30 20 secondes etc. Le site omet qu'Hugo est plus rapide mais soit. 21 22 Ces résultats proviennent de [ce 23 benchmark](https://github.com/zachleat/bench-framework-markdown). 24 25 Et Catium ? Testons d'abord les performances de cmark et lowdown, les deux 26 parseur de markdown qui nous utilisons. En prenant les 4000 fichiers markdown 27 du benchmark et en lançant les commandes : 28 29 time find -name '*.md' | xargs -n1 -P0 sh -c 'lowdown "$1" > "$1".html' -- 30 xargs -n1 -P0 sh -c 'lowdown "$1" > "$1".html' -- 4,84s user 1,05s system 307% cpu **2,291** total 31 32 et 33 34 time find -name '*.md' | xargs -n1 -P0 sh -c 'cmark "$1" > "$1".html' -- 35 xargs -n1 -P0 sh -c 'lowdown "$1" > "$1".html' -- 4,84s user 1,05s system 307% cpu **1,914** total 36 37 On tombe sur des temps d'environ deux secondes. Je trouvais surprenant que ces 38 deux logiciels, écrits en C et dont le seul but est de convertir du md en html 39 ne soient pas plus rapides qu'Hugo. Marc m'a rappelé que cette commande fait un 40 fork par fichier et les forks c'est "couteux". 41 42 > Un fork c'est la création d'un nouveau processus par un autre. Nos commandes 43 > seront un processus qui, pour chaque fichier en créera un nouveau pour faire 44 > sa traduction. Créer un nouveau processus a un coût fixe. Il serait donc plus 45 > performant de créer un minimum de processus qui gèrent un maximum de fichiers 46 > chacun. 47 48 En l'occurence cmark peut prendre plusieurs fichiers en argument, on peut donc 49 écrire 50 51 time cmark *.md 52 cmark *.md 0,08s user 0,07s system 29% cpu 0,528 total 53 54 ou pour lowdown tout concaténer 55 56 time cat *.md | lowdown 57 lowdown 0,15s user 0,07s system 32% cpu 0,689 total 58 59 Dans les deux cas on s'économise le fait de devoir créer 4000 fichiers mais pas 60 celui d'écrire les données pour les voir dans la console. D'ailleurs avec : 61 62 time cmark *.md /dev/null 63 cmark *.md > /dev/null 0,08s user 0,07s system 29% cpu 0,093 total 64 65 on voit que la majorité du temps est passé à écrire le résultat. 66 67 J'identifie avec le code suivant 68 69 for i in $(seq 1 4000) 70 do 71 echo $i > $i.txt 72 done 73 ./test 0,03s user 0,17s system 99% cpu 0,199 total 74 75 que cela prend un peu moins de 0,2 secondes de créer 4000 fichiers presque 76 vides[^1] ce qui voudrait dire que l'on a la découpe approximative suivante : 77 78 | opération | temps (s) | 79 |---|---| 80 |traiter les données|0,1| 81 |créer les fichiers|0,2| 82 |écrire les données|0,22| 83 84 En réalité j'en sais rien, je connais pas assez bien linux pour savoir si je 85 mesure les choses comme il faut. Prenez tout ça avec des pincettes. 86 87 Quoi qu'il en soit nous apprenons de ce test que Catium ne pourra pas aller 88 plus vite qu'environ une demie seconde pour 4000 fichiers. Pour en faire un 89 benchmark assez équivalent j'ai retiré tous les alias de page, sauf %S et 90 modifié les pages md du dépôt de benchmark pour qu'elles n'aient plus le 91 92 --- 93 title: blablabla 94 --- 95 96 et leur ajouter le shebang 97 98 #! page 99 100 et les rendre exécutables. 101 102 > J'ai fait ça avec 103 > 104 > find -name '*.md' | xargs -n1 -P0 sed -i 's/^/#! page\n/;2,4d' 105 > chmod 755 ./* 106 107 J'ai vérifié au préalable, le titre n'est pas pris en compte dans le benchmark. 108 Du moins l'HTML généré par Hugo et 11ty a une balise `<title>` vide. 109 Une fois que tout est prêt on construit le site comme on le fait habituellement 110 avec Catium[^2] (version qui utilise lowdown) : 111 112 time make -B -j 113 make -B -j 30,29s user 8,31s system 302% cpu **12,741** total 114 115 On est donc sur du six fois plus lent que la simple conversion en HTML depuis 116 lowdown. Tentons de comprendre pourquoi en bidouillant, faute de savoir comment 117 correctement diagnostiquer ce genre de choses. 118 119 Retirer les shebang et modifier le makefile pour faire 120 121 ./page machin.md 122 123 ne change rien en terme de performance. 124 125 Supprimer l'appel à `install` en faisant directement une redirection semble 126 économiser environ une seconde. 127 128 Supprimer l'appel à page en demandant à makefile de directement utiliser 129 lowdown et en supprimant les heredoc `%S` (en gros ce qu'on a fait au début 130 mais avec l'overhead de make) fait tomber le temps d'exécution à 3,7 secondes. 131 C'est donc quelque part dans page que l'on perd de la performance. 132 133 J'ai ensuite repris depuis le début en supprimant la gestion des sections. Cela 134 revient à s'économiser la création d'un dossier temporaire et d'un fichier 135 temporaire[^3] par article. Ne plus créer le fichier temporaire qu'il faut 136 ensuite relire pour insérer son contenu dans le layout fait gagner environ 2 137 secondes, make ne prend plus qu'environ 9,5 secondes. Ne plus créer le dossier 138 temporaire fait gagner 3 secondes supplémentaires pour descendre à 6,5 secondes 139 environ. 140 141 Il semblerait donc que notre façon de gérer le layout soit responsable de 3 142 secondes d'overhead sur 4000 fichiers. Pour que la comparaison tienne à peu 143 près la route j'ai modifié le template pour qu'il soit identique à celui généré 144 par Hugo. Je m'arrête là dans l'exploration des performances de Catium. 145 146 On en retient qu'à la louche et avec mes outils de diagnostiques très 147 approximatifs, ce qui coûte est : 148 149 | Modification | Temps (s) | 150 |---|---| 151 | overhead make | 1,7 | 152 | la création du dossier temporaire | 2 | 153 | la création puis la lecture du fichier temporaire par section | 3 | 154 | l'appel à install | 1 | 155 | le template | 3 | 156 157 Ce qui ajoutés bout à bout explique la différence entre les deux secondes de 158 lowdown et les 12/13 de Catium. 159 160 Résultats finaux : 161 162 | Générateur | Temps (s) | 163 |---|---| 164 | Hugo | 1,6 | 165 | 11ty | 2 | 166 | Catium (sans sections) | 6 | 167 | Catium | 12 | 168 | Le reste | 20+ | 169 170 ## Et alors ? 171 172 Catium tel qu'il existe pour le site de Katzele est 6 fois plus lent que les 173 deux générateurs de sites statiques les plus rapides et plus rapide que tous les 174 autres. Dans une version allégée, pour un site avec une seule section que l'on 175 souhaite alimenter de contenu il n'est "que" trois fois plus lent. 176 177 C'est significatif mais à mettre au regard du temps d'ingénieurie investit. Il 178 est probable que le temps passé à construire Catium dans son ensemble est un 179 ou deux ou trois ordres de grandeur inférieur au temps passé à rendre Hugo et 180 11ty performants. 181 182 De plus la comparaison de performances de logiciels est compliquée et 183 hasardeuse. Déjà parce que cela dépend du matériel sur lequel les logiciels 184 sont testés. Ensuite parce que les couvertures fonctionnelles ne sont pas les 185 mêmes. Nous avons vu que l'intégration de fonctionnalités supplémentaires dans 186 Catium pouvait avoir un fort impact sur sa performance. Qu'en est-il des 187 autres outils ? Hugo et 11ty font *beaucoup* plus de choses que Catium mais 188 le benchmark leur fait générer un site aussi simple que gros. Au vu de leurs 189 performances, ils ne semblent pas ralentir quand leurs très nombreuses 190 fonctionnalités ne sont pas effectivement utilisées. Comment Hugo et 11ty 191 réagiraient-ils si l'on construisait des sites plus complexes ? Et Catium ? 192 En l'absence de réponse à ces questions les benchmarks ne veulent pas dire 193 grand chose. 194 195 Cela dit, pourquoi est-ce que ces logiciels font la promotion de leurs 196 performances sur leurs pages d'accueil ? Au-delà d'une éventuelle volonté de 197 savoir qui a ~~la plus gro~~ le plus rapide, possibilité à ne pas sous-estimer, 198 on pourrait aller regarder du côté des générateurs historiques. On me racontait 199 que fut une époque nombre de générateurs de sites étaient particulièrement 200 "lents". Il fallait attendre possiblement plusieurs dizaines de secondes pour 201 faire la revu de ses modifications ce qui rendait l'itération lente et le 202 travail fastidieux. Pour résoudre ce souci il semblerait que les communautés 203 autour de ces outils aient opté pour de l'ingénierie logicielle supplémentaire 204 faisant appel à nos matériels informatiques modernes très puissants. "Cela 205 prend 30 secondes de reconstruire tout le site pour vérifier le rendu de 206 notre nouvelle page ? Optimisons le code pour que les opérations aillent plus 207 vite et fassent usage de toute la puissance des processeurs pour le faire 208 descendre à deux secondes". 209 210 Ce qui est intéressant c'est qu'en puisant dans une autre culture informatique, 211 comme la notre par exemple, ce n'est pas une autre solution qui aurait été 212 choisie mais le problème qui n'aurait tout simplement existé - ou suffisamment 213 rarement pour que ça n'en soit pas un. 214 215 Illustrons cette idée en trois points : 216 217 1. Dans le monde Unix le système de "build"[^4] traditionnel permet de ne 218 reconstruire que le nécessaire. 219 220 Le système utilisé pour compiler de nombreux programmes dans le monde Unix (et 221 sur lequel Catium se base), make, utilise un graph de dépendance pour savoir 222 ce qui doit être reconstruit et ce qui est encore à jour. Ainsi, si l'on 223 modifie 10 fichiers markdown sur les 4000 il n'est nécessaire de reconstruire 224 que 10 fichiers HTML. A moins d'avoir vraiment besoin de tout reconstruire, 225 pour une raison technique ou parce que l'on a touché à quelque de chose de 226 commun à tout le site (un template par exemple), la question du temps de 227 génération de la totalité d'un si gros site est caduque. La variable 228 qui influe sur la vitesse de construction est dorénavant la quantité de 229 fichiers modifiés et non plus la quantité de fichiers au total. 230 231 A noter que cet avantage n'est pas gratuit, les moteurs de production sont 232 souvent des logiciels assez complexes. L'alternative à priori plus légère et 233 maintenable à cmake et make serait 234 [mk](https://doc.cat-v.org/plan_9/4th_edition/papers/mk). 235 236 Si les personnes impliquées dans les communautés des générateurs de site 237 statique avaient identifié des moteurs tels que make comme judicieux pour leurs 238 besoins alors le problème ne ce serait probablement jamais posé. 239 240 Dans la pratique une configuration parmi d'autres qui permettrait d'itérer 241 rapidement serait d'avoir une fenêtre vim d'ouverte sur le fichier qui nous 242 intéresse et depuis le dossier dans lequel le makefile se trouve, et une autre 243 fenêtre avec l'aperçu du fichier html. Dans vim on met la configuration 244 "autowrite" (aw de son petit nom) à vraie en faisant `set aw` et lorsque l'on 245 veut vérifier nos modifs faire `:make!`. Suffit ensuite de rafraichir la page 246 dans le navigateur. 247 248 > autowrite permet d'indiquer à vim que vous voulez qu'il enregistre les 249 > modifications apportées au lancement de tout un tas de commandes dont make. 250 > Voir `:help autowrite` pour plus d'infos. 251 252 Un petit map pour n'avoir à appuyer sur qu'un seul bouton dans vim : 253 254 map <F3>:set aw<CR>:make!<CR><CR> 255 256 2. L'utilisation d'éditeurs de texte s'interfaçant bien avec le système permet 257 de tester des bouts de markdown. 258 259 Toujours en partant du principe que le besoin principal est d'obtenir un 260 feedback rapide sur ce que l'on a écrit, un éditeur tel que vim permet d'y 261 répondre sans jamais toucher à la génération du site. 262 263 Exemple, on a un doute sur la syntaxe des liens (personnellement j'inverse 264 souvent les () et les []), on écrit : 265 266 (un lien)[http://katzele.netlib.re] 267 268 On teste si ça fonctionne en se mettant sur la ligne et en le filtrant avec 269 lowdown - ou markdown ou pandoc ou... - en lançant `:.!lowdown` : 270 271 <p>(un lien)[<a href="http://katzele.netlib.re">http://katzele.netlib.re</a>]</p> 272 273 Ah oui non c'est pas ça 274 275 [un lien](http://katzele.netlib.re) 276 <p><a href="http://katzele.netlib.re">un lien</a></p> 277 278 mieux ! 279 280 Si l'on veut tester plusieurs lignes on peut faire une sélection visuelle sur 281 plusieurs lignes ou remplacer `.` de la commande `:.!lowdown` par un autre range[^5]. 282 283 On peut aussi écrire un heredoc et le filtrer avec sh. En faisant `vip` puis `:!sh` 284 (ce qui va écrire `:'<,'>!sh` dans la ligne de commande, les `'<>` étant les ranges 285 du début jusqu'à la fin de la sélection visuelle) : 286 287 <<. lowdown 288 | Générateur | Temps (s) | 289 |---| 290 | Hugo | 1,6 | 291 | 11ty | 2 | 292 | Catium (sans sections) | 6 | 293 | Catium | 12 | 294 | Le reste | 20+ | 295 . 296 297 et ça va donner 298 299 <p>| Générateur | Temps (s) | 300 |—| 301 | Hugo | 1,6 | 302 | 11ty | 2 | 303 | Catium (sans sections) | 6 | 304 | Catium | 12 | 305 | Le reste | 20+ |</p> 306 307 Ce n'est pas un tableau, réessayons en ajoutant un colonne ligne 2 : 308 309 <<. lowdown 310 | Générateur | Temps (s) | 311 |---|---| 312 | Hugo | 1,6 | 313 | 11ty | 2 | 314 | Catium (sans sections) | 6 | 315 | Catium | 12 | 316 | Le reste | 20+ | 317 . 318 319 et ça donne : 320 321 <table> 322 <thead> 323 <tr> 324 <th>Générateur</th> 325 <th>Temps (s)</th> 326 </tr> 327 </thead> 328 329 <tbody> 330 <tr> 331 <td>Hugo</td> 332 <td>1,6</td> 333 </tr> 334 <tr> 335 <td>11ty</td> 336 <td>2</td> 337 </tr> 338 <tr> 339 <td>Catium (sans sections)</td> 340 <td>6</td> 341 </tr> 342 <tr> 343 <td>Catium</td> 344 <td>12</td> 345 </tr> 346 <tr> 347 <td>Le reste</td> 348 <td>20+</td> 349 </tr> 350 </tbody> 351 </table> 352 353 Sauf que c'est difficile de dire à l'oeil nu si c'est juste. On peut le piper 354 dans lynx et lui demander de dump le résultat dans vim pour voir ce que ça 355 donne : 356 357 <<. lowdown | lynx -stdin --dump 358 | Générateur | Temps (s) | 359 |---|---| 360 | Hugo | 1,6 | 361 | 11ty | 2 | 362 | Catium (sans sections) | 6 | 363 | Catium | 12 | 364 | Le reste | 20+ | 365 . 366 367 Générateur Temps (s) 368 Hugo 1,6 369 11ty 2 370 Catium (sans sections) 6 371 Catium 12 372 Le reste 20+ 373 374 Nickel. 375 376 J'imagine qu'il y a pleins d'autres façons d'obtenir du feedback, que ce soit 377 avec vim ou d'autres outils. Vous pouvez écrire au collectif si vous voulez 378 les partager. Ou mieux encore, écrire sur la liste linux du lug. 379 380 ## Mot de la fin 381 382 Le but de l'article est de mettre en lumière que pour une situation donnée des 383 cultures informatiques différentes peuvent mener à des lectures radicalement 384 différentes. Ce qui est un problème pour un groupe n'en est pas un pour un 385 autre. Ce qui doit donc être produit pour y remédier par le premier n'a pas à 386 l'être pour l'autre. Ce n'est pas sans conséquence. 387 388 Problème ou pas, une autre façon de le voir serait de prendre le problème à 389 l'envers. Plutôt que d'estimer qu'un temps de construction "long" pour un gros 390 site est un problème d'optimisation logiciel, on pourrait estimer que lorsque 391 le temps de construction du site est perçu comme "long" c'est que le site est 392 trop gros. 393 394 [^1]: Peut-être que ça a un gros impact qu'ils ne le soient pas d'ailleurs, je ne sais pas 395 [^2]: Nous utiliserons lowdown à partir d'ici 396 [^3]: Un seul puisque les fichiers markdown du benchmark n'ont pas de "section". Tout va donc au même endroit dans le layout et un seul fichier de section a besoin d'être créé 397 [^4]: moteur de production en bon français semble-t-il 398 [^5]: `.` est le range qui veut dire "la ligne sous le curseur". Voir `:help range` pour plus d'infos