J’utilise Plausible Analytics de manière auto-hébergée depuis plus d’un an, et j’ai remarqué qu’il avait la fâcheuse tendance de prendre de l’embonpoint.
C’est une belle alternative à Google Analytics, développée en Europe. Et en plus, si vous utilisez leur service cloud, vos données seront hébergées également en Europe.
Donc si vous voulez arrêter d’alimenter Google avec toutes les données de vos utilisateurs, c’est une option très intéressante.
Dans mon cas, j’ai choisi d’utiliser la version open source de leur logiciel, et de l’héberger sur mon infrastructure, afin d’économiser quelques euros 😇
Plausible Analytics utilise, entres autres, une base de données Clickhouse pour fonctionner. Le souci, c’est que cette base grossit avec le temps, et de manière significative :
Après avoir creusé un peu, je suis tombé sur cette discussion sur Github.
TL;DR : Dans sa configuration initiale, Clickhouse log beaucoup de choses, qui ne vous seront pas forcément utiles dans le cadre de votre utilisation.
Allez c’est parti !
Par défaut, Clickhouse génère et stocke de nombreux journaux.
Nous allons d’abord les nettoyer.
Si vous utilisez Docker, trouvez l’ID de votre conteneur Clickhouse en utilisant :
docker ps
puis accédez au shell du conteneur avec la commande suivante :
docker exec -it <ID_DU_CONTENEUR> bash
et exécutez ensuite cette commande pour nettoyer les journaux :
clickhouse-client -q "SELECT name FROM system.tables WHERE name LIKE '%log%';" | xargs -I{} clickhouse-client -q "TRUNCATE TABLE system.{};"
Commençons par créer les fichiers de configuration nécessaires :
clickhouse-config.xml
<clickhouse>
<logger>
<level>warning</level>
<console>true</console>
</logger>
<!-- Arrêter tous les journaux inutiles -->
<query_thread_log remove="remove"/>
<query_log remove="remove"/>
<text_log remove="remove"/>
<trace_log remove="remove"/>
<metric_log remove="remove"/>
<asynchronous_metric_log remove="remove"/>
</clickhouse>
clickhouse-user-config.xml
<clickhouse>
<profiles>
<default>
<log_queries>0</log_queries>
<log_query_threads>0</log_query_threads>
</default>
</profiles>
</clickhouse>
Ensuite, associez les volumes à ces fichiers dans votre fichier docker-compose :
image: clickhouse/clickhouse-server:22.6-alpine
volumes:
- ./clickhouse/clickhouse-config.xml:/etc/clickhouse-server/config.d/docker_related_config.xml:ro
- ./clickhouse/clickhouse-user-config.xml:/etc/clickhouse-server/users.d/docker_related_user_config.xml:ro
Dans mon cas précis j’ai récupéré 50Go de stockage.
Cela devrait vous aider à réduire l’espace occupé par Plausible Analytics 🚀