Plausible Analytics qui prend trop de place ? Une solution rapide

Plausible Analytics qui prend trop de place ? Une solution rapide

J’utilise Plausible Analytics de manière auto-hébergée depuis plus d’un an, et j’ai remarqué qu’il avait la fâcheuse tendance de prendre de l’embonpoint.

C’est quoi Plausible Analytics ?

C’est une belle alternative à Google Analytics, développée en Europe. Et en plus, si vous utilisez leur service cloud, vos données seront hébergées également en Europe.

Donc si vous voulez arrêter d’alimenter Google avec toutes les données de vos utilisateurs, c’est une option très intéressante.

Dans mon cas, j’ai choisi d’utiliser la version open source de leur logiciel, et de l’héberger sur mon infrastructure, afin d’économiser quelques euros 😇

Prise de poids

Plausible Analytics utilise, entres autres, une base de données Clickhouse pour fonctionner. Le souci, c’est que cette base grossit avec le temps, et de manière significative :

Prise de poids de Plausible Analytics

Après avoir creusé un peu, je suis tombé sur cette discussion sur Github.

TL;DR : Dans sa configuration initiale, Clickhouse log beaucoup de choses, qui ne vous seront pas forcément utiles dans le cadre de votre utilisation.

Allez c’est parti !

Nettoyer les journaux

Par défaut, Clickhouse génère et stocke de nombreux journaux.

Nous allons d’abord les nettoyer.

Si vous utilisez Docker, trouvez l’ID de votre conteneur Clickhouse en utilisant :

docker ps

puis accédez au shell du conteneur avec la commande suivante :

docker exec -it <ID_DU_CONTENEUR> bash

et exécutez ensuite cette commande pour nettoyer les journaux :

clickhouse-client -q "SELECT name FROM system.tables WHERE name LIKE '%log%';" | xargs -I{} clickhouse-client -q "TRUNCATE TABLE system.{};"

Configurer Clickhouse pour exclure les journaux inutiles

Commençons par créer les fichiers de configuration nécessaires :

clickhouse-config.xml

<clickhouse>
    <logger>
        <level>warning</level>
        <console>true</console>
    </logger>

    <!-- Arrêter tous les journaux inutiles -->
    <query_thread_log remove="remove"/>
    <query_log remove="remove"/>
    <text_log remove="remove"/>
    <trace_log remove="remove"/>
    <metric_log remove="remove"/>
    <asynchronous_metric_log remove="remove"/>
</clickhouse>

clickhouse-user-config.xml

<clickhouse>
    <profiles>
        <default>
            <log_queries>0</log_queries>
            <log_query_threads>0</log_query_threads>
        </default>
    </profiles>
</clickhouse>

Ensuite, associez les volumes à ces fichiers dans votre fichier docker-compose :

image: clickhouse/clickhouse-server:22.6-alpine
volumes:
    - ./clickhouse/clickhouse-config.xml:/etc/clickhouse-server/config.d/docker_related_config.xml:ro
    - ./clickhouse/clickhouse-user-config.xml:/etc/clickhouse-server/users.d/docker_related_user_config.xml:ro

Dans mon cas précis j’ai récupéré 50Go de stockage.

Cela devrait vous aider à réduire l’espace occupé par Plausible Analytics 🚀

Publié le :
20/09/2023
Dans la catégorie :
Net
Auteur :
Mathieu LESNIAK
Mathieu LESNIAK