Décider si une expérience doit être lancée, arrêtée ou prolongée. — Claude Skill
Une compétence Claude pour Claude Code par Paweł Huryn — exécuter /ab-test-analysis dans Claude·Mis à jour le 12 juin 2026·vphuryn/pm-skills@ab-test-analysis
Lit résultats d'expérience, taille d'échantillon, conversion, métriques garde-fous et contexte métier pour recommander lancer, arrêter ou continuer.
- Explique les résultats en langage simple au lieu de seulement répéter une p-value ou capture d'écran.
- Vérifie métrique principale, échantillon, différences de segments et métriques garde-fous avant recommandation.
- Sépare vrai lift, bruit statistique, effet nouveauté, tracking cassé et comportement segmenté.
- Produit un mémo de décision avec preuves, risque, prochaine expérience et confirmations humaines.
Un growth marketer montre une capture de tableau de bord, dit que le test est positif, puis l'équipe débat de la confiance en réunion.
Lancez /ab-test-analysis avec le tableau de résultats et le contexte. La compétence renvoie décision, preuves, risques et test suivant.
Pour qui
Transformer résultats d'expérience en décision lancer, arrêter ou continuer.
Voir les compétences de ce rôleComprendre impact sur comportement utilisateur, risque produit et itération suivante.
Voir les compétences de ce rôleRepérer problèmes de tracking, échantillon et garde-fous avant confiance stakeholder.
Voir les compétences de ce rôleCe qu'il fait
Transformer résultats Optimizely, Amplitude ou GA en mémo de décision.
Vérifier si un gain de conversion cache un risque revenu, support, vitesse ou rétention.
Trouver problèmes de tracking, segment, échantillon ou timing avant de croire le résultat.
Fonctionnement
Partagez objectif, variantes, dates, trafic, taille d'échantillon et résultats métriques.
Ajoutez les garde-fous disponibles : churn, revenu, remboursements, tickets support ou vitesse page.
La compétence interprète lift, confiance, importance pratique et risque business.
Elle recommande lancer, arrêter, continuer ou refaire avec un design plus propre.
Options d'entrée
Hypothèse, variantes, dates, répartition trafic, audience et métrique de succès.
Exemple
Expérience : texte CTA page pricing. Variante A : Start free trial. Variante B : Build my plan. Dates : 1-14 juin. Résultats : - A : 24 100 visiteurs, 1 084 essais, 4,5% conversion. - B : 23 900 visiteurs, 1 267 essais, 5,3% conversion. - Confiance affichée : 96%. Garde-fous : - Conversion payante après essai : A 18,4%, B 17,9%. - Questions support sur pricing +11% pour B. Besoin : lancer, arrêter ou continuer, et message pour leadership.
Lancer à 50% d'abord, pas à 100%. La variante B améliore le démarrage d'essai de 4,5% à 5,3%, mais la conversion payante baisse légèrement et les questions pricing augmentent.
Le lift est probablement réel pour les essais. L'impact business n'est pas encore prouvé tant que qualité d'essai et charge support ne sont pas suivies une semaine de plus.
La confusion pricing peut augmenter. Ajouter un lien FAQ pricing près du CTA avant déploiement complet.
Le nouveau CTA augmente les essais d'environ 18% relatif, mais le rollout sera progressif pendant le suivi conversion payante et tickets pricing.
Confirmer fenêtre d'attribution, maturité de la conversion payante et cohérence du tagging support.
Métriques améliorées
Compatible avec
Comparer tableaux de résultats et rédiger le mémo de décision.
Utiliser résultats, variantes, confiance et allocation trafic.
Vérifier comportement produit, activation, rétention et impact segment.
Utiliser trafic, conversion et contexte d'acquisition.
Partout
Paste the notes, exports, screenshots, or summaries you already have. The skill works without a connected system.
Connect the relevant support, analytics, CRM, or data tool when you want fresher source evidence.
Envie d'utiliser Analyse de test A/B ?
Choisissez comment commencer.
Installez et exécutez cette compétence localement sur votre ordinateur.
Ouvrez un terminal sur votre ordinateur et collez cette commande :
Cela télécharge la compétence avec tous ses fichiers sur votre ordinateur :
Ajoutez -g à la fin pour le rendre disponible dans tous vos projets.
Démarrez Claude Code, puis tapez la commande :
Analyse de test A/B
Source public : https://github.com/phuryn/pm-skills/blob/HEAD/pm-data-analytics/skills/ab-test-analysis/SKILL.md
Commande d'installation : npx skills add phuryn/pm-skills@ab-test-analysis
À quoi elle sert
Lit résultats d'expérience, taille d'échantillon, conversion, métriques garde-fous et contexte métier pour recommander lancer, arrêter ou continuer.
Pour utilisateur métier
Utilisez-la pour interpréter un résultat d'expérience et décider s'il faut lancer, arrêter ou continuer. Elle doit expliquer quoi fournir, ce que l'IA renvoie, les risques à vérifier et la décision humaine restante.
Garde-fous
- Garder les chiffres, dates, noms d'outils, commandes, identifiants, URLs et règles fournis par l'utilisateur.
- Ne pas inventer de métrique, source, responsable, décision ou risque absent des éléments fournis.
- Signaler clairement ce qui doit être confirmé par un humain avant publication, mise à jour d'outil ou décision.
Documents de référence
Source Analyse de test A/B
Source public : https://github.com/phuryn/pm-skills/blob/HEAD/pm-data-analytics/skills/ab-test-analysis/SKILL.md
Commande d'installation : npx skills add phuryn/pm-skills@ab-test-analysis
Le document source public est en anglais. Cette page catalogue conserve le lien source et présente une synthèse française orientée utilisateur métier.
Analyse de test A/B
Source public : https://github.com/phuryn/pm-skills/blob/HEAD/pm-data-analytics/skills/ab-test-analysis/SKILL.md
Commande d'installation : npx skills add phuryn/pm-skills@ab-test-analysis
À quoi elle sert
Lit résultats d'expérience, taille d'échantillon, conversion, métriques garde-fous et contexte métier pour recommander lancer, arrêter ou continuer.
Pour utilisateur métier
Utilisez-la pour interpréter un résultat d'expérience et décider s'il faut lancer, arrêter ou continuer. Elle doit expliquer quoi fournir, ce que l'IA renvoie, les risques à vérifier et la décision humaine restante.
Garde-fous
- Garder les chiffres, dates, noms d'outils, commandes, identifiants, URLs et règles fournis par l'utilisateur.
- Ne pas inventer de métrique, source, responsable, décision ou risque absent des éléments fournis.
- Signaler clairement ce qui doit être confirmé par un humain avant publication, mise à jour d'outil ou décision.