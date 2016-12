Pour estimer une proportion lors d’un sondage ou d’un échantillonnage probabiliste, deux paramètres sont généralement pertinents dans la détermination de la taille minimale d’un échantillon statistique à sélectionner. Ce sont la taille de la population cible et le degré de précision désiré. Ce dernier est composé de la marge d’erreur tolérée et du niveau de confiance souhaité.

Dans le cas du Bureau du contentieux électoral national (BCEN), ces paramètres sont facilement identifiables. Le nombre total de procès-verbaux (PV) est connu : 11 993. La marge d’erreur est choisie de façon arbitraire : 1 %, 5 % ou 10 %. On dépasse très rarement une marge d’erreur de 10 %. Quand au niveau de confiance, il est souvent fixé à 95 %, parfois aussi à 99 %. Comme le dossier électoral est un dossier très sensible, étant ses enjeux majeurs, il est opportun d’avoir une marge d’erreur très faible : idéalement 1 %.

Un niveau de confiance de 95 % indique que si l’on tire 100 échantillons, dans 95 des cas, l’intervalle de confiance contiendrait la vraie valeur du paramètre d’intérêt de la population cible que l’on cherche à estimer. Ce paramètre peut représenter la proportion de votes exprimés en faveur d’un candidat ou la proportion de bulletins contenant une irrégularité grave.

Pour un niveau de confiance de 95 % et une taille de la population cible de 11 993 procès-verbaux, il ne reste que la marge d’erreur à être flexible. Plus cette marge d’erreur est faible, plus la taille de l’échantillon doit être élevée.

Aujourd’hui, avec la grande vulgarisation des méthodes de sondage, certains sites Internet offrent la possibilité de simuler la taille d’échantillon selon ces trois paramètres. Par exemple, sur le site https://fr.checkmarket.com/calculateur-taille-echantillon/, on peut constater que, pour une taille de population de 11 993 procès-verbaux, avec un niveau de confiance de 95 % et une marge d’erreur de 2 %, la taille de l’échantillon s’élève à 2001 procès-verbaux.

Pour une marge d’erreur de 1 %, il faut plutôt choisir 5 334 procès-verbaux; tandis que, pour une marge d’erreur de 3 %, on doit vérifier 981 procès-verbaux. Ainsi, les 12 % de procès-verbaux (1 939 PV) correspondent à une marge d’erreur comprise entre 2,5 % et 3 %. Cela veut dire que le pourcentage de 12 % est acceptable pour une vérification de l’ensemble des procès-verbaux et permettrait d’obtenir de bonnes estimations.

Ceux qui questionnaient, avec raison, le pourcentage de 12 %, peuvent trouver ici une première explication de son fondement statistique. Très souvent, les non-initiés aux méthodes statistiques choisissent un pourcentage de la population cible au lieu de déterminer la taille d’échantillon minimale à partir de la marge d’erreur et de la précision, comme il vient d’être mentionné plus haut. Il faut comprendre que le choix d’une taille d’échantillon élevée peut être très coûteuse en termes d’argent et de temps. Le Conseil électoral provisoire (CEP) peut en témoigner puisqu’il est contraint par un budget et un délai strict dicté par le calendrier électoral. Celui-ci ne donne pas le temps de vérifier l’ensemble des procès-verbaux. Et statistiquement, ce n’est pas nécessaire non plus.

Cependant, le choix de la taille de l’échantillon ne suffit pas à garantir à elle seule la fiabilité du processus de vérification des procès-verbaux. La méthode de sélection des 1 439 procès-verbaux demeure très importante. Une taille d’échantillon élevée peut ne pas permettre d’estimer, avec précision, les paramètres de la population cible si la sélection des unités statistiques de cet échantillon est biaisée ou orientée à la base.

L’hypothèse de base est que tous les procès-verbaux ont la même importance. Auquel cas, un tirage aléatoire simple et systématique permet de sélectionner de façon aléatoire un échantillon de la population. Celui-ci constitue un échantillon représentatif de l’ensemble des procès-verbaux tout en tenant compte de certaines de leurs caractéristiques. Et les paramètres d’intérêt de l’échantillon permettent alors d’extrapoler afin de déterminer ceux de la population.

Le tirage aléatoire simple et systématique se fait de la façon suivante : 1- il faut disposer de l’ensemble des procès-verbaux dans un tableur; 2- les numéroter de 1 à 11 993 (qui est la taille de la population); 3- calculer le pas de sondage, obtenu en divisant la taille de la population (11 993 PV) par la taille de l’échantillon (1 439 PV), ce qui donne un pas de sondage de 8.33; 4- il faut maintenant choisir de manière aléatoire un nombre compris entre 1 et 8 pour trouver le premier procès-verbal qui doit faire partie de l’échantillon; 5- Enfin, on ajoute 8 à ce nombre aléatoire pour trouver le deuxième; puis, on rajoute 8 pour trouver le troisième et on continue jusqu’à ce que l’on tire les 1 439 procès-verbaux de l’échantillon.

La méthode aléatoire simple accorde à chaque procès-verbal la même probabilité de faire partie de l’échantillon. Il n’est même pas nécessaire de stratifier l’échantillon (par département par exemple) puisque le tirage tiendra compte de toutes les unités de la population cible. Ce n’est pas la seule méthode statistique qui existe. On pourrait également stratifier l’échantillon par département pour garantir une représentativité géographique et effectuer un tirage aléatoire simple et sans remise de façon aléatoire. Chaque méthode a ses avantages et ses inconvénients. Le progiciel Excel permet d’effectuer ces tirages très facilement.

Imposer que certains procès-verbaux soient tirés d’office leur confère une probabilité de 100 % d’appartenir à l’échantillon. Cela enlève donc tout caractère aléatoire au choix de ces procès-verbaux et à la représentativité de l’échantillon par rapport à la population. Il est presque certain que la majorité des 27 procès-verbaux de Pitit Desalin sont entachés d’irrégularités. De même que ceux de Jude Célestin. Si l’on donne la possibilité au Parti haïtien Tèt Kale (PHTK) de choisir un certain nombre de procès-verbaux, il va choisir que des procès-verbaux sains, étant donné ses intérêts.

C’est pour éviter ces manipulations intentionnelles qu’il faut choisir une méthode de sélection rigoureuse comme la méthode aléatoire simple et systématique. Les partis politiques peuvent participer à un tirage au sort pour déterminer qui d’entre eux choisira le premier procès-verbal à tirer. À aucun moment du processus, on ne doit laisser l’impression d’une influence quelconque.

Claude Joseph a raison de conclure que « la proportion d’irrégularités dans l’ensemble des procès-verbaux est successible d’être surestimé à partir d’un échantillon dont 25 % contiennent de prime abord des irrégularités », si l’on a choisi d’inclure les procès-verbaux de Pitit Desalin et de Jude Célestin. Il n’est nullement nécessaire non plus de procéder à la vérification de l’ensemble des 11 993 verbaux comme le souhaitent certains leadeurs politiques. Une méthode statistique rigoureusement appliquée peut donner d’excellents résultats en termes de vérification. Une grande partie des entreprises de production disposent d’un département de vérification permettant de s’assurer de la régularité et de la qualité des produits. Et cette vérification se fait sur la base d’un échantillon probabiliste.

La méthode aléatoire et systématique a la particularité d’être très transparente et facile à mettre en œuvre à la main au vu et su de tout le monde. C’est pourquoi il est exposé en détail. Il est donc opportun que les prochaines lois électorales intègrent la vérification avant même la tabulation des résultats pour éviter toute contestation futile. La loi électorale peut même suggérer à l’avance la méthode statistique à utiliser. Le Centre de techniques, de planification et d’économie appliquée (CTPEA) forme des statisticiens depuis des années, il faut arriver à un moment que le pays fasse confiance aux statisticiens, aux méthodes statistiques et les applique dans la vie de tous les jours.

Thomas Lalime source le nouvelliste