Je suis interne de médecine, et mes cours de stats remontent à fort longtemps
Je réalise ma thèse qui concerne le recueil de pratique de médecins. Pour cela, j'utilise un questionnaire qui se présente sous la forme d'une échelle ordinale dit de Likert à 5 modalités (de "pas du tout d'accord" à "tout à fait d'accord"). Le but de mon travail est de classer, ordonner, des "facteurs d'influence" à la pratique des médecins.
Pour cela, je compare les histogrammes des modalités d'accord et calcul la moyenne de l'accord à chaque pratique étudiée (je sais que la moyenne n'est pas le meilleur indice pour interpréter une échelle de Likert à cause de l'irrégularité des intervalles entre deux modalités mais c'était le plus pratique...).
Ma question porte sur la taille de l'échantillon.
J'ai pas mal chercher sur le net mais je n'arrive pas à trouver s'il existe une formule qui permet de déterminer la taille minimale de l'échantillon que je dois viser pour que mes réponses soit représentatives de ma population.
Ma population mère est représentée par une fraction de 7000 médecins, que j'estime à 3000.
J'ai trouvé deux formules qui permettrait à mon sens de déterminer la taille minimal de mon échantillon, l'une se dispensant de l'estimation de la taille de ma population mère.
n = taille de l'échantillon = [z²*p(1-p)] / e² / 1 + [z²*p(1-p)] / e²*N
avec :
N = taille de la population
z = z-score : 1,96 d’après la loi normale centrée réduite pour un intervalle de confiance à 95%
e = marge d'erreur soit 5% ici
p = écart type fixé à 0,5 correspondant à la dispersion maximale
et n = [z² *p(1-p)] / e²
les deux formules donnent une estimation entre 300 et 400 participants.
Je les ai donc utilisé dans mon travail, la thèse est presque terminée mais je doute sur l'utilisation que j'ai faite de ces formules, sont-elles réellement adaptées à mon étude ?
Si c'est le cas, j'ai du mal à comprendre ce que représente "p". J'ai lu qu'on peut l'interpréter comme "la proportion a priori d'individus présentant la caractéristique étudiée parmi la population N". Cependant cela ne s'adapte pas à mon étude étant donné que j'étudie l'accord qui est une variable qualitative, que je transforme secondairement en variable quantitative à l'aide du calcul de la moyenne.
Qu'en pensez-vous ? Ai-je fait fausse route ?
Je vous remercie d'avance pour toute aide,

