Analyse statistique du transcriptome

Utilisation de GeneANOVA: résultats

Les résultats obtenus sur les données orge sont présentés dans la tableau ci-dessous:

Légende:

Somme des carrés: sommes des carrés des écarts à la moyenne totale

DDL: nombre de degré de liberté de l'information résiduelle

F: Variable de Fisher

p-value: probabilité que la valeur de F ait été obtenue par hasard (plus cette probabilité est faible, plus la valeur de F est significative).

Colonne selection: on a la possibilité via les cases à cocher ou décocher de supprimer certaines lignes qui ne rentrerons alors plus dans les calculs. L'effet d'une supression de ligne dépend du rapport entre le bruit et le DDL de cette ligne. Par exemple, prenons l'effet lignée pour lequel nous avons une p-value de 0, 00018. Si vous supprimez la ligne 4 (lignée-année), la p-value de l'effet lignée devient 0, 00005 ce qui est meilleur. On a diminué le bruit moyen par cellule, autrement dit le bruit/DDL. A l'inverse, si on supprime la ligne 5 (lignée-lieux), on obtient une p-value qui varie peu: 0, 00017 ce qui ne change pas grand chose. Enfin, si on supprime la ligne 6 (année-lieux), on obtient une p-value de 0, 023 ce qui beaucoup moins bon.

En conclusion, selon ce que l'on décide de mettre dans le bruit (que l'on néglige), on peut faire varier la p-value. Globalement, on ne change pas son ordre de grandeur mais il faudra être vigilant lors de l'emploi de seuil sur la p-value pour sélectionner des résultats significatifs.

Mesure d'audience ROI statistique webanalytics par