Description des variables continues

La fonction condes() permet de caractériser une variable continue par d'autres variables continues ou qualitatives et par des modalités.

Objectifs

On va utiliser le tableau de données "wine" et caractériser la varible "Overall quality".

Quelles variables continues et qualitatives et quelles modalités décrivent le mieux la qualité globale des vins ?

condes

Premièrement, chargez le package et le tableau de données en écrivant : library(FactoMineR)
data(wine)

Puis lancez la fonction condes() : res = condes(wine, num.var=30, proba=0.05) #wine: le tableau de données utilisé
#num.var: l'indice de la variable continue à caractériser
#proba: le seuil de significativité considéré pour caractériser la variable (par défaut 0.05)

Description par des variables continues

Le coefficient de corrélation entre chaque variable continue et la variable Overall quality est calculé. Les coefficients de corrélation significativement différents de zéro sont gardés et triés.

Continuous variables description: description by continuous variables Cliquez pour voir

Les variables qui décrivent le mieux Overall quality sont Balance puis Smooth puis Harmony, etc... Les vins qui ont des valeurs élevées pour ces variables auront tendance à avoir des notes élevées pour Overall quality.

La variable Plante est significative et négativement corrélée à Overall quality. Cela signifie que plus l'odeur d'un vin après agitation rappelle celle d'une plante, moins il est apprécié des juges.

Description par des variables qualitatives et des modalités

Un modèle d'analyse de variance à un facteur est réalisé pour chaque variable qualitative; on explique la variable Overall quality par une autre variable qualitative.
Un test F permet de voir si la variable a un effet significatif sur la variable Overall quality et des test T sont réalisés modalité par modalité (avec le contraste somme alpha_i=0).
les variables et modalités sont triées par probabilité critique et seules les significatives sont conservées dans le résultat.

Continuous variables description: description by categorical variables Cliquez pour voir Continuous variables description: description by categories

La variable Soil est la seule variable qualitative significative pour Overall quality.
La modalité Reference a un coefficient positif alors que celui de la modalité Env4 est négatif. Cela signifie que les vins issus du sol Reference sont plus appréciés (notes plus élevées pour Overall quality) et ceux issus du sol Env4 le sont moins (notes plus faibles) que la moyenne.