Package
“agrocampus”
Ce
package permet de faire :
-
de
la régression multiple en sélectionnant un sous-modèle
adapté
-
de
l'analyse de variance en utilisant la contrainte que la somme des
alpha_i est égale à 0 (et non le premier coefficient
égal à 0, ce qui est pris par défaut dans R); les
tests de conformité sur TOUS les coefficients sont
fournis.
Pour
utiliser le package, il faut :
-
télécharger
le fichier agrocampus_1.01.zip
- télécharger
le fichier agrocampus_1.01.tar.gz
-
Aller
sous R et faire : package --> intaller
le(s) package(s) depuis des fichiers zip ... et choisir
le package que vous venez de sauvegarder (le package
est alors installé une fois pour toute sur l'ordinateur, cette
manipulation n'est à faire qu'une seule fois)
-
Ensuite,
à chaque fois que vous voulez utiliser le package vous devez
le charger en faisant package --> Charger le package ou bien écrire dans la console R: library(agrocampus)
Pour
avoir de l'aide sur le package, faire : Aide --> Aide
HTML --> Packages --> agrocampus; vous
avez alors l'ensemble des fonctions et des jeux de données
disponibles dans le package.
Pour
faire une analyse de variance :
-
Importer
les données
-
Transformer
si nécessaire les variables explicatives en variables
qualitatives (si les modalités sont des nombres, par défaut,
lors de l'importation, la variable est considérée
comme quantitative)
-
Utiliser
la fonction aov.sum qui
fournit le tableau d'analyse de variance (tests F) et le tableau des coefficients (tests T) (cf l'aide
de la fonction)
Exemple d'analyse de variance à
2 facteurs
data(senso)
res = aov.sum(Note~ Produit +
Jour , data=senso)
res
$Ftest
Sum
Sq Df CM F value Pr(>F)
Produit
2.0278 2 1.0139 3.4428 0.04148 *
Jour
25.4725 1 25.4725 86.4959 1.18e-11 ***
Residuals
12.0742 41 0.2945
---
Signif.
codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
$Ttest
Estimate
Std. Error t value Pr(>|t|)
(Intercept)
4.59073574 0.08146418 56.3528167 1.802496e-40
Produit
- 1 0.23705706 0.12067527 1.9644212 5.628400e-02
Produit
- 2 -0.28474474 0.11466272 -2.4833246 1.719733e-02
Produit
- 3 0.04768769 0.11845633 0.4025761 6.893515e-01
Jour
- 1 0.80337838 0.08638181 9.3003184 1.179987e-11
Jour
- 2 -0.80337838 0.08638181 -9.3003184 1.179987e-11
Exemple d'analyse de variance à
2 facteurs avec interaction
data(senso)
res2
= aov.sum(Note~ Produit + Jour + Produit : Jour, data=senso)
res2
$Ftest
Sum
Sq Df CM F value Pr(>F)
Produit
1.7773 2 0.8886 2.9876 0.06206 .
Jour
25.8418 1 25.8418 86.8787 1.804e-11 ***
Produit:Jour 0.4738 2 0.2369 0.7964 0.45813
Residuals
11.6004 39 0.2974
---
Signif.
codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
$Ttest
Estimate
Std. Error t value Pr(>|t|)
(Intercept)
4.5842929 0.08712387 52.618107 7.754226e-38
Prod
- 1 0.2557070 0.12258359 2.085981 4.356959e-02
Prod
- 2 -0.2509595 0.12031588 -2.085839 4.358314e-02
Prod
- 3 -0.0047474 0.12665212 -0.037484 9.702900e-01
Jour
- 1 0.8120707 0.08712387 9.320875 1.803829e-11
Jour
- 2 -0.8120707 0.08712387 -9.320875 1.803829e-11
Prod
- 1 : Jour - 1 0.0279292 0.12258359 0.227838 8.209619e-01
Prod
- 2 : Jour - 1 -0.1454040 0.12031588 -1.208519 2.341243e-01
Prod
- 3 : Jour - 1 0.1174747 0.12665212 0.927538 3.593519e-01
Prod
- 1 : Jour - 2 -0.0279292 0.12258359 -0.227838 8.209619e-01
Prod
- 2 : Jour - 2 0.1454040 0.12031588 1.208519 2.341243e-01
Prod
- 3 : Jour - 2 -0.1174747 0.12665212 -0.927538 3.593519e-01
Pour
sélectionner les variables lors d'une régression
multiple :
Exemple de sélection de variables en régression:
data(lait)
res
= reg.best(y=lait[,6],x=lait[,-6])
res$best
Call:
lm(formula
= as.formula(as.character(formul)), data = don)
Residuals:
Min
1Q Median 3Q Max
-0.60149
-0.25261 -0.01715 0.24097 1.07494
Coefficients:
Estimate
Std. Error t value Pr(>|t|)
(Intercept)
1.84751 1.34436 1.374 0.17315
BUTYREUX
0.10449 0.03028 3.451 0.00089 ***
PROTEINE
0.11660 0.03432 3.398 0.00106 **
EXTRAITSEC
0.04036 0.01790 2.255 0.02682 *
---
Signif.
codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual
standard error: 0.3169 on 81 degrees of freedom
Multiple
R-Squared: 0.6027, Adjusted R-squared: 0.588
F-statistic:
40.96 on 3 and 81 DF, p-value: 3.296e-16