Math  /  Data & Statistics

QuestionExercice N02\mathrm{N}^{\circ} 02 : On étudie un échantillon de taille n=100\boldsymbol{n}=\mathbf{1 0 0}, sur lequel ont été mesurés deux caractères XX et YY. On a observé les résultats suivants : i=1100xi=800i=1100yi=1200i=1100xi2=7200i=1100yi2=16000i=1100xiyi=10200\begin{array}{c} \sum_{i=1}^{100} x_{i}=800 \quad \sum_{i=1}^{100} y_{i}=1200 \quad \sum_{i=1}^{100} x_{i}^{2}=7200 \\ \sum_{i=1}^{100} y_{i}^{2}=16000 \quad \sum_{i=1}^{100} x_{i} y_{i}=10200 \end{array}
1. Déterminer les moyennes, les variances et la covariance de XX et YY.
2. En déduire le coefficient de corrélation entre XX et YY. Interpréter.
3. Déterminer la droite de régression linéaire de YY en XX.

Studdy Solution

STEP 1

Qu'est-ce qu'on nous demande ? On nous donne des sommes de valeurs et on veut calculer des statistiques comme les moyennes, les variances, la covariance et le coefficient de corrélation, et finalement trouver la droite de régression linéaire. Attention ! Il ne faut pas confondre variance et covariance, ni moyenne et somme !
Et n'oubliez pas d'interpréter le coefficient de corrélation.

STEP 2

1. Calculer les moyennes
2. Calculer les variances
3. Calculer la covariance
4. Calculer le coefficient de corrélation et interpréter
5. Déterminer la droite de régression linéaire

STEP 3

On commence par calculer la **moyenne** de XX, notée xˉ\bar{x}.
La formule de la moyenne est la **somme des valeurs** divisée par le **nombre de valeurs**.
On a xˉ=i=1nxin\bar{x} = \frac{\sum_{i=1}^{n} x_i}{n}.

STEP 4

On nous donne i=1100xi=800\sum_{i=1}^{100} x_i = 800 et n=100n = 100, donc xˉ=800100=8\bar{x} = \frac{800}{100} = 8.
La **moyenne de** XX est **8**!

STEP 5

De la même manière, on calcule la **moyenne** de YY, notée yˉ\bar{y}.
On a yˉ=i=1nyin\bar{y} = \frac{\sum_{i=1}^{n} y_i}{n}.

STEP 6

On nous donne i=1100yi=1200\sum_{i=1}^{100} y_i = 1200 et n=100n = 100, donc yˉ=1200100=12\bar{y} = \frac{1200}{100} = 12.
La **moyenne de** YY est **12**!

STEP 7

Calculons la **variance** de XX, notée Var(X)Var(X).
La formule est Var(X)=1ni=1nxi2xˉ2Var(X) = \frac{1}{n} \sum_{i=1}^{n} x_i^2 - \bar{x}^2.

STEP 8

On a i=1100xi2=7200\sum_{i=1}^{100} x_i^2 = 7200, n=100n = 100 et xˉ=8\bar{x} = 8, donc Var(X)=720010082=7264=8Var(X) = \frac{7200}{100} - 8^2 = 72 - 64 = 8.
La **variance de** XX est **8**!

STEP 9

Calculons la **variance** de YY, notée Var(Y)Var(Y).
La formule est Var(Y)=1ni=1nyi2yˉ2Var(Y) = \frac{1}{n} \sum_{i=1}^{n} y_i^2 - \bar{y}^2.

STEP 10

On a i=1100yi2=16000\sum_{i=1}^{100} y_i^2 = 16000, n=100n = 100 et yˉ=12\bar{y} = 12, donc Var(Y)=16000100122=160144=16Var(Y) = \frac{16000}{100} - 12^2 = 160 - 144 = 16.
La **variance de** YY est **16**!

STEP 11

La **covariance** de XX et YY, notée Cov(X,Y)Cov(X, Y), est donnée par la formule Cov(X,Y)=1ni=1nxiyixˉyˉCov(X, Y) = \frac{1}{n} \sum_{i=1}^{n} x_i y_i - \bar{x} \cdot \bar{y}.

STEP 12

On a i=1100xiyi=10200\sum_{i=1}^{100} x_i y_i = 10200, n=100n = 100, xˉ=8\bar{x} = 8 et yˉ=12\bar{y} = 12, donc Cov(X,Y)=10200100812=10296=6Cov(X, Y) = \frac{10200}{100} - 8 \cdot 12 = 102 - 96 = 6.
La **covariance** est **6**!

STEP 13

Le **coefficient de corrélation**, noté rr, est calculé avec r=Cov(X,Y)Var(X)Var(Y)r = \frac{Cov(X, Y)}{\sqrt{Var(X)} \cdot \sqrt{Var(Y)}}.

STEP 14

Avec Cov(X,Y)=6Cov(X, Y) = 6, Var(X)=8Var(X) = 8 et Var(Y)=16Var(Y) = 16, on a r=6816=6128=682=3420.53r = \frac{6}{\sqrt{8} \cdot \sqrt{16}} = \frac{6}{\sqrt{128}} = \frac{6}{8\sqrt{2}} = \frac{3}{4\sqrt{2}} \approx 0.53.

STEP 15

Le coefficient de corrélation est **positif**, donc les variables XX et YY sont **positivement corrélées**.
Cela signifie que lorsque XX augmente, YY a tendance à augmenter aussi.
La corrélation est **modérée**, car la valeur est plus proche de 0 que de 1.

STEP 16

L'équation de la droite de régression linéaire de YY en XX est y=ax+by = ax + b, où a=Cov(X,Y)Var(X)a = \frac{Cov(X, Y)}{Var(X)} et b=yˉaxˉb = \bar{y} - a \cdot \bar{x}.

STEP 17

On a Cov(X,Y)=6Cov(X, Y) = 6 et Var(X)=8Var(X) = 8, donc a=68=34a = \frac{6}{8} = \frac{3}{4}.

STEP 18

Ensuite, b=yˉaxˉ=12348=126=6b = \bar{y} - a \cdot \bar{x} = 12 - \frac{3}{4} \cdot 8 = 12 - 6 = 6.

STEP 19

Donc, l'équation de la droite de régression est y=34x+6y = \frac{3}{4}x + 6.

STEP 20

Moyenne de XX: 8 Moyenne de YY: 12 Variance de XX: 8 Variance de YY: 16 Covariance de XX et YY: 6 Coefficient de corrélation: 0.53\approx 0.53 (corrélation positive modérée) Droite de régression linéaire de YY en XX: y=34x+6y = \frac{3}{4}x + 6

Was this helpful?

Studdy solves anything!

banner

Start learning now

Download Studdy AI Tutor now. Learn with ease and get all help you need to be successful at school.

ParentsInfluencer programContactPolicyTerms
TwitterInstagramFacebookTikTokDiscord