Qu'est-ce qu'une régression linéaire simple?
La régression linéaire simple est un moyen de décrire une relation entre deux variables par une équation d'une ligne droite, Appelée ligne de meilleur ajustement, qui modélise le plus étroitement cette relation.
Une forme commune d'une équation linéaire dans les deux variables x et y est
`Y = mx + b`
Où m et b désignent des constantes. L'origine du nom et de la citation; linéaire et citation; Provient du fait que l'ensemble des solutions d'une telle équation forme une ligne droite dans le plan.
Dans cette équation particulière, la constante m détermine la pente ou le gradient de cette ligne, et le terme constant "b" détermine le point auquel la ligne traverse l'axe des y,
Autrement connu sous le nom de y-intercept.
Compte tenu de tout ensemble de n points de données dans le formulaire (`x_i`,` y_i`)
Selon cette méthode de minimisation de la somme des erreurs carrées, la ligne de meilleur ajustement est obtenue lorsque
`M \ sum_ {i = 1} ^ {n} x_i + bn = \ sum_ {i = 1} ^ {n} y_i`
`M \ sum_ {i = 1} ^ {n} x_i ^ 2 + b \ sum_ {i = 1} ^ {n} x_i = \ sum_ {i = 1} ^ {n} x_iy_i`
Où les sommations sont prises sur l'ensemble du jeu de données. Ces équations sont connues comme les équations normales.
à partir des équations normales ci-dessus, nous pouvons trouver les expressions pour les coefficients inconnus m et b.
Pour une ligne décrite par `y = mx + b`, les formules de régression linéaire pour la pente m et l'interception b sont données par
Pente m,
`M = \ frac {n \ sum_ {i = 1} ^ {n} x_iy_i- \ sum_ {i = 1} ^ n x_i \ sum_ {i = 1} ^ n y_i} {n \ sum_ {i = 1} ^ {N} x_i ^ 2 - (\ sum_ {i = 1} ^ n x_i) ^ 2} `
Interceptez b,
`B = \ frac {\ sum_ {i = 1} ^ {n} y_i - b \ sum_ {i = 1} ^ {n} x_i} {n}`
Où les sommations sont de nouveau reprises sur l'ensemble de données
ligne de meilleur ajustement (ligne de tendance) - Une ligne sur un diagramme de dispersion qui peut être dessinée près des points de façon plus claire montrer La tendance entre deux ensembles de données.
- La ligne de meilleur qui monte rapidement de gauche à droite s'appelle une corrélation positive .
- La ligne de meilleur qui tombe rapidement de gauche à droite est Appelée une corrélation négative
- Fort positve et les corrélations négatives ont des données Points très proches de la ligne de meilleur ajustement ..
- Faible positve et les corrélations négatives ont des données Points qui ne sont pas regroupés près ou sur la ligne de meilleur ajustement.
- Les points de données qui ne sont pas proches de la ligne de meilleur ajustement sont appelés outliers .
Outil en ligne pour calculer la régression linéaire et le diagramme de diffusion graphique et la ligne de meilleur ajustement
Points de données
Dispersion action et Ligne de Meilleur ajustement des propriétés
Données de la meilleure ligne
Valeur de X | Valeur de Y | Actions |
---|---|---|
No data available in table |
Données de régression
x | y | `x\timesy` | `x^2` |
---|---|---|---|
No data available in table |
Calculs de régression
Dispersion action et Ligne de Meilleur ajustement
L'écart type
Il est également utile d'avoir une mesure de l'incertitude moyenne des mesures, et ceci est donné par l'écart-type:
La déviation de la mesure `x_i` de la moyenne est` d_i = x_i - \ bar {x} `
Incertitudes dans la pente et l'interception
La pente et l'interception sont calculés À partir de valeurs de données qui ont des incertitudes qui leur sont associées. Ces incertitudes peuvent être propagées à travers les calculs pour la pente et
Intercepter par les méthodes standard d'analyse d'erreur différentielle.
L'erreur standard dans la pente `\ sigma_m`:
`\ Sigma_m ^ 2 = \ frac {n \ sigma_y ^ 2} {n \ sum_ {i = 1} ^ {n} x_i ^ 2 - (\ sum_ {i = 1} ^ n x_i) ^ 2}`
L'erreur standard dans l'interception `\ sigma_b`:
`\ Sigma_b ^ 2 = \ frac {\ sigma_y ^ 2 \ sum_ {i = 1} ^ {n} x_i ^ 2} {n \ sum_ {i = 1} ^ {n} x_i ^ 2 - (\ sum_ {i = 1} ^ n x_i) ^ 2} `
Où l'écart type de `y_i`:
` \ sigma_i ^ 2 = \ sigma_y ^ 2 = \ frac {\ sum_ {i = 1} ^ {n} (y_i-b-mx_i) ^ 2 } {N-2} `
0 commentaires:
Enregistrer un commentaire