Online Covariance

By Joshua Burkholder October 26, 2013 Mathematics 3 Comments

Given the following set of two-dimensional inputs:

${(x_{1}, y_{1}), (x_{2}, y_{2}), \dots, (x_{n - 1}, y_{n - 1}), (x_{n}, y_{n})}$

Let $n$ be the number of two-dimensional inputs, $X$ represent the $x$ dimension, $Y$ represent the $y$ dimension, $C o v_{n} (X, Y)$ be the biased sample covariance of the $x$ and $y$ dimensions for the first $n$ two-dimensional inputs, $C o v_{n - 1} (X, Y)$ be the biased sample covariance of the $x$ and $y$ dimensions for the first $n - 1$ two-dimensional inputs, $x_{n}$ be the $x$ value of the $n$ -th two-dimensional input, ${\bar{x}}_{n}$ be the sample mean of the $x$ values for the first $n$ two-dimensional inputs, $y_{n}$ be the $y$ value of the $n$ -th two-dimensional input, and ${\bar{y}}_{n - 1}$ be the sample mean of the $y$ values for the first $n - 1$ two-dimensional inputs. Then, the recurrence equation for the biased sample covariance (a.k.a. online covariance) is:

$C o v_{n} (X, Y) = C o v_{n - 1} (X, Y) - \frac{C o v_{n - 1} (X, Y) - (x_{n} - {\bar{x}}_{n}) (y_{n} - {\bar{y}}_{n - 1})}{n}$

Note: The recurrence equation above also applies when computing the online covariance matrix:

$Σ_{n} [j, k] = Σ_{n - 1} [j, k] - \frac{Σ_{n - 1} [j, k] - (x_{n} [j] - {\bar{x [j]}}_{n}) (x_{n} [k] - {\bar{x [k]}}_{n - 1})}{n}$ .

However, we will restrict ourselves to the online covariance computation of two-dimensional input in this post and explore the online covariance matrix computation of $m$ -dimensional input in a later post.

Proof:

The definition of the biased sample covariance of the $x$ and $y$ dimensions for the first $n$ two-dimensional inputs is defined as:

$C o v_{n} (X, Y) = \frac{\sum_{i = 1}^{n} (x_{i} - {\bar{x}}_{n}) (y_{i} - {\bar{y}}_{n})}{n}$ .

If we expand this definition, we have:

$C o v_{n} (X, Y) = \frac{\sum_{i = 1}^{n - 1} (x_{i} - {\bar{x}}_{n}) (y_{i} - {\bar{y}}_{n}) + (x_{n} - {\bar{x}}_{n}) (y_{n} - {\bar{y}}_{n})}{n}$ .

Since the recurrence equations for the sample mean of the $x$ and $y$ values are:

${\bar{x}}_{n} = {\bar{x}}_{n - 1} - \frac{{\bar{x}}_{n - 1} - x_{n}}{n}$ and ${\bar{y}}_{n} = {\bar{y}}_{n - 1} - \frac{{\bar{y}}_{n - 1} - y_{n}}{n}$ ,

then we have:

$\begin{array}{l} C o v_{n} (X, Y) = \frac{\sum_{i = 1}^{n - 1} (x_{i} - ({\bar{x}}_{n - 1} - \frac{{\bar{x}}_{n - 1} - x_{n}}{n})) (y_{i} - ({\bar{y}}_{n - 1} - \frac{{\bar{y}}_{n - 1} - y_{n}}{n})) + (x_{n} - {\bar{x}}_{n}) (y_{n} - {\bar{y}}_{n})}{n} \\ C o v_{n} (X, Y) = \frac{\sum_{i = 1}^{n - 1} (x_{i} - {\bar{x}}_{n - 1} + \frac{{\bar{x}}_{n - 1} - x_{n}}{n}) (y_{i} - {\bar{y}}_{n - 1} + \frac{{\bar{y}}_{n - 1} - y_{n}}{n}) + (x_{n} - {\bar{x}}_{n}) (y_{n} - {\bar{y}}_{n})}{n} \\ C o v_{n} (X, Y) = \frac{\sum_{i = 1}^{n - 1} (\begin{array}{l} x_{i} y_{i} - x_{i} {\bar{y}}_{n - 1} + x_{i} (\frac{{\bar{y}}_{n - 1} - y_{n}}{n}) - {\bar{x}}_{n - 1} y_{i} + {\bar{x}}_{n - 1} {\bar{y}}_{n - 1} - {\bar{x}}_{n - 1} (\frac{{\bar{y}}_{n - 1} - y_{n}}{n}) \\ + (\frac{{\bar{x}}_{n - 1} - x_{n}}{n}) y_{i} - (\frac{{\bar{x}}_{n - 1} - x_{n}}{n}) {\bar{y}}_{n - 1} + (\frac{{\bar{x}}_{n - 1} - x_{n}}{n}) (\frac{{\bar{y}}_{n - 1} - y_{n}}{n}) \end{array}) + (x_{n} - {\bar{x}}_{n}) (y_{n} - {\bar{y}}_{n})}{n} \\ C o v_{n} (X, Y) = \frac{(\begin{array}{l} \sum_{i = 1}^{n - 1} (x_{i} y_{i} - x_{i} {\bar{y}}_{n - 1} - {\bar{x}}_{n - 1} y_{i} + {\bar{x}}_{n - 1} {\bar{y}}_{n - 1}) + \sum_{i = 1}^{n - 1} (x_{i} (\frac{{\bar{y}}_{n - 1} - y_{n}}{n}) - {\bar{x}}_{n - 1} (\frac{{\bar{y}}_{n - 1} - y_{n}}{n})) \\ + \sum_{i = 1}^{n - 1} ((\frac{{\bar{x}}_{n - 1} - x_{n}}{n}) y_{i} - (\frac{{\bar{x}}_{n - 1} - x_{n}}{n}) {\bar{y}}_{n - 1} + (\frac{{\bar{x}}_{n - 1} - x_{n}}{n}) (\frac{{\bar{y}}_{n - 1} - y_{n}}{n})) + (x_{n} - {\bar{x}}_{n}) (y_{n} - {\bar{y}}_{n}) \end{array})}{n} \\ C o v_{n} (X, Y) = \frac{(\begin{array}{l} \sum_{i = 1}^{n - 1} (x_{i} - {\bar{x}}_{n - 1}) (y_{i} - {\bar{y}}_{n - 1}) + (\frac{{\bar{y}}_{n - 1} - y_{n}}{n}) \sum_{i = 1}^{n - 1} (x_{i} - {\bar{x}}_{n - 1}) \\ + (\frac{{\bar{x}}_{n - 1} - x_{n}}{n}) \sum_{i = 1}^{n - 1} (y_{i} - {\bar{y}}_{n - 1} + (\frac{{\bar{y}}_{n - 1} - y_{n}}{n})) + (x_{n} - {\bar{x}}_{n}) (y_{n} - {\bar{y}}_{n}) \end{array})}{n} \end{array}$

Since the biased sample covariance of the $x$ and $y$ dimensions for the first $n - 1$ two-dimensional inputs is defined as:

$C o v_{n - 1} (X, Y) = \frac{\sum_{i = 1}^{n - 1} (x_{i} - {\bar{x}}_{n - 1}) (y_{i} - {\bar{y}}_{n - 1})}{n - 1}$ ,

then we also have:

$\sum_{i = 1}^{n - 1} (x_{i} - {\bar{x}}_{n - 1}) (y_{i} - {\bar{y}}_{n - 1}) = (n - 1) C o v_{n - 1} (X, Y)$ .

With this, we have:

$\begin{matrix} C o v_{n} (X, Y) = \frac{(\begin{array}{l} (n - 1) C o v_{n - 1} (X, Y) + (\frac{{\bar{y}}_{n - 1} - y_{n}}{n}) \sum_{i = 1}^{n - 1} (x_{i} - {\bar{x}}_{n - 1}) \\ + (\frac{{\bar{x}}_{n - 1} - x_{n}}{n}) \sum_{i = 1}^{n - 1} (y_{i} - {\bar{y}}_{n - 1} + (\frac{{\bar{y}}_{n - 1} - y_{n}}{n})) + (x_{n} - {\bar{x}}_{n}) (y_{n} - {\bar{y}}_{n}) \end{array})}{n} \\ C o v_{n} (X, Y) = \frac{(\begin{array}{l} (n - 1) C o v_{n - 1} (X, Y) + (\frac{{\bar{y}}_{n - 1} - y_{n}}{n}) (\sum_{i = 1}^{n - 1} (x_{i}) + \sum_{i = 1}^{n - 1} (- {\bar{x}}_{n - 1})) \\ + (\frac{{\bar{x}}_{n - 1} - x_{n}}{n}) (\sum_{i = 1}^{n - 1} (y_{i}) + \sum_{i = 1}^{n - 1} (- {\bar{y}}_{n - 1}) + \sum_{i = 1}^{n - 1} (\frac{{\bar{y}}_{n - 1} - y_{n}}{n})) + (x_{n} - {\bar{x}}_{n}) (y_{n} - {\bar{y}}_{n}) \end{array})}{n} \\ C o v_{n} (X, Y) = \frac{(\begin{array}{l} (n - 1) C o v_{n - 1} (X, Y) + (\frac{{\bar{y}}_{n - 1} - y_{n}}{n}) (\sum_{i = 1}^{n - 1} (x_{i}) - {\bar{x}}_{n - 1} \sum_{i = 1}^{n - 1} (1)) \\ + (\frac{{\bar{x}}_{n - 1} - x_{n}}{n}) (\sum_{i = 1}^{n - 1} (y_{i}) - {\bar{y}}_{n - 1} \sum_{i = 1}^{n - 1} (1) + (\frac{{\bar{y}}_{n - 1} - y_{n}}{n}) \sum_{i = 1}^{n - 1} (1)) + (x_{n} - {\bar{x}}_{n}) (y_{n} - {\bar{y}}_{n}) \end{array})}{n} \\ C o v_{n} (X, Y) = \frac{(\begin{array}{l} (n - 1) C o v_{n - 1} (X, Y) + (\frac{{\bar{y}}_{n - 1} - y_{n}}{n}) (\sum_{i = 1}^{n - 1} (x_{i}) - {\bar{x}}_{n - 1} (n - 1)) \\ + (\frac{{\bar{x}}_{n - 1} - x_{n}}{n}) (\sum_{i = 1}^{n - 1} (y_{i}) - {\bar{y}}_{n - 1} (n - 1) + (\frac{{\bar{y}}_{n - 1} - y_{n}}{n}) (n - 1)) + (x_{n} - {\bar{x}}_{n}) (y_{n} - {\bar{y}}_{n}) \end{array})}{n} \end{matrix}$

Since the sample mean for the first $n - 1$ $x$ and $y$ values are defined as:

${\bar{x}}_{n - 1} = \frac{\sum_{i = 1}^{n - 1} x_{i}}{n - 1}$ and ${\bar{y}}_{n - 1} = \frac{\sum_{i = 1}^{n - 1} y_{i}}{n - 1}$ ,

then we also have:

$\sum_{i = 1}^{n - 1} x_{i} = {\bar{x}}_{n - 1} (n - 1)$ and $\sum_{i = 1}^{n - 1} y_{i} = {\bar{y}}_{n - 1} (n - 1)$ .

With that, we have:

$\begin{array}{l} C o v_{n} (X, Y) = \frac{(\begin{array}{l} (n - 1) C o v_{n - 1} (X, Y) + (\frac{{\bar{y}}_{n - 1} - y_{n}}{n}) ({\bar{x}}_{n - 1} (n - 1) - {\bar{x}}_{n - 1} (n - 1)) \\ + (\frac{{\bar{x}}_{n - 1} - x_{n}}{n}) ({\bar{y}}_{n - 1} (n - 1) - {\bar{y}}_{n - 1} (n - 1) + (\frac{{\bar{y}}_{n - 1} - y_{n}}{n}) (n - 1)) + (x_{n} - {\bar{x}}_{n}) (y_{n} - {\bar{y}}_{n}) \end{array})}{n} \\ C o v_{n} (X, Y) = \frac{(\begin{array}{l} (n - 1) C o v_{n - 1} (X, Y) + (\frac{{\bar{y}}_{n - 1} - y_{n}}{n}) ({\bar{x}}_{n - 1} (n - 1) - {\bar{x}}_{n - 1} (n - 1)) \\ + (\frac{{\bar{x}}_{n - 1} - x_{n}}{n}) ({\bar{y}}_{n - 1} (n - 1) - {\bar{y}}_{n - 1} (n - 1) + (\frac{{\bar{y}}_{n - 1} - y_{n}}{n}) (n - 1)) + (x_{n} - {\bar{x}}_{n}) (y_{n} - {\bar{y}}_{n}) \end{array})}{n} \\ C o v_{n} (X, Y) = \frac{((n - 1) C o v_{n - 1} (X, Y) + (\frac{{\bar{x}}_{n - 1} - x_{n}}{n}) (\frac{{\bar{y}}_{n - 1} - y_{n}}{n}) (n - 1) + (x_{n} - {\bar{x}}_{n}) (y_{n} - {\bar{y}}_{n}))}{n} \\ C o v_{n} (X, Y) = \frac{(\begin{array}{l} (n - 1) C o v_{n - 1} (X, Y) + (n - 1) (\frac{{\bar{x}}_{n - 1} - x_{n}}{n}) (\frac{{\bar{y}}_{n - 1} - y_{n}}{n}) \\ + x_{n} y_{n} - x_{n} {\bar{y}}_{n} - {\bar{x}}_{n} y_{n} + {\bar{x}}_{n} {\bar{y}}_{n} \end{array})}{n} \end{array}$

Since the recurrence equation for the sample mean of the $y$ values is:

${\bar{y}}_{n} = {\bar{y}}_{n - 1} - \frac{{\bar{y}}_{n - 1} - y_{n}}{n}$ ,

then we have:

$\begin{matrix} C o v_{n} (X, Y) = \frac{(\begin{array}{l} (n - 1) C o v_{n - 1} (X, Y) + (n - 1) (\frac{{\bar{x}}_{n - 1} - x_{n}}{n}) (\frac{{\bar{y}}_{n - 1} - y_{n}}{n}) \\ + x_{n} y_{n} - x_{n} ({\bar{y}}_{n - 1} - \frac{{\bar{y}}_{n - 1} - y_{n}}{n}) - {\bar{x}}_{n} y_{n} + {\bar{x}}_{n} ({\bar{y}}_{n - 1} - \frac{{\bar{y}}_{n - 1} - y_{n}}{n}) \end{array})}{n} \\ C o v_{n} (X, Y) = \frac{(\begin{array}{l} (n - 1) C o v_{n - 1} (X, Y) + (n - 1) (\frac{{\bar{x}}_{n - 1} - x_{n}}{n}) (\frac{{\bar{y}}_{n - 1} - y_{n}}{n}) \\ + x_{n} y_{n} - x_{n} {\bar{y}}_{n - 1} + x_{n} (\frac{{\bar{y}}_{n - 1} - y_{n}}{n}) - {\bar{x}}_{n} y_{n} + {\bar{x}}_{n} {\bar{y}}_{n - 1} - {\bar{x}}_{n} (\frac{{\bar{y}}_{n - 1} - y_{n}}{n}) \end{array})}{n} \\ C o v_{n} (X, Y) = \frac{(\begin{array}{l} (n - 1) C o v_{n - 1} (X, Y) + (n - 1) (\frac{{\bar{x}}_{n - 1} - x_{n}}{n}) (\frac{{\bar{y}}_{n - 1} - y_{n}}{n}) \\ + x_{n} y_{n} - x_{n} {\bar{y}}_{n - 1} - {\bar{x}}_{n} y_{n} + {\bar{x}}_{n} {\bar{y}}_{n - 1} + (x_{n} - {\bar{x}}_{n}) (\frac{{\bar{y}}_{n - 1} - y_{n}}{n}) \end{array})}{n} \\ C o v_{n} (X, Y) = \frac{(\begin{array}{l} (n - 1) C o v_{n - 1} (X, Y) + (n - 1) (\frac{{\bar{x}}_{n - 1} - x_{n}}{n}) (\frac{{\bar{y}}_{n - 1} - y_{n}}{n}) \\ + (x_{n} - {\bar{x}}_{n}) (y_{n} - {\bar{y}}_{n - 1}) + (x_{n} - {\bar{x}}_{n}) (\frac{{\bar{y}}_{n - 1} - y_{n}}{n}) \end{array})}{n} \end{matrix}$

Since the recurrence equation for the sample mean of the $x$ values is:

$\begin{array}{l} {\bar{x}}_{n} = {\bar{x}}_{n - 1} - \frac{{\bar{x}}_{n - 1} - x_{n}}{n} \\ {\bar{x}}_{n} = \frac{n {\bar{x}}_{n - 1}}{n} + \frac{- {\bar{x}}_{n - 1} + x_{n}}{n} \\ {\bar{x}}_{n} = \frac{(n - 1) {\bar{x}}_{n - 1} + x_{n}}{n}, \end{array}$

then we have:

$\begin{array}{l} C o v_{n} (X, Y) = \frac{(\begin{array}{l} (n - 1) C o v_{n - 1} (X, Y) + (n - 1) (\frac{{\bar{x}}_{n - 1} - x_{n}}{n}) (\frac{{\bar{y}}_{n - 1} - y_{n}}{n}) \\ + (x_{n} - {\bar{x}}_{n}) (y_{n} - {\bar{y}}_{n - 1}) + (x_{n} - (\frac{(n - 1) {\bar{x}}_{n - 1} + x_{n}}{n})) (\frac{{\bar{y}}_{n - 1} - y_{n}}{n}) \end{array})}{n} \\ C o v_{n} (X, Y) = \frac{(\begin{array}{l} (n - 1) C o v_{n - 1} (X, Y) + (n - 1) (\frac{{\bar{x}}_{n - 1} - x_{n}}{n}) (\frac{{\bar{y}}_{n - 1} - y_{n}}{n}) \\ + (x_{n} - {\bar{x}}_{n}) (y_{n} - {\bar{y}}_{n - 1}) + (\frac{n x_{n}}{n} + \frac{- (n - 1) {\bar{x}}_{n - 1} - x_{n}}{n}) (\frac{{\bar{y}}_{n - 1} - y_{n}}{n}) \end{array})}{n} \\ C o v_{n} (X, Y) = \frac{(\begin{array}{l} (n - 1) C o v_{n - 1} (X, Y) + (n - 1) (\frac{{\bar{x}}_{n - 1} - x_{n}}{n}) (\frac{{\bar{y}}_{n - 1} - y_{n}}{n}) \\ + (x_{n} - {\bar{x}}_{n}) (y_{n} - {\bar{y}}_{n - 1}) + (\frac{- (n - 1) {\bar{x}}_{n - 1} + (n - 1) x_{n}}{n}) (\frac{{\bar{y}}_{n - 1} - y_{n}}{n}) \end{array})}{n} \\ C o v_{n} (X, Y) = \frac{(\begin{array}{l} (n - 1) C o v_{n - 1} (X, Y) + (n - 1) (\frac{{\bar{x}}_{n - 1} - x_{n}}{n}) (\frac{{\bar{y}}_{n - 1} - y_{n}}{n}) \\ + (x_{n} - {\bar{x}}_{n}) (y_{n} - {\bar{y}}_{n - 1}) - (n - 1) (\frac{{\bar{x}}_{n - 1} - x_{n}}{n}) (\frac{{\bar{y}}_{n - 1} - y_{n}}{n}) \end{array})}{n} \\ C o v_{n} (X, Y) = \frac{(\begin{array}{l} (n - 1) C o v_{n - 1} (X, Y) + (n - 1) (\frac{{\bar{x}}_{n - 1} - x_{n}}{n}) (\frac{{\bar{y}}_{n - 1} - y_{n}}{n}) \\ + (x_{n} - {\bar{x}}_{n}) (y_{n} - {\bar{y}}_{n - 1}) - (n - 1) (\frac{{\bar{x}}_{n - 1} - x_{n}}{n}) (\frac{{\bar{y}}_{n - 1} - y_{n}}{n}) \end{array})}{n} \\ C o v_{n} (X, Y) = \frac{(n - 1) C o v_{n - 1} (X, Y) + (x_{n} - {\bar{x}}_{n}) (y_{n} - {\bar{y}}_{n - 1})}{n} \\ C o v_{n} (X, Y) = \frac{n C o v_{n - 1} (X, Y) - C o v_{n - 1} (X, Y) + (x_{n} - {\bar{x}}_{n}) (y_{n} - {\bar{y}}_{n - 1})}{n} \\ C o v_{n} (X, Y) = \frac{n C o v_{n - 1} (X, Y)}{n} + \frac{- (C o v_{n - 1} (X, Y) - (x_{n} - {\bar{x}}_{n}) (y_{n} - {\bar{y}}_{n - 1}))}{n} \\ C o v_{n} (X, Y) = C o v_{n - 1} (X, Y) - \frac{C o v_{n - 1} (X, Y) - (x_{n} - {\bar{x}}_{n}) (y_{n} - {\bar{y}}_{n - 1})}{n} \end{array}$

Therefore, the recurrence equation for the biased sample covariance (a.k.a. online covariance) is:

$C o v_{n} (X, Y) = C o v_{n - 1} (X, Y) - \frac{C o v_{n - 1} (X, Y) - (x_{n} - {\bar{x}}_{n}) (y_{n} - {\bar{y}}_{n - 1})}{n}$

Note: We can manipulate this recurrence equation such as that we also have:

$C o v_{n} (X, Y) = C o v_{n - 1} (X, Y) - \frac{C o v_{n - 1} (X, Y) - (x_{n} - {\bar{x}}_{n - 1}) (y_{n} - {\bar{y}}_{n})}{n}$ ,

$C o v_{n} (X, Y) = C o v_{n - 1} (X, Y) - \frac{C o v_{n - 1} (X, Y) - (\frac{n - 1}{n}) (x_{n} - {\bar{x}}_{n - 1}) (y_{n} - {\bar{y}}_{n - 1})}{n}$ ,

and

$C o v_{n} (X, Y) = \frac{(n - 1) (C o v_{n - 1} (X, Y) + \frac{(x_{n} - {\bar{x}}_{n - 1}) (y_{n} - {\bar{y}}_{n - 1})}{n})}{n}$ .

Reference:
https://en.wikipedia.org/wiki/Algorithms_for_calculating_variance

Example of C++ code that computes the online covariance:


// Filename: main.cpp
#include <iostream>
#include <iomanip>
 
int main() {
 
    double x;
    double y;
    double n = 0;
    double mean_x = 0;  // mean of the x values
    double mean_y = 0;  // mean of the y values
    double cov = 0;     // covariance of the x and y values
    double prev_mean_x; // previous mean of the x values
    double prev_mean_y; // previous mean of the y values
    double prev_cov;    // previous covariance of the x and y values
 
    if ( std::cin >> x && std::cin >> y ) {
        ++n;
        mean_x = x;
        mean_y = y;
        cov = 0;
        while ( std::cin >> x && std::cin >> y ) {
            prev_mean_x = mean_x;
            prev_mean_y = mean_y;
            prev_cov = cov;
            ++n;
            mean_x = prev_mean_x - ( prev_mean_x - x ) / n;
            mean_y = prev_mean_y - ( prev_mean_y - y ) / n;
            cov = prev_cov - ( prev_cov - ( x - mean_x ) * ( y - prev_mean_y ) ) / n;
        }
    }
 
    std::cout << "n:      " << n << '\n';
    std::cout << "mean_x: " << std::setprecision( 17 ) << mean_x << '\n';
    std::cout << "mean_y: " << std::setprecision( 17 ) << mean_y << '\n';
    std::cout << "cov:    " << std::setprecision( 17 ) << cov << '\n';
 
}

Example of data.txt:


-281.189       612.083
974.663        -24.0965
25.8526        401.539
.              .
.              .
.              .

Command Line:


g++ -o main.exe main.cpp -std=c++11 -march=native -O3 -Wall -Wextra -Werror -static
./main.exe < data.txt

Note: Mathematica’s Covariance[] function computes the unbiased sample covariance matrix, not the biased sample covariance matrix; therefore, the biased sample covariance matrix is computed in Mathematica as:


( ( Length[ list ] - 1 ) / Length[ list ] ) * Covariance[ list ]

Online Covariance
online_covariance.pdf
online_covariance.docx

Tagged on: Mathematics

3 thoughts on “Online Covariance”

Joshua Burkholder Post authorApril 22, 2014 at 3:12 pm
This is also derived from the following:
- D. E. Knuth (1998). The Art of Computer Programming (Volume 2): Seminumerical Algorithms. Third Edition. Page 232.
- B. P. Welford (1962). Note on a Method for Calculating Corrected Sums of Squares and Products. Technometrics (Volume 4, Number 3). Pages 419-420.
  Link: http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.302.7503
  Link: http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.302.7503&rep=rep1&type=pdf
- T. F. Chan, G. H. Golub, and R. J. LeVeque (1983). Algorithms for Computing the Sample Variance: Analysis and Recommendations. The American Statistician (Volume 37, Number 3). Pages 242-247.
  Related Link: http://webmail.cs.yale.edu/publications/techreports/tr222.pdf
Reply ↓
Lavinius March 5, 2018 at 4:47 am

Hello,

I just tried your online covariance formula and it is very precise. Thank you for it, and for the mathematical demonstration. Do you have anything published in which you included it (just the formula), or should I just reference the website?

Reply ↓
1. Joshua Burkholder Post authorMarch 7, 2018 at 6:40 am
  
  Please reference the website. Thanks for your interest.
  
  Reply ↓

Joshua Burkholder

Mathematics and Computer Science

Online Covariance

3 thoughts on “Online Covariance”

Leave a Reply to Lavinius Cancel reply