In [None]:
#r "nuget: Plotly.NET, 4.0.0"
#r "nuget: Plotly.NET.Interactive, 4.0.0"
#r "nuget: FSharp.Stats"

open Plotly.NET


# Imputation

[![Binder](https://mybinder.org/badge_logo.svg)](https://mybinder.org/v2/gh/fslaborg/FSharp.Stats/gh-pages?urlpath=/tree/home/jovyan/Imputation.ipynb)
[![Notebook](https://fslab.org/FSharp.Stats/img/badge-notebook.svg)](https://fslab.org/FSharp.Stats/Imputation.ipynb)

Short documentation how to impute values



In [3]:
open FSharp.Stats
open FSharp.Stats.ML


let a = [3.;2.;3.;4.;5.;]
let b = [1.;2.;3.;nan;5.;]
let c = [nan;2.;3.;4.;nan;]
let d = [5.;2.;6.;4.;5.;]
let e = [0.5;2.;3.;5.;5.;]

let data = [a;b;c;d;e]


"rawData               0         1         2         3         4 _________________________________________________________0     |    3.000     2.000     3.000     4.000     5.0001     |    1.000     2.000     3.000       NaN     5.0002     |      NaN     2.000     3.000     4.000       NaN3     |    5.000     2.000     6.000     4.000     5.0004     |    0.500     2.000     3.000     5.000     5.000"

In [None]:
<a name="k-Nearest imputation"></a>


## k-Nearest imputation

Missing data imputation based on the k-nearest neighbour algorithm:



In [6]:
// init kNearest MatrixBaseImpute
let kn : Impute.MatrixBaseImputation<float[],float> = Impute.kNearestImpute 2
let imputedData = Impute.imputeBy kn Ops.isNan data


"k nearest neighbours imputed data               0         1         2         3         4 _________________________________________________________0     |    3.000     2.000     3.000     4.000     5.0001     |    1.000     2.000     3.000     4.500     5.0002     |    1.750     2.000     3.000     4.000     5.0003     |    5.000     2.000     6.000     4.000     5.0004     |    0.500     2.000     3.000     5.000     5.000"

In [None]:
<a name="random imputation"></a>


## random imputation

...



In [9]:
// init random VectorBaseImpute
let rnd = Impute.rnd (System.Random())

let rndRowWise = Impute.imputeRowWiseBy rnd Ops.isNan data
let rndColWise = Impute.imputeColWiseBy rnd Ops.isNan data


"rndRowDataMatrix imputed data               0         1         2         3         4 _________________________________________________________0     |    3.000     2.000     3.000     4.000     5.0001     |    1.000     2.000     3.000     1.000     5.0002     |    2.000     2.000     3.000     4.000     2.0003     |    5.000     2.000     6.000     4.000     5.0004     |    0.500     2.000     3.000     5.000     5.000"

"rndColDataMatrix imputed data               0         1         2         3         4 _________________________________________________________0     |    3.000     2.000     3.000     4.000     5.0001     |    1.000     2.000     3.000     4.000     5.0002     |    5.000     2.000     3.000     4.000     5.0003     |    5.000     2.000     6.000     4.000     5.0004     |    0.500     2.000     3.000     5.000     5.000"

In [None]:
<a name="normal imputation"></a>


## normal imputation

...



In [13]:
let normalRowWise = Impute.imputeRowWiseBy Impute.normal Ops.isNan data
let normalColWise = Impute.imputeColWiseBy Impute.normal Ops.isNan data


"normalRowDataMatrix imputed data               0         1         2         3         4 _________________________________________________________0     |    3.000     2.000     3.000     4.000     5.0001     |    1.000     2.000     3.000     -0.41     5.0002     |    4.217     2.000     3.000     4.000     1.3733     |    5.000     2.000     6.000     4.000     5.0004     |    0.500     2.000     3.000     5.000     5.000"

"normalColDataMatrix imputed data               0         1         2         3         4 _________________________________________________________0     |    3.000     2.000     3.000     4.000     5.0001     |    1.000     2.000     3.000     4.497     5.0002     |    1.651     2.000     3.000     4.000     5.0003     |    5.000     2.000     6.000     4.000     5.0004     |    0.500     2.000     3.000     5.000     5.000"