#r "nuget: SeqPrinter, 0.2.1"
open SeqPrinter

type Prior =
    { Hypothesis: string
      Prior: float
      Likelihood: float }

type Posterior =
    { Hypothesis: string
      Prior: float
      Likelihood: float
      Posterior: float }

let calcPosteriors (priors: Prior list) : Posterior list =
    let totalProbability = priors |> List.sumBy (fun r -> r.Prior * r.Likelihood)

    priors
    |> List.map (fun h ->
        { Hypothesis = h.Hypothesis
          Prior = h.Prior
          Likelihood = h.Likelihood
          Posterior = ((h.Prior * h.Likelihood) / totalProbability) })

let priors =
    [ { Hypothesis = "Bowl 1"
        Prior = 0.5
        Likelihood = 0.75 }
      { Hypothesis = "Bowl 2"
        Prior = 0.5
        Likelihood = 0.50 } ]

priors 
|> calcPosteriors 
|> Printer
|> Printer.withColumns [ "Hypothesis"; "Prior"; "Likelihood" ; "Posterior"  ]
|> Printer.print

 Hypothesis  Prior     Likelihood  Posterior 
 <String>    <Double>  <Double>    <Double>  
 Bowl 1      0.5       0.75        0.6       
 Bowl 2      0.5       0.5         0.4

let die = EmpiricalDistribution.createNominal() [ 1; 2; 3; 4; 5; 6 ]
die

1

0.16666666666666666

2

0.16666666666666666

3

0.16666666666666666

4

0.16666666666666666

5

0.16666666666666666

#r "nuget: FSharp.Stats, 0.4.12-preview.1"
open FSharp.Stats
open FSharp.Stats.Distributions

let priorDist = EmpiricalDistribution.createNominal () [ "Bowl 1"; "Bowl 2" ]

let likelihoodVanilla = [ "Bowl 1", 0.75; "Bowl 2", 0.5 ] |> Map.ofSeq

let likelihoodChocolate = [ "Bowl 1", 0.25; "Bowl 2", 0.5 ] |> Map.ofSeq

let normalise (dist: Map<'a, float>) =
    let totalProbability = dist |> Map.toSeq |> Seq.sumBy snd
    dist |> Map.map (fun k v -> v / totalProbability)

let updatePosteriorDist (likelihoods: Map<'a, float>) (priorDist: Map<'a, float>) =
    priorDist
    |> Map.map (fun k v ->
        match (likelihoods.TryFind k) with
        | Some l -> v * l
        | None -> v)
    |> normalise

updatePosteriorDist likelihoodVanilla priorDist
|> updatePosteriorDist likelihoodVanilla

0.6923076923076923

0.30769230769230776

[1..10]
|> List.fold(fun dist _ -> updatePosteriorDist likelihoodVanilla dist) priorDist

0.9829540725450701

0.01704592745492984

let die = EmpiricalDistribution.createNominal() [ 1; 2; 3; 4; 5; 6 ]
die

1

0.16666666666666666

2

0.16666666666666666

3

0.16666666666666666

4

0.16666666666666666

5

0.16666666666666666

let prior101Dist = EmpiricalDistribution.createNominal () {0..100}
prior101Dist

0

0.009900990099009901

1

0.009900990099009901

2

0.009900990099009901

3

0.009900990099009901

4

0.009900990099009901

let likelihoodVanilla =
    [ 0..100 ] |> List.map (fun i -> i, (float i / 100.)) |> Map.ofList

let likelihoodChocolate =
    [ 0..100 ] |> List.map (fun i -> i, 1. - (float i / 100.)) |> Map.ofList

let hundredBowlsPosterior =
    updatePosteriorDist likelihoodVanilla prior101Dist

HundredBowlsPosterior

0

0

1

2.955519432540268E-06

2

1.1822077730161073E-05

3

2.6599674892862408E-05

4

4.728831092064429E-05

#r "nuget: Plotly.NET"
#r "nuget: Plotly.NET.Interactive, 4.0.0"
open Plotly.NET


let drawChart priorDist posteriorDist vanillas chocolates =
    let posteriorAfterOneVanillaLine =
        Chart.Line((posteriorDist |> Map.toSeq), Name = "Posterior")

    let prior101DistLine = Chart.Line((priorDist |> Map.toSeq), Name = "Prior")

    let title = (sprintf "Posterior after %i vanilla cookies and %i chocolate cookies" vanillas chocolates)
            

    [ posteriorAfterOneVanillaLine; prior101DistLine ]
    |> Chart.combine
    |> Chart.withXAxisStyle ("Bowl")
    |> Chart.withYAxisStyle ("PMF")
    |> Chart.withTitle(title)

drawChart prior101Dist HundredBowlsPosterior 1 0

let posterior3 =
    updatePosteriorDist likelihoodVanilla prior101Dist
    |> updatePosteriorDist likelihoodVanilla
    |> updatePosteriorDist likelihoodChocolate


drawChart prior101Dist posterior3 2 1

key	value
0	0
1	2.955519432540268E-06
2	1.1822077730161073E-05
3	2.6599674892862408E-05
4	4.728831092064429E-05
5	7.388798581350669E-05
6	0.00010639869957144963
7	0.00014482045219447315
8	0.00018915324368257716
9	0.00023939707403576168
10	0.00029555194325402677
11	0.00035761785133737247
12	0.0004255947982857985
13	0.0004994827840993052
14	0.0005792818087778926
15	0.0006649918723215601
16	0.0007566129747303087
17	0.0008541451160041376
18	0.0009575882961430467
19	0.0010669425151470368
... (more)

Bayesian F# Series - Probability distributions with Bayes

Posted on 2023-9-30 by Harry McCarney in Data Science

Introduction¶

2 bowls of Cookies¶

101 bowls of cookies¶

key	value
1	0.16666666666666666
2	0.16666666666666666
3	0.16666666666666666
4	0.16666666666666666
5	0.16666666666666666
6	0.16666666666666666

key	value
0	0.009900990099009901
1	0.009900990099009901
2	0.009900990099009901
3	0.009900990099009901
4	0.009900990099009901
5	0.009900990099009901
6	0.009900990099009901
7	0.009900990099009901
8	0.009900990099009901
9	0.009900990099009901
10	0.009900990099009901
11	0.009900990099009901
12	0.009900990099009901
13	0.009900990099009901
14	0.009900990099009901
15	0.009900990099009901
16	0.009900990099009901
17	0.009900990099009901
18	0.009900990099009901
19	0.009900990099009901
... (more)