Ero sivun ”Koronavirus” versioiden välillä

Opasnet Suomista
Siirry navigaatioon Siirry hakuun
Rivi 21: Rivi 21:
Sensitiivisyys (se) on testin (B) herkkyys eli todennäköisyys saada positiivinen tulos jos asia (A) on totta: se = P(B|A) = a/(a+c). Mitä parempi herkkyys, sitä vähemmän vääriä negatiivisia.
Sensitiivisyys (se) on testin (B) herkkyys eli todennäköisyys saada positiivinen tulos jos asia (A) on totta: se = P(B|A) = a/(a+c). Mitä parempi herkkyys, sitä vähemmän vääriä negatiivisia.


Spesifisyys (sp) on testin (B) tarkkuus eli todennäköisyys saada negatiivinen tulos jos asia (A) ei ole totta: sp = 1-P(B|¬A-) = 1 - b/(b+d). Mitä parempi tarkkuus, sitä vähemmän vääriä positiivisia. Herkkyys ja tarkkuus ovat tärkeitä mittareita, koska ne eivät riipu itse asian todennäköisyydestä.
Spesifisyys (sp) on testin (B) tarkkuus eli todennäköisyys saada negatiivinen tulos jos asia (A) ei ole totta: sp = 1-P(B|¬A-) = 1 - b/(b+d). Mitä parempi tarkkuus, sitä vähemmän vääriä positiivisia. Herkkyys ja tarkkuus ovat tärkeitä mittareita, koska ne eivät riipu itse asian A todennäköisyydestä.


Esimerkkinä laskennasta on oheinen taulukko.
Esimerkkinä laskennasta on oheinen taulukko.
Rivi 50: Rivi 50:
Jotta käyttäjän antamat parametrit olisivat aina määriteltyjä ja helppo ymmärtää,  voitaisiin ottaa käyttöön seprime-parametri, joka saa arvoja välillä ]-1,1[, joka kattaa koko sensitiivisyyden määrittelyjoukon ja joka saa epärelevantin argumentin kohdalla arvon 0. Niinpä
Jotta käyttäjän antamat parametrit olisivat aina määriteltyjä ja helppo ymmärtää,  voitaisiin ottaa käyttöön seprime-parametri, joka saa arvoja välillä ]-1,1[, joka kattaa koko sensitiivisyyden määrittelyjoukon ja joka saa epärelevantin argumentin kohdalla arvon 0. Niinpä


  se = P(B|A) = P(B) + seprime(min(1,P(B)/P(A)) - P(B)), jos 0 <= seprime < 1
  se = P(B|A) = P(B) + seprime(B)(min(1,P(B)/P(A)) - P(B)), jos 0 <= seprime(B) < 1
  se = P(B|A) = P(B) + seprimeP(B), jos -1 < seprime < 0.
  se = P(B|A) = P(B) + seprime(B)P(B), jos -1 < seprime(B) < 0.


Kuitenkin meitä kiinnostaa relevanssiargumentin C vaikutus A:han B:n kautta. Koska P(B|A) riippuu A:sta, relevanssivaikutusta ei voida suoraan laskea C:n ja B:n tietojen avulla. Sen sijaan voidaan laskea seprime(B), jos ajatellaan seprime(C):n voimistavan tai heikentävän vaikutusta tietyn osuuden verran. C-argumentin todennäköisyys vaikuttaa siihen voimakkuuteen, jolla C muuttaa seprime(B):tä.
Kuitenkin meitä kiinnostaa relevanssiargumentin C vaikutus A:han B:n kautta. Koska P(B|A) riippuu A:sta, relevanssivaikutusta ei voida suoraan laskea C:n ja B:n tietojen avulla. Sen sijaan voidaan laskea seprime(B), jos ajatellaan seprime(C):n voimistavan tai heikentävän vaikutusta tietyn osuuden verran. Lisäksi C-argumentin todennäköisyys vaikuttaa siihen voimakkuuteen, jolla C muuttaa seprime(B):tä.


  seprime(B|C) = seprime(B) + seprime(C) P(C)(1-seprime(B)), jos seprime(C)>=0
  seprime(B|C) = seprime(B) + seprime(C) P(C)(1-seprime(B)), jos seprime(C)>=0
  seprime(B|C) = seprime(B) + seprime(C) P(C) seprime(B), jos seprime(C)<0
  seprime(B|C) = seprime(B) + seprime(C) P(C) seprime(B), jos seprime(C)<0


Edellä sanottu pätee, jos seprime(B) >= 0, muussa tapauksessa pitää ensin laskea yhtälöt seprime(B):n itseisarvolla ja palauttaa negatiivinen etumerkki jälkikäteen. Tämä johtuu siitä, että argumenttiin B kohdistuvat argumentit voivat lisätä tai vähentää sen relevanssia, mutta ne eivät voi vaihtaa hyökkäävää argumenttia puolustavaksi eikä päinvastoin.
Edellä sanottu pätee, jos seprime(B) >= 0, muussa tapauksessa pitää ensin laskea yhtälöt seprime(B):n itseisarvolla ja palauttaa negatiivinen etumerkki jälkikäteen. Tämä johtuu siitä, että argumenttiin B kohdistuvat argumentit voivat voimistaa tai heikentää sen relevanssia, mutta ne eivät voi vaihtaa hyökkäävää argumenttia puolustavaksi eikä päinvastoin.
 
Seprime-parametri voidaan yleistää tilanteeseen, jossa argumenttiin B kohdistuu useita relevanssiargumentteja C<sub>i</sub>. Näiden keskinäinen laskentajärjestys ei saa vaikuttaa lopputulokseen, koska argumenteilla ei ole olemassa mitään mielekästä järjestystä. Seuraava yleistys on järjestyksestä riippumaton ja tuottaa melko selkeän laskenta-algoritmin:
 
seprime(B|C<sub>i</sub>) = seprime(B) + (&Sigma;<sub>i</sub><sup>n</sup> seprime(C<sub>i</sub>) P(C<sub>i</sub>)) / n * (1-seprime(B)), jos &Sigma;<sub>i</sub><sup>n</sup> seprime(C<sub>i</sub>) P(C<sub>i</sub>)>=0
seprime(B|C<sub>i</sub>) = seprime(B) + (&Sigma;<sub>i</sub><sup>n</sup> seprime(C<sub>i</sub>) P(C<sub>i</sub>)) / n * seprime(B), jos &Sigma;<sub>i</sub><sup>n</sup> seprime(C<sub>i</sub>) P(C<sub>i</sub>)<0


Argumentin vaikutus keskusteluun lasketaan käyttäen esimerkiksi seuraavia oletusarvoja (näiden toimivuutta on testattava käytännössä):
Argumentin vaikutus keskusteluun lasketaan käyttäen esimerkiksi seuraavia oletusarvoja (näiden toimivuutta on testattava käytännössä):
Rivi 68: Rivi 73:
  P(A|B) = P(B|A)P(A)/P(B) = se P(A)/P(B)
  P(A|B) = P(B|A)P(A)/P(B) = se P(A)/P(B)


Jos argumentti C on relevanssityyppiä, se vaikuttaa argumentin B relevanssiin muuttamalla tekijää se = P(B|A) epäsuorasti seprimen kautta
Eli yhteenvetona: A:n posteriori P(A|B) voidaan laskea joss tiedetään A:n priori P(A), B:n totuusarvo P(B) ja B:n relevanssi A:n suhteen seprime(B), josta johdetaan P(B|A). Ylävirran argumentti C vaikuttaa A:han epäsuorasti joko muuttamalla B:n relevanssia seprime-parametrin kautta (jos C on relevanssityyppiä) tai muuttamalla B:n totuusarvoa (P(B) (jos C on totuustyyppiä). Näin koko argumenttipuu saadaan laskettua ylhäältä alas.
 
Jos kuitenkin halutaan päivittää jonkin argumentin totuusarvoa, tilanne on johdonmukainen vain jos oletetaan, että joko
# alkuperäisillä todennäköisyyksillä seprime(B):stä laskettu P(B|A) säilyy tästä lähtien vakiona vaikka P(A) tai P(B) muuttuisivat (molempia tarvitaan, kun P(B|A) lasketaan seprime(B):stä, tai
# P(B|A) pitää laskea aina uudestaan seprime(B):stä todennäköisyyksien muuttuessa.
 
Tapauksessa (1) voidaan käyttää Bayes-verkon päivityssääntöjä ja päivittää kaikki todennäköisyydet lennosta joka suuntaan, kun jokin todennäköisyys lukitaan. Mutta tapauksessa (2) näin ei voida tehdä, vaan kaikki todennäköisyydet on laskettava uusiksi ylävirrasta alas seprime(B):n avulla.


=== Laskenta ===
=== Laskenta ===
==== Piirrä näkemysverkko koronakeskustelusta ====


<rcode>
<rcode>

Versio 11. elokuuta 2021 kello 13.46




Koronavirus käsittelee SARS-COV-2-viruksen ja sen aiheuttaman COVID-19-taudin olennaisia piirteitä.

Perustelut

Data

Keskusteluja koronaviruksesta ja kovidista Kialo-alustalla, esim. Onko kovidipandemialla pysyviä vaikutuksia yhteiskuntaan?. Alla olevassa tiedostossa on 15 keskustelua aihepiiristä. Toisessa tiedostossa on Kialon ilmastokeskusteluja.

Näkemysverkko Kialon koronakeskustelusta

Argumentaatio koskien koronarokotusten pakollisuutta.

Koronakide-hankkeeseen liittyen tehdään näkemysverkkoja koronarokotusten argumentaatiosta.

Laskennan logiikka on seuraava. Alkuperäiseen väitteeseen A kohdistuu argumentti B ja tähän kohdistuu argumentti C eli C → B → A. Prioritodennäköisyys, että A on totta on P(A), kun meillä ei ole muuta tietoa. Kun lisätään argumentti B, saadaan Bayesin kaavalla

P(A|B) = P(B|A)P(A)/P(B).

Sensitiivisyys (se) on testin (B) herkkyys eli todennäköisyys saada positiivinen tulos jos asia (A) on totta: se = P(B|A) = a/(a+c). Mitä parempi herkkyys, sitä vähemmän vääriä negatiivisia.

Spesifisyys (sp) on testin (B) tarkkuus eli todennäköisyys saada negatiivinen tulos jos asia (A) ei ole totta: sp = 1-P(B|¬A-) = 1 - b/(b+d). Mitä parempi tarkkuus, sitä vähemmän vääriä positiivisia. Herkkyys ja tarkkuus ovat tärkeitä mittareita, koska ne eivät riipu itse asian A todennäköisyydestä.

Esimerkkinä laskennasta on oheinen taulukko.

A+ A- Sum
B+ 0.29 (a) 0.60 (b) 0.89
B- 0.01 (c) 0.10 (d) 0.11
Sum 0.30 0.70 1.00
se = a/(a+c) = 0.29/0.30 = 29/30

sp = b/(b+d) = 0.10/0.70 = 1/7

Mitä tietoja tarvitaan, jotta nelikenttä saadaan yksikäsitteisesti muodostettua? Jos tiedetään poikkisummat P(A) ja P(B), saadaan laskettua myös P(¬A) = 1-P(A) ja P(¬B) = 1-P(B). Yksiselitteisyyden saavuttamiseksi on tiedettävä vielä kolmas asia eli esimerkiksi P(B|A) eli herkkyys, joka kuvaa myös argumentin B relevanssia A:n suhteen eli kykyä muuttaa A:n posterioritodennäköisyyttä.

P(A) = a+c
P(B) = a+b
se = P(B|A) = a/(a+c) <=> a = se P(A), joten b = P(B) -se P(A)

Koska P(A|B) saadaan laskettua a/(a+b), matemaattinen määrittelyjoukko on 0 < P(A), P(B), se, a, b < 1 eli erityisesti 0 < P(B)-se P(A) < 1 eli (P(B)-1)/P(A) < se < P(B)/P(A). Koska P(B)<=1, alarajaehto ei tule koskaan vastaan vaan riittää, että se>0. Sen sijaan ylärajaehto voi hyvinkin olla <1 eli tulee joskus rajoittavaksi tekijäksi.

Argumentti on epärelevantti, jos P(A) = P(A|B) = a/(a+b) = se P(A)/P(B) eli se = P(B).

Jotta käyttäjän antamat parametrit olisivat aina määriteltyjä ja helppo ymmärtää, voitaisiin ottaa käyttöön seprime-parametri, joka saa arvoja välillä ]-1,1[, joka kattaa koko sensitiivisyyden määrittelyjoukon ja joka saa epärelevantin argumentin kohdalla arvon 0. Niinpä

se = P(B|A) = P(B) + seprime(B)(min(1,P(B)/P(A)) - P(B)), jos 0 <= seprime(B) < 1
se = P(B|A) = P(B) + seprime(B)P(B), jos -1 < seprime(B) < 0.

Kuitenkin meitä kiinnostaa relevanssiargumentin C vaikutus A:han B:n kautta. Koska P(B|A) riippuu A:sta, relevanssivaikutusta ei voida suoraan laskea C:n ja B:n tietojen avulla. Sen sijaan voidaan laskea seprime(B), jos ajatellaan seprime(C):n voimistavan tai heikentävän vaikutusta tietyn osuuden verran. Lisäksi C-argumentin todennäköisyys vaikuttaa siihen voimakkuuteen, jolla C muuttaa seprime(B):tä.

seprime(B|C) = seprime(B) + seprime(C) P(C)(1-seprime(B)), jos seprime(C)>=0
seprime(B|C) = seprime(B) + seprime(C) P(C) seprime(B), jos seprime(C)<0

Edellä sanottu pätee, jos seprime(B) >= 0, muussa tapauksessa pitää ensin laskea yhtälöt seprime(B):n itseisarvolla ja palauttaa negatiivinen etumerkki jälkikäteen. Tämä johtuu siitä, että argumenttiin B kohdistuvat argumentit voivat voimistaa tai heikentää sen relevanssia, mutta ne eivät voi vaihtaa hyökkäävää argumenttia puolustavaksi eikä päinvastoin.

Seprime-parametri voidaan yleistää tilanteeseen, jossa argumenttiin B kohdistuu useita relevanssiargumentteja Ci. Näiden keskinäinen laskentajärjestys ei saa vaikuttaa lopputulokseen, koska argumenteilla ei ole olemassa mitään mielekästä järjestystä. Seuraava yleistys on järjestyksestä riippumaton ja tuottaa melko selkeän laskenta-algoritmin:

seprime(B|Ci) = seprime(B) + (Σin seprime(Ci) P(Ci)) / n * (1-seprime(B)), jos Σin seprime(Ci) P(Ci)>=0
seprime(B|Ci) = seprime(B) + (Σin seprime(Ci) P(Ci)) / n * seprime(B), jos Σin seprime(Ci) P(Ci)<0

Argumentin vaikutus keskusteluun lasketaan käyttäen esimerkiksi seuraavia oletusarvoja (näiden toimivuutta on testattava käytännössä):

  • Argumentin herkkyys P(B|A) lasketaan relevanssitekijän (seprime) avulla: oletuksena 0.3 jos argumentti puolustaa ja -0.3 jos hyökkää
  • Argumenttien totuuden prioritodennäköisyys P(A) = 0.7 jos on uskottava viite, 0.3 jos viite puuttuu

Näiden avulla lasketaan argumentin posterioritodennäköisyys:

P(A|B) = P(B|A)P(A)/P(B) = se P(A)/P(B)

Eli yhteenvetona: A:n posteriori P(A|B) voidaan laskea joss tiedetään A:n priori P(A), B:n totuusarvo P(B) ja B:n relevanssi A:n suhteen seprime(B), josta johdetaan P(B|A). Ylävirran argumentti C vaikuttaa A:han epäsuorasti joko muuttamalla B:n relevanssia seprime-parametrin kautta (jos C on relevanssityyppiä) tai muuttamalla B:n totuusarvoa (P(B) (jos C on totuustyyppiä). Näin koko argumenttipuu saadaan laskettua ylhäältä alas.

Jos kuitenkin halutaan päivittää jonkin argumentin totuusarvoa, tilanne on johdonmukainen vain jos oletetaan, että joko

  1. alkuperäisillä todennäköisyyksillä seprime(B):stä laskettu P(B|A) säilyy tästä lähtien vakiona vaikka P(A) tai P(B) muuttuisivat (molempia tarvitaan, kun P(B|A) lasketaan seprime(B):stä, tai
  2. P(B|A) pitää laskea aina uudestaan seprime(B):stä todennäköisyyksien muuttuessa.

Tapauksessa (1) voidaan käyttää Bayes-verkon päivityssääntöjä ja päivittää kaikki todennäköisyydet lennosta joka suuntaan, kun jokin todennäköisyys lukitaan. Mutta tapauksessa (2) näin ei voida tehdä, vaan kaikki todennäköisyydet on laskettava uusiksi ylävirrasta alas seprime(B):n avulla.

Laskenta

Piirrä näkemysverkko koronakeskustelusta

+ Näytä koodi

Hae kirjanmerkit Firefoxista

+ Näytä koodi

Katso myös

Arkisto

  • Arkistoitu aiempi pohdinta perustuen mm. vedonlyöntisuhteisiin sekä totuus- ja relevanssifaktoreihin. Lisäksi käytettiin termistä P(B|A) nimeä sensitiivisyys, mikä on sinänsä oikein mutta ei ehkä hyödyllistä.