Ero sivun ”Koronavirus” versioiden välillä

Opasnet Suomista
Siirry navigaatioon Siirry hakuun
 
(4 välissä olevaa versiota samalta käyttäjältä ei näytetä)
Rivi 3: Rivi 3:


== Perustelut ==
== Perustelut ==
=== Linkkejä ===
* [http://77.86.191.32/rtools_server/runs/covid_cases_cities.pdf Koviditapaukset kaupungeittain viikon keskiarvo]
* [http://77.86.191.32/rtools_server/runs/covid_cases_cities_daily.pdf Koviditapaukset kaupungeittain ja päivittäin]
* [http://77.86.191.32/rtools_server/runs/Sade-ennusteen_muutos.png Sade-ennusteen muutos (ei liity koronaan)]


=== Data ===
=== Data ===
Rivi 13: Rivi 19:
=== Näkemysverkko Kialon koronakeskustelusta ===
=== Näkemysverkko Kialon koronakeskustelusta ===


[[File:Koronakideargumentaatio.png|600px|thumb|Argumentaatio koskien koronarokotusten pakollisuutta.]]Koronakide-hankkeeseen liittyen tehdään näkemysverkkoja koronarokotusten argumentaatiosta.
[[File:Koronakideargumentaatio.png|600px|thumb|Argumentaatio koskien koronarokotusten pakollisuutta.]]Koronakide-hankkeeseen liittyen tehdään näkemysverkkoja koronapolitiikan eri aiheiden argumentaatiosta.


Laskennan logiikka on seuraava. Alkuperäiseen väitteeseen A kohdistuu argumentti B ja tähän kohdistuu argumentti C eli C → B → A. Prioritodennäköisyys, että A on totta on P(A), kun meillä ei ole muuta tietoa. Kun lisätään argumentti B, saadaan Bayesin kaavalla
Laskennan logiikka on seuraava. Alkuperäiseen väitteeseen A kohdistuu argumentti B ja tähän kohdistuu argumentti C eli C → B → A. Prioritodennäköisyys, että A on totta on P(A), kun meillä ei ole muuta tietoa. Kun lisätään argumentti B, saadaan Bayesin kaavalla
Rivi 37: Rivi 43:
  se = a/(a+c) = 0.29/0.30 = 29/30
  se = a/(a+c) = 0.29/0.30 = 29/30
   
   
  sp = b/(b+d) = 0.10/0.70 = 1/7
  sp = 1 - b/(b+d) = 1 - 0.6/0.70 = 1/7
   
   
Mitä tietoja tarvitaan, jotta nelikenttä saadaan yksikäsitteisesti muodostettua? Jos tiedetään poikkisummat P(A) ja P(B), saadaan laskettua myös P(¬A) = 1-P(A) ja P(¬B) = 1-P(B). Yksiselitteisyyden saavuttamiseksi on tiedettävä vielä kolmas asia eli esimerkiksi P(B|A) eli herkkyys, joka kuvaa myös argumentin B relevanssia A:n suhteen eli kykyä muuttaa A:n posterioritodennäköisyyttä.
Bayesin kaavalla saadaan arvio P(A|B) päivitettyä, jos tiedetään priorit P(A) ja P(B) sekä ehdollinen todennäköisyys P(B|A) = se. Totuusarvot päivittyvät suoraan Bayes-verkon mukaisesti. Sen sijaan relevanssi vaatii erityiskäsittelyä.
P(A) = a+c
P(B) = a+b
se = P(B|A) = a/(a+c) <=> a = se P(A), joten b = P(B) -se P(A)
 
Koska P(A|B) saadaan laskettua a/(a+b), matemaattinen määrittelyjoukko on 0 < P(A), P(B), se, a, b < 1 eli erityisesti 0 < P(B)-se P(A) < 1 eli (P(B)-1)/P(A) < se < P(B)/P(A). Koska P(B)<=1, alarajaehto ei tule koskaan vastaan vaan riittää, että se>0. Sen sijaan ylärajaehto voi hyvinkin olla <1 eli tulee joskus rajoittavaksi tekijäksi.
 
Argumentti on epärelevantti, jos P(A) = P(A|B) = a/(a+b) = se P(A)/P(B) eli se = P(B).
 
Jotta käyttäjän antamat parametrit olisivat aina määriteltyjä ja helppo ymmärtää,  voitaisiin ottaa käyttöön seprime-parametri, joka saa arvoja välillä ]-1,1[, joka kattaa koko sensitiivisyyden määrittelyjoukon ja joka saa epärelevantin argumentin kohdalla arvon 0. Niinpä
 
se = P(B|A) = P(B) + seprime(B)(min(1,P(B)/P(A)) - P(B)), jos 0 <= seprime(B) < 1
se = P(B|A) = P(B) + seprime(B)P(B), jos -1 < seprime(B) < 0.
 
Kuitenkin meitä kiinnostaa relevanssiargumentin C vaikutus A:han B:n kautta. Koska P(B|A) riippuu A:sta, relevanssivaikutusta ei voida suoraan laskea C:n ja B:n tietojen avulla. Sen sijaan voidaan laskea seprime(B), jos ajatellaan seprime(C):n voimistavan tai heikentävän vaikutusta tietyn osuuden verran. Lisäksi C-argumentin todennäköisyys vaikuttaa siihen voimakkuuteen, jolla C muuttaa seprime(B):tä.
 
seprime(B|C) = seprime(B) + seprime(C) P(C)(1-seprime(B)), jos seprime(C)>=0
seprime(B|C) = seprime(B) + seprime(C) P(C) seprime(B), jos seprime(C)<0
 
Edellä sanottu pätee, jos seprime(B) >= 0, muussa tapauksessa pitää ensin laskea yhtälöt seprime(B):n itseisarvolla ja palauttaa negatiivinen etumerkki jälkikäteen. Tämä johtuu siitä, että argumenttiin B kohdistuvat argumentit voivat voimistaa tai heikentää sen relevanssia, mutta ne eivät voi vaihtaa hyökkäävää argumenttia puolustavaksi eikä päinvastoin.
 
Seprime-parametri voidaan yleistää tilanteeseen, jossa argumenttiin B kohdistuu useita relevanssiargumentteja C<sub>i</sub>. Näiden keskinäinen laskentajärjestys ei saa vaikuttaa lopputulokseen, koska argumenteilla ei ole olemassa mitään mielekästä järjestystä. Seuraava yleistys on järjestyksestä riippumaton ja tuottaa melko selkeän laskenta-algoritmin:
 
seprime(B|C<sub>i</sub>) = seprime(B) + (&Sigma;<sub>i</sub><sup>n</sup> seprime(C<sub>i</sub>) P(C<sub>i</sub>)) / n * (1-seprime(B)), jos &Sigma;<sub>i</sub><sup>n</sup> seprime(C<sub>i</sub>) P(C<sub>i</sub>)>=0
seprime(B|C<sub>i</sub>) = seprime(B) + (&Sigma;<sub>i</sub><sup>n</sup> seprime(C<sub>i</sub>) P(C<sub>i</sub>)) / n * seprime(B), jos &Sigma;<sub>i</sub><sup>n</sup> seprime(C<sub>i</sub>) P(C<sub>i</sub>)<0
 
Argumentin vaikutus keskusteluun lasketaan käyttäen esimerkiksi seuraavia oletusarvoja (näiden toimivuutta on testattava käytännössä):
* Argumentin herkkyys P(B|A) lasketaan relevanssitekijän (seprime) avulla: oletuksena 0.3 jos argumentti puolustaa ja -0.3 jos hyökkää
* Argumenttien totuuden prioritodennäköisyys P(A) = 0.7 jos on uskottava viite, 0.3 jos viite puuttuu
 
Näiden avulla lasketaan argumentin posterioritodennäköisyys:


P(A|B) = P(B|A)P(A)/P(B) = se P(A)/P(B)
Argumentti B on irrelevantti joss P(B|A+) = P(B|A-) = P(B|A) eli a/(a+c) = b/(b+d) eli se + sp = 1. Niinpä relevanssi r voidaan määritellä sensitiivisyyden poikkeamaksi irrelevantista tilanteesta, eli r = (1 - sp) - se. Relevanssihyökkäykset k<sub>i</sub> puolestaan voidaan ajatella tekijöiksi, joiden takia r lähestyy nollaa eli hyökkäysten jälkeinen relevanssi r' on


Eli yhteenvetona: A:n posteriori P(A|B) voidaan laskea joss tiedetään A:n priori P(A), B:n totuusarvo P(B) ja B:n relevanssi A:n suhteen seprime(B), josta johdetaan P(B|A). Ylävirran argumentti C vaikuttaa A:han epäsuorasti joko muuttamalla B:n relevanssia seprime-parametrin kautta (jos C on relevanssityyppiä) tai muuttamalla B:n totuusarvoa (P(B) (jos C on totuustyyppiä). Näin koko argumenttipuu saadaan laskettua ylhäältä alas.
r' = r &Pi;(1 - k<sub>i</sub>)
    = (1 - sp - se) &Pi;(1 - k<sub>i</sub>),


Jos kuitenkin halutaan päivittää jonkin argumentin totuusarvoa, tilanne on johdonmukainen vain jos oletetaan, että joko
jossa k<sub>i</sub> ∈ [0, 1] saa sitä suurempia arvoja, mitä voimakkaampi hyökkäys relevanssia vastaan tehdään. Tämän kuvauksen hyvä puoli on, että irrelevanssipiste ei riipu A:n ja B:n todennäköisyyksistä ja että lopputulos ei riipu siitä, missä järjestyksessä relevanssihyökkäykset k<sub>i</sub> esitetään.
# alkuperäisillä todennäköisyyksillä seprime(B):stä laskettu P(B|A) säilyy tästä lähtien vakiona vaikka P(A) tai P(B) muuttuisivat (molempia tarvitaan, kun P(B|A) lasketaan seprime(B):stä, tai
# P(B|A) pitää laskea aina uudestaan seprime(B):stä todennäköisyyksien muuttuessa.


Tapauksessa (1) voidaan käyttää Bayes-verkon päivityssääntöjä ja päivittää kaikki todennäköisyydet lennosta joka suuntaan, kun jokin todennäköisyys lukitaan. Mutta tapauksessa (2) näin ei voida tehdä, vaan kaikki todennäköisyydet on laskettava uusiksi ylävirrasta alas seprime(B):n avulla.
Jos taas halutaan esittää puolustava relevanssiargumentti, ei ole selvää, millä tavalla sensitiivisyyden tulisi muuttua. Niinpä tällä hetkellä ajatellaan, että puolustavan relevanssiargumentin yhteydessä pitää erikseen ilmoittaa, mikä kohdeargumentin sensitiivisyys on puolustuksen jälkeen. Tätä on vaikea automatisoida, joten tätä pitää opetella todellisten käyttäjätapausten kautta: millaisia keskusteluja tarvitaan, jotta käyttäjät voivat päätyä perusteltuihin päätelmiin relevanssin suuruudesta?


=== Laskenta ===
=== Laskenta ===
Rivi 317: Rivi 292:
== Katso myös ==
== Katso myös ==


* Aiempi versio, jossa käytettiin relevanssitekijää ja oletettiin ettei spesifisyyttä tiedetä. [http://fi.opasnet.org/fi-opwiki/index.php?title=Koronavirus&oldid=36880#N.C3.A4kemysverkko_Kialon_koronakeskustelusta]
* A Global collection of open source projcts during COVID-19 [http://open-source-covid-19.weileizeng.com/]
* A Global collection of open source projcts during COVID-19 [http://open-source-covid-19.weileizeng.com/]
* Annu Haho, Marja Tiirola. Sammutammeko koronakriisiä oikeilla välineillä? Suojaa-testaa-jäljitä-eristä-hoida! Miten? [https://www.suolistoblogi.com/446264861]
* Annu Haho, Marja Tiirola. Sammutammeko koronakriisiä oikeilla välineillä? Suojaa-testaa-jäljitä-eristä-hoida! Miten? [https://www.suolistoblogi.com/446264861]

Nykyinen versio 1. elokuuta 2022 kello 09.33




Koronavirus käsittelee SARS-COV-2-viruksen ja sen aiheuttaman COVID-19-taudin olennaisia piirteitä.

Perustelut

Linkkejä

Data

Keskusteluja koronaviruksesta ja kovidista Kialo-alustalla, esim. Onko kovidipandemialla pysyviä vaikutuksia yhteiskuntaan?. Alla olevassa tiedostossa on 15 keskustelua aihepiiristä. Toisessa tiedostossa on Kialon ilmastokeskusteluja.

Näkemysverkko Kialon koronakeskustelusta

Argumentaatio koskien koronarokotusten pakollisuutta.

Koronakide-hankkeeseen liittyen tehdään näkemysverkkoja koronapolitiikan eri aiheiden argumentaatiosta.

Laskennan logiikka on seuraava. Alkuperäiseen väitteeseen A kohdistuu argumentti B ja tähän kohdistuu argumentti C eli C → B → A. Prioritodennäköisyys, että A on totta on P(A), kun meillä ei ole muuta tietoa. Kun lisätään argumentti B, saadaan Bayesin kaavalla

P(A|B) = P(B|A)P(A)/P(B).

Sensitiivisyys (se) on testin (B) herkkyys eli todennäköisyys saada positiivinen tulos jos asia (A) on totta: se = P(B|A) = a/(a+c). Mitä parempi herkkyys, sitä vähemmän vääriä negatiivisia.

Spesifisyys (sp) on testin (B) tarkkuus eli todennäköisyys saada negatiivinen tulos jos asia (A) ei ole totta: sp = 1-P(B|¬A-) = 1 - b/(b+d). Mitä parempi tarkkuus, sitä vähemmän vääriä positiivisia. Herkkyys ja tarkkuus ovat tärkeitä mittareita, koska ne eivät riipu itse asian A todennäköisyydestä.

Esimerkkinä laskennasta on oheinen taulukko.

A+ A- Sum
B+ 0.29 (a) 0.60 (b) 0.89
B- 0.01 (c) 0.10 (d) 0.11
Sum 0.30 0.70 1.00
se = a/(a+c) = 0.29/0.30 = 29/30

sp = 1 - b/(b+d) = 1 - 0.6/0.70 = 1/7

Bayesin kaavalla saadaan arvio P(A|B) päivitettyä, jos tiedetään priorit P(A) ja P(B) sekä ehdollinen todennäköisyys P(B|A) = se. Totuusarvot päivittyvät suoraan Bayes-verkon mukaisesti. Sen sijaan relevanssi vaatii erityiskäsittelyä.

Argumentti B on irrelevantti joss P(B|A+) = P(B|A-) = P(B|A) eli a/(a+c) = b/(b+d) eli se + sp = 1. Niinpä relevanssi r voidaan määritellä sensitiivisyyden poikkeamaksi irrelevantista tilanteesta, eli r = (1 - sp) - se. Relevanssihyökkäykset ki puolestaan voidaan ajatella tekijöiksi, joiden takia r lähestyy nollaa eli hyökkäysten jälkeinen relevanssi r' on

r' = r Π(1 - ki)
   = (1 - sp - se) Π(1 - ki),

jossa ki ∈ [0, 1] saa sitä suurempia arvoja, mitä voimakkaampi hyökkäys relevanssia vastaan tehdään. Tämän kuvauksen hyvä puoli on, että irrelevanssipiste ei riipu A:n ja B:n todennäköisyyksistä ja että lopputulos ei riipu siitä, missä järjestyksessä relevanssihyökkäykset ki esitetään.

Jos taas halutaan esittää puolustava relevanssiargumentti, ei ole selvää, millä tavalla sensitiivisyyden tulisi muuttua. Niinpä tällä hetkellä ajatellaan, että puolustavan relevanssiargumentin yhteydessä pitää erikseen ilmoittaa, mikä kohdeargumentin sensitiivisyys on puolustuksen jälkeen. Tätä on vaikea automatisoida, joten tätä pitää opetella todellisten käyttäjätapausten kautta: millaisia keskusteluja tarvitaan, jotta käyttäjät voivat päätyä perusteltuihin päätelmiin relevanssin suuruudesta?

Laskenta

Piirrä näkemysverkko koronakeskustelusta

+ Näytä koodi

Hae kirjanmerkit Firefoxista

+ Näytä koodi

Katso myös

Arkisto

  • Arkistoitu aiempi pohdinta perustuen mm. vedonlyöntisuhteisiin sekä totuus- ja relevanssifaktoreihin. Lisäksi käytettiin termistä P(B|A) nimeä sensitiivisyys, mikä on sinänsä oikein mutta ei ehkä hyödyllistä.