Ero sivun ”Opasnet-kanta” versioiden välillä
pEi muokkausyhteenvetoa |
pEi muokkausyhteenvetoa |
||
Rivi 15: | Rivi 15: | ||
Opasnet-kantaan voidaan myös kerätä havaintodataa tietyistä tutkimuksista. "Tutkimus" voi olla perinteinen tieteellinen tutkimus(julkaisu) tai esim. "Opasnet-tutkimus", jonka data kerätään tietyllä Opasnet-sivulla olevalle lomakepohjalle. On useita mahdollisia syitä käyttää Opasnet-kantaa tietovarastona: | Opasnet-kantaan voidaan myös kerätä havaintodataa tietyistä tutkimuksista. "Tutkimus" voi olla perinteinen tieteellinen tutkimus(julkaisu) tai esim. "Opasnet-tutkimus", jonka data kerätään tietyllä Opasnet-sivulla olevalle lomakepohjalle. On useita mahdollisia syitä käyttää Opasnet-kantaa tietovarastona: | ||
*Kerätä havaintoaineistoa jotta sitä voidaan käyttää suoraan | *Kerätä havaintoaineistoa jotta sitä voidaan käyttää suoraan ja kätevästi [[Variable|muuttuja]] ja [[Object|objekti]] tulkintojen tekemiseen. | ||
*Kollektiivisesti kerätä tietoa erityisistä tapauksista yleisemmän tapauksen selvittämiseksi | *Kollektiivisesti kerätä tietoa erityisistä tapauksista yleisemmän tapauksen selvittämiseksi | ||
Rivi 21: | Rivi 21: | ||
*Objekti joka on kokoelma havainnoista, on nimeltään [[Study|tutkimus]], kun taas tämän tulkinnan objekti on nimeltään [[Variable|muuttuja]]. Esimerkiksi tutkimus voi kerätä tietoa ihmisryhmästä kyselylomakkeella ja verinäyttein. Tutkimuksen tunniste on Obj.id Opasnet kannassa. | *Objekti joka on kokoelma havainnoista, on nimeltään [[Study|tutkimus]], kun taas tämän tulkinnan objekti on nimeltään [[Variable|muuttuja]]. Esimerkiksi tutkimus voi kerätä tietoa ihmisryhmästä kyselylomakkeella ja verinäyttein. Tutkimuksen tunniste on Obj.id Opasnet kannassa. | ||
*Objektin voi jakaa pienempiin osiin käyttämällä [[Index|indeksiä]]. Esimerkiksi kyselylomakkeessa saattaa olla kolmekymmentä kysymystä ja niinpä kyselylomake data voidaan jakaa kolmeenkymmeneen indeksin, jossa on kolmekymmentä saraketta (tai riviä, riippuen omasta ajattelutavastasi), yksi rivi jokaiselle kysymykselle. Jokainen tutkimuksen sarake sisältää yhden solun, eli yhden vastauksen kysymykseen. Tässä tutkimuksessa tutkitaan kymmenen veren biomarkkeria ja siispä objektin koko on neljäkymmentä solua ja indeksi | *Objektin voi jakaa pienempiin osiin käyttämällä [[Index|indeksiä]]. Esimerkiksi kyselylomakkeessa saattaa olla kolmekymmentä kysymystä ja niinpä kyselylomake data voidaan jakaa kolmeenkymmeneen indeksin, jossa on kolmekymmentä saraketta (tai riviä, riippuen omasta ajattelutavastasi), yksi rivi jokaiselle kysymykselle. Jokainen tutkimuksen sarake sisältää yhden solun, eli yhden vastauksen kysymykseen. Tässä tutkimuksessa tutkitaan kymmenen veren biomarkkeria ja siispä objektin koko on neljäkymmentä solua ja indeksi sisältää neljäkymmentä saraketta (30 kyselylomakkeesta ja kymmenen verinäytteistä). Solun tunniste Opasnet kannassa on Cell.id. | ||
*Jokaiselle yksittäiselle potilaalle on yksi havaintorivi, jokainen kooltaan neljäkymmentä solua. Tämä havaintorivi Opasnet kannassa on nimeltään Res.Sample. | *Jokaiselle yksittäiselle potilaalle on yksi havaintorivi, jokainen kooltaan neljäkymmentä solua. Tämä havaintorivi Opasnet kannassa on nimeltään Res.Sample. | ||
*Yksittäisen potilaan tietyn solun tulos löytyy Opasnet kannasta paikasta Sam.Result (tai Res_info.Description jossa se ilmaistaan ei-numeerisessa muodossa teksinä) | *Yksittäisen potilaan tietyn solun tulos löytyy Opasnet kannasta paikasta Sam.Result (tai Res_info.Description jossa se ilmaistaan ei-numeerisessa muodossa teksinä) | ||
*Jokainen tutkimus voi olla moniulotteinen, aivan kuten muuttujakin ja voi sisältää indeksejä esim. paikan, ajan tai sukupuolen suhteen. | *Jokainen tutkimus voi olla moniulotteinen, aivan kuten muuttujakin ja voi sisältää indeksejä esim. paikan, ajan tai sukupuolen suhteen. | ||
*Jos data on kerätty käyttäen Opasnet web forumia, aikakirjaus, käyttäjänimi ja EP talletetaan jokaiselle syötteelle Resinfo.:on (tämä on Opasnetin mukaan muuttumatonta dataa) | *Jos data on kerätty käyttäen Opasnet web forumia, aikakirjaus, käyttäjänimi ja EP talletetaan jokaiselle syötteelle Resinfo.:on (tämä on Opasnetin mukaan muuttumatonta dataa) | ||
*Joissain tapauksissa voi olla hyödyllistä rajoittaa käyttäjien antamien syötteiden määrän yhteen. Tämä tehdään kuitenkin vain tulkintavaiheessa missä vain viimeinen syöte lasketaan. Uuden datan syöttämisessä ei ole rajoituksia ja sikispä käyttäjä voi vaihtaa hänen aiempaa syötettä yksinkertaisesti tekemällä uuden. | *Joissain tapauksissa voi olla hyödyllistä rajoittaa käyttäjien antamien syötteiden määrän yhteen. Tämä tehdään kuitenkin vain tulkintavaiheessa missä vain viimeinen syöte lasketaan. Uuden datan syöttämisessä ei ole rajoituksia ja sikispä käyttäjä voi vaihtaa hänen aiempaa syötettä yksinkertaisesti tekemällä uuden. | ||
Versio 22. huhtikuuta 2009 kello 07.58
[show] Tämä sivu on ensyklopedia-artikkeli.
Sivutunniste: Op_fi1690 |
---|
Tämä sivu on yleiskuvaus Opasnet-kannasta.
- Opasnet-kanta on osa Opasnettiä ja se sisältää muuttujien tuloksia sekä tutkimusdataa. Tietokanta on pyritty suunnittelemaan joustavaksi, joten se soveltuu lähes kaikenlaisen datan tallettamiseen. Kanta soveltuu niin todennäköisyysjakaumille kuin piste-estimaateille, paikkatiedolle sekä moniulotteiselle datalle. Opasnet-kannassa olevaa dataa voidaan käyttää suoraan esimerkiksi Analytica-malleissa. Opasnet-kantaan pääsee käsiksi muuttuja- ja tutkimussivuilla olevien linkkien ("metadata-laatikko") kautta, oman Opasnet-nettiliittymänsä kautta sekä Analytica-ohjelmalla toteutetulla Opasnet base connection.ANA-tietokantaliittymällä.
Joitakin Opasnet-kannan käyttötapoja ja -kohteita
Tulkittujen mallitulosten taltiointi
Alunperin Opasnet-kanta suunniteltiin tulkittujen mallinnustulosten tallennuspaikaksi, ts. muuttujien tuloksille. Muuttujilla pyritään vastaamaan todellisuutta koskeviin kysymyksiin, ja niiden tulokset ovat tämänhetkinen paras arvio vastaukseksi. Muuttujat eroavat tutkimus-sivuista, jotka ilmaisevat vain havainnot jostakin tietystä tieteellisestä (osa)tutkimuksesta. Muuttujien tulosten odotetaan kehittyvän jatkuvasti, kun taas tietyn tutkimuksen tuottama data pysyy muuttumattomana tutkimuksen valmistuttua.
"Perinteisten" tutkimustulosten taltiointi
Opasnet-kantaan voidaan myös kerätä havaintodataa tietyistä tutkimuksista. "Tutkimus" voi olla perinteinen tieteellinen tutkimus(julkaisu) tai esim. "Opasnet-tutkimus", jonka data kerätään tietyllä Opasnet-sivulla olevalle lomakepohjalle. On useita mahdollisia syitä käyttää Opasnet-kantaa tietovarastona:
- Kerätä havaintoaineistoa jotta sitä voidaan käyttää suoraan ja kätevästi muuttuja ja objekti tulkintojen tekemiseen.
- Kollektiivisesti kerätä tietoa erityisistä tapauksista yleisemmän tapauksen selvittämiseksi
On kuitenkin joitain asioita mitä muuttujista ja tutkimuksista tulee ymmärtää:
- Objekti joka on kokoelma havainnoista, on nimeltään tutkimus, kun taas tämän tulkinnan objekti on nimeltään muuttuja. Esimerkiksi tutkimus voi kerätä tietoa ihmisryhmästä kyselylomakkeella ja verinäyttein. Tutkimuksen tunniste on Obj.id Opasnet kannassa.
- Objektin voi jakaa pienempiin osiin käyttämällä indeksiä. Esimerkiksi kyselylomakkeessa saattaa olla kolmekymmentä kysymystä ja niinpä kyselylomake data voidaan jakaa kolmeenkymmeneen indeksin, jossa on kolmekymmentä saraketta (tai riviä, riippuen omasta ajattelutavastasi), yksi rivi jokaiselle kysymykselle. Jokainen tutkimuksen sarake sisältää yhden solun, eli yhden vastauksen kysymykseen. Tässä tutkimuksessa tutkitaan kymmenen veren biomarkkeria ja siispä objektin koko on neljäkymmentä solua ja indeksi sisältää neljäkymmentä saraketta (30 kyselylomakkeesta ja kymmenen verinäytteistä). Solun tunniste Opasnet kannassa on Cell.id.
- Jokaiselle yksittäiselle potilaalle on yksi havaintorivi, jokainen kooltaan neljäkymmentä solua. Tämä havaintorivi Opasnet kannassa on nimeltään Res.Sample.
- Yksittäisen potilaan tietyn solun tulos löytyy Opasnet kannasta paikasta Sam.Result (tai Res_info.Description jossa se ilmaistaan ei-numeerisessa muodossa teksinä)
- Jokainen tutkimus voi olla moniulotteinen, aivan kuten muuttujakin ja voi sisältää indeksejä esim. paikan, ajan tai sukupuolen suhteen.
- Jos data on kerätty käyttäen Opasnet web forumia, aikakirjaus, käyttäjänimi ja EP talletetaan jokaiselle syötteelle Resinfo.:on (tämä on Opasnetin mukaan muuttumatonta dataa)
- Joissain tapauksissa voi olla hyödyllistä rajoittaa käyttäjien antamien syötteiden määrän yhteen. Tämä tehdään kuitenkin vain tulkintavaiheessa missä vain viimeinen syöte lasketaan. Uuden datan syöttämisessä ei ole rajoituksia ja sikispä käyttäjä voi vaihtaa hänen aiempaa syötettä yksinkertaisesti tekemällä uuden.
- To collect observation data to be directly and conveniently usable in interpretations of variables and other objects.
- To collectively collect information about specific cases for the purpose of conditionalizing generalised assessment models with data specific to particular cases.
However, there are some things about variables and studies that should be understood:
- The object for a collection of observations is called a study, while the object of interpretations is called a variable. As an example, a study can collect information about a population group by a questionnaire and by taking a blood sample. The study identifier is the Obj.id in the Opasnet Base.
- The object may be divided into smaller pieces along one or more indices. For example, the questionnaire may have 30 questions, and therefore the questionnaire data can be indexed by an index with 30 columns (or rows, depending on which way you think), one row for each question. Each column of the study object has one cell, i.e. an answer to one question. In this study, ten blood markers will be studied, and therefore the study object will have 40 cells, and the index has 40 columns (30 from the questionnaire, 10 from the blood sample). The cell identifier is the Cell.id in the Opasnet Base.
- For each individual patient, there is one row of observations, each 40 cells. The observation row identifier is Res.Sample in Opasnet Base.
- The actual result of a particular cell of a particular patient is located in Sam.Result in Opasnet Base (or in Res_info.Description in the case where the result is text, i.e. non-numeric).
- Each study may be multidimensional just like a variable and have indices along e.g. space, time, or sex.
- If the data is collected using an Opasnet web form, then the timestamp and username or IP will be recorded for each entry into Resinfo.When and Resinfo.Who fields, respectively. This is not needed, if the data comes from a previously performed study (which is static data in the eyes of Opasnet).
- In some cases, it might be useful to restrict the number of entries per user to one. However, this is done only at the interpretation phase where only the last entry is counted. There are no restrictions to enter new data, and therefore a user may change his/her previous entry by simply making a new entry.
Making value-of-information analyses in Opasnet base
Value of information (VOI) is a decision analysis tool for estimating the importance of remaining uncertainty for decision-making. Result database can be used to perform a large number of VOI analyses, because all variables are in the right format for that: as random samples from uncertain variables. The analysis is done by optimising an indicator variable by adjusting a decision variable so that the variable under analysis is conditionalised to different values. All this can in theory be done in the result database by just listing the indicator, the decision variable, and the variable of interest. Practical tools should be developed for this. After that, systematic VOI analyses can be made over a wide range of environmental health issues.
Analysing the change in the quality of a variable result in Opasnet base
All results that have once been stored in the result database remain there. Old results can be very interesting for some purposes:
- The time trend of informativeness and calibration (see performance) can be evaluated for a single variable against the newest information.
- Critical pieces of information that had a major impact on the informativeness and calibration can be identified afterwards.
- Large number of variables can be assessed and e.g. following questions can be asked:
- How much work is needed to make a variable with reasonable performance for practical applications?
- What are the critical steps after which the variable performance is saturated, i.e., does not improve much despite additional effort?