Anne in Duitsland schreef: Super uitgelegd, kakocavi! Dank je!Graag gedaan, fijn dat je er wat aan hebt

Moderators: Lizzy, Charlie Angel, eelke
kakocavi schreef: Graag gedaan, fijn dat je er wat aan hebtZoals jij het uitlegt vind ik statistiek leuk, maar ik ben momenteel bezig met een vertaling waarin begrippen uit de statistiek voorkomen, en wanneer ik dan de uitleg daarvan op bv. Wikipedia lees, dan denk ik: brrrr. Liever een gesprek kunnen voeren met een Braziliaanse in haar moedertaal dan dit soort abstracte herrie!![]()
kakocavi schreef: Voor iemand die zijn kind of hond niet vaccineert is het ook belangrijk te weten dat er risico's aan zitten. En dat je misschien verder moet met ernstige schade. Statistiek gaat over grote groepen en als er dan eentje doodgaat door het niet vaccineren dan moet dan maar. Maar als het je eigen kind/hond is, is dat anders. Dus hoe bepaal je dan wanneer je het grootste risico loopt? Door te kijken naar de statistieken.Als Tannetje zich onthoudt van een kansuitspraak over een hond die langs komt in haar praktijk, dan doet zij het enige juiste en zij beroept zich daarbij op de (beperkingen van de) statistiek.
Als de risico's van niet vaccineren voor jou en je omgeving groter zijn dan die van niet vaccineren (in cijfertjes, inderdaad, want hoe stel je dat anders objectief vast) dan wordt aangeraden te vaccineren. Het gaat dan inderdaad om kansen, niet om garanties, en geen enkele dokter zal anders beweren. Maar die kansberekeningen geven juist aan wat de kansen zijn voor een individu. Niet wat er gebeurt, maar wat de kans is dat er iets gebeurt. En wat is er dan mis mee om statistiek te gebruiken om risico's voor het individu te verkleinen? Als jij je niet baseert op statistische gegevens om een keuze te maken, begrijp ik werkelijk waar absoluut niet waar je je dan wel op baseert. Juist die grote groepen geven betrouwbare gegevens, vanwege de wet van de grote getallen. Als persoon ben je simpelweg niet in staat zulke risicoanalyses uit te voeren, omdat je onderzoeksgroep te klein is en selectiebias de resultaten onbetrouwbaar maakt (jouw klanten vormen geen weerspiegeling van alle hondeneigenaren).
Esther Q schreef:Integendeel, reteboeiend dit!
En nu is 99% van barfplaats vrees ik in slaap gevallen![]()
Mieke L. schreef: Nee juist niet! Alhoewel ik het waarschijnlijk niet helemaal snap vind ik het vreselijk interessant!En jij zegt iets heel erg interessants! Er is echt maar een handjevol mensen dat het wel helemaal snapt. Idealiter zouden dat soort mensen altijd betrokken zijn bij het uitvoeren en interpreteren van statistische tests, om alle kleuterziektes uit te bannen. Dat zijn mensen die de wiskundige bewijzen achter alle analyses kennen, ook volledig doorgronden en soms in staat zijn om andere/nieuwe bewijzen te genereren en zo tot nieuwe statistische (of andere) theorieën te komen. Ik behoor niet tot die mensen. Ik kom een klein eindje mee, maar ga dan gauw verder met het opruimen van hondenstront
Esther Q schreef: Als Tannetje zich onthoudt van een kansuitspraak over een hond die langs komt in haar praktijk, dan doet zij het enige juiste en zij beroept zich daarbij op de (beperkingen van de) statistiek.Maar wie zegt dat elk onderzoek is uitgevoerd op proefdieren in een lab? Natuurlijk, dat wordt wel vaak gedaan in de testfase van een vaccin, maar als dat tot goede resultaten leidt worden er meestal ook onderzoeken gedaan naar de maatschappelijke impact. Vaak wordt bij onderzoeken ook gerandomiseerd, waardoor honden willekeurig verdeeld worden over onderzoeksgroepen en dus niet a priori zijn gekozen. En natuurlijk kan het zijn dat er in zo'n onderzoeksgroep 10% Husky's zitten terwijl er in Nederland 5% Husky's rondlopen. En misschien heeft dat wel een heel klein beetje invloed op de onderzoeksresultaten. Maar als het invloed heeft op de onderzoeksresultaten, en dat vergeet je nu misschien, dan kan men dat natuurlijk ook gewoon meten. En dan zeggen ze: kijk, volgens onze data reageren Husky's anders dan andere rassen. Hou daar rekening mee, toekomstige onderzoekers van toekomstig onderzoek! Verder wordt er natuurlijk alles gedaan om het onderzoek zo representatief mogelijk te maken. Verschillende rassen worden gebruikt, er wordt gestreefd naar 50/50 geslachtsverdeling, enzovoorts. Maar als er daadwerkelijk een groot verschil merkbaar is in een bepaalde hond, dan is dat gewoon zichtbaar aan de individuele resultaten en dan wordt daar rekening mee gehouden.
Ik ben eigenlijk de juiste persoon niet meer om diep op de dingen in te gaan, ik houd mij al heel lang met heel andere dingen bezig dan methoden van onderzoek, maar ik heb hiervoor wat bronnen geraadpleegd om dit uit te leggen. Omdat ik het wel belangrijk vind helder te hebben dat je niet tegen de eigenaar van een hond die bij jou komt in de praktijk kunt zeggen: 'jouw hond heeft zoveel kans op,´ waarbij je je baseert op de uitslagen van een onderzoek. Dat is, statistisch gezien, geen gefundeerde uitspraak.
Dit heeft twee redenen.
De eerste, die eigenlijk het belangrijkste is, en die je zelf ook al aanhaalt, zij het in een andere context, nl de da-praktijk, is dat in de diergeneeskunde de steekproef proefdieren geen representatie vormt van de gehele populatie, in dit geval de populatie honden, wat inhoudt alle honden die nu rondlopen op de hele aarbol. De honden die meedoen in het onderzoek worden namelijk niet a priori (toevallig) gekozen uit de gehele populatie. Nu weet ik niet genoeg van de praktijken rondom proefdieren, maar ik kan me allerlei redenen indenken waarom die dieren in details afwijken van de gehele populatie waardoor bepaalde gemiddelden bij die dieren afwijken van gemiddelden binnen de populatie. Wordt er bv speciaal gefokt met proefdieren om nieuwe proefdieren te krijgen? Zo ja, hoe, waarop wordt er geselecteerd, in hoeverre vormt de populatie proefdieren door fokbelissingen, voeding, huishouding, ras, en vorige experimentele onderzoeken (of worden ze allemaal na 1 onderzoek weggegooid?) een subpopulatie? Vragen waarop de antwoorden zo onduidelijk zijn, dat je de onderzoeksresultaten niet kunt generaliseren naar de populatie honden. Hierdoor kun je zelfs bij een a priori gekozen hond uit de populatie (waarbij je het experiment in feite voortzet) niet zeggen dat zijn kans A % is op dit of dat. Wat je wel kunt doen als een onderzoek voldoet aan alle statistische aannamen. Dat is denk ik wat je hierboven probeert te zeggen, dat je bij een a priori gekozen individu kunt stellen dat de kans zoveel is. Maar in het geval van proefdieren gaat het om een subpopulatie en voldoet het experiment dus niet aan alle statistische aannamen, waardoor je slechts een uitspraak kunt doen over de subpopulatie, in dit geval proefdieren.
Een ander voorbeeld, als ik voor een onderzoek allemaal wetenschappers een blikje cola laat drinken en ik observeer dat 20% van de wetenschappers na het drinken van een blikje cola beter op hun skippibal blijven zitten dan voor het drinken van het blikje cola, en dat 80% er nog even vaak vanaf valt, dan kan ik dat resultaat niet gebruiken om een uitspraak te doen over de populatie mensen. De groep wetenschappers is te specifiek en kan in allerlei gemiddelden verschillen van de totale populatie, oa in het gemiddelde prestatievermogen op een skippibal, die bv lager ligt dan bij sporters. Het gaat hier om een subgroep en geen a priori gekozen steekproef uit de gehele populatie. De uitspraak die je mag doen moet zich beperken tot de subgroep wetenschappers.Als de steekproef groot genoeg is (dus genoeg wetenschappers) dan kun je daar wel degelijk iets over zeggen. Die 20% is dan namelijk niet meer toe te schrijven aan toeval. Je kunt stellen dat die 20% in een bepaald opzicht anders moet zijn dan de 80%. Maar in welk opzicht? Dat kun je onderzoeken. Heb je een verschil gevonden, dan heb je een hypothese. En dan ga je proefpersonen zoeken die diezelfde afwijking hebben, en hun testen. Doe je dat vaak genoeg, dan heb je een bevestigde of ontkrachte hypothese.
De tweede reden is misschien wat moeilijker te volgen. Er moet onderscheid gemaakt worden tussen een a priori gekozen individu uit de gehele populatie en Vlekje die door Pietje naar de da wordt gebracht om gevaccineerd te worden. Over Vlekje en de a priori gekozen hond uit de populatie kun je niet dezelfde uitspraken doen.Dat stel je denk ik te simpel. Natuurlijk kan Vlekje bijwerkingen krijgen of geen bijwerkingen, maar als hij bijwerkingen krijgt is dat niet het einde van de meting. Bijwerkingen kunnen op allerlei gebieden optreden en in verschillende stadia van nauwelijks tot heel ernstig. Ik haalde inderdaad ook dat experiment aan van kansen op wel of geen bijwerkingen, maar dat was om de zaak wat te versimpelen. Een 10% kans op hele milde bijwerkingen is beter dan 5% kans op de dood, dus je kunt niet alleen uitgaan van een ja/nee kansenexperiment. Vaak worden in de statistiek waarden toegekend aan de ernst van bepaalde symptomen, en die waarde kan dan bijvoorbeeld vermenigvuldigd worden met de kans dat het gebeurt.
Een hond die bij een da in de praktijk komt is namelijk niet a priori gekozen en voldoet dus niet aan de aannamen binnen de statistiek. Binnen de frequentistische statistiek (waarin de kans op A gedefinieerd is als de relatieve frequentie waarmee A optreedt in een lange reeks identieke kansexperimenten) is een kansuitspraak op het niveau van een individueel geval niet gedefinieerd. 50% is die dus ook niet, zoals ik eerder onterecht stelde. Vlekje krijgt bijwerken, of hij krijgt geen bijwerkingen. Ongeacht welke van deze twee uitkomsten het wordt, de uitkomst waarin hij terecht komt, daarin komt hij voor de volle 100% terecht. Er belandt geen pootje, of oortje, of staart van Vlekje in de andere uitkomst. Je kunt zodoende geen statistisch verantwoorde kansuitspraak doen over de individuele hond die bij jou in de praktijk komt. Dit heet in vaktermen het probleem van de singuliere kansuitspraken (singular probabilities), die bij de standaard statistiek niet definieerbaar zijn. Er is dus geen kans te noemen voor Vlekje.
Tannetje heeft het helemaal juist. Statistiek gaat over groepen. Het is een theorie en geen praktijk. En die theorie kun je niet loslaten op Vlekje.Oké, een gedachtenexperimentje dan, want ik wil weten of ik je nou goed begrijp. Je zegt dat een statistisch gegeven, gemeten over een grotere groep, niet kan leiden tot een voorspelling over een individu. Roken is ongezond en kan leiden tot longkanker, dat is over grote groepen mensen gemeten en vastgesteld. Als ik dan tegen een roker zeg dat hij een grotere kans heeft op longkanker dan als hij niet zou roken, heb ik dat dan volgens jou mis omdat ik een statistisch gegeven loslaat op een individu?
En nu is 99% van barfplaats vrees ik in slaap gevallen![]()
kakocavi schreef: Maar wie zegt dat elk onderzoek is uitgevoerd op proefdieren in een lab? Natuurlijk, dat wordt wel vaak gedaan in de testfase van een vaccin, maar als dat tot goede resultaten leidt worden er meestal ook onderzoeken gedaan naar de maatschappelijke impact. Vaak wordt bij onderzoeken ook gerandomiseerd, waardoor honden willekeurig verdeeld worden over onderzoeksgroepen en dus niet a priori zijn gekozen. En natuurlijk kan het zijn dat er in zo'n onderzoeksgroep 10% Husky's zitten terwijl er in Nederland 5% Husky's rondlopen. En misschien heeft dat wel een heel klein beetje invloed op de onderzoeksresultaten. Maar als het invloed heeft op de onderzoeksresultaten, en dat vergeet je nu misschien, dan kan men dat natuurlijk ook gewoon meten. En dan zeggen ze: kijk, volgens onze data reageren Husky's anders dan andere rassen. Hou daar rekening mee, toekomstige onderzoekers van toekomstig onderzoek! Verder wordt er natuurlijk alles gedaan om het onderzoek zo representatief mogelijk te maken. Verschillende rassen worden gebruikt, er wordt gestreefd naar 50/50 geslachtsverdeling, enzovoorts. Maar als er daadwerkelijk een groot verschil merkbaar is in een bepaalde hond, dan is dat gewoon zichtbaar aan de individuele resultaten en dan wordt daar rekening mee gehouden.Je volgt blijkbaar niet mijn gedachtegang dat proefdieren geen goede representatie vormen van de totale populatie honden, om de redenen die ik opnoem. Het kan natuurlijk zijn dat jij die mogelijkheid helemaal niet inziet. Ook prima. Het is geen wet van meden en persen, het zijn mijn bedenkingen bij een steekproef die bestaat uit proefdieren. De boodschap hier is dus, zorg dat een steekproef de populatie die men wil onderzoeken representeert. Lukt dit niet in een onderzoek, presenteer de resultaten van dat ene onderzoek dan ook niet als zodanig. Aan een uitspraak als 'er wordt alles aan gedaan om...' hebben we niets. Wees gewoon correct bij de interpretatie en presentatie van resultaten, dan is er niets aan de hand.
Als de steekproef groot genoeg is (dus genoeg wetenschappers) dan kun je daar wel degelijk iets over zeggen. Die 20% is dan namelijk niet meer toe te schrijven aan toeval. Je kunt stellen dat die 20% in een bepaald opzicht anders moet zijn dan de 80%. Maar in welk opzicht? Dat kun je onderzoeken. Heb je een verschil gevonden, dan heb je een hypothese. En dan ga je proefpersonen zoeken die diezelfde afwijking hebben, en hun testen. Doe je dat vaak genoeg, dan heb je een bevestigde of ontkrachte hypothese.Het doet er niet toe hoe groot de steekproef is, en of er wel of geen significant resultaat is, zolang de steekproef slechts uit wetenschappers bestaat kun je de resultaten niet presenteren als gaande over de gehele populatie mensen. Wetenschappers zijn een subgroep in de populatie. Dat is het enige punt dat ik met het voorbeeld maak. En is dus een herhaling van bovenstaande, zorg dat een steekproef goed in elkaar steekt en interpreteer en presenteer de resultaten correct.
Dat stel je denk ik te simpel. Natuurlijk kan Vlekje bijwerkingen krijgen of geen bijwerkingen, maar als hij bijwerkingen krijgt is dat niet het einde van de meting. Bijwerkingen kunnen op allerlei gebieden optreden en in verschillende stadia van nauwelijks tot heel ernstig. Ik haalde inderdaad ook dat experiment aan van kansen op wel of geen bijwerkingen, maar dat was om de zaak wat te versimpelen. Een 10% kans op hele milde bijwerkingen is beter dan 5% kans op de dood, dus je kunt niet alleen uitgaan van een ja/nee kansenexperiment. Vaak worden in de statistiek waarden toegekend aan de ernst van bepaalde symptomen, en die waarde kan dan bijvoorbeeld vermenigvuldigd worden met de kans dat het gebeurt.Hoe complex de aard van de bijwerkingen zijn en wat voor kansen je daar op basis van onderzoek ook aan ophangt, doet niet ter zake. Voor alle resultaten geldt hetzelfde, over een niet at random gekozen individu kun je geen kansuitspraak doen die statistisch gezien gegrond is.
Ik begrijp trouwens niet hoe een kansenexperiment met twee mogelijke uitkomsten leidt tot onbetrouwbaarheid. Als ik een muntje opgooi en ik weet dat de kans op kop of munt 50/50 is, dan kan ik volgens mij juist heel makkelijk uitspraken daarover doen. Als ik dan kop of munt kies voor het opgooien, weet ik dat mijn kans sowieso 50% is. Kun je uitleggen wat je bedoelt met die onbetrouwbaarheid?Zolang het om een a priori (at random of toevallig) gekozen kansexperiment gaat dan kun je daarover een uitspraak doen, mits in het onderzoek aan alle statistische aannamen is voldaan en de juiste testen zijn uitgevoerd. Niet over het individu dat voor jou zit in de praktijk. Vergelijk het met de kans om een vrouw te trekken als je aselect 1 persoon uit de populatie Nederlanders trekt. Die is zo'n 50%. Maar de kans dat jij vrouw (of man) bent is geen 50%, geen 80%, en geen 90%. Jij bent vrouw (of man) met kans 1. "Volgens mij" is hier dus helemaal niet aan de orde. Het is geen mening, het is een statistisch gegeven. Ook hiervoor geldt, zoekt en gij zult vinden.
Oké, een gedachtenexperimentje dan, want ik wil weten of ik je nou goed begrijp. Je zegt dat een statistisch gegeven, gemeten over een grotere groep, niet kan leiden tot een voorspelling over een individu. Roken is ongezond en kan leiden tot longkanker, dat is over grote groepen mensen gemeten en vastgesteld. Als ik dan tegen een roker zeg dat hij een grotere kans heeft op longkanker dan als hij niet zou roken, heb ik dat dan volgens jou mis omdat ik een statistisch gegeven loslaat op een individu?