Top 10 artikelen

Goole
Koreaanse thee
nasza-klasa.pl
Creditcardfraude
Het zingen
Misbruik
Muziek van Indonesië
Tchiluba
De Provincie van Balkh
Provincie van Balkh Thermische straling

News:

Statistieken

Statistieken is a wiskundige wetenschap betreffende de inzameling, de analyse, de interpretatie of de verklaring, en de presentatie van gegevens. Het is van toepassing op een grote verscheidenheid van academische disciplines, van natuurlijk en sociaal wetenschappen aan menswetenschappen, en aan overheid en zaken.

De statistische methodes kunnen worden gebruikt om een verzameling van gegevens samen te vatten of te beschrijven; dit wordt geroepen beschrijvende statistieken. Bovendien kunnen de patronen in de gegevens zijn gemodelleerd op een bepaalde manier geeft dat rekenschap van willekeur en onzekerheid in de observaties, en dan gebruikt om gevolgtrekkingen over het proces of bevolking te trekken die worden de bestudeerd; dit wordt geroepen afleidbare statistieken. Zowel bestaan uit de beschrijvende als afleidbare statistieken toegepaste statistieken. Er is ook een geroepen discipline wiskundige statistieken, wat met de theoretische basis van het onderwerp betrokken is.

Het woord statistieken is ook het meervoud van statistiek (enkelvoud), wat naar het resultaat van het toepassen van een statistisch algoritme op een reeks gegevens verwijst, zoals binnen economische statistieken, misdaad statistieken, enz.

Inhoud

Geschiedenis

„Vijf mensen, Conring, Achenwall, Süssmilch, Graunt en Klein zijn geëerdr door verschillende schrijvers als stichter van statistieken. „ eisen één bron (Willcox, Walter (1938) De stichter van Statistieken. Overzicht van Internationaal Statistisch Instituut 5 (4): 321-328.)

Sommige geleerden wijzen de oorsprong van statistieken aan 1662, met de publicatie van „Observaties op de Rekeningen van Mortaliteit“ door John Graunt aan. Vroege toepassingen van het statistische denken die rond de behoeften van staten aan basisbeleid worden gedraaid inzake demografische en economische gegevens. Het werkingsgebied van de discipline van statistieken verbreedde in vroeg 19de eeuw om de verzameling en de analyse van gegevens in het algemeen te omvatten. Vandaag, is de statistieken wijd aangewend in overheid, zaken, en de natuurlijke en sociale wetenschappen.

Wegens zijn empirische wortels en zijn toepassingen, wordt de statistieken over het algemeen als beschouwd om een deelgebied van zuivere wiskunde, maar eerder geen verschillende tak van toegepaste wiskunde. Zijn wiskundige fundamenten werden gelegd in de 17de eeuw met de ontwikkeling van kansberekening door Pascal en Fermat. De kansberekening was van de studie van kansspelen het gevolg. methode van de minst - vierkanten eerst langs werd beschreven Carl Friedrich Gauss rond 1794. Het gebruik van modern computers statistische berekening op grote schaal, bevorderd en ook mogelijke nieuwe methodes heeft gemaakt die onpraktisch om zijn manueel te presteren.

Overzicht

Bij het toepassen van statistieken op een wetenschappelijk, industrieel, of sociaal probleem, begint één met een proces of bevolking om worden bestudeerd. Dit zou een bevolking van mensen in een land, van kristalkorrels in een rots, of van goederen kunnen zijn die door een bepaalde fabriek tijdens een bepaalde periode worden vervaardigd. Het kan in plaats daarvan een proces zijn dat in diverse tijden wordt waargenomen; de gegevens die over dit soort „bevolking“ worden verzameld vormen wat a wordt genoemd tijd reeks.

Om praktische redenen, eerder dan het compileren van gegevens over een volledige bevolking, bestudeert één gewoonlijk een gekozen ondergroep van de bevolking, genoemd a steekproef. De gegevens worden verzameld over de steekproef in waarnemings of experimenteel het plaatsen. De gegevens worden dan onderworpen aan statistische analyse, die twee verwante doeleinden dient: beschrijving en gevolgtrekking.

„… is het slechts de manipulatie van onzekerheid die ons interesseert. Wij zijn niet betrokken bij de kwestie die onzeker is. Aldus bestuderen wij niet het mechanisme van regen; slechts of het.“ zal regenen
Dennis Lindley, de „Filosofie van Statistieken“, De statisticus (2000).

Het concept correlatie is bijzonder opmerkelijk. Statistische analyse van a gegevens reeks kan openbaren dat twee variabelen (namelijk twee eigenschappen van de bevolking in beraad) neigen samen te variëren, alsof zij worden verbonden. Bijvoorbeeld, zouden een studie van jaarlijks inkomen en de leeftijd van dood onder mensen kunnen vinden dat de slechte mensen neigen om het kortere leven te hebben dan rijke mensen. De twee variabelen zijn naar verluidt gecorreleerd (wat een positieve correlatie in dit geval is). Nochtans, kan men het bestaan van een oorzakelijk verband tussen de twee variabelen onmiddellijk concluderen niet. (Zie De correlatie impliceert geen veroorzaken.) De gecorreleerde fenomenen zouden door een derde kunnen worden veroorzaakt, unconsidered fenomeen, eerder genoemd a het sluimeren van variabele of verwarrende variabele.

Als de steekproef voor de bevolking representatief is, dan gevolgtrekkingen en de conclusies kunnen die van de steekproef worden de gemaakt tot de bevolking worden uitgebreid als geheel. Een belangrijk probleem ligt in het bepalen van de mate waarin de gekozen steekproef representatief is. De statistieken biedt methodes voor willekeur in de steekproef en in de procedure van de gegevensinzameling te schatten en te verbeteren, evenals methodes om robuuste experimenten in de eerste plaats aan te ontwerpen. (Zie experimenteel ontwerp.)

Het fundamentele wiskundige concept dat in het begrip van dergelijke willekeur wordt aangewend is waarschijnlijkheid. Wiskundige statistieken (ook geroepen statistische theorie) is de tak van toegepaste wiskunde dat gebruikt kansberekening en analyse om de theoretische basis van statistieken te onderzoeken.

Het gebruik van om het even welke statistische methode is geldig slechts wanneer het systeem of de bevolking in beraad de fundamentele wiskundige veronderstellingen van de methode tevredenstellen. Misbruik van statistieken kan subtiele maar ernstige fouten in beschrijving en interpretatie - veroorzaken subtiel in de betekenis dat zelfs de ervaren beroeps soms dergelijke fouten maken, ernstig in de betekenis dat zij, bijvoorbeeld, sociale politiek, medische praktijk en de betrouwbaarheid van structuren zoals bruggen kunnen beïnvloeden. Zelfs wanneer de statistieken correct wordt toegepast, kunnen de resultaten voor de leek moeilijk zijn te interpreteren. Bijvoorbeeld, statistische betekenis van een tendens in de gegevens, die de mate meten waarin de tendens door willekeurige variatie in de steekproef zou kunnen worden veroorzaakt, kan niet met zijn intuïtieve betekenis van zijn betekenis akkoord gaan. De reeks van fundamentele statistische vaardigheden (en scepticisme) dat door mensen worden wordt gewenst om informatie in hun dagelijks leven te behandelen doorverwezen naar zoals statistische geletterdheid.

Statistische methodes

Experimentele en waarnemingsstudies

Een gemeenschappelijk doel voor een statistisch onderzoekproject is te onderzoeken causaliteit, en in het bijzonder om een gevolgtrekking op het effect van veranderingen in de waarden van voorspellers te maken of onafhankelijke variabelen op reactie of afhankelijke variabelen. Er zijn twee belangrijke soorten oorzakelijke statistische studies, experimentele studies en waarnemingsstudies. In beide soorten studies, wordt het effect van verschillen van een onafhankelijke variabele (of variabelen) op het gedrag van de afhankelijke variabele waargenomen. Het verschil tussen de twee types ligt in hoe de studie eigenlijk wordt uitgevoerd. Elk kan zeer efficiënt zijn.

Een experimentele studie impliceert het nemen van metingen van het systeem in studie, het manipuleren van het systeem, en dan het nemen van extra metingen gebruikend de zelfde procedure om te bepalen als de manipulatie de waarden van de metingen heeft gewijzigd. In tegenstelling, impliceert een waarnemingsstudie geen experimentele manipulatie. In plaats daarvan, worden de gegevens verzameld en de correlaties tussen voorspellers en reactie worden onderzocht.

Een voorbeeld van een experimentele studie is beroemd De studies van Hawthorne, wat probeerde om de veranderingen in de werkomgeving bij de installatie Hawthorne van Western Electric Company te testen. De onderzoekers waren geinteresseerd in het bepalen of de verhoogde verlichting de productiviteit van zou verhogen lopende band arbeiders. De onderzoekers maten de productiviteit in de installatie, dan wijzigden eerst de verlichting op een gebied van de installatie en controleerden als de veranderingen in verlichting de productiviteit beïnvloedden. Het bleek dat de inderdaad betere productiviteit (in de experimentele omstandigheden). (Zie Het effect van Hawthorne.) Nochtans, wordt de studie zwaar gekritiseerd vandaag voor fouten in experimentele procedures, specifiek voor het gebrek aan a controle groep en blindedness.

Een voorbeeld van een waarnemingsstudie is een studie die de correlatie tussen het roken en longkanker onderzoekt. Dit type van studie gebruikt typisch een onderzoek om observaties over het aandachtsgebied te verzamelen en voert dan statistische analyse uit. In dit geval, zouden de onderzoekers observaties van zowel rokers als non-smokers, misschien door a verzamelen geval-controle studie, en zoek dan het aantal gevallen van longkanker in elke groep.

De basisstappen van een experiment zijn;

  1. De planning van het onderzoek, met inbegrip van het bepalen van informatiebronnen, onderzoek onderworpen selectie, en ethisch overwegingen voor het voorgestelde onderzoek en de methode.
  2. Ontwerp van experimenten, zich concentreert op het systeemmodel en de interactie van onafhankelijke en afhankelijke variabelen.
  3. Het samenvatten van een inzameling van observaties om hun uniformiteit te kenmerken door details te onderdrukken. (Beschrijvende statistieken)
  4. Het bereiken van consensus over wat de observaties vertellen ongeveer de wereld die wordt waargenomen. (Statistische gevolgtrekking)
  5. Het documenteren van/het voorstellen van de resultaten van de studie.

Niveaus van meting

Zie: Schalen van Stanley Stevens' de „van meting“ (1946): nominaal, rangschikkend, interval, verhouding

Er zijn vier soorten metingen of niveaus van meting of metingsschalen die in statistieken worden gebruikt: nominaal, rangschikkend, interval, en verhouding. Zij hebben verschillende graden van nut in statistisch onderzoek. De verhouding metingen heeft zowel een nul bepaalde waarde als de afstanden tussen verschillende bepaalde metingen; zij verstrekken de grootste flexibiliteit in statistische methodes die voor het analyseren van de gegevens kunnen worden gebruikt. De metingen van het interval hebben zinvolle afstanden tussen bepaalde metingen, maar hebben geen zinvolle nul bepaalde waarde (zoals in het geval met de metingen van de IQ of met temperatuur binnen metingen Fahrenheit). De rangschikkende metingen hebben onnauwkeurige verschillen tussen opeenvolgende waarden, maar hebben een zinvolle orde aan die waarden. De nominale metingen hebben geen zinvolle weelderige orde onder waarden.

Aangezien de variabelen die slechts met nominale of rangschikkende metingen in overeenstemming zijn redelijk niet kunnen numeriek worden gemeten, soms worden zij bijeengeroepen als categorische variabelen, terwijl verhouding en interval de metingen als kwantitatieve of ononderbroken variabelen toe te schrijven aan hun numerieke aard worden gegroepeerd.

Statistische technieken

Wat goed - bekende statistisch tests en procedures voor onderzoek observaties zijn:

Gespecialiseerde disciplines

Sommige gebieden van onderzoek gebruiken zo uitgebreid toegepaste statistieken die zij hebben gespecialiseerde terminologie. Deze disciplines omvatten:

  • Statistieken in diverse sporten, in het bijzonder honkbal en veenmol

De statistieken vormen een zeer belangrijk basishulpmiddel in zaken en eveneens productie. Het wordt gebruikt om de veranderlijkheid van metingssystemen te begrijpen, processen controleren (zoals binnen statistische procesbeheersing of SPC), voor het samenvatten van gegevens, en om gegeven-gedreven besluiten te nemen. In deze rollen, is het een zeer belangrijk hulpmiddel, en misschien het enige betrouwbare hulpmiddel.

Statistische gegevensverwerking

De snelle en aanhoudende verhogingen van rekencapaciteit die van de tweede helft van de 20ste eeuw beginnen hebben een wezenlijke invloed op de praktijk van statistische wetenschap gehad. De vroege statistische modellen waren bijna altijd van de klasse van lineaire modellen, maar krachtige computers, die aan geschikte numeriek worden gekoppeld algoritmen, veroorzaakte een verhoogde rente in niet-lineaire modellen (vooral neurale netwerken en besluit bomen) evenals de verwezenlijking van nieuwe types, zoals algemene lineaire modellen en modellen op verscheidene niveaus.

De verhoogde rekencapaciteit heeft ook geleid tot de groeiende populariteit van met behulp van computer-intensieve methodes worden gebaseerd die op het opnieuw stalen nemen van, zoals permutatietests en laarzentrekker, terwijl technieken zoals De bemonstering van Gibbs Bayesian methodes uitvoerbaarder hebben gemaakt. De computerrevolutie heeft implicaties voor de toekomst van statistieken met nieuwe nadruk op „experimentele“ en „empirische“ statistieken. Een groot aantal zowel algemeen als voor speciale doeleinden statistische software zijn nu beschikbaar.

Misbruik

Er is een algemene waarneming dat de statistische kennis alle-ook-vaak opzettelijk is verkeerd gebruikt door manieren te vinden om slechts de gegevens te interpreteren die aan de presentator gunstig zijn. Het beroemde zeggen toegeschreven aan Benjamin Disraeli is, „Er zijn drie soorten leugens: ligt, vervloekt ligt, en statistieken"; en de Voorzitter van Harvard Lawrence Lowell schreef in 1909 die statistieken, „als kalfsvlees is de pastei, goed als u de persoon die hen maakte, kent en zeker van de ingrediënten“ bent.

Als diverse studies schijnen elkaar tegen te spreken, dan kan het publiek komen dergelijke studies wantrouwen. Bijvoorbeeld, kan één studie suggereren dat een bepaalde dieet of een activiteit opheffen bloeddruk, terwijl een andere kan voorstellen dat het bloeddruk vermindert. De discrepantie kan van subtiele variaties in experimenteel ontwerp, zoals verschillen in de geduldige groepen of de onderzoekprotocollen het gevolg zijn, die niet makkelijk te begrijpen door de leek zijn. (De rapporten van Media laten volledig soms deze essentiële contextuele informatie weg.)

Door zich het kiezen van (of te verwerpen of, te wijzigen) een bepaalde steekproef, kunnen de resultaten worden gemanipuleerd. Dergelijke manipulaties te hoeven niet kwaadwillig of omslachtig zijn; zij kunnen van onbedoelde biases van de onderzoeker het gevolg zijn. De grafieken die worden gebruikt om gegevens samen te vatten kunnen ook misleidend zijn.

De diepere kritieken komen uit het feit dat de hypothese testende benadering, die wijd door wet of regelgeving wordt gebruikt en in veel gevallen wordt vereist, één hypothese dwingt ( ongeldige hypothese) „worden goedgekeurd“, en kan ook schijnen om het belang van minder belangrijke verschillen in grote studies te overdrijven. Een verschil dat hoogst statistisch significant is kan nog van geen praktische betekenis zijn. (Zie kritiek van hypothese het testen en controverse over de ongeldige hypothese.)

Één reactie is door een grotere nadruk op te geven p- waarde dan eenvoudig meldend of een hypothese op het bepaalde niveau van betekenis wordt verworpen. p- taxeer, echter, wijst niet op de grootte van het effect. Een andere meer en meer gemeenschappelijke benadering is te rapporteren vertrouwens intervallen. Hoewel deze uit de zelfde berekeningen zoals die van hypothesetests worden geproduceerd of p- waarden, beschrijven zij zowel de grootte van het effect als de onzekerheid die het omringt.

Zie ook

Bibliografie

  • Best, Joel (2001). Vervloekt ligt en Statistieken: Het ophelderen Aantallen van de Media, de Politici, en de Activisten. Universiteit van de Pers van Californië. ISBN 0-520-21978-3. 
  • Desrosières, Alain (2004). De politiek van Grote Aantallen: Een geschiedenis van het Statistische Redeneren, Trans. Camille Naish, de Universitaire Pers van Harvard. ISBN 0-674-68932-1. 
  • Het binnendringen in een beveiligd computersysteem, Ian (1990). Het Bedwingen van Kans. De Universitaire Pers van Cambridge. ISBN 0-521-38884-8. 
  • Hand, David J. (1998). „Brekende misvatting-Statistieken en Zijn Verhouding met Wiskunde“. De statisticus 47: 245–250. 
  • Lindley, D.V. (1985). Het nemen van Besluiten, 2de E-D., John Wiley & Zonen. ISBN 0-471-90808-8. 
  • Tijms, Henk (2004). Het begrip van Waarschijnlijkheid: De Regels van de kans in het Dagelijkse leven. De Universitaire Pers van Cambridge. ISBN 0-521-83329-9. 

Externe verbindingen

Algemene plaatsen en organisaties

Online cursussen en handboeken

Wikibooks heeft een boek op het onderwerp van
Bij Wikiversity, kunt u leren over:

Andere middelen

Wikiquote heeft een inzameling van citaten met betrekking tot:
The original article is from Wikipedia. To view the original article please click here.
Creative Commons Licence