Statistiko

scienco pri la kolektado, organizado, analizado, interpretado kaj prezentado de datenoj

Statistiko estas scienco pri la metodoj por kolekti, analizi kaj interpreti empiriajn nombrajn donitaĵojn kaj por prezenti la rezultojn. Tio fariĝas komplike, kiam la donitaĵoj kaj la interdependoj ne estas tute konataj, estas neprecizaj aŭ tro multenombraj por esti detale traktataj. Statistiko estas rimedo por kompari sciencan teorion kun la reala mondo kaj por serĉi novajn interrilatojn por nova teorio.

Statistiko uzas probablo-teorion, matematikan mezurteorion kaj modeladon. Nuntempe matematiko, komputoscienco kaj statistiko formas novan kampon, Datum-scienco, kun novaj rimedoj por kalkulado, modelado, inferencado kaj prezentado.

Kvanteca scienca esplorado baziĝas sur statistikaj metodoj (kp. kvaliteca esplorado).

Fojfoje oni renkontas la vorton statistiko (minuskle kaj ofte plurale) ankaŭ por bazaj statistikaĵoj: statistikaj datumoj, tabeloj kaj aliaj statistikaj datum-prezentoj. Tio imitas uzadon en iuj gentaj lingvoj, sed en Esperanto tia malpreciza uzado impresas nenature, eĉ misgvide, kaj estas evitinda.

Teorio de statistiko

redakti
 
Normala distribuo.

Statistiko estas transversa apogo al ampleksa varieco de disciplinoj, de la fiziko ĝis la sociaj sciencoj, de la sciencoj de la sano ĝis la kontrolo de kvalito. Ĝi estas uzata por la decidado en areoj de negocoj aŭ institucioj registaraj.

La statistiko dividiĝas en du grandaj areoj:

Ambaŭ branĉoj apartenas al la aplikita statistiko. Estas ankaŭ disciplino nomata matematika statistiko, kiu referencas al la teoriaj bazoj de la materio. La vorto «statistikoj» ankaŭ aludas al la rezulto apliki algoritmon statistikan al aro de datumoj, kiel en ekonomiaj, kriminalaj statistikoj, inter aliaj.

Etimologio

redakti

La germana termino Statistik, kiu estis unue enkondukita de Gottfried Achenwall (1749), referencis origine al la analizo de datumoj de la Ŝtato, tio estas, la "scienco de la ŝtato" (ankaŭ nomata aritmetika politiko laŭ ĝia rekta traduko).[1] La termino statistiko akiris la signifon de kolektado kaj klasifikado de datumoj nur en la 19a jarcento. Ĉi tiun koncepton enkondukis anglo John Sinclair.

Historio de statistiko

redakti
 
La verko de Bernoulli nome Ars Conjectandi estis la unua verko kiu temas pri Probablo-teorio kiel ĝi kompreneblas aktuale.

Formalaj studoj pri dedukta statistiko datiĝas el arabaj matematikistoj kaj kriptografoj, dum la Islama Orepoko inter la 8-a kaj la 13-a jarcentoj. Al-Ĥalil (717–786) verkis la Libron de Kriptografiaj Mesaĝoj, kiu enhavas unu el la unuaj uzoj de permutaĵoj kaj kombinaĵoj, por listigi ĉiujn eblajn arablingvajn vortojn kun kaj sen vokaloj.[2] La verko de Al-Kindi nome Manuskripto pri Deĉifrado de Kriptografiaj Mesaĝoj havigis detalan priskribon kiel uzi analizon pri frekvencoj por deĉifri ĉifritajn mesaĝojn, havigante fruan ekzemplon de dedukta statistiko por dekodigi. Ibn Adlan (1187–1268) poste faris gravan kontribuon al la uzado de montrogrando en analizo pri frekvencoj.[2]

La termino 'statistiko' estis enkondukita fare de la itala fakulo Girolamo Ghilini en 1589 reference al tiu scienco.[3][4] La plej frua verko enhavanta statistikojn en Eŭropo datiĝas el 1663, pro la publikigo de la verko Natural and Political Observations upon the Bills of Mortality de John Graunt.[5] Fruaj aplikaĵoj de statistika pensaro temis pri la bezonoj de ŝtatoj bazi sian politikon sur demografiaj kaj ekonomiaj datumoj, kaj el tio devenas la etimologio de statistiko el ŝtato. La alrigardo de la fako statistiko ampleksiĝis en la komenco de la 19-a jarcento por inkludi la kolektadon kaj analizon de ĝeneralaj datumoj. Nuntempe, statistiko estas amplekse uzata en politiko, aparte regado, negocado, kaj naturaj kaj sociaj sciencoj. Malfacile oni povas nun atenti gazetaron aŭ televidan novaĵprogramon netrafinte statistikojn.

 
Carl Friedrich Gauss faris gravajn kontribuojn al la probablistikaj metodoj kondukantaj al statistiko.

La matematikaj fundamentoj de statistiko disvolviĝis el studoj pri hazardludoj inter matematikistoj kiel Gerolamo Cardano, Blaise Pascal, Pierre de Fermat, kaj Christiaan Huygens. Kvankam la ideo de probablo estis jam pritraktita en antikva kaj mezepoka juro kaj filozofio (kiel ĉe la verkaro de Juan Caramuel), la probabloteorio kiel matematika fako formiĝis nur en la plej frua komenco de la 17-a jarcento, partikulare en la postmorta verko de Jacob Bernoulli nome Ars Conjectandi.[6] Tiu estis la unua libro en kiu la temoj de hazardludoj kaj de probableco (kiuj postulis opinion, pruvaron kaj argumentojn) estis kombinitaj kaj submetitaj al la matematika analizo.[7][8] La metodo de "malplej nombraj kvadratoj" estis por la unua fojo priskribita de Adrien-Marie Legendre en 1805, kvankam Carl Friedrich Gauss supozeble uzis ĝin unu jardekon antaŭe, nome en 1795.[9]

La moderna fako de statistiko aperis fine de la 19-a kaj komenco de la 20-a jarcentoj en tri etapoj.[10] La unuan ondon, fine de la jarcento, enkondukis la verkaroj de Francis Galton kaj Karl Pearson, kiuj transformis statistikon en rigore matematika fako uzebla por analizoj, ne nur en scienco, sed ankaŭ en ekonomio kaj politiko. La kontribuoj de Galton inkludis la enkondukon de la konceptoj de norma devio, korelacio, analizo de regreso kaj la aplikadon de tiuj metodoj al la studo de la varieco de homaj trajtoj — alto, pezo kaj eĉ longo de okulharoj inter aliaj.[11]

 
Karl Pearson, fondinto de la matematika statistiko.

Pearson disvolvis la korelacian koeficienton de Pearson difinita per produkt-momanto,[12] la metodon de momantoj por la kongruigo de distribuaĵoj al montraĵoj kaj la Pearson distribuon, inter multaj aliaj konceptoj.[13] Galton kaj Pearson fondis Biometrika nome la unua scienca gazeto pri matematika statistiko kaj biostatistiko (tiam nomita biometrio), kaj la laste menciita fondis la unuan universitatan statistikan departementon en la mondo nome en la Universitato-Kolegio de Londono.[14]

La duan ondon, de la 1910-aj kaj la 1920-aj jaroj, iniciatis William Sealy Gosset, kaj atingis sian kulminon en la alrigardoj fare de Ronald Fisher, kiu verkis la lernolibrojn kiuj difinos la akademian fakon en universitatoj tra la tuta mondo. La plej gravaj publikaĵoj de Fisher estis lia ŝlosila artikolo de 1918 nome The Correlation between Relatives on the Supposition of Mendelian Inheritance (Korelacio inter parencoj pri supozoj de mendela heredo) kiu estis la unua verko kiu uzis la poste tre utilan statistikan terminon, varianco), lia klasika verko de 1925 nome Statistical Methods for Research Workers (Statistikaj metodoj por esploristoj) kaj lia verko de 1935 nome The Design of Experiments (Dezajno de eksperimentoj),[15][16][17] en kiu li disvolvis rigorajn modelojn por dezajno de eksperimentoj.

 
Ronald Fisher estis grava disvolvanto de statistiko.

Fisher kreis la konceptojn de "sufiĉeco" kaj "komplementa statistiko", la diskriminantan analitikon de Fisher kaj la "informaron de Fisher".[18] Li ankaŭ stampis la terminon "nula hipotezo" dum la eksperimento de la "Sinjorino tegustumanta", kio "estas neniam pruvita aŭ establita, sed ĝi estas eble dispruvita, laŭ la daŭro de la eksperimentado".[19][20] En sia libro de 1930 nome The Genetical Theory of Natural Selection (La genetika teorio de natura selektado), li aplikis statistikon al variaj biologiaj konceptoj kiel la "principo de Fisher"[21] (kion A. W. F. Edwards nomis "probable la plej fama argumento en evolucia biologio") kaj la "modelo de natura selektado pere de masklornamo de Fisher",[22][23][24][25][26][27] koncepto pri seksa selektado pri pozitiva reenfuĝa efiko troviĝanta en evolucio.

La fina ondo, kiu ĉefe konsistis el rafinado kaj ekspansio de pli fruaj disvolviĝoj, aperis el la kunlabora verkado inter Egon Pearson kaj Jerzy Neyman en la 1930-aj jaroj. Ili enkondukis la konceptojn de eraroj "Tipo II", "statistika povo" kaj konfidintervaloj. Jerzy Neyman en 1934 montris, ke tavoligita hazarda montraĵaro estas ĝenerale pli bona metodo de ĉirkaŭkalkulado ol la celita (kvota) montraĵaro.[28]

Aktuale, statistikajn metodojn oni aplikas en ĉiaj fakokampoj, kiuj postulas decidfaradon, por atingi akuratajn inferencojn el kolektita korpuso de datumoj kaj por decidfarado antaŭ necerteco bazite sur statistika metodologio. La uzado de modernaj komputiloj ebligis faradon de grandskalaj statistikaj komputadojn kaj ebligis ankaŭ novajn metodojn kiuj estis nepraktike plenumeblaj permane. Statistiko plue estas areo de aktiva esplorado, por ekzemplo por la problemo kiel analizi datumaregon (angle big data).[29]

Originoj en probablo

redakti
 
Christiaan Huygens donis la unuan sciencan traktadon de la fako

La metodoj statistika-matematikaj emerĝis de la teorio de probablo, kiu datiĝas de la mesaĝado inter Blaise Pascal kaj Pierre de Fermat (1654). Christiaan Huygens (1657) donis la unuan sciencan traktadon de la fako. La Ars coniectandi (postmorta, 1713) de Jakob Bernoulli kaj la Doktrino de ebloj (1718) de Abraham de Moivre studis la disciplinon kiel branĉo de la matematikoj. En la moderna erao, la laboro de Andrej Kolmogorov estis kolono en la formulado de la fundamenta modelo de probablo-teorio, kiu estas uzita tra la statistiko.

Pierre-Simon Laplace (1774) faras la unuan provon dedukti regulon por la ĉifro de observoj de la komencoj de probablo-teorio. Laplace reprezentis la leĝon de probabloj de eraroj per kurbo kaj li deduktis formulon por la mezumo de tri observoj. La metodo de minimumaj kvadratajoj, kiu estis uzita por minimumigi la erarojn en mezuradoj, estis eldonita sendepende por Adrien-Marie Legendre (1805), Robert Adrain (1808), kaj Carl Friedrich Gauss (1809). Gaŭso estis uzinta la metodon en lia fama antaŭdiro de la lokigado de la nanoplanedo Cereso en 1801. Pliaj provoj estis skribitaj de Laplace (1810, 1812), Gaŭso (1823), James Ivory (1825, 1826), Hagen (1837), Friedrich Bessel (1838), W.F. Donkin (1844, 1856), John Herschel (1850) kaj Morgan Crofton (1870). Aliaj kontribuintoj estis Ellis (1844), Augustus De Morgan (1864), Glaisher (1872) kaj Giovanni Schiaparelli (1875). La formulo de Peters por  , la probabla eraro de simpla observo estas bone konita.

La 19a jarcento inkludas aŭtorojn kiel Laplace, Silvestre Lacroix (1816), Littrow (1833), Richard Dedekind (1860), Helmert (1872), Hermann Laurent (1873), Liagre, Didion kaj Karl Pearson. Augustus De Morgan kaj George Boole plibonigis la prezenton de la teorio. Adolphe Quetelet (1796-1874),fariĝis alia grava fondinto de la statistiko kaj enkondukis la nocion de la «averaĝa homo» (l’homme moyen) kiel maniero kompreni la kompleksajn sociajn fenomenojn.

Aktuala stato

redakti
 
La modelo IS-LM estas uzata por analizi la efikon de peteksplodo en ekonomiko (cikla sendungeco).

Dum la 20a jarcento, la kreo de precizaj instrumentoj por aferoj de publika sano (Epidemiologio, biostatistiko, ktp.) kaj sociaj kaj ekonomiaj celoj (proporcio de senlaboreco, Ekonometrio, ktp.) necesigis la konstantan uzadon de la oportunaj statistikoj.

Hodiaŭ la uzo de la statistiko etendiĝis for de ĝiaj originoj kiel servo al la Ŝtato aŭ al la registaro. Personoj kaj organizoj uzas statistikon por kompreni datumojn kaj preni decidojn en sociaj kaj naturaj sciencoj, medicino, negocoj kaj aliaj areoj. La statistiko estas komprenita ĝenerale ne kiel sub-areo de la matematikoj sed kiel malsama scienco «aliancita». Multaj universitatoj havas akademiajn fakojn de matematiko kaj statistiko aparte. La statistiko instruas en fakoj tiel diversaj kiel psikologio, eduko kaj publika sano.

Bazaj konceptoj kaj rezultoj de probablo-teorio

redakti

Se la probablodistribuo de variablo X estas normala, la aritmetika averaĝo estas la plej efika (minimumvarianca) pritakso de ekspekto de la variablo:

 

kaj la ekspektofidela estimanto por la varianco   estas

 

La kvadratradiko   pritaksas disiĝgradon de la   (kvankam ne estas ekspektofidela pritakso de  ).

Praktike oni plej ofte uzas la suprajn pritaksojn, kiam oni volas scii lokon ĉirkaŭ kiu X varias kaj la koncernan gradon de disiĝo.

Statistikaj metodoj

redakti

Oni povas dividi statistikajn metodojn diversmaniere:

  1. laŭ la nombro de traktataj variabloj: ĉu unu, du aŭ pli
  2. kiom oni scias pri valoroj de variablo: ĉu oni scias ilin perfekte,

t.e. la distribuo estas konata (parametra metodo), aŭ en alia ekstremo, la valoroj estas kodigitaj per klaso aŭ vicnombro (neparametra metodo)

 
Grafikaĵo de sonorila kurbo pri normala distribuo.
 
Histogramo de nombroj de okazaĵoj laŭ iliaj valoroj, la plej oftaj valoroj estas ĉirkaŭ 100.

Inter statistikaj metodoj menciendas jenaj:

Regresa statistiko

redakti

Regresa statistiko estas unu el aro da statistikaj metodoj tre uzataj por analizi rilaton de dependa variablo al unu aŭ pluraj aliaj nedependaj variabloj. Pli specife, regreso helpas komprenigi, kiel tipa valoro de dependa variablo ŝanĝas, kiam unu el la nedependaj variabloj varias, dum la aliaj nedependaj variabloj restas senŝanĝaj. Regresanalizo estas vaste uzata por prognozo kaj antaŭvido, kiam la laborkampo proksimiĝas al artefarita intelekto.

Granda aro da teĥnikoj por trakti analizojn estis realigitaj. Konataj metodoj, kiel la lineara regreso kaj la metodo de kvadrataj minimumoj, estas parametraj regresoj, ĉar ilia regresofunkcio, kiu bildigas la problemon, estas difinita per finia nombro da nekonataj parametroj, kiuj estas laŭtaksataj el la datenoj. Neparametraj regresoj estas malpli konataj, kaj rilatas al teĥnikoj, kiuj permesas regresojn ligitajn al specifa aro da funkcioj, kun okazeble nefiniaj dimensioj.

Statistika mekaniko

redakti

Statistika mekaniko, unu el la pilieroj de la moderna fiziko, priskribas kiel makroskopaj observoj (kiel temperaturo kaj premo) estas rilataj al mikroskopaj parametroj kiuj fluktuas averaĝe. Ĝi konektas termodinamikajn kvantojn (kiel varmokapacito) al mikroskopa konduto, dum, en klasika termodinamiko, la nura disponebla eblo estus la mezuro kaj tabeligo de tiaj kvantoj por variaj materialoj.[30]

Statistika mekaniko estas necesa por la fundamenta studo de ajna fizika sistemo kiu havas multajn gradojn de libereco. La alproksimigo estas bazata sur statistikaj metodoj, probabloteorio kaj la mikroskopaj fizikaj leĝoj.[30][31][32] [33]

Specialigitaj fakoj

redakti

Statistikajn teknikojn oni uzas en ampleksa gamo de tipoj de sciencaj kaj sociaj esploroj, inter kiuj: biostatistiko, komputika biologio, komputika sociologio, reta biologio, sociaj sciencoj, sociologio kaj socia esplorado. Kelkaj esplorkampoj uzas aplikatan statistikon tiom etende ke ili havas specializitan terminaron. Inter tiuj fakoj menciendas jenaj:

Famaj statistikistoj

redakti
 
Andrej Nikolajeviĉ Kolmogorov.
 
Ĉefa sidejo de la Nacia Instituto de Statistiko, en Madrido (Hispanio), konstruita en 1973 kaj rehabilitigita en 2008.

Statistikaj servoj

redakti

Premioj

redakti

Vidu ankaŭ

redakti

Referencoj

redakti
  1. "Statistik" en Digitales Wörterbuch der deutschen Sprache
  2. 2,0 2,1 (1 November 2011) “An Account of Early Statistical Inference in Arab Cryptology”, The American Statistician 65 (4), p. 255–257. doi:10.1198/tas.2011.10191. 123537702. 
  3. (2014) “The emergence of statistical science”, Śląski Przegląd Statystyczny 12 (18), p. 76–77. doi:10.15611/sps.2014.12.04. 
  4. Bruneau, Quentin. (2022) States and the Masters of Capital: Sovereign Lending, Old and New. Columbia University Press. ISBN 978-0231555647.
  5. Willcox, Walter (1938) "The Founder of Statistics". Review of the International Statistical Institute 5(4): 321–328. JSTOR 1400906
  6. J. Franklin, The Science of Conjecture: Evidence and Probability before Pascal, Johns Hopkins Univ Press. 2002
  7. Schneider, I. (2005). Jakob Bernoulli, Ars Conjectandi (1713). En I. Grattan-Guinness (eld.), Landmark writings in Western Mathematics, 1640-1940 (pp. 88-103).
  8. Sylla, E. D.. (2006) The Art of Conjecturing, Together with Letter to a Friend on Sets in Court Tennis (trad.) (angle). JHU Press. ISBN 978-0-8018-8235-7.
  9. . Gauss, Least Squares, and the Missing Planet (2021). Alirita 2022-11-01.
  10. Helen Mary Walker. (1975) Studies in the history of statistical method. Arno Press. ISBN 978-0405066283.
  11. (1877) “Typical laws of heredity”, Nature 15 (388), p. 492–553. doi:10.1038/015492a0. Bibkodo:1877Natur..15..492.. 
  12. (1989) “Francis Galton's Account of the Invention of Correlation”, Statistical Science 4 (2), p. 73–79. doi:10.1214/ss/1177012580. 
  13. (1900) “On the Criterion that a given System of Deviations from the Probable in the Case of a Correlated System of Variables is such that it can be reasonably supposed to have arisen from Random Sampling”, Philosophical Magazine 50 (302), p. 157–175. doi:10.1080/14786440009463897. Alirita 2019-06-27.. 
  14. Karl Pearson (1857–1936). Department of Statistical Science – University College London. Arkivita el la originalo je 2008-09-25. Arkivigite je 2008-09-25 per la retarkivo Wayback Machine
  15. Box, JF (Februaro 1980). “R.A. Fisher and the Design of Experiments, 1922–1926”, 'The American Statistician' 34 (1), p. 1–7. doi:10.2307/2682986. 
  16. Yates, F (June 1964). “Sir Ronald Fisher and the Design of Experiments”, 'Biometrics' 20 (2), p. 307–321. doi:10.2307/2528399. 
  17. (1966) “The Influence of Fisher's "The Design of Experiments" on Educational Research Thirty Years Later”, American Educational Research Journal 3 (3), p. 223–229. doi:10.3102/00028312003003223. 145725524. 
  18. (2005) “Bayesian Inference for Categorical Data Analysis”, Statistical Methods & Applications 14 (3), p. 298. doi:10.1007/s10260-005-0121-y. 18896230. Alirita 2013-12-19.. 
  19. OED quote: 1935 R.A. Fisher, The Design of Experiments ii. 19, "We may speak of this hypothesis as the 'null hypothesis', and the null hypothesis is never proved or established, but is possibly disproved, in the course of experimentation."
  20. Fisher|1971|loc=Chapter II. The Principles of Experimentation, Illustrated by a Psycho-physical Experiment, Section 8. "The Null Hypothesis"
  21. (1998) “Natural Selection and the Sex Ratio: Fisher's Sources”, American Naturalist 151 (6), p. 564–569. doi:10.1086/286141. 40540426. 
  22. Fisher, R.A. (1915) The evolution of sexual preference. Eugenics Review (7) 184:192
  23. Fisher, R.A. (1930) The Genetical Theory of Natural Selection. (ISBN 0-19-850440-3)
  24. Edwards, A.W.F. (2000) Perspectives: Anecdotal, Historical and Critical Commentaries on Genetics. The Genetics Society of America (154) 1419:1426
  25. Andersson, Malte. (1994) Sexual Selection. Princeton University Press. ISBN 0-691-00057-3.
  26. Andersson, M. kaj Simmons, L.W. (2006) Sexual selection and mate choice. Trends, Ecology and Evolution (21) 296:302
  27. Gayon, J. (2010) Sexual selection: Another Darwinian process. Comptes Rendus Biologies (333) 134:144
  28. (1934) “On the two different aspects of the representative method: The method of stratified sampling and the method of purposive selection”, 'Journal of the Royal Statistical Society' 97 (4), p. 557–625. doi:10.2307/2342192. 
  29. Science in a Complex World – Big Data: Opportunity or Threat?. Santa Fe Institute. Arkivita el la originalo je 2016-05-30. Alirita 2014-10-13.
  30. 30,0 30,1 Gibbs, Josiah Willard (1902). Elementary Principles in Statistical Mechanics. New York: Charles Scribner's Sons.
  31. Tolman, R. C. (1938). The Principles of Statistical Mechanics. Dover Publications. ISBN 9780486638966.
  32. Balescu, Radu (1975). Equilibrium and Non-Equilibrium Statistical Mechanics. John Wiley & Sons. ISBN 9780471046004.
  33. La termino statistika mekaniko estas foje uzata por referenci nur al statistika termodinamiko. Tiu artikolo sekvas la larĝan rigardon. Laŭ kelkaj difinoj, statistika fiziko estas eĉ pli larĝsenca termino kun statistikaj studoj de ajna tipo de fizika sistemo, sed ĝi estas ofte komprenita kiel sinonimo kun statistika mekaniko.

Bibliografio

redakti
  • Best, Joel (2001). Damned Lies and Statistics: Untangling Numbers from the Media, Politicians, and Activists. University of California Press. ISBN 0-520-21978-3.
  • Hacking, Ian (1990). The Taming of Chance. Cambridge University Press. ISBN 0-521-38884-8.
  • Lindley, D. V. (1985). Making Decisions (2a eldono). John Wiley & Sons. ISBN 0-471-90808-8.
  • Stigler, Stephen M. (1990). The History of Statistics: The Measurement of Uncertainty before 1900. Belknap Press/Harvard University Press. ISBN 0-674-40341-X.
  • Tijms, Henk (2004). Understanding Probability: Chance Rules in Everyday life. Cambridge University Press. ISBN 0-521-83329-9.
  • Volle, Michel (1984). Le métier de statisticien (2a eld.). Económica. ISBN 2-7178-0824-8. rete
  • Bernard Delmas, Statistique descriptive pour l’économie et la gestion, Presses Universitaires du Septentrion, 2009 (ISBN 978-2-7574-0074-6).
  • Jean-Pierre Favre, Mathématiques de gestion, Digilex, 2009 (ISBN 978-2-940404-01-8).
  • Olivier Martin, L'enquête et ses méthodes : l'analyse de données quantitatives, Paris, Armand Colin, 2005 puis 2009.
  • Michel Volle, Histoire de la statistique industrielle, Economica, 1982, ISBN 2-7178-0520-6, rete.
  • Georges Hostelet, Le concours de l’analyse mathématique à l’analyse expérimentale des faits statistiques, Paris, Hermann, Actualités Scientifiques et Industrielles, no 585), 1937, 70 pp.
  • T.H. kaj R.J. Wonnacott, Statistique, éd. Economica, 1995 (4e éd.), 922 p., ISBN 2-7178-2072-8
  • Gilbert Saporta, Probabilités, Analyse des données et Statistiques, Paris, Éditions Technip,‎ 2006, 622 p. (ISBN 978-2-7108-0814-5, rete)
  • Mathieu Rouaud, Probabilités, statistiques et analyses multicritères Un livre de 182 pages pour s'initier à la statistique.
  • Nicolas Gauvrit, Statistiques : Méfiez-vous !, Ed. Ellipses (Paris), 2007, ISBN 978-2-7298-3070-0
  • Stéphanie Dupays, "Déchiffrer les statistiques économiques et sociales" Ed. Dunod, 2008, ISBN 2-10-051584-5
  • Alain Desrosières, La politique des grands nombres : histoire de la raison statistique, Paris, La Découverte,‎ 2000 (ISBN 978-2-7071-6504-6) (2004). La política de los grandes números. Ed. Melusina. ISBN 84-933273-5-2.
  • Anders Hald, A History of Mathematical Statistics, New-York, Wiley,‎ 1998 (ISBN 0-471-17912-4)
  • David Salsburg, The Lady Tasting Tea : How statistics revolutionized science in the twentieth century, Holt McDougal,‎ mai 2002, 1e éd. (ISBN 978-0-8050-7134-4)

Eksteraj ligiloj

redakti
  • En tiu ĉi artikolo estas uzita traduko de teksto el la artikolo Statistics en la angla Vikipedio.