CM Statistique s2 PDF

Title CM Statistique s2
Author Olga Variolp
Course Histoire moderne
Institution Université de Lorraine
Pages 15
File Size 202.7 KB
File Type PDF
Total Downloads 47
Total Views 144

Summary

Bonjour voici le cours sur la statistique...


Description

CM HSTAT S3 CM1 18/09 : Introduction Quantifier :

- résumer le réel en décrivant une population - histoire de la stat : - sociologie des sciences —> socio philosophique, qui travail sur notion de statistique - socio-histoire des producteurs de stat (ex : B. Touchelay s’y intéresse en Fr) - Courant important : Alain Desrosières ds La politique des grands nombres Alain Desrosières :

- Administrateur de l’INSEE, ds grd fonctionnaire, polytechnicien - cherche à réfléchir à la construction des statistiques : ex, pq mesurer un taux de chômage - contenu de son analyse • question de la quantification systématique : pourquoi est-ce mis en place - mise en œuvre grâce à la découverte des stats (et des probabilités) —> création au XVII - Statistik allemande et arithmétique politique anglaise, qui s’est trouvée nécessaire à la multiplication des implications de l’État ds la société

- statq = outil de gouvernement des hommes (du biopouvoir selon M. Foucault) - statq est par excellence une science d’expert, qui tourne son orientation au service de l’État

ou des intervention collectives sur la société —> science pragmatique qui cherche nécessairement à être utile à toutes les autres sciences sociales et à la gestion des pops ; d’où l’utilisation du mot « expert » prp mot « savant », qui sera plus porté sur le savoir pur • question du classement

- mise en place de conventions d’équivalence —> tel individu qui est ds une situation 1 va être rapproché d’un autre qui serait ds une même situation => même si l’égalité des situations n’est pas assurée, on va les classer ds la même case

- travail de catégorisation —> différentes traditions nationales vont expliquer qu’on ne va pas classer les gens de la même manière en fn du lieu d’origine, et pas uniquement en fn de l’objectif

- définition d’un objet d’étude par au moins une caractéristique commune : ex : cas des

révolutions paysannes ; en fn de ce qu’on étudie, on va étudier soit les personnes qui se révoltes, soit les révoltes-mêmes.

- descriptions des variables : sont les différentes caractéristiques utilisées pour classer les individus des populations : variables quantitatives ; variables qualitatives. Une variable est un caractère ; les modalités sont les différentes formes que peut prendre la variable. Ex, pr variable genre ; différentes modalités : homme, femme, etc

- catégorisation : étape cruciale du raisonnement sur l’exemple de l’âge - jeune/vieux —> dichotomie => définition relative - âge biologique —> descriptible soit en variable discrète (quasi toujours le cas en histoire), soit en variable continue

- classes d’âge —> découpé es de façon pertinente, elles permettent de mieux étudier les risques de tomber au chômage par ex. Descriptibles en variables qualitative ordinales (d’abord on est 18-25, ensuite on est 25-35) ou en variable qualitative nominale (ex : ds quel département j’habite)

↳ catégoriser, c’est déjà faire des maths

- effectivement, on pourrait faire dire n’importe quoi aux chiffres en choisissant des nomenclatures artificielles

Le langage statistique : un artefact ?

- La position relativiste - Ex : Howard Becker montre qu’il n’est pas possible d’étudier la délinquance, puisqu’on

s’appuie sur des stats publiques, qui in fine ne montrent que la façon dont l’état classe la délinquance

- La position du réductionnisme - on résume, on distort, on ne rend pas compte d’une réalité plus complexe avec des stats ↳ que répondre à ces critiques ?

• nous sommes tous individus, et pourtant on peut parler de nous comme des êtres humains, comme des hommes, comme des femmes, etc

• on se base sur des conceptions juridiques, qui peuvent évidemment être critiquées, mais qui ont

une incidence ds la vie de tous les jours : ex, un accidenté du travail perçoit une pension que d’autres types d’accidentés ne perçoivent pas —> a une incidence en vérité • nécessité de la stat : on a besoin de quantifier pour agir sur les discriminations salariales ; c’est pas grave si c’est pas parfait, mais c’est assez nécessaire • honnêteté en sciences sociales est nécessaire —> si on s’y connait en stat, on peut faire des choses qui tiennent et qui nous racontent des choses sur la réalité

CM2 : L’émergence des statistiques (de la fin du MA au dbt du XIXe) I.

La lente émergence du calcul des probs

Un domaine ancien de gestion de l’incertitude : les assurances maritimes L’aléa maritime est calculé dès l’antiquité. L’assurance fonctionnait sous forme de prêtinvestissement. —> l’Église a condamné les prêts à intérêts car c’était considéré comme de l’exploitation Cmmerçants génois : une connaissance fine des risques, qui sont « mis en mathématiques » —>

- contrats passés devant notaire - correspondance entre les commerçants regorgent de détails pour aider les commerçants à éviter les risques à la fois structurels (paysage) et conjoncturels (dpt de la situation)

Les origines du raisonnement probabiliste

- on avait pas encore créé les calculs probabilistes - AINSI, c’est les prémisses du raisonnement, mais pas encore l’émergence

Un contexte historique propice

Av : probabilités conçues comme « loi divine »

- pr cert. personnes ds cert. positions, il est possible de prendre des décisions car ils sont dépositaires de l’autorité divine : ex, juges, roi…

MAIS : Réforme et Contre Réforme

- dvlpt des proba comme connaissance scientifique avec réflexion sur les connaissances certaines et incertaines

De la vérité révélée aux degrés de certitude, un continuum entre probabilités subjectives et proba objectives

- certitude morale : ds un jugement par ex, on juge que en s’appuyant sur des indices qui ne sont jamais certains

- certitude physique : obéit à des lois immuables - certitude mathématique : absolue certitude qui n’est néanmoins pas divine Le développement d’une conception fréquentiste de la probabilité

- calcul des prob va aller parfois à l’encontre de l’intuition : paradoxe de Saint-Pétersboug - ds l’intuition interviennent mille éléments subjectifs liés à notre situation perso, aux montants en jeu… Deux branches de la stat :

- statistique épistémique : Bayes - stat fréquentiste : Bernoulli, Laplace… ↳ victoire du fréquentisme grâce aux philosophes empiristes du XVII-XVIII : Hume, Locke

II. Les premières applications des probabilités aux affaires humaines Les sociétés d’Ancien Régime : des économies de la rente Dvlpt de l’État militaro-fiscal

- org de création d’une administration - nécessité pour l’État d’avoir masse de thunes - pourrait faire fner l’imprimante à billet - les impôts aug฀ - les emprunts : rentes perpétuelles et rentes viagères Les rentes = indicateur principal de la richesse des élites

- l’État dvlp ++ cette €co de la rente au XVIIe —> c’est un des éléments central de la transmission du patrimoine

- utilisé pour le mariage ou le placement au couvent des jeunes filles - MAIS : équilibre relativement fragile à cause des guerres mi-XVII, mi XVIII

CM3 et 4

CM5 : Naissance et essor de la stat publique XIXe I.

L’émergence d’une nvL forme de stat : la stat publique

A. La fusion de deux conceptions opposées de la stat

- stat allemande : science admin qui recoure à une argumentation litttéraire, ds un contexte

d’émiettement des états all —> pas de maths, seulement description des richesses destinée au souverain => aspect outil administratif ;

- au fur et à mesure —> de plus en plus de maths, outils inspirés des calculs des experts de la société civile au service du gouvernement des hommes ↳ science hybride, entre description et mathématiques

B. Démarche quételienne (1/2 que le partiel porte dessus)

- permet d’instituer le corps social : càd définition des contours de la nation, sur lequel s’applique la souveraineté

- création outil de dénombrement de la pop —> permet d’allouer les crédits publics selon taille de la pop => outil de pvr

- le recensement est un recensement de tte la population —> agents envoyés ds chaque foyer, pour interroger la pop => nouveauté ds cette exhaustivité, avant on partait d’un échantillon qqconque et on appliquait les réformes partout, sans souci de représentativité de l’échantillon ; AINSI, on échappe à la question de la représentativité au XIXe

- outils de description très sommaires : moyennes, graphiques, tableaux —> peu efficace et peu de recherche sur les techniques

- action de Quetelet en faveur d’une internationale statistique - création de congrès internationaux de stat qui permettent la réunion de ts les agents de stat publique. Le responsable du bureau, les experts, les statisticiens y participent, à hauteur de plrs 100aines de stat

II. La stat publique au service de la construction des Étatsnations modernes 2 usages à la stat publique : savoir et application de réformes

A. Usages sociaux d’un outil : l’ex des catégories de pop ds les recensements américains et frs Le cas américain :

- nation am : entre exclusion et inclusion, un melting pot sélectif. L’id de la nation est celle d’un grand brassage entre toutes les origines qui unissent la pop, mais qui coexiste avec une exclusion des autochtones

- premier recensement : 1790 : tous les hab qui vont payer l’impôt, pour connaître les recettes, et pour choisir le nombre de sièges au congrès

- exlue les autochtones qui ∉ système fiscal et politique - division entre esclaves et citoyens : le recensement des esclaves a pr but de fonder une connaissance sur la richesse du pays et sa répartition ds les États

- nationalité ou origines migratoire : le recensement am garde en mémoire la communauté

d’origine des citoyens —> communauté de culture, ≠ communauté de nationalité. Cert lobbies sont même mis en place pour faire reconnaître certaine communautés, comme par ex la nationalité polonaise, avant même que la Pologne soit reconnue comme État.

- agent recenseur pose des questions : recensement déclaratif, qui dc dépend à la façon dont les

gens perçoivent leur identité : se déclare-t-on comme afro-am si son grd père est afro-am ? par exemple, si le recenseur était afro-am, il y avait plus de chance que l’interrogé se dise « mulâtre » que s’il était blanc —> dépend donc des personnes et du recenseur => parfois un hiatus entre id administrative, assignée par l’État, et id individuelle perçue. de plus en plus, les id administratives sont de + en + intériorisées par les 1nd.

- Dbt XIXe, personne ne se def en fn de son id nationale, fin XXe, quasi tout le monde le fait. Dépend de l’histoire et des modes de pensée de l’identité au cours du temps.

Le cas frs : la République une et indivisible, mis en place sous la IIIe Rép

- cmt se construit la nation en Frce —> on a tendance à assimiler la nationalité et la citoyenneté : peu importe son origine, un citoyen ∈ au corps social => idéal révolutionnaire qui coupe avec la façon de penser les identités de l’Ancien Régime, au moment où l’aristocratie basait sa conception de l’id sur la naissance

- le recensement ne comprend que la nationalité, en disant que nationalité = citoyenneté ; pas de trace des origines ds les questionnements

- 1851 : réforme du droit de la nationalité (double droit du sol, = on devient automatiquement frs à la naissance quand on nait en France de parents nés en France (y compris si les parents sont étrangers —> bcp de frs le sont en faveur de cette règle) ; introduction de la catégorie de nationalité ds le recensement

- les ratés des nomenclatures juridiques : - on présuppose que nationalité = citoyenneté ; MAIS : femmes n’ont pas le droit de vote et son pourtant françaises

- réforme du code de la nationalité en 1927 —> femmes frse mariées à des étrangers, on perd la nationalité et on devient étrangère ; ces femmes vont-elles se déclarer française de naissance, comme le questionnaire le propose, ou étrangères

- nationalités émergentes au XIXe : la Pologne n’existe pas comme pays indépendant, mais la

nationalité est très active, d’autant plus qu’il y a une émigration politique de ces nationalités émergentes, à Paris par ex. Ainsi, la France propose aux Polonais de se déclarer polonais — > marque de soutien de la Frce au mvt d’indépendance nationale Polonaise

- question des populations coloniales, en particulier pour les Algériens. Quand on recense les

Algériens en frce, on cherche des 1nd de nationalité frse ; mais l’administration frse continue de penser que les Algériens ne sont pas des citoyens comme les autres : mais ce n’est pas possible de les dénombrer avec le même questionnaire. On va donc le recenser comme un français musul d’Algérie. Les pops vont rentrer en conflit

B. France championne de la stat administrative - héritage de l’Ancien Régime —> tradition de centralisation, y compris des données chiffrées - rupture révolutionnaire : nv système de mesure et de classement au service de la transparence démocratique

- remise à plat système de nomenclature, de catégorisation, en essayant de faire un maillage plus serré, ds ses moindres recoins —> mise en place d’un préfet pour que l’État connaisse mieux ses territoires

- bureau de statistique du ministère de l’Intérieur sous Chaptal (1800-1812) : premier pays à le mettre en place

III. Les administrations de la stat publique ; un dvlpt chaotique Autonomie de la stat publique au sein de l’appareil d’État : une conquête difficle - opposition stérile au sein du premier bureau de stat : Duvillard contre Peuchet - Mireau de Jonnès à la tête de la SGF : un statisticien du dénombrement hostile au calcul - une institution sous tutelle —> au dprt, pas assez de moyen ds les bureaux de stat —> c’est le préfet, appuyé sur les maires, qui organise les recensements

- du ministère de l’intérieur au ministère du commerce - de la compilation des données stat des ministères à la participation au nomenclatures de recensement (1852) puis à son organisation (Belle époque)

App du bureau de stat sous Napo Suppr sous la restauration recréation « Statistique générale de la France » sous monarchie de juillet —> perdure jusqu’à la création de l’INSEE en 1945

CM6 : 23/10 CHAPITRE 5 : Les renouveaux de la démographie (fin XIXe - dbt XXe) I. Deuxième âge de la stat A. La nouvelle démographie : un projet stat et politique

Deux personnages importants pr refondation de la démographie : Galton et Pearson.

- sont important : majeure partie des outils stat utilisés en démographie ont été créés par eux - mais projet politique très sulfureux, basé sur l’eugénisme, qui sera utilisé pdt WWII Quel est ce projet: le darwinisme social

- s’appuie sur travaux de Darwin —> explique l’évolution de l’humanité - Galton, cousin de Darwin, tente d’appliquer ce raisonnement darwinien aux aspects sociaux de l’espèce humaine

- => permet un développement de l’eugénisme, sur fond d’exclusion et de volonté d’anéantissement

- ex : les plus pauvres sont les moins adaptés ; mais les plus pauvres sont ceux qui font le plus d’enfants

- Une nouvelle géographie du savoir quatificateur : chgt de la discipline, qui était auparavant une science multiforme ; après la fin du XIXe, se met en place une domination des biométriciens anglais, qui ouvre la voie à l’essor de la biologie et de la psychologie statistique

B. De nouveaux outils statistiques au service d’une nouvelle conception du corps social Quetelet : : analyse des hiérarchies sociales et des aptitudes individuelles —> popularise le rencensement et la moyenne dans l’objectif de trouver l’unité du corps social Galton-Pearson : au contraire, ils calculent la dispersion et non plus la moyenne (entreprise de distinction) ; ils cherchent à mettre en valeurs les ÊH idéaux prp à ceux qui forment la moyenne

II. Nv outils stat A. L’analyse de la dispersion Les quartiles au fondement d’une échelle des aptitudes :

- la médiane, pile au milieu des quartiles, comme outils de distinction du bon et du mauvais côté de la distribution

- les quantiles : quartiles, décilles, centiles - usage fréquent en économie des inégalités —> ex T. Piketty Le degré de confiance à accorder à la moyenne : la variance et l’écart-type

- écart-type (σ) : donne la dispersion autour de la moyenne : qu on ordonne nos valeurs, la courbe est-elle étalée ? resserrée ?

- variance : une mesure de la distance entre les valeurs observée et l’indicateur synthétique : càd (moyenne des écarts à la moyenne) au carré

- le coefficient de variation : rapporte l’écart-type à la moyenne (σ/moyenne) : plus ce nombre est petit, plus la dispersion est faible

B. Analyse bivariée et testes statistiques analyser les relations entre deux variables : les tableaux croisés / tables de contingence

- usage antique dvlp par Aristote : les tableaux 2*2, ds calculs de probabilité - un usage minimaliste des premiers tableaux croisés : les dénombrements de Quetelet - ex : tableau de l’Etat de l’instruction dans le Royaume des Pays-Bas. Inscrit un décompte des niveaux de dépense consacrés à l’instruction primaire dans chaque province => mais ne met en œuvre aucun calcul ou aucune réflexion statistique

- les biométriciens anglais vont bco utiliser ces tableaux croisés : - car fin XIXe, on a des instruments qui permettent de faire des tableaux croisés : cartes perforées de la machine Hollerith, qui permettent de faire rentrer bcp de données

- outil importé par la SGF sous Lucien March, directeur polytechnicien de la SGF qui développe une approche + mathématique des statistiques

- le premier à réfléchir comment analyser les tableaux croisés dynamiques, on essaie de voir

s’il y a une relation entre telle et telle variable —> il analyse la forme des empreintes digitales se ressemblent => tjrs orientation eugéniste

CM7 : 6/11 Le teste du Khi-deux : un test d’indépendance entre deux variables

- robustesse des stats - l’apport de Pearson : une mathématisation du raisonnement de Galton : ils fondent leur réflexion sur des cas concrets avec bcp d’observations —> permet de mettre en place le test

- les tests peuvent permettre de voir si en stat, 3 peut être = à 0 exemple : choix des filières sup en fn du bac

- d’un pt de vue global, en général, en moyenne, 50% néo-bacheliers se dirigent à l’université, 40% de filières pro, 10% de classes prépa

- d’abord commenter les totaux en ligne ou en colonne, puis les cases pour mesurer les écarts - il y a une différence en fn des filières —> donc test de Khi2 permet de savoir si l’écart qu’on observé

- est-ce que 30 = 0 est-ce que 30 est une déviation de la variable due au hasard, où est-ce un biais sociologique

- on crée un deuxième tableau : tableau de ce qu’on devrait avoir si on se base sur les totaux des colonnes et lignes —> tableau d’indépendance, effectifs d’indépendance

- on crée un troisième tableau : écarts à l’indépendance = écart entre le vrai tableau et le tableau d’indépendance

- on crée un quatrième tableau (contribution au khi2) : on pondère les écarts à l’indépendance

avec les effectifs : les écarts importants sont important surtt pour les filières techno-pro, même une fois qu’on les a pondérées ↳ à retrouver sur l’EPI et sur le fichier Excel

- ici, valeur moyenne de ces contributions = 20,763. Réslutat du test de chi2 = 6,18…e-51

Pearson a établit une table qui, en fonction du nb de colonnes et de l...


Similar Free PDFs