Feuille-aide-mémoire PDF

Title Feuille-aide-mémoire
Author Ayman Acharkı
Course Introduction à l'analytique d'affaires
Institution HEC Montréal
Pages 3
File Size 234.5 KB
File Type PDF
Total Downloads 57
Total Views 125

Summary

Download Feuille-aide-mémoire PDF


Description

FEUILLE AIDE-MÉMOIRE (INTRODUCTION À L’ANALYTIQUE DES AFFAIRES TYPES DE VARIABLES Qualitative : Décrit des caractéristiques ou des attributs. Elle peut être codée à l’aide de nombres choisis arbitrairement. Nominale : Étiquettes associées à chaque catégorie. Ne correspondent pas à des unités de mesure connues, pas d’ordre logique. Ordinale : Les catégories ont un ordre défini, mais leur valeur numérique n’a pas de signification directe. Ordre logique. (ex : degré de Coefficient d’asymétrie : Formule mathématique : g1 = satisfaction) Quantitative (numérique) : Valeurs mesurées sur une échelle. Discrète : Les valeurs possibles sont isolées. La plus petite différence entre deux valeurs distinctes est > 0. Ex : Nombre de réclamations, S’il est égal à 0 = distribution parfaitement symétrique nombre d’appels, nombre de likes. Pas une infinité de valeurs et possibilités. S’il est égal à < 0 distribution asymétrique à gauche Continue : Les valeurs possibles couvrent un intervalle ou une collection d’intervalles. Même les données arrondies pourraient être traitées S’il est égal à > 0 distribution asymétrique à droite comme continues en autant que la plus petite différence entre deux valeurs distinctes est faible. Infinité de valeurs et possibilités. Ex : Coefficient d’aplatissement ou kurtosis : consommation d’énergie, vitesse.

x n n (¿¿ i−´x )3 / s3 ∑ (n−1)(n−2) i=1 ¿

REPRÉSENTATIONS GRAPHIQUES Diagramme circulaire ou diagramme à secteurs : pour les variables qualitatives, se construit à l’aide de fréquences relatives. Diagramme à bâtons : pour les variables qualitatives et les variables quantitatives discrètes (si le nombre de possibilités est limité, ex : nombre d’enfants) Histogramme : pour les variables quantitatives à valeurs groupées en classes. MESURES DE CENTRALITÉ (les points de concentration des données/valeur la plus probable d’une variable) n Moyenne

´x =

1 ∑x n i=1 i

x n 1 g 2= ∑ (¿¿ i− x´ )4 / s4 −3 n−1 i=1 ¿ -

S’il est > 0 : positive kurtosis S’il est < 0 : negative kurtosis S’il est égal à 0 : distribution normale.

: Mesure de centralité la plus utilisée, Souvent mal interprétée, Seulement utilisable pour des variables

quantitatives, Influencée par les valeurs extrêmes : une seule donnée très grande (ou très petite) peut occasionner un grand changement dans sa valeur (effet Bill Gates). Lorsque les valeurs prennent les valeurs 0 ou 1, la moyenne se nomme alors proportion. Si l’on répète une MESURES DE POSITION (le rang de différentes valeurs, par rapport à l’ensemble des valeurs de la distribution) expérience aléatoire un grand nombre de fois, la moyenne des résultats devient presque constante. Pour un histogramme : effectif x milieu Un quantile d’ordre α, noté Qa (0 < α Qa ) £ 1- α. Médiane : La médiane est la valeur de la variable qui départage les données en deux parties égales (en moitié). Elle indique le centre des données ordonnées. Mesure de localisation moins utilisée et moins connue que la moyenne. La médiane est plus robuste que la moyenne (peu ou pas influencée par les valeurs extrêmes). Facile à interpréter. Mode (moins pertinente) : Seule mesure de tendance centrale pour les données qualitatives. Le mode est la valeur la plus fréquente. Pour une variable continue, les données doivent être groupées et le mode sera le point milieu de l’intervalle définissant la catégorie avec le plus grand effectif. Le mode est ce qui est le plus à la mode…! Deux modes : distribution bimodale Pour une distribution unimodale symétrique : mode = médiane = moyenne (distribution normale) Pour une distribution unimodale asymétrique à droite ou positive : mode < médiane < moyenne Pour une distribution unimodale asymétrique à gauche ou négative : mode > médiane > moyenne

BOXPLOT Le boxplot permet de rapidement résumer la position des données. La boîte au centre s’étend de

Q 1 à Q 3 . Sa longueur est l’intervalle interquartile (IQR = Q Q 2 , la médiane. Si Q est à gauche = asymétrie à droite. Si Q

La ligne au centre de la boîte est

2

3

– Q1).

2

est à droite = asymétrie à gauche.

Les moustaches (lignes horizontales) joignent la boîte aux barres verticales (situées en L et U) délimitant les frontières avec les valeurs extrêmes. Chaque valeur extrême (à l’extérieur de la région délimitée par les barres verticales) est marquée par un point. La symétrie du diagramme en boîte est associée à la symétrie de la distribution. Les données à l’extérieur sont des valeurs extrêmes. Il n’y a aucun lien entre le boxplot et le mode.

MESURES DE DISPERSION (l’importance des écarts observés entre les valeurs) Étendue = maximum - minimum

Variance

X 2 (¿¿ i−´x ) n 1 := ∑¿ n−1 i=1 :s=√ s

=

X ¿ ¿ i−moyenne ¿2 pour chacune desdonnées ¿ ¿ ¿

PROBABILITÉS DE BASE Ensemble fondamental (S) : L’ensemble de tous les résultats possibles d’une expérience aléatoire. S = {}

2

Écart type : représente l’écart moyen observé entre les données et leur moyenne. L’écart-type partage les mêmes unités OPÉRATION que la variable originale. L’écart-type est influencé par les valeurs extrêmes (comme la moyenne). L’écart-type et la variance sont toujours Intersection (A et B) positifs. Plus l’écart-type est faible, plus les données sont concentrées autour de la moyenne. En finance, on mesure la volatilité par l’écart- Union (A ou B) Complémentaire (~A) type. C’est aussi vu comme une mesure de risque. Ensembles mutuellement exclusifs Ensembles collectivement exhaustifs Coefficient de variation : outil pour comparer la dispersion de deux séries de données qui n’ont pas la

CV =

Écart type(σ ) Moyenne(μ)

même unité de mesure ou grandeur. (Ex : poids de la fourmi et du chien) Justification : relativement à leur CV, X varie plus. MESURES DE GÉOMÉTRIE (les caractéristiques géométriques de la distribution)

SENS CONCRET Les deux évènements se réalisent Au moins l’un des deux évènements se réalise L’évènement A ne se réalise pas Évènements qui ne peuvent pas se réaliser en même temps L’union des ensembles couvre tous les résultats possibles

TYPES DE PROBABILITÉS -

Probabilités objectives classiques :

P ( événement )=

Nombre de cas favorables Nombre de cas possibles

P ( événement )=

-

Probabilités objectives empiriques :

-

Probabilités subjectives : varie d’une personne à l’autre

On a toujours �(�≤�) = �(�...


Similar Free PDFs