dans le statistiques et en Théorie des probabilités, les Quantiles sont les valeurs dans lesquelles un ensemble de données est divisé Intervalles avec la même quantité de données. Il y a donc un quantile inférieur au nombre de groupes créés. Alors le Quartiles sont les trois quantiles qui divisent un ensemble de données en quatre groupes de taille égale. le Médian Le quantile sépare l’ensemble de données en deux groupes de taille égale.

le Quantiles de Variable aléatoire univarié, discret (par exemple des nombres entiers) ou continu (réel)sont les valeurs que la variable prend pour des valeurs de probabilité inférieures au quantile considéré et qui ont une valeur remarquable, par exemple 3 dixièmes ou 5 centièmes, etc. Nous les appelons toujours Fractile, synonyme complet en fonction du contexte d’utilisation, et ce sont les valeurs mutuelles du Fonction de distribution de Loi de probabilité pris en considération. Nous nous intéressons particulièrement à certains ensembles de valeurs quantiles qui correspondent à des multiples de fractions simples de 100% de la probabilité totale. Par exemple, nous pouvons diviser la probabilité totale de 100% en 4 ensembles de probabilités, dont chacun est égal 14e= 25%, correspondant aux valeurs des variables aléatoires de quatre intervalles adjacents. Les trois valeurs intermédiaires définissent donc chacune les fractiles de 14e= 0,25, 12= 0,5 et 34e= 0,75 ou exprimés en fractions sont les quantiles d’un quart, demi et trois quarts (les deux limites extrêmes, la limite inférieure correspond au quantile de 0 et la limite supérieure pour le quantile de 1, sont les limites du domaine de la définition de la variable aléatoire.

le Quantiles de échantillon statistique Les nombres de nombres sont des valeurs remarquables qui permettent à l’ensemble de ces données ordonnées d’être divisées (c’est-à-dire triées) à des intervalles successifs contenant le même nombre de données (à l’exactitude de la division totale du nombre total de données, fermer) . Par exemple, un échantillon de 90 éléments de données pourrait être divisé en 10 sous-intervalles consécutifs en utilisant un ensemble de 9 quantiles (plus les limites inférieure et supérieure du domaine de l’échantillon).

Certains ensembles de quantiles ont reçu des noms spéciaux:

  • Les quantiles de multiples d’un centième sont mentionnés Centile, ou Centiles après un anglicisme fréquemment. Alors le 5e Le percentile divise l’échantillon en 5% des données ci-dessous et les 95% restants au-dessus. Le dernier centile (le 99e) joue souvent un rôle de seuil d’alerte extrême pour des mesures qui reflètent l’intensité d’un phénomène soumis à des changements critiques et permettent ainsi son suivi (voir ci-dessous l’exemple en hydrologie de la définition du inondation centenaire);
  • Sont des quantiles de multiples d’un dixième Décile. Ils sont souvent utilisés en géologie minière (étude des propriétés granulométriques des matériaux divisés), en hydrologie (définition des niveaux d’eau, notamment en cas d’inondations). 9e Décile du débit d’une rivière qui définit son niveau crue de dix ans) ainsi que dans de nombreuses statistiques médicales;
  • Les quantiles des multiples d’un quart sont les Quartiles. Le premier quartile est la statistique généralement notée q1 ;; Le deuxième quartile n’est autre que cela Médian ;; Le troisième quartile est noté q3 et son écart par rapport à 1est Quartile définiGamme interquartile, qui est l’une des mesures classiques de la diffusion de l’échantillon de données, mais plus robuste Quoi’Écart-type.

Les quatre étaient encore définis Quintileset les deux terciles d’une utilisation rare.

Veuillez noter : Certains programmes informatiques définissent un Quantile minimum et un Maximum de quantile par le quantile de 0 ou le quantile de 100%. Cependant, cette terminologie va au-delà des définitions traditionnelles des statistiques.

Sur préavis q-quantile l’ensemble des quantiles de multiples de la fraction 1q. Il y a (q-1) q-quantile. le p-e q-quantile d’une variable aléatoire X. est donc défini comme[1] valeur X((p/.q) comme :

ou équivalent,

C’est donc l’inverse du groupe pq pour la fonction de distribution associée.

Généralisation au-delà des valeurs p et q pris comme des nombres entiers définit le fractile: pour un nombre réel F pris entre 0 et 1 = 100%, le fractile pour la valeur F, ou la F-fractile, est le[1] Valeur du domaine de la variable aléatoire pour laquelle la fonction de distribution vaut F. En d’autres termes, la probabilité (nous disons aussi, pour être plus explicite, la masse de probabilité) des variables aléatoires sous le F-Fractile est 100 ×F %.. Ou encore avec le langage mathématique des fonctions, le F-fractile est l’inverse de la fonction de distribution dans F.

Avis d’abus de langage[modifier | modifier le code]

Dans les résultats de tests statistiques standardisés, il est courant d’utiliser l’expression « dans le 80e Centile « . Étant donné que les centiles sont des valeurs et non des intervalles, il serait plus correct de « dans l’intervalle entre les » J’accepte 80e et le 81e Centile « ou » dans l’intervalle de probabilité de 1% après 80e Centile ».

Cas d’une variable aléatoire à distribution symétrique[modifier | modifier le code]

Lorsqu’une distribution est symétrique par rapport à une certaine valeur, la médiane et la moyenne sont égales à cette certaine valeur. En pratique, c’est le cas de toutes les variables aléatoires gaussiennes. D’un autre côté, il existe des exemples d’utilisation courante quand ce n’est pas le cas.

Plus d’information[modifier | modifier le code]

Les quantiles sont des mesures utiles car ils sont moins sensibles aux distributions allongées et aux valeurs aberrantes. Par exemple avec une valeur aléatoire après un Distribution exponentielleTout échantillon donné de ces variables aléatoires a environ 63% de chances d’être inférieur à la moyenne. Cela est dû à la présence d’une longue queue de la distribution exponentielle en valeurs positives, qui est absente en valeurs négatives.

Empiriquement, les quantiles sont beaucoup plus utiles que la moyenne ou d’autres types de moments statistiques lorsque les données que vous analysez ne sont pas distribuées comme prévu, ou lorsqu’une autre source de valeurs aberrantes affecte la valeur de la moyenne.

le régression robuste est étroitement lié à ce problème. La somme des valeurs absolues des valeurs observées est utilisée à la place des erreurs carrées. La corrélation est que parmi les estimateurs liés à une distribution, la moyenne est la seule qui minimise l’espérance de l’erreur quadratique, tandis que la médiane minimise l’espérance de l’erreur absolue. Une régression robuste partage la capacité d’être relativement insensible aux écarts importants dus à quelques valeurs aberrantes.

Les quantiles d’une variable aléatoire sont conservés avec des transformations croissantes, ce qui signifie, par exemple, que si m est la médiane d’une variable aléatoire X. puis 2m est la médiane de 2X.sauf si une sélection arbitraire a été faite à partir d’une plage de valeurs pour spécifier un quantile particulier. Les quantiles peuvent également être utilisés dans les cas où seules des données sont disponibles ordinal sont disponibles.

Il existe plusieurs méthodes pour estimer les quantiles:

Est N. le nombre de valeurs observées de la population échantillon et soit X1, X2, …, XN. valeurs ordonnées de la même population, par ex. X1 est la plus petite valeur, etc. k-e q-quantile, sur un p = kq.

Fonction de distribution empirique

j est la partie entière de Par exemple et g la fraction.

Fonction de distribution empirique avec moyennage

jest toute la partie de Par exemple et g est la fraction.

Moyenne pondérée

j est la partie entière de ((N.-1)p et g est la fraction. Cette méthode est utilisée, par exemple, dans la fonction PERCENTILE de Microsoft Excel.

Numéro d’échantillon suivant ((N.-1)p+1

j est toute la partie de ((N.-1)p+1 et g est la fraction.

  1. une et bEn fait, ces définitions définissent « les » Quantile ou fractile non unique. Si la densité de probabilité est strictement nulle dans un intervalle du domaine, la fonction de distribution est constante dans cet intervalle, et l’inverse de cette constante n’est donc pas une valeur unique, mais au moins cet intervalle particulier. C’est exactement le cas des variables aléatoires discrètes grâce à l’utilisation de l’outil  » Distribution  » créé par Laurent Schwartz et l’introduction de Mesures de probabilité ponctuelleunifier sous le même formalisme avec des variables aléatoires continues. L’ambiguïté de ces définitions apparaît alors entre chaque masse de probabilité ponctuelle et toutes ces définitions de quantiles, fractiles, percentiles, déciles, quartiles, etc. doivent être remplies pour lever l’incertitude. Le choix habituel est de soustraire un epsilon de probabilité des masses ponctuelles et de le répartir de manière continue et uniforme sur les mesures de probabilité ponctuelles. En termes plus simples, cela signifie une interpolation linéaire bon choix. Il convient de noter, cependant, que certains logiciels choisissent, ou ont choisi, d’autres moyens de supprimer cette incertitude, ce qui signifie que les résultats des calculs de quantiles peuvent différer d’un programme à l’autre.



Source link

Recent Posts