Saturday 21 January 2017

Calculer Les Indices Saisonniers À L'Aide De La Méthode Du Ratio À La Moyenne Mobile

Spreadsheet implémentation de l'ajustement saisonnier et lissage exponentiel Il est facile d'effectuer un ajustement saisonnier et d'ajuster les modèles de lissage exponentielle en utilisant Excel. Les images et diagrammes d'écran ci-dessous sont tirés d'une feuille de calcul qui a été configurée pour illustrer l'ajustement saisonnier multiplicatif et le lissage exponentiel linéaire sur les données de ventes trimestrielles suivantes de Outboard Marine: Pour obtenir une copie du fichier de feuille de calcul lui-même, cliquez ici. La version de lissage linéaire exponentielle qui sera utilisée ici à des fins de démonstration est la version Brown8217s, simplement parce qu'elle peut être implémentée avec une seule colonne de formules et qu'il n'y a qu'une seule constante de lissage à optimiser. Habituellement, il est préférable d'utiliser la version Holt8217s qui dispose de constantes de lissage distinctes pour le niveau et la tendance. Le processus de prévision se déroule comme suit: (i) d'abord les données sont désaisonnalisées (ii) ensuite les prévisions sont générées pour les données désaisonnalisées par lissage exponentiel linéaire et (iii) enfin les prévisions désaisonnalisées sont quasiment saisonnalisées pour obtenir des prévisions pour la série originale . Le processus d'ajustement saisonnier est effectué dans les colonnes D à G. La première étape de l'ajustement saisonnier est de calculer une moyenne mobile centrée (effectuée ici dans la colonne D). Cela peut se faire en prenant la moyenne de deux moyennes sur une année qui sont compensées par une période l'une par rapport à l'autre. (Une combinaison de deux moyennes de décalage plutôt qu'une moyenne simple est nécessaire pour des fins de centrage lorsque le nombre de saisons est pair.) L'étape suivante consiste à calculer le rapport à la moyenne mobile - ie. Les données originales sont divisées par la moyenne mobile dans chaque période - ce qui est réalisé ici dans la colonne E. (On appelle également cette composante du cycle quottrend-cycle, dans la mesure où les effets de tendance et de cycle d'affaires peuvent être considérés comme étant tout ce que Il est évident que les variations mensuelles qui ne sont pas dues à la saisonnalité pourraient être déterminées par de nombreux autres facteurs, mais la moyenne sur douze mois les lisse dans une large mesure. L'indice saisonnier estimé pour chaque saison est calculé en faisant la moyenne d'abord de tous les ratios pour cette saison particulière, qui est effectuée dans les cellules G3-G6 en utilisant une formule AVERAGEIF. Les ratios moyens sont alors redimensionnés de sorte qu'ils totalisent exactement 100 fois le nombre de périodes dans une saison, ou 400 dans ce cas, ce qui est fait dans les cellules H3-H6. Dans la colonne F, les formules VLOOKUP sont utilisées pour insérer la valeur d'indice saisonnier appropriée dans chaque ligne du tableau de données, en fonction du trimestre de l'année où il est représenté. La moyenne mobile centrée et les données désaisonnalisées se terminent comme suit: Notez que la moyenne mobile ressemble généralement à une version plus lisse de la série désaisonnalisée et qu'elle est plus courte aux deux extrémités. Une autre feuille de calcul dans le même fichier Excel montre l'application du modèle de lissage exponentiel linéaire aux données désaisonnalisées, commençant dans la colonne G. Une valeur pour la constante de lissage (alpha) est entrée au-dessus de la colonne de prévision (ici, dans la cellule H9) et Pour plus de commodité, on lui attribue le nom de la plage quotAlpha. quot (Le nom est attribué à l'aide de la commande quotInsertNameCreatequot). Le modèle LES est initialisé en définissant les deux premières prévisions égales à la première valeur réelle de la série désaisonnalisée. La formule utilisée ici pour la prévision des LES est la forme récursive à une seule équation du modèle Brown8217s: Cette formule est entrée dans la cellule correspondant à la troisième période (ici, cellule H15) et copiée à partir de là. On remarque que les prévisions ERP pour la période courante se réfèrent aux deux observations précédentes et aux deux erreurs de prévision précédentes, ainsi qu'à la valeur de alpha. Ainsi, la formule de prévision de la rangée 15 se réfère uniquement aux données qui étaient disponibles dans la rangée 14 et antérieures. (Bien sûr, si on voulait utiliser le lissage exponentiel linéaire plutôt que linéaire, nous pourrions remplacer la formule SES ici.) On pourrait aussi utiliser Holt8217s plutôt que le modèle LES de Brown8217, ce qui nécessiterait deux colonnes supplémentaires de formules pour calculer le niveau et la tendance Qui sont utilisés dans la prévision). Les erreurs sont calculées dans la colonne suivante (ici, colonne J) en soustrayant les prévisions des valeurs réelles. L'erreur quadratique moyenne est calculée comme étant la racine carrée de la variance des erreurs plus le carré de la moyenne. (Cela résulte de l'identité mathématique: VARIANCE MSE (erreurs) (AVERAGE (erreurs)) 2). Dans le calcul de la moyenne et de la variance des erreurs dans cette formule, les deux premières périodes sont exclues parce que le modèle ne commence effectivement à prévoir que La troisième période (ligne 15 sur le tableur). La valeur optimale de alpha peut être trouvée soit en changeant manuellement alpha jusqu'à ce que le RMSE minimum soit trouvé, soit vous pouvez utiliser le quotSolverquot pour effectuer une minimisation exacte. La valeur de alpha que le Solver a trouvée est affichée ici (alpha0.471). C'est généralement une bonne idée de tracer les erreurs du modèle (en unités transformées) et aussi de calculer et de tracer leurs autocorrélations à des décalages de jusqu'à une saison. Voici une courbe chronologique des erreurs (désaisonnalisées): Les autocorrélations d'erreur sont calculées à l'aide de la fonction CORREL () pour calculer les corrélations des erreurs avec elles-mêmes retardées par une ou plusieurs périodes - les détails sont indiqués dans le modèle de feuille de calcul . Voici une trame des autocorrélations des erreurs aux cinq premiers décalages: Les autocorrélations aux intervalles 1 à 3 sont très proches de zéro, mais la pointe au retard 4 (dont la valeur est 0,35) est légèrement gênante - elle suggère que la Le processus d'ajustement saisonnier n'a pas été complètement réussi. Cependant, il n'est en fait que marginalement significatif. 95 pour déterminer si les autocorrélations sont significativement différentes de zéro sont approximativement plus-ou-moins 2SQRT (n-k), où n est la taille de l'échantillon et k est le lag. Ici n est 38 et k varie de 1 à 5, donc la racine carrée de - n-moins-k est d'environ 6 pour tous, et donc les limites pour tester la signification statistique des écarts à partir de zéro sont plus ou moins plus - Ou-moins 26 ou 0,33. Si vous modifiez la valeur de l'alpha à la main dans ce modèle Excel, vous pouvez observer l'effet sur la série temporelle et les diagrammes d'autocorrélation des erreurs, ainsi que sur l'erreur quadratique moyenne qui sera illustrée ci-dessous. Au bas de la feuille de calcul, la formule de prévision est quotbootstrappée à l'avenir en substituant simplement les prévisions aux valeurs réelles au point où les données réelles s'épuisent, c'est-à-dire. Où l'avenir commence. (En d'autres termes, dans chaque cellule où une future valeur de données se produirait, une référence de cellule est insérée qui pointe vers la prévision faite pour cette période.) Toutes les autres formules sont simplement copiées vers le bas depuis le dessus: Notez que les erreurs pour les prévisions de L'avenir sont tous calculés à zéro. Cela ne signifie pas que les erreurs réelles seront nulles, mais plutôt que cela reflète simplement le fait qu'à des fins de prédiction, nous supposons que les données futures seront égales aux prévisions en moyenne. Les prévisions des ERP résultant pour les données désaisonnalisées ressemblent à ceci: Avec cette valeur particulière de alpha, qui est optimale pour les prévisions à une période d'avance, la tendance projetée est légèrement à la hausse, reflétant la tendance locale qui a été observée au cours des 2 dernières années Ou plus. Pour d'autres valeurs d'alpha, une projection de tendance très différente pourrait être obtenue. C'est généralement une bonne idée de voir ce qui arrive à la projection de tendance à long terme lorsque alpha est varié, parce que la valeur qui est la meilleure pour la prévision à court terme ne sera pas nécessairement la meilleure valeur pour prédire l'avenir plus lointain. Par exemple, voici le résultat qui est obtenu si la valeur de alpha est réglée manuellement à 0.25: La tendance à long terme projetée est maintenant négative plutôt que positive Avec une plus petite valeur d'alpha, le modèle place plus de poids sur les données plus anciennes Son estimation du niveau et de la tendance actuels et ses prévisions à long terme reflètent la tendance à la baisse observée au cours des cinq dernières années plutôt que la tendance à la hausse plus récente. Ce diagramme illustre également clairement comment le modèle avec une plus petite valeur d'alpha est plus lent à répondre aux points de quotturning dans les données et tend donc à faire une erreur du même signe pendant de nombreuses périodes d'affilée. Ses erreurs de prévision à 1 pas sont plus élevées en moyenne que celles obtenues avant (RMSE de 34,4 plutôt que 27,4) et fortement positivement autocorrélées. L'autocorrélation lag-1 de 0,56 dépasse de beaucoup la valeur de 0,33 calculée ci-dessus pour un écart statistiquement significatif par rapport à zéro. Comme alternative à la réduction de la valeur de l'alpha afin d'introduire plus de conservatisme dans les prévisions à long terme, un facteur quottrend d'amortissement est parfois ajouté au modèle afin de rendre la tendance projetée aplatir après quelques périodes. La dernière étape de la construction du modèle de prévision consiste à quantifier les prévisions ERP en les multipliant par les indices saisonniers appropriés. Ainsi, les prévisions saisonnières de la colonne I ne sont que le produit des indices saisonniers de la colonne F et des prévisions des prévisions saisonnières corrigées des variations saisonnières dans la colonne H. Il est relativement facile de calculer les intervalles de confiance pour les prévisions à une étape de ce modèle: Calculer le RMSE (erreur quadratique moyenne équivaut à la racine carrée du MSE), puis calculer un intervalle de confiance pour la prévision désaisonnalisée en ajoutant et en soustrayant deux fois le RMSE. (En général, un intervalle de confiance de 95 pour une prévision à une période d'avance est approximativement égal à la prévision de point plus ou moins deux fois l'écart type estimé des erreurs de prévision, en supposant que la distribution des erreurs est approximativement normale et que la taille de l'échantillon Est assez grand, disons, 20 ou plus. Ceci, le RMSE plutôt que l'écart type de l'échantillon des erreurs est la meilleure estimation de l'écart-type des erreurs de prévisions futures car il prend le biais ainsi que les variations aléatoires en compte.) Les limites de confiance Pour les prévisions corrigées des variations saisonnières sont ensuite recalées. Ainsi que les prévisions, en les multipliant par les indices saisonniers appropriés. Dans ce cas, le RMSE est égal à 27,4 et la prévision désaisonnalisée pour la première période future (décembre 93) est de 273,2. De sorte que l'intervalle de confiance corrigé des variations saisonnières est de 273,2-227,4 218,4 à 273,227,4 328,0. Multipliant ces limites par Decembers indice saisonnier de 68,61. Nous obtenons des limites de confiance inférieures et supérieures de 149,8 et 225,0 autour de la prévision ponctuelle de 187,4 déc-93. Les limites de confiance pour les prévisions plus d'une période à venir s'élargiront généralement à mesure que l'horizon de prévision augmente, en raison de l'incertitude concernant le niveau et la tendance ainsi que les facteurs saisonniers, mais il est difficile de les calculer en général par des méthodes analytiques. (La méthode appropriée pour calculer les limites de confiance pour la prévision des ERI est en utilisant la théorie ARIMA, mais l'incertitude dans les indices saisonniers est une autre question.) Si vous voulez un intervalle de confiance réaliste pour une prévision plus d'une période à venir, en prenant toutes les sources de , Il vaut mieux utiliser des méthodes empiriques: par exemple, pour obtenir un intervalle de confiance pour une prévision à deux étapes, vous pouvez créer une autre colonne sur le tableur pour calculer une prévision à deux étapes pour chaque période ( En amorçant la prévision en une étape). Calculez ensuite le RMSE des erreurs de prévision en 2 étapes et utilisez-la comme base pour un intervalle de confiance à 2 étapes. La saisonnalité dans les prévisions La saisonnalité fait référence aux variations de la demande qui se produisent tout au long de l'année dans un cycle annuel régulier. Il est causé par divers facteurs qui peuvent inclure des conditions météorologiques régulières, des événements religieux, des comportements traditionnels et des vacances scolaires. Lorsqu'il existe une saisonnalité marquée ou extrême dans le modèle de la demande, l'efficacité à traiter avec elle aura le plus grand impact sur l'exactitude des prévisions. L'autre aspect de l'équation est qu'il est important de ne pas établir la saisonnalité dans la prévision si elle n'existe pas vraiment, car cela affecterait négativement la précision des prévisions. Ainsi, dans les données où l'existence de la saisonnalité est ambiguë, il est important de prendre la meilleure décision possible quant à l'utilisation ou non de la saisonnalité dans le processus de prévision. Différents tests statistiques peuvent aider à cela. Méthodes de calcul de la saisonnalité La façon la plus simple de tenir compte de la saisonnalité est peut-être de faire en sorte que les prévisions soient identiques à celles de l'année dernière. Ce n'est généralement pas une bonne façon de procéder parce que les ventes des dernières années peut être anormale pour un certain nombre de raisons possibles. Les approches populaires incluent la méthode du pourcentage d'années ou la création de facteurs saisonniers additifs ou d'indices saisonniers multiplicatifs. En termes de calcul des indices saisonniers multiplicatifs, il existe un certain nombre de méthodes différentes. Les approches simples incluent les moyennes saisonnières et la méthode du ratio de la moyenne mobile centrée. D'autres méthodes incluent l'analyse fourier, où diverses ondes sinus et cosinus sont combinées afin de représenter le modèle saisonnier. Méthode moyenne saisonnière C'est une méthode vraiment simple. Tout d'abord, les ventes moyennes sont calculées pour chaque saison, p. mois. Cela donne la moyenne de janvier, la moyenne de février, etc. La moyenne du grand est alors calculée comme la moyenne des moyennes saisonnières. Enfin, les indices saisonniers sont créés en divisant chaque moyenne saisonnière par la moyenne générale. Les indices seront en moyenne 1,00. Cette méthode facile est bonne lorsque l'historique des ventes est raisonnablement stable, c'est-à-dire non sujet à de grands changements dans le niveau sous-jacent de la demande dans le temps. Pour des données qui sont moins stables, la méthode du rapport à la moyenne mobile centrée, décrite ci-dessous, peut être meilleure. Ratio to Centered Moyenne Moyenne Mouvante La méthode du ratio de la moyenne mobile centrée pour le calcul des indices saisonniers multiplicatifs est un calcul simple qui peut facilement être configuré dans Excel ou un autre logiciel. L'exemple suivant pour les données mensuelles: Créez une série pour la moyenne mobile annuelle centrée (CMA), par ex. Commencez par classer la moyenne mensuelle de 2009 par rapport à juin 2009, etc. Calculez une autre série comme le ratio des ventes d'un mois donné à l'AMC à ce mois, c.-à-d. Calculez les indices saisonniers comme la moyenne des rapports par mois saisonnier, par ex. L'indice saisonnier de mars est la moyenne des ratios pour mars-09, mars-10, mars-11, mars-12, mars-13 et mars-14. Ajustez les indices si nécessaire pour faire ajouter les indices saisonniers à 12.00 Comme le centre d'un calendrier de 12 mois n'est pas Juin ou Juillet, mais au milieu des deux, la méthode traditionnelle pour l'étape 1. a impliqué la création de deux séries pour l'AMC. Ainsi, dans une série de mettre la moyenne annuelle contre Juin, dans l'autre contre Juillet. Ensuite, les deux séries CMA ont été moyennés afin de créer quelque chose qui pourrait être dit être vraiment centré. En pratique, cela fait peu de différence avec la plupart des données commerciales. Le seul inconvénient de cette méthode est qu'il ya besoin de données un peu plus historiques que la méthode moyenne saisonnière. Un minimum de trois ans est nécessaire. Nettoyage des données et volatilité des données Le nettoyage des données a une incidence sur le calcul de la saisonnalité en ce sens que les données anormales doivent être exclues du calcul saisonnier. Il est clair que la saisonnalité naturelle ne doit pas être mal interprétée comme des ventes anormales, donc le point est que le nettoyage des données et le calcul saisonnier sont étroitement liés. Au moins deux années de données historiques devraient être mises à la disposition du calcul de la saisonnalité. Étant donné qu'il peut être nécessaire d'exclure certaines données si elles sont anormales, il est habituellement recommandé d'inclure au moins trois ou quatre ans d'information. Le problème avec beaucoup de prévisions d'affaires est qu'il ya souvent une période relativement courte de l'histoire cohérente. Cela rend souvent l'analyse saisonnière quelque chose d'un art plutôt que d'une science exacte. Diverses méthodes peuvent être employées pour réduire l'impact des données volatiles sur le calcul de la saisonnalité pour les prévisions et ainsi améliorer l'exactitude des prévisions. (Par exemple l'utilisation d'indices mensuels pour les données hebdomadaires) le rétrécissement saisonnier (également connu sous le nom d'amortissement saisonnier) le lissage saisonnier (par exemple, en utilisant une période centrée de 3 périodes ou moyenne de 5 périodes) Saisonnalité Dans la prévision hebdomadaire et quotidienne Les problèmes découlant d'une petite quantité d'histoire et de données volatiles deviennent plus importants lorsque l'on passe du calcul de la saisonnalité mensuelle au calcul de la saisonnalité hebdomadaire. Il devient moins probable que les événements annuels se déroulent au cours de la même période, ce qui peut nécessiter le nettoyage de ces instances de l'historique des ventes et l'ajout des futures instances aux prévisions en tant qu'événements prévus. Il ya parfois un cycle supplémentaire de la semaine dans le mois à traiter. Avec la saisonnalité hebdomadaire, une grande partie de la volatilité résiduelle est souvent observée dans les indices résultant du calcul saisonnier à tel point que l'on ne peut pas faire confiance aux indices bruts. Il est donc plus nécessaire de modifier les indices en utilisant les indices saisonniers du groupe, la simplification saisonnière ou le lissage saisonnier. S'il est nécessaire de faire une prévision quotidienne, il est habituellement préférable de calculer d'abord la saisonnalité à l'aide de données hebdomadaires, puis d'approcher le reste de la tâche en utilisant les profils de la semaine pour diviser les semaines en jours.


No comments:

Post a Comment