Erro De Previsao Media Movel




Erro De Previsão Média MóvelMoving Average Forecasting Introducao. Como voce pode imaginar, estamos olhando para algumas das abordagens mais primitivas para a previsao. Mas espero que estas sejam pelo menos uma introducao interessante a algumas das questoes de computacao relacionadas a implementacao de previsoes em planilhas. Neste sentido, vamos continuar a partir do inicio e comecar a trabalhar com previsoes de media movel. Previsoes medias moveis. Todo mundo esta familiarizado com as previsoes de media movel, independentemente de eles acreditam que sao. Todos os estudantes universitarios faze-los o tempo todo. Pense nas suas pontuacoes dos testes num curso em que vai ter quatro testes durante o semestre. Vamos supor que voce tem um 85 em seu primeiro teste. O que voce poderia prever para sua pontuacao do segundo teste O que voce acha que seu professor iria prever para a sua proxima pontuacao de teste O que voce acha que seus amigos podem prever para a sua proxima pontuacao de teste O que voce acha que seus pais podem prever para sua pontuacao proxima teste Independentemente de Todo o blabbing voce pode fazer a seus amigos e pais, eles e seu professor sao muito provaveis ??esperar que voce comece algo na area do 85 que voce comecou apenas. Bem, agora vamos supor que, apesar de sua auto-promocao para seus amigos, voce superestimar-se e figura que voce pode estudar menos para o segundo teste e assim voce comeca um 73. Agora o que sao todos os interessados ??e despreocupado vai Antecipar voce vai chegar em seu terceiro teste Existem duas abordagens muito provavel para que eles desenvolvam uma estimativa, independentemente de se eles vao compartilhar com voce. Eles podem dizer a si mesmos: "Esse cara esta sempre soprando fumaca sobre suas espertinas. Hes que vai obter outro 73 se hes afortunado. Talvez os pais tentem ser mais solidarios e dizer: "Bem, ate agora voce tem obtido um 85 e um 73, entao talvez voce deve figura em obter cerca de um (85 73) / 2 79. Eu nao sei, talvez se voce fez menos Festejando e werent abanando a doninhas em todo o lugar e se voce comecou a fazer muito mais estudando voce poderia obter uma pontuacao mais alta. quot Ambas as estimativas sao, na verdade, media movel previsoes. O primeiro e usar apenas sua pontuacao mais recente para prever o seu desempenho futuro. Isso e chamado de media movel usando um periodo de dados. A segunda tambem e uma media movel, mas usando dois periodos de dados. Vamos supor que todas essas pessoas rebentando em sua grande mente tem tipo de puto voce fora e voce decidir fazer bem no terceiro teste para suas proprias razoes e colocar uma pontuacao mais alta na frente de seus quotalliesquot. Voce toma o teste e sua pontuacao e realmente um 89 Todos, incluindo voce mesmo, esta impressionado. Entao agora voce tem o teste final do semestre chegando e, como de costume, voce sente a necessidade de incitar todo mundo a fazer suas predicoes sobre como voce vai fazer no ultimo teste. Bem, espero que voce veja o padrao. Agora, espero que voce possa ver o padrao. Qual voce acha que e o apito mais preciso enquanto trabalhamos. Agora vamos voltar para a nossa nova empresa de limpeza iniciada por sua meia irma distante chamado Whistle While We Work. Voce tem alguns dados de vendas anteriores representados na secao a seguir de uma planilha. Primeiro, apresentamos os dados para uma previsao media movel de tres periodos. A entrada para a celula C6 deve ser Agora voce pode copiar esta formula de celula para baixo para as outras celulas C7 a C11. Observe como a media se move sobre os dados historicos mais recentes, mas usa exatamente os tres periodos mais recentes disponiveis para cada previsao. Voce tambem deve notar que nos realmente nao precisamos fazer as previsoes para os periodos passados, a fim de desenvolver a nossa previsao mais recente. Isto e definitivamente diferente do modelo de suavizacao exponencial. Ive incluido o quotpast previsoesquot porque vamos usa-los na proxima pagina da web para medir a validade de previsao. Agora eu quero apresentar os resultados analogos para uma previsao media movel de dois periodos. A entrada para a celula C5 deve ser Agora voce pode copiar esta formula de celula para baixo para as outras celulas C6 a C11. Observe como agora apenas as duas mais recentes pecas de dados historicos sao utilizados para cada previsao. Mais uma vez inclui as previsoes quotpast para fins ilustrativos e para uso posterior na validacao de previsao. Algumas outras coisas que sao de importancia notar. Para uma previsao media movel de m-periodo, apenas os m valores de dados mais recentes sao usados ??para fazer a previsao. Nada mais e necessario. Para uma previsao media movel de m-periodo, ao fazer previsoes quotpastquot, observe que a primeira predicao ocorre no periodo m 1. Ambas as questoes serao muito significativas quando desenvolvemos nosso codigo. Desenvolvendo a funcao de media movel. Agora precisamos desenvolver o codigo para a previsao da media movel que pode ser usado de forma mais flexivel. O codigo segue. Observe que as entradas sao para o numero de periodos que voce deseja usar na previsao ea matriz de valores historicos. Voce pode armazena-lo em qualquer pasta de trabalho que voce deseja. Funcao MovingAverage (Historico, NumberOfPeriods) Como Unico Declarar e inicializar variaveis ??Dim Item Como variante Dim Counter Como Inteiro Dim Acumulacao como unico Dim HistoricalSize As Inteiro Inicializando variaveis ??Counter 1 Acumulacao 0 Determinando o tamanho da Historical array HistoricalSize Historical. Count For Counter 1 To NumberOfPeriods Acumulando o numero apropriado dos valores mais recentes anteriormente observados Acumulacao Acumulacao Historico (HistoricalSize - NumberOfPeriods Counter) MovingAverage Acumulacao / NumberOfPeriods O codigo sera explicado na classe. Voce quer posicionar a funcao na planilha para que o resultado da computacao apareca onde ele deve gostar do seguinte. Na pratica, a media movel fornecera uma boa estimativa da media das series temporais se a media for constante ou mudar lentamente. No caso de uma media constante, o maior valor de m dara as melhores estimativas da media subjacente. Um periodo de observacao mais longo medira os efeitos da variabilidade. O objetivo de fornecer um m menor e permitir que a previsao responda a uma mudanca no processo subjacente. Para ilustrar, propomos um conjunto de dados que incorpora mudancas na media subjacente das series temporais. A figura mostra a serie de tempo usada para ilustracao juntamente com a demanda media a partir da qual a serie foi gerada. A media comeca como uma constante em 10. Comecando no tempo 21, ele aumenta em uma unidade em cada periodo ate atingir o valor de 20 no tempo 30. Entao ele se torna constante novamente. Os dados sao simulados adicionando a media um ruido aleatorio de uma distribuicao Normal com media zero e desvio padrao 3. Os resultados da simulacao sao arredondados para o numero inteiro mais proximo. A tabela mostra as observacoes simuladas usadas para o exemplo. Quando usamos a tabela, devemos lembrar que a qualquer momento, apenas os dados passados ??sao conhecidos. As estimativas do parametro do modelo, para tres valores diferentes de m, sao mostradas juntamente com a media das series temporais na figura abaixo. A figura mostra a estimativa media movel da media em cada momento e nao a previsao. As previsoes mudariam as curvas da media movel para a direita por periodos. Uma conclusao e imediatamente aparente a partir da figura. Para as tres estimativas, a media movel esta aquem da tendencia linear, com o atraso aumentando com m. O atraso e a distancia entre o modelo ea estimativa na dimensao temporal. Devido ao atraso, a media movel subestima as observacoes a medida que a media esta aumentando. O vies do estimador e a diferenca em um tempo especifico no valor medio do modelo eo valor medio predito pela media movel. O vies quando a media esta aumentando e negativo. Para uma media decrescente, o vies e positivo. O atraso no tempo e o vies introduzido na estimativa sao funcoes de m. Quanto maior o valor de m. Maior a magnitude do atraso e do vies. Para uma serie de crescimento continuo com tendencia a. Os valores de lag e vies do estimador da media sao dados nas equacoes abaixo. As curvas de exemplo nao correspondem a essas equacoes porque o modelo de exemplo nao esta aumentando continuamente, em vez disso, ele comeca como uma constante, muda para uma tendencia e, em seguida, torna-se constante novamente. Tambem as curvas de exemplo sao afetadas pelo ruido. A previsao media movel de periodos no futuro e representada deslocando as curvas para a direita. O atraso e o vies aumentam proporcionalmente. As equacoes abaixo indicam o atraso e o vies de um periodo de previsao para o futuro quando comparado aos parametros do modelo. Novamente, essas formulas sao para uma serie de tempo com uma tendencia linear constante. Nao devemos nos surpreender com esse resultado. O estimador da media movel baseia-se no pressuposto de uma media constante, eo exemplo tem uma tendencia linear na media durante uma parte do periodo do estudo. Como as series de tempo real raramente obedecerao exatamente aos pressupostos de qualquer modelo, devemos estar preparados para tais resultados. Podemos tambem concluir a partir da figura que a variabilidade do ruido tem o maior efeito para m menor. A estimativa e muito mais volatil para a media movel de 5 do que a media movel de 20. Temos os desejos conflitantes de aumentar m para reduzir o efeito da variabilidade devido ao ruido e diminuir m para tornar a previsao mais sensivel as mudancas Em media O erro e a diferenca entre os dados reais e o valor previsto. Se a serie temporal e verdadeiramente um valor constante, o valor esperado do erro e zero ea variancia do erro e composta por um termo que e uma funcao de e um segundo termo que e a variancia do ruido,. O primeiro termo e a variancia da media estimada com uma amostra de m observacoes, assumindo que os dados provem de uma populacao com media constante. Este termo e minimizado fazendo-se o maior possivel. Um grande m faz com que a previsao nao responda a uma mudanca nas series temporais subjacentes. Para tornar a previsao responsiva as mudancas, queremos que m seja o menor possivel (1), mas isso aumenta a variancia do erro. A previsao pratica requer um valor intermediario. Previsao com o Excel O suplemento de Previsao implementa as formulas de media movel. O exemplo abaixo mostra a analise fornecida pelo add-in para os dados da amostra na coluna B. As 10 primeiras observacoes sao indexadas -9 a 0. Em comparacao com a tabela acima, os indices de periodo sao deslocados por -10. As primeiras dez observacoes fornecem os valores de inicializacao para a estimativa e sao usados ??para calcular a media movel para o periodo 0. A coluna MA (10) (C) mostra as medias moveis calculadas. O parametro de media movel m esta na celula C3. A coluna Fore (1) (D) mostra uma previsao para um periodo no futuro. O intervalo de previsao esta na celula D3. Quando o intervalo de previsao e alterado para um numero maior, os numeros na coluna Fore sao deslocados para baixo. A coluna Err (1) (E) mostra a diferenca entre a observacao e a previsao. Por exemplo, a observacao no tempo 1 e 6. O valor previsto a partir da media movel no tempo 0 e 11.1. O erro e entao -5.1. O desvio padrao eo Desvio Medio Medio (MAD) sao calculados nas celulas E6 e E7 respectivamente.8.4 Modelos de media movel Em vez de usar valores passados ??da variavel de previsao em uma regressao, um modelo de media movel usa erros de previsao passados ??em um modelo de regressao . Y e teta teta e dots theta e, onde et e ruido branco. Referimo-nos a isto como um modelo MA (q). E claro que nao observamos os valores de et, entao nao e realmente regressao no sentido usual. Observe que cada valor de yt pode ser considerado como uma media movel ponderada dos ultimos erros de previsao. No entanto, os modelos de media movel nao devem ser confundidos com o alisamento medio movel discutido no Capitulo 6. Um modelo de media movel e usado para prever valores futuros, enquanto o alisamento medio movel e usado para estimar o ciclo tendencial de valores passados. Figura 8.6: Dois exemplos de dados de modelos de media movel com diferentes parametros. Esquerda: MA (1) com y t 20e t 0,8e t-1. Direita: MA (2) com y t e t - e t-1 0,8e t-2. Em ambos os casos, e t e normalmente distribuido ruido branco com media zero e variancia um. A Figura 8.6 mostra alguns dados de um modelo MA (1) e um modelo MA (2). Alterando os parametros theta1, dots, thetaq resulta em diferentes padroes de series temporais. Tal como acontece com modelos autorregressivos, a variancia do termo de erro e so mudara a escala da serie, nao os padroes. E possivel escrever qualquer modelo AR (p) estacionario como um modelo MA (infty). Por exemplo, usando a substituicao repetida, podemos demonstrar isso para um modelo AR (1): begin yt amp phi1y et amp phi1 (phi1y e) amp phi12y phi1 e amp phi13y phi12e phi1 e amptext final Fornecido -1 lt phi1 lt 1, o valor de phi1k sera menor a medida que k for maior. Assim, eventualmente, obtemos yt et phi1 e phi12 e phi13 e cdots, um processo MA (infty). O resultado inverso e valido se impomos algumas restricoes nos parametros MA. Em seguida, o modelo MA e chamado invertible. Ou seja, que podemos escrever qualquer processo de MA (q) invertivel como um processo AR (infty). Modelos Invertiveis nao sao simplesmente para nos permitir converter de modelos MA para modelos AR. Eles tambem tem algumas propriedades matematicas que torna-los mais faceis de usar na pratica. As restricoes de invertibilidade sao semelhantes as restricoes de estacionaridade. Para um modelo MA (1): -1lttheta1lt1. Para um modelo MA (2): -1lttheta2lt1, theta2theta1 gt-1, theta1-theta2 lt 1. Condicoes mais complicadas mantem-se para qge3. Novamente, R ira cuidar dessas restricoes ao estimar os modelos. Dados suaves removem variacoes aleatorias e mostram tendencias e componentes ciclicos Inerente na coleta de dados ao longo do tempo e alguma forma de variacao aleatoria. Existem metodos para reduzir o cancelamento do efeito devido a variacao aleatoria. Uma tecnica frequentemente usada na industria e suavizar. Essa tecnica, quando corretamente aplicada, revela mais claramente a tendencia subjacente, os componentes sazonais e ciclicos. Existem dois grupos distintos de metodos de alisamento Metodos de media Metodos de suavizacao exponencial Tomar medias e a maneira mais simples de suavizar os dados Vamos primeiro investigar alguns metodos de media, como a media simples de todos os dados passados. Um gerente de um armazem quer saber o quanto um fornecedor tipico oferece em unidades de 1000 dolares. Ele / ela toma uma amostra de 12 fornecedores, aleatoriamente, obtendo os seguintes resultados: A media computada ou media dos dados 10. O gerente decide usar isto como a estimativa para despesa de um fornecedor tipico. Esta e uma boa ou ma estimativa O erro quadratico medio e uma maneira de julgar o quao bom e um modelo Vamos calcular o erro quadratico medio. O valor verdadeiro do erro gasto menos o valor estimado. O erro ao quadrado e o erro acima, ao quadrado. O SSE e a soma dos erros quadrados. O MSE e a media dos erros quadrados. Resultados do MSE por exemplo Os resultados sao: Erro e esquadrado Erros A estimativa 10 A questao surge: podemos usar a media para prever a renda se suspeitarmos de uma tendencia? Um olhar para o grafico abaixo mostra claramente que nao devemos fazer isso. A media pondera todas as observacoes passadas igualmente Em resumo, afirmamos que A media simples ou media de todas as observacoes passadas e apenas uma estimativa util para previsao quando nao ha tendencias. Se houver tendencias, use estimativas diferentes que levem em conta a tendencia. A media pesa todas as observacoes passadas igualmente. Por exemplo, a media dos valores 3, 4, 5 e 4. Sabemos, e claro, que uma media e calculada adicionando todos os valores e dividindo a soma pelo numero de valores. Outra forma de calcular a media e adicionando cada valor dividido pelo numero de valores, ou 3/3 4/3 5/3 1 1.3333 1.6667 4. O multiplicador 1/3 e chamado de peso. Em geral: barra fracao soma esquerda (fratura direita) x1 esquerda (fratura direita) x2,. ,, Esquerda (frac direito) xn. Os modelos de media movel e de suavizacao exponencial Como um primeiro passo para ir alem dos modelos de media, modelos de tendencia aleatoria e modelos de tendencia linear, padroes e tendencias nao sazonais Pode ser extrapolada usando um modelo de media movel ou suavizacao. A suposicao basica por tras dos modelos de media e suavizacao e que a serie temporal e localmente estacionaria com uma media lentamente variavel. Assim, tomamos uma media movel (local) para estimar o valor atual da media e entao usamos isso como a previsao para o futuro proximo. Isto pode ser considerado como um compromisso entre o modelo medio e o modelo aleatorio-andar-sem-deriva. A mesma estrategia pode ser usada para estimar e extrapolar uma tendencia local. Uma media movel e muitas vezes chamado de uma versao quotsmoothedquot da serie original, porque a media de curto prazo tem o efeito de suavizar os solavancos na serie original. Ajustando o grau de suavizacao (a largura da media movel), podemos esperar encontrar algum tipo de equilibrio otimo entre o desempenho dos modelos de caminhada media e aleatoria. O tipo mais simples de modelo de media e o. Media Movel Simples (igualmente ponderada): A previsao para o valor de Y no tempo t1 que e feita no tempo t e igual a media simples das observacoes m mais recentes: (Aqui e em outro lugar usarei o simbolo 8220Y-hat8221 para ficar Para uma previsao da serie temporal Y feita o mais cedo possivel antes de um determinado modelo). Esta media e centrada no periodo t (m1) / 2, o que implica que a estimativa da media local tende a ficar para tras Valor real da media local em cerca de (m1) / 2 periodos. Dessa forma, dizemos que a idade media dos dados na media movel simples e (m1) / 2 relativa ao periodo para o qual a previsao e calculada: e a quantidade de tempo em que as previsoes tenderao a ficar para tras dos pontos de inflexao na dados. Por exemplo, se voce estiver calculando a media dos ultimos 5 valores, as previsoes serao cerca de 3 periodos atrasados ??em responder a pontos de viragem. Observe que se m1, o modelo de media movel simples (SMA) e equivalente ao modelo de caminhada aleatoria (sem crescimento). Se m e muito grande (comparavel ao comprimento do periodo de estimacao), o modelo SMA e equivalente ao modelo medio. Como com qualquer parametro de um modelo de previsao, e costume ajustar o valor de k para obter o melhor quotfitquot aos dados, isto e, os erros de previsao mais pequenos em media. Aqui esta um exemplo de uma serie que parece apresentar flutuacoes aleatorias em torno de uma media de variacao lenta. Primeiro, vamos tentar ajusta-lo com um modelo de caminhada aleatoria, o que equivale a uma media movel simples de um termo: O modelo de caminhada aleatoria responde muito rapidamente as mudancas na serie, mas ao faze-lo ele escolhe grande parte do quotnoise no Dados (as flutuacoes aleatorias), bem como o quotsignalquot (a media local). Se, em vez disso, tentarmos uma media movel simples de 5 termos, obtemos um conjunto de previsoes mais suaves: A media movel simples de 5 periodos produz erros significativamente menores do que o modelo de caminhada aleatoria neste caso. A idade media dos dados nessa previsao e de 3 ((51) / 2), de modo que ela tende a ficar atras de pontos de viragem em cerca de tres periodos. (Por exemplo, uma desaceleracao parece ter ocorrido no periodo 21, mas as previsoes nao virar ate varios periodos mais tarde.) Observe que as previsoes de longo prazo do modelo SMA sao uma linha reta horizontal, assim como na caminhada aleatoria modelo. Assim, o modelo SMA assume que nao ha tendencia nos dados. No entanto, enquanto as previsoes do modelo de caminhada aleatoria sao simplesmente iguais ao ultimo valor observado, as previsoes do modelo SMA sao iguais a uma media ponderada de valores recentes. Os limites de confianca calculados pela Statgraphics para as previsoes de longo prazo da media movel simples nao se alargam a medida que o horizonte de previsao aumenta. Isto obviamente nao e correto Infelizmente, nao existe uma teoria estatistica subjacente que nos diga como os intervalos de confianca devem se alargar para este modelo. No entanto, nao e muito dificil calcular estimativas empiricas dos limites de confianca para as previsoes de longo prazo. Por exemplo, voce poderia configurar uma planilha na qual o modelo SMA seria usado para prever 2 passos a frente, 3 passos a frente, etc. dentro da amostra de dados historicos. Voce poderia entao calcular os desvios padrao da amostra dos erros em cada horizonte de previsao e, em seguida, construir intervalos de confianca para previsoes de longo prazo adicionando e subtraindo multiplos do desvio padrao apropriado. Se tentarmos uma media movel simples de 9 termos, obtemos previsoes ainda mais suaves e mais um efeito retardado: A idade media e agora de 5 periodos ((91) / 2). Se tomarmos uma media movel de 19 periodos, a idade media aumenta para 10: Observe que, na verdade, as previsoes estao agora atrasadas por pontos de inflexao em cerca de 10 periodos. Qual a quantidade de suavizacao e melhor para esta serie Aqui esta uma tabela que compara suas estatisticas de erro, incluindo tambem uma media de 3-termo: Modelo C, a media movel de 5-termo, rende o menor valor de RMSE por uma pequena margem sobre o 3 E medias de 9-termo, e suas outras estatisticas sao quase identicas. Assim, entre os modelos com estatisticas de erro muito semelhantes, podemos escolher se prefeririamos um pouco mais de resposta ou um pouco mais de suavidade nas previsoes. O modelo de media movel simples descrito acima tem a propriedade indesejavel de tratar as ultimas k observacoes igualmente e completamente ignora todas as observacoes anteriores. (Voltar ao inicio da pagina.) Marrons Simples Exponencial Suavizacao (exponencialmente ponderada media movel) Intuitivamente, os dados passados ??devem ser descontados de forma mais gradual - por exemplo, a observacao mais recente deve ter um pouco mais de peso que a segunda mais recente, ea segunda mais recente deve ter um pouco mais de peso que a 3? mais recente, e em breve. O modelo de suavizacao exponencial simples (SES) realiza isso. Vamos 945 denotar uma constante quotsmoothingquot (um numero entre 0 e 1). Uma maneira de escrever o modelo e definir uma serie L que represente o nivel atual (isto e, o valor medio local) da serie, conforme estimado a partir dos dados ate o presente. O valor de L no tempo t e calculado recursivamente a partir de seu proprio valor anterior como este: Assim, o valor suavizado atual e uma interpolacao entre o valor suavizado anterior e a observacao atual, onde 945 controla a proximidade do valor interpolado para o mais recente observacao. A previsao para o proximo periodo e simplesmente o valor suavizado atual: Equivalentemente, podemos expressar a proxima previsao diretamente em termos de previsoes anteriores e observacoes anteriores, em qualquer uma das seguintes versoes equivalentes. Na primeira versao, a previsao e uma interpolacao entre previsao anterior e observacao anterior: Na segunda versao, a proxima previsao e obtida ajustando a previsao anterior na direcao do erro anterior por uma fracao 945. e o erro feito em Tempo t. Na terceira versao, a previsao e uma media movel exponencialmente ponderada (ou seja, descontada) com o fator de desconto 1- 945: A versao de interpolacao da formula de previsao e a mais simples de usar se voce estiver implementando o modelo em uma planilha: Celula unica e contem referencias de celulas que apontam para a previsao anterior, a observacao anterior ea celula onde o valor de 945 e armazenado. Observe que, se 945 1, o modelo SES e equivalente a um modelo de caminhada aleatoria (sem crescimento). Se 945 0, o modelo SES e equivalente ao modelo medio, assumindo que o primeiro valor suavizado e definido igual a media. A idade media dos dados na previsao de suavizacao exponencial simples e de 1/945 em relacao ao periodo para o qual a previsao e calculada. (Isso nao e suposto ser obvio, mas pode ser facilmente demonstrado atraves da avaliacao de uma serie infinita.) Portanto, a previsao media movel simples tende a ficar para tras de pontos de viragem em cerca de 1/945 periodos. Por exemplo, quando 945 0,5 o atraso e 2 periodos quando 945 0,2 o atraso e de 5 periodos quando 945 0,1 o atraso e de 10 periodos, e assim por diante. Para uma dada idade media (isto e, a quantidade de atraso), a previsao de suavizacao exponencial simples (SES) e um pouco superior a previsao de media movel simples (SMA) porque coloca relativamente mais peso na observacao mais recente - i. e. E ligeiramente mais quotresponsivequot as mudancas que ocorrem no passado recente. Por exemplo, um modelo SMA com 9 termos e um modelo SES com 945 0,2 tem uma idade media de 5 para os dados nas suas previsoes, mas o modelo SES coloca mais peso nos ultimos 3 valores do que o modelo SMA e no modelo SMA. Outra vantagem importante do modelo SES sobre o modelo SMA e que o modelo SES usa um parametro de suavizacao que e continuamente variavel, de modo que pode ser facilmente otimizado Utilizando um algoritmo quotsolverquot para minimizar o erro quadratico medio. O valor optimo de 945 no modelo SES para esta serie revela-se 0.2961, como mostrado aqui: A idade media dos dados nesta previsao e de 1 / 0.2961 3.4 periodos, que e semelhante ao de um 6-termo simples de movimento media. As previsoes a longo prazo do modelo SES sao uma linha reta horizontal. Como no modelo SMA eo modelo de caminhada aleatoria sem crescimento. No entanto, note que os intervalos de confianca calculados por Statgraphics agora divergem de uma forma razoavelmente aparente, e que eles sao substancialmente mais estreitos do que os intervalos de confianca para o modelo de caminhada aleatoria. O modelo SES assume que a serie e um tanto mais previsivel do que o modelo de caminhada aleatoria. Um modelo SES e realmente um caso especial de um modelo ARIMA. De modo que a teoria estatistica dos modelos ARIMA fornece uma base solida para o calculo de intervalos de confianca para o modelo SES. Em particular, um modelo SES e um modelo ARIMA com uma diferenca nao sazonal, um termo MA (1) e nenhum termo constante. Tambem conhecido como um modelo quimetrico ARIMA (0,1,1) sem constantequot. O coeficiente MA (1) no modelo ARIMA corresponde a quantidade 1-945 no modelo SES. Por exemplo, se voce ajustar um modelo ARIMA (0,1,1) sem constante a serie aqui analisada, o coeficiente MA estimado (1) resulta ser 0,7029, que e quase exatamente um menos 0,2961. E possivel adicionar a hipotese de uma tendencia linear constante nao-zero para um modelo SES. Para isso, basta especificar um modelo ARIMA com uma diferenca nao sazonal e um termo MA (1) com uma constante, ou seja, um modelo ARIMA (0,1,1) com constante. As previsoes a longo prazo terao entao uma tendencia que e igual a tendencia media observada ao longo de todo o periodo de estimacao. Nao e possivel fazer isso em conjunto com o ajuste sazonal, porque as opcoes de ajuste sazonal sao desativadas quando o tipo de modelo e definido como ARIMA. No entanto, voce pode adicionar uma tendencia exponencial de longo prazo constante a um modelo de suavizacao exponencial simples (com ou sem ajuste sazonal) usando a opcao de ajuste de inflacao no procedimento de Previsao. A taxa adequada de inflacao (crescimento percentual) por periodo pode ser estimada como o coeficiente de declive num modelo de tendencia linear ajustado aos dados em conjuncao com uma transformacao de logaritmo natural, ou pode basear-se noutras informacoes independentes relativas as perspectivas de crescimento a longo prazo . (Retornar ao inicio da pagina.) Browns Linear (ie double) Suavizacao exponencial Os modelos SMA e SES assumem que nao ha tendencia de qualquer tipo nos dados (o que geralmente e OK ou pelo menos nao muito ruim para 1- Antecipadamente quando os dados sao relativamente ruidosos) e podem ser modificados para incorporar uma tendencia linear constante como mostrado acima. O que acontece com as tendencias a curto prazo Se uma serie exibe uma taxa variavel de crescimento ou um padrao ciclico que se destaca claramente contra o ruido, e se houver uma necessidade de prever mais de um periodo a frente, a estimativa de uma tendencia local tambem pode ser um problema. O modelo de suavizacao exponencial simples pode ser generalizado para obter um modelo de suavizacao exponencial linear (LES) que calcula estimativas locais de nivel e tendencia. O modelo de tendencia de variacao de tempo mais simples e o modelo de alisamento exponencial linear de Browns, que usa duas series suavizadas diferentes que sao centradas em diferentes pontos no tempo. A formula de previsao e baseada em uma extrapolacao de uma linha atraves dos dois centros. (Uma versao mais sofisticada deste modelo, Holt8217s, e discutida abaixo). A forma algebrica do modelo de suavizacao exponencial linear de Brown8217s, como a do modelo de suavizacao exponencial simples, pode ser expressa em um numero de formas diferentes mas equivalentes. A forma quotstandard deste modelo e usualmente expressa da seguinte maneira: Seja S a serie de suavizacao simples obtida pela aplicacao de suavizacao exponencial simples a serie Y. Ou seja, o valor de S no periodo t e dado por: (Lembre-se que, sob simples Exponencial, esta seria a previsao para Y no periodo t1.) Entao deixe Squot denotar a serie duplamente-alisada obtida aplicando a suavizacao exponencial simples (usando o mesmo 945) a serie S: Finalmente, a previsao para Y tk. Para qualquer kgt1, e dada por: Isto produz e 1 0 (isto e, enganar um pouco e deixar a primeira previsao igual a primeira observacao real) e e 2 Y 2 8211 Y 1. Apos o que as previsoes sao geradas usando a equacao acima. Isto produz os mesmos valores ajustados que a formula baseada em S e S se estes ultimos foram iniciados utilizando S 1 S 1 Y 1. Esta versao do modelo e usada na proxima pagina que ilustra uma combinacao de suavizacao exponencial com ajuste sazonal. Holt8217s Linear Exponential Smoothing Brown8217s O modelo LES calcula estimativas locais de nivel e tendencia ao suavizar os dados recentes, mas o fato de que ele faz isso com um unico parametro de suavizacao coloca uma restricao nos padroes de dados que e capaz de ajustar: o nivel ea tendencia Nao sao permitidos variar em taxas independentes. Holt8217s modelo LES aborda esta questao, incluindo duas constantes de alisamento, um para o nivel e um para a tendencia. Em qualquer momento t, como no modelo Brown8217s, existe uma estimativa L t do nivel local e uma estimativa T t da tendencia local. Aqui eles sao calculados recursivamente a partir do valor de Y observado no tempo t e as estimativas anteriores do nivel e tendencia por duas equacoes que aplicam alisamento exponencial para eles separadamente. Se o nivel estimado ea tendencia no tempo t-1 sao L t82091 e T t-1. Respectivamente, entao a previsao para Y tshy que teria sido feita no tempo t-1 e igual a L t-1 T t-1. Quando o valor real e observado, a estimativa atualizada do nivel e computada recursivamente pela interpolacao entre Y tshy e sua previsao, L t-1 T t-1, usando pesos de 945 e 1-945. A mudanca no nivel estimado, Nomeadamente L t 8209 L t82091. Pode ser interpretado como uma medida ruidosa da tendencia no tempo t. A estimativa actualizada da tendencia e entao calculada recursivamente pela interpolacao entre L t 8209 L t82091 e a estimativa anterior da tendencia, T t-1. Usando pesos de 946 e 1-946: A interpretacao da constante de alisamento de tendencia 946 e analoga a da constante de alisamento de nivel 945. Modelos com valores pequenos de 946 assumem que a tendencia muda apenas muito lentamente ao longo do tempo, enquanto modelos com Maior 946 supor que esta mudando mais rapidamente. Um modelo com um 946 grande acredita que o futuro distante e muito incerto, porque os erros na tendencia-estimativa tornam-se completamente importantes ao prever mais de um periodo adiante. As constantes de suavizacao 945 e 946 podem ser estimadas da maneira usual, minimizando o erro quadratico medio das previsoes de 1 passo a frente. Quando isso e feito em Statgraphics, as estimativas se tornam 945 0,3048 e 946 0,008. O valor muito pequeno de 946 significa que o modelo assume muito pouca mudanca na tendencia de um periodo para o outro, entao basicamente este modelo esta tentando estimar uma tendencia de longo prazo. Por analogia com a nocao de idade media dos dados que e usada na estimativa do nivel local da serie, a idade media dos dados que e usada na estimativa da tendencia local e proporcional a 1/946, embora nao exatamente igual a isto. Neste caso, isto e 1 / 0.006 125. Este numero e muito preciso, na medida em que a precisao da estimativa de 946 e realmente de 3 casas decimais, mas e da mesma ordem geral de magnitude que o tamanho da amostra de 100 , Assim que este modelo esta calculando a media sobre bastante muita historia em estimar a tendencia. O grafico de previsao abaixo mostra que o modelo LES estima uma tendencia local ligeiramente maior no final da serie do que a tendencia constante estimada no modelo SEStrend. Alem disso, o valor estimado de 945 e quase identico ao obtido pelo ajuste do modelo SES com ou sem tendencia, de modo que este e quase o mesmo modelo. Agora, eles parecem previsoes razoaveis ??para um modelo que e suposto estar estimando uma tendencia local Se voce 8220eyeball8221 esse enredo, parece que a tendencia local virou para baixo no final da serie O que aconteceu Os parametros deste modelo Foram calculados minimizando o erro quadratico das previsoes de um passo a frente, e nao as previsoes a mais longo prazo, caso em que a tendencia nao faz muita diferenca. Se tudo o que voce esta olhando sao 1-passo-frente erros, voce nao esta vendo a imagem maior de tendencias sobre (digamos) 10 ou 20 periodos. A fim de obter este modelo mais em sintonia com a nossa extrapolacao do globo ocular dos dados, podemos ajustar manualmente a tendencia de suavizacao constante para que ele usa uma linha de base mais curto para a estimativa de tendencia. Por exemplo, se escolhemos definir 946 0,1, entao a idade media dos dados usados ??na estimativa da tendencia local e de 10 periodos, o que significa que estamos fazendo uma media da tendencia ao longo dos ultimos 20 periodos aproximadamente. Here8217s o que o lote de previsao parece se ajustarmos 946 0.1 mantendo 945 0.3. Isso parece intuitivamente razoavel para esta serie, embora seja provavelmente perigoso para extrapolar esta tendencia mais de 10 periodos no futuro. E sobre as estatisticas de erro Aqui esta uma comparacao de modelos para os dois modelos mostrados acima, bem como tres modelos SES. O valor otimo de 945 para o modelo SES e de aproximadamente 0,3, mas resultados semelhantes (com ligeiramente mais ou menos responsividade, respectivamente) sao obtidos com 0,5 e 0,2. (A) Holts linear exp. Alisamento com alfa 0,3048 e beta 0,008 (B) Holts linear exp. Alisamento com alfa 0,3 e beta 0,1 (C) Alisamento exponencial simples com alfa 0,5 (D) Alisamento exponencial simples com alfa 0,3 (E) Alisamento exponencial simples com alfa 0,2 Suas estatisticas sao quase identicas, entao realmente nao podemos fazer a escolha com base De erros de previsao de 1 passo a frente dentro da amostra de dados. Temos de recorrer a outras consideracoes. Se acreditarmos firmemente que faz sentido basear a estimativa de tendencia atual sobre o que aconteceu nos ultimos 20 periodos, podemos fazer um caso para o modelo LES com 945 0,3 e 946 0,1. Se quisermos ser agnosticos quanto a existencia de uma tendencia local, entao um dos modelos SES pode ser mais facil de explicar e tambem fornecera mais previsoes de medio-caminho para os proximos 5 ou 10 periodos. Evidencias empiricas sugerem que, se os dados ja tiverem sido ajustados (se necessario) para a inflacao, entao pode ser imprudente extrapolar os resultados lineares de curto prazo Muito para o futuro. As tendencias evidentes hoje podem afrouxar no futuro devido as causas variadas tais como a obsolescencia do produto, a competicao aumentada, e os abrandamentos ciclicos ou as ascensoes em uma industria. Por esta razao, a suavizacao exponencial simples geralmente desempenha melhor fora da amostra do que poderia ser esperado, apesar da sua extrapolacao de tendencia horizontal quotnaivequot. Modificacoes de tendencia amortecida do modelo de suavizacao exponencial linear tambem sao frequentemente usadas na pratica para introduzir uma nota de conservadorismo em suas projecoes de tendencia. O modelo LES com tendencia a amortecimento pode ser implementado como um caso especial de um modelo ARIMA, em particular, um modelo ARIMA (1,1,2). E possivel calcular intervalos de confianca em torno de previsoes de longo prazo produzidas por modelos exponenciais de suavizacao, considerando-os como casos especiais de modelos ARIMA. A largura dos intervalos de confianca depende de (i) o erro RMS do modelo, (ii) o tipo de suavizacao (simples ou linear) (iii) o valor (S) da (s) constante (s) de suavizacao e (iv) o numero de periodos que voce esta prevendo. Em geral, os intervalos se espalham mais rapidamente a medida que o 945 se torna maior no modelo SES e eles se espalham muito mais rapido quando se usa linear ao inves de alisamento simples. Este topico e discutido mais adiante na secao de modelos ARIMA das notas. (Voltar ao topo da pagina.)