Estimativa de escoamento em captação urbana utilizando modelos de rede neural artificial

Mahsa Bakhshaei

mahsabakhsha@gmail.com

Islamic Azad University, Tehran, Iran

Hassan Ahmadi

h-ahmad@srbiau.ac.ir

Islamic Azad University, Tehran, Iran

Baharak Motamedvaziri

b-bmvazir@gmail.com

Islamic Azad University, Tehran, Iran

Payam Najafi

payam.najaf@gmail.com

Islamic Azad University, Isfahan, Iran

RESUMO

Muitos tipos de modelos físicos foram desenvolvidos para estimativa de escoamento superficial com resultados bem sucedidos. Entretanto, a estimativa precisa do escoamento continua sendo um problema desafiador devido à falta de dados de campo e à complexidade de seu processo hidrológico. Neste artigo, um método de aprendizagem de máquina para a estimativa de escoamento é apresentado como uma abordagem alternativa ao modelo físico. Vários tipos de variáveis de entrada e arquiteturas de Rede Neural Artificial (RNA) foram examinados neste estudo. Os resultados mostraram que uma rede de duas camadas com a função de ativação de tansig e o algoritmo de aprendizagem Levenberg-Marquardt tinha o melhor desempenho. Para esta arquitetura, o vetor de entrada mais eficaz consiste em um perímetro de captação, comprimento do canal, inclinação, coeficiente de escoamento e intensidade da chuva. No entanto, os resultados da análise multivariada de variância indicaram o efeito de interação significativo dos dados de entrada e da arquitetura RNA. Assim, para criar um modelo RNA adequado para a estimativa de escoamento superficial, é necessária uma determinação sistemática do vetor de entrada.

Palavras-chave: Captação urbana, estimativa de escoamento superficial, rede neural artificial, aprendizagem de máquinas.

INTRODUÇÃO

A gestão de águas pluviais e escoamento superficial são questões comuns na maioria das bacias hidrográficas urbanas (Whitford et al., 2001; Zhang et al., 2012; Kumar et al., 2013). O processo hidrológico em bacias hidrográficas urbanas é complicado (Freni et al., 2009) e envolve uma rede complexa de superfícies impermeáveis e vegetativas, canais, esgotos, tubulações, etc. (Whitford et al., 2001; Zhang et al., 2012; Kumar et al., 2013). A maioria das bacias urbanas é ineficaz para instrumentos de medição hidrométrica.

A parte fundamental de todos os modelos de gestão do escoamento de águas pluviais é a estimativa precisa do escoamento superficial (Chen; Adams, 2007). A previsão de escoamento é essencial para o planejamento, projeto e operação de projetos de recursos hídricos (Reddy et al., 2008). Durante as últimas décadas, a estimativa de escoamento superficial foi muito beneficiada pela modelagem conceitual, que mantém algumas das leis físicas em suas formulações matemáticas. Entretanto, estes modelos dependem de uma grande quantidade de dados de entrada (Elshorbagy et al., 2000). Portanto, a produção a partir deles é cara (Elshorbagy et al., 2000), e existe uma grande incerteza nos resultados (Freni et al., 2009).

Em casos de dados limitados e complexidade de processos, o uso de técnicas de aprendizagem de máquinas é uma abordagem adequada (Chae et al., 2016). A rede neural artificial (RNA) é um subgrupo de aprendizagem de máquinas que tem recebido atenção significativa no contexto de problemas de estimativa (Khayatian; Sarto, 2016). Nas últimas décadas, os modelos de RNA tornaram-se muito utilizados nas áreas de hidrologia, recursos hídricos e gestão de bacias hidrográficas (Chavoshi et al., 2013; Orimi et al., 2015).

Elshorbagy et al. (2000), por exemplo, estudaram a aplicabilidade e a utilidade dos modelos RNA na previsão de escoamento superficial. Ao desenvolver vários modelos baseados em RNA no Rio Vermelho, Canadá, e comparando-os com técnicas tradicionais, concluíram que os modelos baseados em RNA produzem melhores resultados e têm melhor capacidade de previsão. Da mesma forma, Ahmad e Simonovic (2001) utilizaram um RNA de alimentação com um algoritmo de retropropagação para prever o fluxo de pico, o tempo e a forma de um hidrográfico de escoamento no Rio Vermelho, em Manitoba, Canadá.

Para analisar o desempenho dos modelos de RNA para previsão de fluxo diário de curto prazo, Pulido-Calvo e Portela (2007) aplicaram uma rede neural feedforward em grandes bacias hidrográficas portuguesas. Eles alegaram que os modelos de RNA podem prever o fluxo da bacia hidrográfica utilizando dados insuficientes. Reddy et al. (2008) modelaram o processo de escoamento da chuva usando modelos empíricos e o compararam com as RNAs. Eles utilizaram os dados sobre a Bacia Godavari da Índia e exploraram a melhoria do desempenho da RNA, combinando-a com métodos empíricos. Lee et al. (2010) construíram dois tipos de modelos de RNA para a previsão da utilização do escoamento regional e compararam sua confiabilidade. Uma rede com uma função de base radial usando a função Gaussiana mostrou melhor estabilidade do que um modelo de rede neural usando retropropagação.

Chiang et al. (2004) estudaram a estabilidade e a efetividade de dois tipos de RNA: alimentação estática para frente e alimentação dinâmica para frente. Eles aplicaram várias arquiteturas de RNA ao rio Lan-Yang, Taiwan, e mostraram que tanto as redes neurais estáticas quanto as dinâmicas produziam resultados razoáveis. Entretanto, o tipo de feedforward estático mostrou melhor desempenho do que o tipo de feedforward dinâmico caso os dados fossem suficientes. No caso de dados de treinamento insuficientes, o tipo RNA de feedforward dinâmico demonstrou um desempenho significativamente melhor. Enquanto isso, Chavoshi et al. (2013) aplicaram a RNA para a estimativa de inundações na faixa sul da bacia hidrográfica do Mar Cáspio. Eles compararam seus resultados com um modelo de regressão múltipla e mostraram que o modelo de RNA é uma ferramenta poderosa para resolver a complexidade do problema hidrológico. Entre os diferentes tipos de arquiteturas RNA, a propagação de multicamadas com o Levenberg-Marquardt resultou no melhor desempenho.

Uma ampla revisão da literatura sobre a gestão de recursos hídricos e hidrologia indica os seguintes pontos: (1) vários estudos foram realizados para investigar a aplicabilidade das RNAs na previsão de escoamento em diferentes bacias hidrográficas e para compará-las com modelos físicos tradicionais. A maioria destes estudos mostrou o desempenho aceitável dos modelos de RNA, particularmente em bacias hidrográficas com dados insuficientes; (2) Além disso, explorar a arquitetura de RNA com o melhor desempenho tem sido o foco dos pesquisadores. Assim, várias estruturas de RNA foram projetadas e testadas através da mudança dos componentes da rede neural, incluindo vários neurônios e camadas, funções transformadoras, métodos de aprendizagem e tipos de rede. Embora uma rede de perceptrons feedforward tenha sido recomendada por muitos pesquisadores, não há consenso sobre a estrutura da rede; (3) poucos trabalhos têm se concentrado no estudo do efeito do vetor de entrada no desempenho do modelo de RNA para estimativa de escoamento superficial; (4) além disso, poucos estudos têm se concentrado na aplicação de RNA em bacias hidrográficas urbanas. Particularmente, devido à complexidade do processo hidrológico em bacias hidrográficas urbanas e a falta de dados de campo (Bertrand-Krajewski 2007), esta área de pesquisa requer mais atenção.

O objetivo deste estudo é, portanto, determinar as arquiteturas de RNA que resultam no desempenho mais preciso para a estimativa da bacia de captação urbana. Para este fim, um total de 24 modelos de RNA foram propostos e testados. Os desempenhos dos modelos propostos foram sistematicamente comparados. Além disso, este estudo serviu para explorar o efeito de interação dos vetores de entrada na arquitetura RNA.

REDE NEURAL ARTIFICIAL

Uma RNA é um sistema de processamento de informações que compartilha certas características de desempenho com redes neurais biológicas (Fausett, 1994). Uma RNA consiste de um grande número de nós computacionais interconectados, chamados neurônios, que trabalham juntos (Sethi et al., 2010). Geralmente, uma rede neural consiste em três camadas: entrada, meio (oculta) e saída, que estão totalmente conectadas. A camada de entrada representa as entradas; e a camada de saída representa os valores correspondentes. Nas camadas do meio, existem vários neurônios artificiais compostos pela função de ativação (pesos e viés para calcular valores de saída), bem como a função de transferência para propagação de valores para as camadas subsequentes. Uma característica importante da RNA é sua capacidade de aprender. O aprendizado é o processo pelo qual um sistema neural adquire a capacidade de realizar certas tarefas ajustando seus parâmetros internos de acordo com algum esquema de aprendizado. (Karayiannis; Venetsanopoulos, 2013).

Uma rede neural é caracterizada por sua arquitetura, que representa o padrão de conexões entre os neurônios, seu método de determinação dos pesos das conexões e a função de ativação (Fausett, 1994). Uma RNA típica é o Perceptron de Múltiplas Camadas (PMC). No PMC, a direção do fluxo de informação é feedforward (onde a informação flui dos nós de entrada para os nós de saída). O processo de aprendizagem é supervisionado com o algoritmo de retropropagação. Muitos estudos demonstraram a capacidade do PMC de resolver problemas complexos e diversos (Haykin et al., 2009).

Além da configuração de camadas e do algoritmo de treinamento, o número de neurônios na camada média é significativo para o desempenho da RNA. Uma RNA com muito poucos neurônios na camada média não é capaz de fazer um resultado preciso, enquanto uma RNA com muitos neurônios na camada média é excessivamente equipada e tem um desempenho preditivo ruim (Chae et al., 2016). Para determinar o número de camadas e neurônios ocultos, podem ser usados métodos de tentativa e erro ou inteligentes (Najafi-Marghmaleki et al., 2016).

ÁREA DE ESTUDO

A área selecionada para este estudo está localizada no sudoeste de Isfahan, Irã, abrangendo 69 km2. Está localizada em uma zona de baixa pluviosidade, com precipitação média anual de 127,2 mm durante as duas últimas décadas. Ao norte e ao nordeste está o rio Zayanderood. A oeste, a área é cercada por um distrito residencial. A leste e sudoeste, o terreno da área é elevado. Está localizada entre 51º39' e 51º43' E longitude e 32º35' a 32º38' N latitude (Figura 1). A área de estudo é caracterizada por uma topografia diversificada com um declive geral de 2,5%. A inclinação do terreno na direção norte é íngreme em direção ao rio Zayanderood; a inclinação na direção oeste é moderada. Os canais de escoamento que correm pelas áreas urbanas levam ao rio Zayanderood.

Figura 1. Estudo da área

A área de estudo foi dividida em duas partes: bacias hidrográficas urbanas e suburbanas. A bacia hidrográfica suburbana consistia em seis sub-bacias (CO-1 até CO-6); a bacia urbana incluía 35 sub-bacias (CI-1 até CI-35). Uma vez que o escoamento do CO-6 fluiu para fora da área de estudo, essa sub-bacia hidrográfica foi omitida. Para cada sub-bacia da bacia hidrográfica urbana, foram calculados os parâmetros fisiográficos (área, perímetro, comprimento do canal e declive) e o tempo de concentração. O coeficiente de escoamento para diferentes terrenos foi obtido da Sociedade Americana de Engenharia Civil (ASCE - American Society of Civil Engineering). Os dados de escoamento pluviométrico de 2000 a 2016 foram utilizados para o desenvolvimento de modelos.

METODOLOGIA

A metodologia adotada neste estudo consistiu em duas fases. A fase 1 foi dedicada à seleção do modelo e à análise do vetor de entrada. Nesta fase, através da mudança dos componentes da rede, incluindo o número de neurônios, funções transformadoras, métodos de aprendizagem e camadas ocultas, vários modelos RNA de redes neurais artificiais foram desenvolvidos e avaliados. O efeito de interação do vetor de entrada na estrutura RNA foi analisado utilizando técnicas de análise multivariada de variância (MANOVA - Multivariate Analysis of Variance). O conjunto de dados para MANOVA foi gerado por um procedimento de validação cruzada. A segunda fase envolveu a aplicabilidade dos modelos RNA para a estimativa de escoamento. Para este fim, as saídas do modelo RNA foram comparadas com os resultados do Modelo de Gerenciamento de Águas Tempestades (SWMM - Storm Water Management Model). Ao implantar a MANOVA, foram estudadas as diferenças significativas entre estes modelos. Uma descrição detalhada da metodologia é ilustrada na Figura 2.

Figura 2. Seleção de modelos e análise vetorial de entrada

Seleção da arquitetura RNA

Uma rede neural artificial de perceptron de múltiplas camadas (PMC) com um algoritmo de propagação traseira foi usada para estimar o escoamento nas bacias hidrográficas urbanas. O PMC é uma arquitetura RNA proeminente que é usada em muitas aplicações hidrológicas e de recursos hídricos (Braddock et al., 1998; Wang et al., 2008).

Em muitos problemas não lineares, o uso de uma única camada oculta é suficiente (Funahashi, 1989;Hornik et al., 1989; Sreekanth et al., 2011). Além disso, estudos demonstraram que a utilização de mais de duas camadas ocultas pode não produzir melhorias consideráveis (Patuwo et al., 1993). Neste estudo, os autores examinaram uma rede de uma camada e outra de duas camadas. Para determinar o número de neurônios nas camadas ocultas, os autores aplicaram as seguintes regras: (1) o número de neurônios na primeira camada não deve exceder em três vezes o número de variáveis de entrada; e (2) o número de neurônios na segunda camada oculta deve ser limitado a duas vezes o número de neurônios na primeira camada.

A função de ativação linear e a função sigmóide logística são as funções mais amplamente utilizadas na camada de saída e na camada oculta, respectivamente (Sivakumar et al., 2002). Um estudo de Yonaba et al. (2010) mostrou que a tangente sigmóide é a função de transferência mais pertinente para a previsão de fluxo. Eles descobriram que uma função de transferência não linear na camada de saída não conseguiu melhorar o valor de desempenho. Para obter a melhor arquitetura RNA, tanto a função logística sigmóide quanto a função sigmóide tangente são consideradas neste estudo.

Seleção do método de aprendizagem

Existem vários algoritmos de aprendizagem RNA, como a gradiente de conjugação em escala (SCG - Scaled Conjugate Gradient), Levenberg-Marquardt (LM), e a retropropagação resiliente (Ruck et al., 1990). Com base em estatísticas de desempenho para algoritmos de retropropagação, a LM é a melhor (Affandi; Watanabe, 2008). Nesta pesquisa, os autores utilizaram tanto a LM quanto o algoritmo de regularização Bayesiana (RB) no procedimento de treinamento.

Seleção vetorial de entrada

Em contraste com os métodos estatísticos, as RNA são categorizadas em várias abordagens baseadas em dados (Chakraborty et al., 1992). Portanto, selecionar um conjunto de vetores de entrada apropriados é um passo crítico no processo de desenvolvimento do modelo RNA (Zealand et al., 1999; Dogan et al., 2008). O vetor de entrada deve ser incorreto, livre de ruído, e ter uma relação significativa com o vetor de saída. As abordagens orientadas por dados podem normalmente determinar o vetor de entrada crítico; no entanto, esta abordagem não é eficiente (Bowden et al., 2005). Ao aumentar o número de variáveis, o resultado será complexidade computacional, dificuldade no processo de aprendizagem, baixa precisão e baixo desempenho. (Back; Trappenberg, 1999; Maier; Dandy, 2000; Bowden et al., 2005).

Apesar da importância da determinação do vetor de entrada no desempenho de RNA, Maier e Dandy (2000) alegaram que, na maioria das aplicações RNA de recursos hídricos, é dada uma atenção mínima à tarefa de selecionar o modelo de entrada apropriado. Neste estudo, os autores empregaram uma combinação de métodos de determinação de entrada, incluindo o método de "conhecimento prévio" (Bowden, et al., 2005) e o método de "análise de saliência" (Abrahart et al. 2001) para selecionar o vetor de entrada apropriado.

De acordo com estas abordagens, são definidos dois vetores de variáveis hidrológicas. Com o vetor 1, as variáveis de entrada consistem na área de captação, tempo de concentração, intensidade de chuvas e coeficiente de escoamento superficial. Como na bacia hidrográfica hidrológica, o tempo variável de concentração pode ser estimado por abordagens experimentais. Assim, com o segundo vetor de entrada, o tempo de concentração foi substituído por afetar as variáveis que consistem no perímetro da bacia hidrográfica, comprimento do canal, inclinação, coeficiente de escoamento superficial e intensidade da chuva. Assim, as relações entre estas variáveis foram exploradas e o valor do escoamento urbano foi estimado.

Preparação dos dados

Como a faixa de dados aceitável para a função de ativação sigmóide está na faixa de -1 a 1, a normalização deve ser realizada para colocar os dados de entrada na faixa de -1 a 1 antes de aplicar os dados à RNA. Para a normalização, são utilizadas as seguintes equações:

onde x é o dado original para cada variável de entrada, MinX e MaxX são respectivamente os valores mínimo e máximo de X, e X_N é o valor normalizado. Para operar uma RNA, geralmente é necessário dividir o conjunto de dados em três subconjuntos para fins de treinamento, validação e teste. O treinamento lida com os valores de peso da rede. Durante a fase de treinamento, aproximadamente 75% de todo o conjunto de dados é frequentemente fornecido à rede até que os valores de peso aceitáveis sejam determinados. O objetivo da validação é assegurar o treinamento adequado e evitar o excesso de ajuste ou de treinamento. Um total de 12,5% do conjunto de dados foi escolhido para validação. Para a avaliação final do desempenho da RNA, foram utilizados os 12,5% restantes do conjunto de dados.

Critérios de avaliação

Para avaliar o desempenho da RNA durante o treinamento, validação e testes, foram aplicadas duas medidas de avaliação. Um erro quadrático médio (EQM) é uma das medidas de desempenho mais comumente utilizadas na modelagem hidrológica (Elshorbagy et al., 2000). O outro índice utilizado para avaliar a correlação entre o escoamento observado e o escoamento previsto foi o coeficiente de determinação, R². As fórmulas para EQM e R² são as seguintes:

onde Y_i denota o valor observado (real) do escoamento superficial, y^{^}_i é o valor estimado e N = o número de observações.

RESULTADOS E DISCUSSÃO

Para determinar a configuração RNA apropriada para obter resultados satisfatórios, vários modelos de RNA com dois vetores de entrada foram investigados. Cada modelo foi desenvolvido utilizando diferentes parâmetros do modelo de rede, tais como algoritmos de aprendizagem (LM, RB), funções de ativação (logig, radbas e tansig), números de camadas ocultas (uma e duas) e quatro a nove neurônios nas camadas ocultas. Estes modelos foram treinados 84 vezes e os melhores desempenhos foram documentados.

Resultados para o vetor de entrada 1

A tabela 1 ilustra os valores dos indicadores estatísticos para um total de seis modelos RNA com vetor de entrada 1 durante os períodos de treinamento e testes. Como mencionado anteriormente, o vetor de entrada 1 consiste em variáveis, incluindo área de captação, tempo de concentração, intensidade de chuvas e coeficiente de escoamento superficial. As diferenças entre os modelos estão relacionadas ao número de neurônios, à forma de função de ativação e ao método de treinamento. Os resultados do desempenho do modelo indicaram que a rede de camada única com cinco neurônios – quando a função de ativação era radbas, e o algoritmo de treinamento era LM – tinha o melhor desempenho. Esta rede resultou em um R² de 0,853 para o conjunto de dados de teste; um erro quadrático médio (EQM) de 0,96 m⁶ para o conjunto de dados de teste, e 0,6 m⁶ para o conjunto de dados de treinamento, respectivamente.

Tabela 1. Desempenhos de diferentes modelos de redes neurais artificiais com uma rede de uma camada e vetor de entrada 1

Para investigar a influência da camada oculta no desempenho da rede, foram desenvolvidas outras combinações de modelos RNA com vetor de entrada 1. Nestes modelos, o número de camadas foi aumentado duas vezes e diferentes parâmetros de rede, incluindo o número de neurônios, formulários de função de ativação e algoritmos de treinamento foram examinados. Para o vetor de entrada 1, os resultados do desempenho do modelo (Tabela 2) indicaram que, quando o número de camadas ocultas aumentou duas vezes, uma rede composta de cinco e oito neurônios com funções de ativação de logsig e tansig, respectivamente, foi realizada com sucesso. Nesta combinação, o melhor algoritmo de treinamento foi o LM. Esta rede resultou em um R² de 0,957 para o conjunto de dados de teste, um EQM de 0,53 m⁶ para o conjunto de dados de teste, e 0,43 m⁶ para o conjunto de dados de treinamento.

Tabela 2. Desempenho de diferentes modelos de redes neurais artificiais com uma rede de duas camadas e vetor de entrada 1

Com o vetor de entrada 1, uma comparação dos indicadores estatísticos mostrou um melhor desempenho para a rede com duas camadas ocultas. Este modelo retornou um EQM de 2,41 m⁶, enquanto a rede com uma única camada retornou um EQM de 4,96 m⁶. Além disso, em termos do coeficiente de determinação, a rede com duas camadas ocultas demonstrou um melhor desempenho. Foi observado que a rede com uma única camada oculta retornou 0,432, enquanto que a rede com duas camadas ocultas retornou 0,704.

Resultados para o vetor de entrada 2

A tabela 3 ilustra os valores dos indicadores estatísticos para um total de seis modelos de RNA com vetor de entrada 2 durante os períodos de treinamento e testes. Como mencionado anteriormente, o vetor de entrada 2 consistiu nas variáveis do perímetro da bacia, comprimento do canal, inclinação, coeficiente de escoamento e intensidade da chuva. Os resultados do desempenho do modelo indicaram que uma rede de camada única com sete neurônios – quando a função de ativação era lógica e o algoritmo de treinamento era LM – apresentava o melhor desempenho. Esta rede resultou em um R² de 0,886 para o conjunto de dados de teste, um EQM de 0,69 m⁶ para o conjunto de dados de teste, e 0,11 m⁶ para o conjunto de dados de treinamento, respectivamente.

Tabela 3. Desempenhos de diferentes modelos de redes neurais artificiais com uma rede de uma camada e vetor de entrada 2

Para investigar a influência da camada oculta no desempenho da rede, outras combinações de modelos de RNA com vetor de entrada 2 foram desenvolvidas. Nestes modelos, o número de camadas foi aumentado duas vezes e diferentes parâmetros de rede, incluindo o número de neurônios, formulários de função de ativação e algoritmos de treinamento foram examinados. Para o vetor de entrada 2, os resultados do desempenho do modelo (Tabela 4) indicaram que, quando o número de camadas ocultas aumentou duas vezes, o desempenho das três primeiras arquiteturas de RNA foi muito semelhante. No entanto, entre os seis modelos de RNA, como descrito na Tabela 4, a rede composta por oito e nove neurônios com funções de ativação de tansig em ambas as camadas é executada da melhor maneira. Nesta arquitetura, o melhor algoritmo de treinamento foi o LM. Esta rede resultou em um R² de 0,987 para o conjunto de dados de teste, um EQM de 0,05 m⁶ para o conjunto de dados de teste, e 0,002 m⁶ para o conjunto de dados de treinamento, respectivamente.

Tabela 4. Desempenho de diferentes modelos de redes neurais artificiais com uma rede oculta de duas camadas e vetor de entrada 2

Como indicado na Tabela 5, uma comparação do desempenho da rede proposta indica o seguinte: (1) o vetor de entrada 2 proporciona melhor desempenho para a estimativa de escoamento superficial em bacias hidrográficas urbanas; (2) o aumento do número de camadas ocultas é frequentemente útil para melhorar a estimativa do escoamento superficial em uma bacia hidrográfica urbana; (3) duas camadas ocultas com oito e nove neurônios e a função de ativação do tansig em ambas as camadas exibe o melhor desempenho. O erro quadrado médio (EQM), Soma dos Erros ao Quadrado (SSE – Sum of Squared Error) e R² observados para esta arquitetura de rede são 0,05 m⁶, 0,314 m⁶ e 0,987, respectivamente.

Tabela 5. Comparação dos desempenhos das quatro redes mais bem ajustadas

Efeito de interação vetorial de entrada na arquitetura RNA

Para determinar se o vetor de entrada e a arquitetura de RNA (por exemplo, algoritmo de aprendizagem, função de transferência) têm um efeito significativo no desempenho da rede, uma MANOVA bidirecional foi utilizada. Assim, foi realizado um experimento no qual os vetores de entrada 1 e 2 foram expostos a uma combinação de métodos de aprendizagem e funções de transferência. Os dados de desempenho foram gerados usando uma validação cruzada de dez vezes. O conjunto de dados foi dividido aleatoriamente em dez partes. Cada parte foi realizada por sua vez, e a rede foi treinada nos nove décimos restantes. Então, seus índices de desempenho (EQM e R²) foram calculados sobre o conjunto de espera. A rede foi executada um total de dez vezes em diferentes conjuntos de treinamento. Finalmente, os dez índices de desempenho foram calculados como média para produzir uma estimativa de desempenho. Uma MANOVA bidirecional foi executada pela SPSS para uma RNA de uma camada e duas camadas. As conclusões gerais são apresentadas a seguir.

Em ambas as redes (RNA de uma camada e RNA de duas camadas), o efeito multivariado da arquitetura RNA foi significativo (P<0,05). Assim, as arquiteturas RNA diferiram em relação aos índices de desempenho da RNA.
Em ambas as redes (RNA de uma camada e RNA de duas camadas), o efeito multivariado do vetor de entrada também foi significativo (P<0,05). Portanto, os vetores de entrada diferiam com relação aos índices de desempenho da RNA.
Em ambas as redes (RNA de uma camada e RNA de duas camadas), a relação F (26,73) indicou que o efeito de interação do vetor de entrada e da arquitetura de rede foi estatisticamente significativo em um alfa 0,05. Portanto, o desempenho da arquitetura foi uma função do vetor de entrada, e as mudanças no vetor de entrada geraram diferenças significativas no desempenho da RNA com arquiteturas particulares. Assim, em uma bacia de captação urbana na qual o processo hidrológico é complexo, e os dados não são suficientes, a estimativa de escoamento superficial requer exame e comparação simultâneos de uma gama diversificada de vetores de entrada e arquiteturas de RNA.

Análise de aplicabilidade

O modelo de RNA proposto desenvolvido neste estudo foi verificado e o desempenho do modelo sob diferentes condições de pluviosidade e vegetação foi avaliado no estudo da área. A verificação do modelo RNA foi realizada comparando-se os resultados do modelo RNA com os resultados do escoamento superficial observado e da simulação SWMM. Para determinar se existiam diferenças significativas entre os resultados, foi realizada uma MANOVA unidirecional. O estudo da área foi composto de ruas e rodovias, apartamentos (com menos de 10% de vegetação), casas (com 10% a 15% de vegetação) e cinturões verdes (com 75% de vegetação). O tipo de precipitação foi classificado como chuva com períodos de retorno de dois, cinco e dez anos.

Para este fim, foi projetada uma experiência na qual nove eventos de chuva foram divididos em três grupos de acordo com três modelos de medição (RNA, SWMM, e observados). Para investigar o desempenho do modelo proposto em diferentes situações de chuva, os autores selecionaram os sujeitos de acordo com três tipos de retorno do período de chuvas (dois, cinco, e dez anos). As saídas do modelo foram medidas por quatro variáveis de resposta, y₁, y₂, y₃, y₄, onde y_i é o volume de escoamento (cm³/h) pertencente aos quatro tipos de vegetação da bacia hidrográfica. A Tabela 6 lista os valores das quatro variáveis dependentes em cada uma das células.

Tabela 6. Comparação do modelo de rede neural artificial e resultados SWMM e escoamento observado em diferentes tipos de bacias de captação urbanas e períodos de retorno de chuvas

A análise unidirecional MANOVA foi realizada pela SPSS. Os resultados estão ilustrados na Tabela 7. Como mostrado na tabela, nenhuma das variáveis de resultado é estatisticamente significativa no nível 0,05 de alfa. Portanto, podemos concluir que não existe diferença estatisticamente significativa entre o valor de escoamento superficial estimado pelo modelo RNA, o modelo SWMM, e o observado nas bacias de captação. Como a experiência foi realizada em vários ambientes de vegetação e períodos de retorno de chuvas, o resultado da MANOVA sugere a capacidade de resposta e aplicabilidade do modelo RNA em um cenário da vida real.

Tabela 7. Testes multivariados

CONCLUSÃO

Neste estudo, várias arquiteturas RNA foram examinadas para explorar a melhor topologia para a estimativa do escoamento superficial em uma bacia de captação urbana. A topologia proposta compreende estas características: duas camadas ocultas, oito neurônios na primeira camada, nove neurônios na segunda camada, a mesma função de ativação do tansig em ambas as camadas, e o algoritmo de treinamento LM. O resultado da MANOVA unidirecional indicou que a arquitetura proposta pode estimar o escoamento superficial para diferentes tipos de vegetação urbana e intensidades pluviométricas. Uma comparação dos valores de escoamento gerados pelo modelo RNA proposto com os do SWMM não mostrou diferenças estatisticamente significativas entre eles.

Os resultados desta pesquisa apoiam a aplicação da RNA como uma alternativa adequada para modelos físicos de estimativa de escoamento superficial. Particularmente, em bacias urbanas onde os dados são insuficientes e os processos hidrológicos são complexos, a aplicação de RNA é adequada. Entretanto, o desempenho da RNA em bacias hidrográficas urbanas é a função do vetor de entrada e da arquitetura de rede. Os resultados de uma MANOVA bidirecional implicaram no efeito significativo da arquitetura de RNA e do vetor de entrada no desempenho da RNA. Além disso, o efeito de interação da arquitetura de RNA e do vetor de entrada foi adicionalmente significativo.

Estas descobertas demonstram a importância das variáveis de entrada na modelagem baseada em RNA da estimativa de escoamento superficial em bacias de captação urbanas. Assim, é necessária uma metodologia para explorar e selecionar as melhores variáveis que afetam os vetores de entrada. A metodologia desenvolvida neste estudo é baseada em uma equação física existente do processo hidrológico. Em pesquisas futuras, sugere-se a aplicação de técnicas estatísticas multivariadas, tais como análise exploratória de fatores e modelos de equações estruturais. Estas técnicas contribuirão para explorar construções não observáveis e para criar um vetor de entrada que promoverá um modelo de RNA mais preciso.

REFERÊNCIAS

Abrahart, R. J., See, L., Kneale, P. E. 2001. Investigating the role of saliency analysis with a neural network rainfall-runoff model. Computers & Geosciences 27, 921-928. https://doi.org/10.1016/S0098-3004(00)00131-X

Affandi, A., Watanabe, K. 2008. Analysis of groundwater level fluctuation in a plain area using genetic algorithms and an artificial neural network. Lowland Technology International 10, 76-85. http://cot.unhas.ac.id/journals/index.php/ialt_lti/article/view/392

Ahmad, S., Simonovic, S. P. 2001. Developing runoff hydrograph using artificial neural networks. Bridging the Gap: Meeting the World's Water and Environmental Resources Challenges.

Back, A. D., Trappenberg, T. P. 1999. Input variable selection using independent component analysis. Neural Networks, 1999. IJCNN'99. International Joint Conference on, IEEE.

Bertrand-Krajewski, J.-L. 2007. Stormwater pollutant loads modelling: epistemological aspects and case studies on the influence of field data sets on calibration and verification. Water Science and Technology 55, 1-17. https://doi.org/10.2166/wst.2007.090

Bowden, G. J., Dandy, G. C., Maier, H. R. 2005. Input determination for neural network models in water resources applications. Part 1—background and methodology. Journal of Hydrology 301, 75-92. https://doi.org/10.1016/j.jhydrol.2004.06.021

Braddock, R. D., Kremmer, M. L., Sanzogni, L. 1998. Feed‐forward artificial neural network model for forecasting rainfall run‐off. Environmetrics 9, 419-432. https://doi.org/10.1002/(SICI)1099-095X(199807/08)9:4<419::AID-ENV312>3.0.CO;2-D

Chae, Y. T., Horesh, R., Hwang, Y. et al. 2016. Artificial neural network model for forecasting sub-hourly electricity usage in commercial buildings. Energy and Buildings 111, 184-194. https://doi.org/10.1016/j.enbuild.2015.11.045

Chakraborty, K., Mehrotra, K., Mohan, C. K. et al. 1992. Forecasting the behavior of multivariate time series using neural networks. Neural networks 5, 961-970. https://doi.org/10.1016/S0893-6080(05)80092-9

Chavoshi, S., Sulaiman, W. N. A., Saghafian, B. et al. 2013. Flood prediction in southern strip of Caspian Sea watershed. Water Resources 40, 593-605. https://doi.org/10.1134/S0097807813060122

Chen, J., Adams, B. J. 2007. Development of analytical models for estimation of urban stormwater runoff. Journal of Hydrology 336, 458-469. https://doi.org/10.1016/j.jhydrol.2007.01.023

Chiang, Y.-M., Chang, L.-C., Chang, F.-J. 2004. Comparison of static-feedforward and dynamic-feedback neural networks for rainfall–runoff modeling. Journal of hydrology 290, 297-311. https://doi.org/10.1016/j.jhydrol.2003.12.033

Dogan, A., Demirpence, H., Cobaner, M. 2008. Prediction of groundwater levels from lake levels and climate data using ANN approach. Water SA 34, 199-208. http://www.scielo.org.za/scielo.php?script=sci_arttext&pid=S1816-79502008000200008

Elshorbagy, A., Simonovic, S. P., Panu, U. S. 2000. Performance evaluation of artificial neural networks for runoff prediction. Journal of Hydrologic Engineering 5, 424-427. https://doi.org/10.1061/(ASCE)1084-0699(2000)5:4(424)

Fausett, L. V. 1994. Fundamentals of neural networks: architectures, algorithms, and applications, Prentice-Hall Englewood Cliffs.

Freni, G., Mannina, G., Viviani, G. 2009. Urban runoff modelling uncertainty: Comparison among Bayesian and pseudo-Bayesian methods. Environmental Modelling & Software 24, 1100-1111. https://doi.org/10.1016/j.envsoft.2009.03.003

Funahashi, K.-I. 1989. On the approximate realization of continuous mappings by neural networks. Neural networks 2, 183-192. https://doi.org/10.1016/0893-6080(89)90003-8

Haykin, S. S. 2009. Neural networks and learning machines, Pearson Upper Saddle River.

Hornik, K., Stinchcombe, M., White, H. 1989. Multilayer feedforward networks are universal approximators. Neural Networks 2, 359-366. https://doi.org/10.1016/0893-6080(89)90020-8

Karayiannis, N., Venetsanopoulos, A. N. 2013. Artificial neural networks: learning algorithms, performance evaluation, and applications. Springer Science & Business Media.

Khayatian, F., Sarto, L. 2016. Application of neural networks for evaluating energy performance certificates of residential buildings. Energy and Buildings 125, 45-54. https://doi.org/10.1016/j.enbuild.2016.04.067

Kumar, D. S., Arya, D., Vojinovic, Z. 2013. Modeling of urban growth dynamics and its impact on surface runoff characteristics. Computers, Environment and Urban Systems 41, 124-135. https://doi.org/10.1016/j.compenvurbsys.2013.05.004

Lee, S., Lin, H., Yang, T. 2010. Artificial neural network analysis for reliability prediction of regional runoff utilization. Environmental monitoring and assessment 161, 315-326. https://doi.org/10.1007/s10661-009-0748-5

Maier, H. R., Dandy, G. C. 2000. Neural networks for the prediction and forecasting of water resources variables: a review of modelling issues and applications. Environmental Modelling & Software 15, 101-124. https://doi.org/10.1016/S1364-8152(99)00007-9

Najafi-Marghmaleki, A., Khosravi-Nikou, M. R., Barati-Harooni, A. 2016. A new model for prediction of binary mixture of ionic liquids+ water density using artificial neural network. Journal of Molecular Liquids 220, 232-237. https://doi.org/10.1016/j.molliq.2016.04.085

Orimi, M. G., Farid, A., Amiri, R. et al. 2015. Cprecip parameter for checking snow entry for forecasting weekly discharge of the Haraz River flow by artificial neural network. Water Resources 42, 607-615. https://doi.org/10.1134/S0097807815050073

Patuwo, E., Hu, M. Y., Hung, M. S. 1993. Two‐group classification using neural networks. Decision Sciences 24, 825-845. https://doi.org/10.1111/j.1540-5915.1993.tb00491.x

Pulido-Calvo, I., Portela, M. M. 2007. Application of neural approaches to one-step daily flow forecasting in Portuguese watersheds. Journal of Hydrology 332, 1-15. https://doi.org/10.1016/j.jhydrol.2006.06.015

Reddy, J. M., Babu, A. S., Mallikarjuna, Ch. 2008. Rainfall–Runoff Modeling: Combination of Simple Time-Series, Linear Autoregressive and Artificial Neural Network Models. 3rd IASME / WSEAS Int. Conf. on WATER RESOURCES, HYDRAULICS & HYDROLOGY (WHH '08), University of Cambridge, UK, Feb. 23-25, 2008. http://www.wseas.us/e-library/conferences/2008/uk/WHH/WHH-03.pdf

Ruck, D. W., Rogers, S. K., Kabrisky, M. et al. 1990. The multilayer perceptron as an approximation to a Bayes optimal discriminant function. IEEE Transactions on Neural Networks 1, 296-298. https://doi.org/10.1109/72.80266

Sethi, R. R., Kumar, A., Sharma, S. P. et al. 2010. Prediction of water table depth in a hard rock basin by using artificial neural network. International Journal of Water Resources and Environmental Engineering 4, 95-102. https://academicjournals.org/article/article1379434338_Sethi%20et%20al.pdf

Sivakumar, B., Jayawardena, A.W., Fernando, T.M.K.G. 2002. River flow forecasting: use of phase-space reconstruction and artificial neural networks approaches. Journal of Hydrology 265, 225-245. https://doi.org/10.1016/S0022-1694(02)00112-9

Sreekanth, P. D., Sreedevi, P. D., Ahmed, S. et al. 2011. "Comparison of FFNN and ANFIS models for estimating groundwater level." Environmental Earth Sciences 62, 1301-1310. https://doi.org/10.1007/s12665-010-0617-0

Wang, Y., Traore, S., Kerh, T. 2008. Feed forward backpropagation algorithm for estimating reference evapotranspiration in Burkina Faso. Proceedings of the 12th WSEAS International Conference on Computers. World Scientific and Engineering Academy and Society, Stevens Point, WI.

Whitford, V., Ennos, A. R., Handley, J. F. 2001. City form and natural process”—indicators for the ecological performance of urban areas and their application to Merseyside, UK. Landscape and Urban Planning 57, 91-103. https://doi.org/10.1016/S0169-2046(01)00192-X

Yonaba, H., Anctil, F., Fortin, V. 2010. Comparing sigmoid transfer functions for neural network multistep ahead streamflow forecasting. Journal of Hydrologic Engineering 15, 275-283. https://doi.org/10.1061/(ASCE)HE.1943-5584.0000188

Zealand, C. M., Burn, D. H., Simonovic, S. P. 1999. Short term streamflow forecasting using artificial neural networks. Journal of Hydrology 214, 32-48. https://doi.org/10.1016/S0022-1694(98)00242-X

Zhang, B., Xie, G., Zhang, C. et al. 2012. The economic benefits of rainwater-runoff reduction by urban green spaces: A case study in Beijing, China. Journal of Environmental Management 100, 65-71. https://doi.org/10.1016/j.jenvman.2012.01.015

Recebido: 30 jun. 2020

Aprovado: 30 jun. 2020

DOI: 10.20985/1980-5160.2020.v15n2.1657

Como citar: Bakhshaei, M., Ahmadi, H., Motamedvaziri, B. et al. (2020). Estimativa de escoamento em captação urbana utilizando modelos de rede neural artificial. Revista S&G 15, 2, 170-180. https://revistasg.emnuvens.com.br/sg/article/view/1657