
Deteção de anomalias em dados de contagem de tráfego
Sector:
Data science
O contexto:
O nosso cliente gere a rede rodoviária no departamento de Val-de-Marne, na periferia de Paris. Nos últimos anos, contratou vários fornecedores para realizar contagens de veículos na sua rede. Estes dados foram fornecidos em diferentes formatos por cada fornecedor, e para alguns deles, não foram realizados controlos de qualidade nos dados finais.
O nosso cliente pretendia reunir todos estes dados numa base de dados unificada e implementar testes automáticos para verificar a qualidade dos dados de contagem e, sempre que possível, corrigir automaticamente os valores atípicos.
O que fizemos:
Desenvolvemos inicialmente scripts dedicados para integrar os dados provenientes dos diferentes fornecedores. Mais de 1.000 ficheiros Excel foram integrados, com as informações relevantes extraídas e estruturadas.
Criámos um processo de aprendizagem automática baseado na análise de séries temporais para detetar incoerências e valores atípicos nos dados. Sempre que possível, corrigimos os dados com base nas tendências observadas em dados passados e futuros. Entregámos uma base de dados unificada e estruturada que contém todos os dados históricos de contagem, mantendo tanto os dados brutos como os corrigidos.
Qual foi o valor do cliente:
As informações fornecidas por vários fornecedores ao longo dos anos puderam ser valorizadas, verificadas e reutilizadas. O nosso cliente pode agora utilizar os dados estruturados e corrigidos no seu próprio ambiente SIG, o que lhe permite consultar todos os seus dados históricos de contagem de tráfego a partir de uma única fonte. Isto tornou muito mais fácil e científica a avaliação da sua política de redução de tráfego.