O primeiro passo da construção de um banco de dados confiável, a aquisição de dados de alta qualidade, já requer planejamento estratégico. Os dados se encontram em múltiplas fontes, com frequências distintas e formatos discrepantes, que podem exigir tecnologias diferentes para extraí-los e incorporá-los aos processos da gestora.
Um esforço inicial é reduzir o número de fontes e processos para obter as informações necessárias para alimentar o sistema, com especial atenção à uniformidade das informações. Essa preocupação é maior em algumas situações, como a dos preços praticados nos mercados de balcão, que frequentemente se mostram discrepantes em fontes diferentes. Não só isso, diferentes provedores identificam dados iguais de maneiras distintas.
Falhas técnicas ou conceituais na construção de séries de dados podem não ser identificadas a tempo e acarretar em erros em cascata, chegando a inviabilizar processos. Eventuais inconsistências podem levar ao questionamento da confiabilidade ou validade dos dados por diferentes áreas da gestora ou mesmo por clientes e auditores.
A contratação de cientistas de dados sem conhecimento do mercado financeiro aumenta esses riscos. Além do conhecimento da infraestrutura técnica, a gestora deve avaliar se esses profissionais estão preparados para trabalhar na aquisição, usabilidade e manutenção dos dados dentro do contexto de gestão de ativos.
Mais recentemente, o mercado financeiro como um todo mostra maior interesse por dados não convencionais que antecipam o comportamento de indicadores macroeconômicos e de resultados de setores e empresas específicos. São exemplos de dados não convencionais as imagens de drone e satélite, gastos em cartão de crédito, movimentação nas redes sociais e mobilidade física de consumidores apurada a partir de telefones celulares.
Paralelamente, aumentou também a demanda dos investidores e da sociedade por informações quantificáveis sobre aspectos ambientais, sociais e de governança das empresas, que precisam ser incorporados às análises e decisões das gestoras de recursos. No entanto, esses dados geralmente são distribuídos de forma não padronizada, com frequências e formatos dissonantes.
Dados precisos e verificáveis são insumos essenciais para diversas funções de administração de recursos de terceiros, incluindo gestão de riscos, auditoria e divulgação de informações ao público e a autoridades reguladoras.
A concorrência no mercado financeiro exige velocidade e agilidade na reação a uma infinidade de informações. Assim, saem na frente os profissionais que têm acesso imediato a dados robustos, incluindo informações que possam ser interpretadas por máquinas, como notícias, análises, recomendações e eventos corporativos.
Casas que atuam com algoritmos de negociação automática têm desafios ainda maiores em se tratando de bancos de dados, uma vez que precisam calibrar seus robôs com feeds de dados referenciais e em tempo real.
Além da parte conceitual, os fluxos de extração e a manutenção das séries e dos feeds de dados exigem conectividade global e atenção constante por parte de equipes de tecnologia e operacionais.
Muitas séries só são disponibilizadas mediante pagamento e a gestora pode ser forçada a administrar a relação com os provedores das informações e os direitos de utilização dos dados em diferentes situações e por públicos distintos. Isso significa custos adicionais e alocação de capital humano nesse acompanhamento.
Assim, a automatização confiável dos processos de captura de dados pode reduzir riscos operacionais e aumentar a eficiência de diversas áreas de uma gestora de recursos.