Por Bruno Dupire, Head of Quantitative Research at Bloomberg L.P.
Estabelecer a ligação entre o que se pode observar agora — dados estruturados e não estruturados — e comportamentos futuros é uma façanha em finanças. O setor está naturalmente adotando o aprendizado de máquinas para lidar com isso, o que requer ampliar o alcance dos dados e os métodos, além de acabar com alguns velhos hábitos.[f1]
Convencionalmente, a maior parte dos dados financeiros é processada em formato estruturado (como informações numéricas sobre os mercados e os preços dos ativos) e os métodos de processamento foram emprestados da estatística clássica. Avanços em aprendizado de máquinas e poder de processamento abrem caminho para processar (e entender) vastas quantidades de dados não estruturados, trazendo consigo o potencial de transformar o setor.
Relevância dos conjuntos de dados
Os participantes dos mercados estão reconhecendo gradualmente a interconexão entre tantas dimensões do mundo. Quem compreende essa teia de interações reforça seus poderes preditivos. Fontes para as quais antes se dava pouca atenção agora estão sendo devassadas em busca de dados potencialmente lucrativos.
Imagens de satélites captam a intensidade da iluminação das ruas à noite, sombras de navios petroleiros e veículos parados em estacionamentos, por exemplo, podendo ser usadas para estimar a atividade econômica. Postagens nas redes sociais e reportagens podem ser usadas para estimar sentimento e a utilização de cartões de crédito pode revelar tendências importantes do gasto do consumidor.
Um primeiro conjunto de técnicas transforma dados brutos em valor numérico: uma foto noturna tirada por satélite é convertida em medida de intensidade da iluminação; a análise da fotografia de um estacionamento mostra o número de automóveis; a linguagem empregada em uma reportagem ou postagem no Twitter entra em um índice de polaridade para indicar se o sentimento é positivo, negativo ou neutro.
Um primeiro conjunto de técnicas transforma dados brutos em valor numérico. Por exemplo:
Fotografia noturna tirada por satélite: medida de intensidade da iluminação
Reportagem ou postagem no Twitter: índice de polaridade (bom/ruim)
O passo seguinte é usar esses dados para fazer projeções. É possível usar a intensidade da iluminação para prever gastos e PIB de determinado país? É possível estimar os lucros da Walmart e outras empresas observando seus estacionamentos? É possível estimar o retorno ou volatilidade da ação de uma companhia de acordo com o sentimento sobre a mesma nas redes sociais?
Métodos de aprendizagem de máquinas
Existem diversos métodos de aprendizado de máquinas e seu emprego depende do objetivo e tipo de dado disponível. Os mais comuns são:
É infinita a lista de tarefas que podem se beneficiar do aprendizado de máquinas. A tabela a seguir mostra alguns dos projetos nos quais a Bloomberg está trabalhando nessa área:
Codificadores autônomos para redução de dimensionalidade
Uma aplicação interessante das redes neurais é diminuir a dimensionalidade de curvas de juros ou superfícies de volatilidade, por exemplo. Nas curvas de juros, a técnica mais popular é a Análise de Componentes Principais e, neste contexto, os componentes mais importantes são forma paralela, em declive e torção.
Uma rede de codificadores autônomos é mais eficiente para redução da dimensionalidade do que a Análise de Componentes Principais, por ser capaz de utilizar plenamente a não linearidade que gera. Uma rede de codificadores autônomos visa reproduzir como output o input inicial inserido no gargalo que destila a informação em representação compacta. Geralmente, funciona melhor do que a Análise de Componentes Principais quando ocorre alguma mudança de regime ou do comportamento global.
Algoritmos de aprendizado supervisionado podem descobrir sinais capazes de gerar alfa ou aprender a construir carteiras para diferentes condições de mercado. Exemplos:
1) Estratégias baseadas em sentimento: Textos extraídos do Twitter ou reportagens podem ser analisadas e automaticamente rotuladas como expressão de sentimento positivo, neutro ou negativo. O gráfico abaixo resume o número das três classes de postagens no Twitter para uma ação (MS) em intervalos de 15 minutos durante um período de dois dias.
A análise desses dados processados gera sinais que podem ser usados para elaborar uma estratégia de negociação de ativos, geralmente adotando posição comprada para ações com sentimento positivo e vendida para ações com sentimento negativo. O gráfico abaixo mostra que uma carteira dessas leva grande vantagem sobre o mercado.
2. Estratégias smart beta: Outra maneira de usar os dados para elaborar uma estratégia de negociação é encontrar características que representem as condições de mercado e então definir uma lista de fatores ou estratégias. A tarefa de aprendizado é estabelecer uma ligação entre as condições do mercado em determinado momento e a melhor estratégia a ser aplicada no futuro.
Entre as características que podem ser usadas para definir as condições do mercado estão as taxas de retorno do SPX, o nível do VIX, o formato da curva de juros, spreads de crédito e inflação. Entre as possíveis estratégias estão carteiras com ativos ponderados de acordo com o valor/ranking de um parâmetro, como o beta das carteiras, fundos smart beta diferentes (como aqueles associados aos fatores do modelo elaborado pelos autores Fama e French) ou regiões geográficas e setores da indústria.
O aprendizado supervisionado consiste em aprender, durante o período de treinamento, a associação entre as estratégias mais lucrativas e as condições de mercado correspondentes. Quando o sistema aprende essas associações e consegue imitá-las, é submetido a teste com um período fora da amostra.
Este gráfico ilustra os benefícios do aprendizado para molde dinâmico de uma carteira, de acordo com quantis beta, e supera uma típica carteira long-short.
Este gráfico mostra a estratégia ótima selecionada para construção de uma estratégia de rotação de carteiras de fatores do modelo Fama-French:
Conclusão
A disponibilidade de novos conjuntos de dados e novas técnicas, assim como a expansão do poder de computação, aumentou as opções de aplicação do aprendizado de máquinas em finanças. É um ramo apenas nascente e que precisa escapar de muitas armadilhas, mas é muito promissor. Uma nova geração de técnicas, ferramentas e talentos está começando a destravar todo o seu potencial.