Une nouvelle enquête dans le secteur financier met en évidence les principaux obstacles à l’intégration des données alternatives, 61 % des personnes interrogées citant des problèmes d’analyse et 53 % soulignant des difficultés d’approvisionnement.

Découvrez comment « l’augmentation de la chaîne de valeur des données » conduit à un retour sur investissement plus élevé grâce à une collecte de données et à des stratégies de gouvernance extrêmement précises, qui se traduisent par des résultats algorithmiques, des informations et des décisions d’investissement de meilleure qualité.
8 min de lecture
Transparency in alt-data

Dans cet article, nous examinerons :

Une nouvelle enquête sur le secteur financier a récemment été publiée. Une centaine de professionnels issus des domaines du crédit, des fonds spéculatifs, de la banque et de l’assurance, tant aux États-Unis qu’au Royaume-Uni, y ont participé. Le rapport souligne le fait que la grande majorité des institutions financières comprennent qu’elles doivent s’appuyer sur des sources de données externes. Cependant, une grande partie de ce secteur dynamique ne dispose ni des connaissances internes ni de l’expertise nécessaires pour analyser correctement les données alternatives et en tirer véritablement des avantages opérationnels. Cet article se concentre à la fois sur les défis et sur les mécanismes technologiques actuellement utilisés par les acteurs du secteur pour y faire face.

Infographic elaborating how much each industry relies on alt-data to function

Source de l’image : Bright Data

Quels sont les principaux obstacles à l’intégration des données alternatives dans le contexte de la finance à grande échelle ?

« Les principaux obstacles à l’intégration des données alternatives dans le contexte de la grande finance comprennent des problèmes au niveau de l’analyse, 61 % des personnes interrogées* citant cela comme leur défi le plus probable, tandis que 53 % citent l’approvisionnement en données comme leur principal défi. »

Principaux obstacles à l’analyse des données alternatives dans le secteur financier

D’après les résultats

de

l’enquête :

«64 % des professionnels des services financiers* utilisent les données alternatives dans le cadre de l’élaboration de leurs stratégies d’investissement continues. »

Mais les choses commencent à se gâter lorsque les gestionnaires de portefeuille se mettent à rechercher des données :

  • À partir d’une grande variété de sources
  • En volumes extrêmement élevés

Les équipes d’analystes de données sont également confrontées à des défis, notamment des problèmes liés à la qualité et à la compatibilité des données collectées pour alimenter les algorithmes d’investissement. Cela est particulièrement vrai pour les données semi-structurées/non structurées, qui sont difficiles à intégrer dans des modèles de trading basés sur des données et dotés de préréglages uniques. C’est là le nœud du problème pour de nombreuses institutions financières qui ne disposent pas de l’infrastructure informatique nécessaire pour traiter et recouper efficacement les ensembles de données alternatives.

Cette situation, associée à un réel manque de main-d’œuvre qualifiée et formée aux dernières techniques de collecte et de traitement des données, crée des obstacles pour les entreprises du secteur financier.

Enfin, les organisations financières ont de plus en plus de mal à respecter les normes d’agilité des données qu’elles se sont elles-mêmes fixées. Elles collectent des données cibles et les stockent dans des réservoirs de la taille du lac Supérieur, mais ne parviennent toujours pas à les décontextualiser afin de tirer des conclusions plus générales qui pourraient déboucher sur des opportunités de monétisation plus intéressantes.

Principaux défis liés à l’approvisionnement en données

Les difficultés liées à l’analyse des données sont interdépendantes et se recoupent en quelque sorte avec les obstacles liés à l’approvisionnement en données. Les principaux défis liés à l’approvisionnement en données sont les suivants

Identification des données : il s’agit de pouvoir repérer et organiser de manière catégorique les ensembles de données qui ont conservé des métadonnées, en fonction du cas d’utilisation et de la classe d’actifs, ce qui peut avoir des implications opérationnelles considérables.

Reproductibilité des processus : souvent, les équipes sont en mesure de se procurer des Jeux de données ponctuels grâce à la mise en ligne d’une certaine quantité d’informations ou à d’autres singularités. Cependant, les entreprises ont besoin d’un flux de données fiable et constant.

Qualité des informations : l’IA et le ML ont une « phase d’apprentissage » importante, au cours de laquelle ils doivent être alimentés par des données propres et traçables afin que leurs résultats soient de haute qualité et précis. Un décalage temporel ou une corruption de fichiers géographiques, par exemple, pourraient tous deux nuire gravement aux informations algorithmiques, telles que les positions sur titres à clôturer et le point de sortie.

Sources disparates – Les données ne proviennent pas toutes du même endroit ni du même format. Certaines données peuvent provenir de plateformes sociales, tandis que d’autres proviennent des résultats des moteurs de recherche et/ou des documents déposés auprès de la Securities and Exchange Commission (SEC). Les formats peuvent aller des fichiers vidéo et audio aux fichiers texte et aux journaux système. Il peut être difficile de les agréger et de les recouper dans un système unifié.

Comment les institutions financières prospèrent malgré les défis

De plus en plus d’institutions financières ont commencé à prendre conscience des avantages de l’externalisation de leurs besoins en matière de collecte de données. Cela se fait soit sous la forme d’achat d’ensembles de données prêts à l’emploi, soit en connectant des systèmes et des équipes à des outils qui fournissent un flux de données automatisé et en temps réel.

Cette approche élimine la plupart des défis rencontrés lors de la phase d’analyse, car les réseaux de collecte de données sont capables de :

  • Adapter les ensembles de données aux besoins spécifiques de votre entreprise
  • Garantir que les entrées/sorties sont dans le format de fichier souhaité, ce qui permet une intégration plus facile des données provenant de sources disparates
  • Vous éviter d’investir dans des systèmes de données coûteux et dans des spécialistes de la collecte de données
  • Donnez à votre fonds la possibilité d’activer et de désactiver les opérations de collecte de données projet par projet (ce que l’on appelle communément « Data on Demand »).

Cette approche peut également être un choix prudent pour les petits bureaux spécialisés qui souhaitent se concentrer sur des investissements basés sur les données, sans que la collecte de données ne leur prenne la majeure partie de leur temps.

Les principaux avantages de traiter les données comme une marchandise dans le contexte des services financiers et de l’investissement sont les suivants

Obtenir un flux de données en temps réel et à faible latence pour prendre des décisions opérationnelles immédiates et instantanées (achat, vente, vente à découvert, etc.)

Rendre l’apprentissage et la personnalisation de l’IA et du ML beaucoup plus accessibles et faciles, afin que la création et le test de modèles de trading rapides deviennent une seconde nature pour les membres de l’équipe

Éliminer la nécessitéd’acheter/développer du matériel, des logiciels et des protocoles/API propriétaires coûteux

Débloquer des ensembles de donnéesdifficiles à obtenir ou délibérément indétectables, comme ce fut le cas avec les hôpitaux américains qui ont cherché à dissimuler les tarifs des procédures à l’aide d’un extrait de code spécifique

Conclusion

La collecte et la mise en œuvre de données alternatives en sont encore au stade de l’adoption dans le secteur financier, ce qui signifie qu’il est encore possible d’obtenir un avantage significatif en matière d’information.

Bien que la plupart des institutions sachent qu’elles ont beaucoup à gagner à exploiter des données externes, beaucoup d’entre elles n’ont pas les capacités ou l’expertise nécessaires pour les analyser et les exploiter correctement.

Il s’ensuit donc que la « chaîne de valeur des données » a une relation inverse avec le volume, le coût, la qualité et le rendement par rapport à la plupart des autres produits d’information. Par exemple, la collecte d’un volume plus faible de données structurées de meilleure qualité, transmises automatiquement aux modèles d’investissement, aux algorithmes et aux analystes, aura un retour sur investissement (ROI) beaucoup plus élevé que des données non structurées en grand volume, collectées à partir de sources et de formats disparates.

Il s’ensuit que les sociétés financières et les fintechs doivent disposer d’une stratégie claire de collecte et de gouvernance des données, intégrant l’automatisation de l’approvisionnement en données, qui permet une meilleure gestion des actifs et une meilleure structuration des portefeuilles.

* Ces données sont basées sur les réponses des personnes interrogées dont l’organisation utilise des données alternatives.