Fintech: Documents Management Tool case study | Codete Clients

Documents management tool

Cloud computing, Data science, Web, Fintech

Tabellenerkennung aus PDF und anderen Quellen

Unser Kunde ist ein großer Hedgefonds mit Sitz in New York City, USA. Das Unternehmen verarbeitet jeden Tag eine riesige Menge an Dokumenten, um Markttrends zu analysieren und die Genauigkeit der Entscheidungsfindung des Managements zu erhöhen. Um diesen Bereich der Analytik zu beschleunigen, war unser Kunde auf der Suche nach einem Tool, das bei der Erfassung von Daten aus PDF-Dokumenten helfen würde.

codete fintech1

ÜBERSICHT

Das Ziel des Projekts war die Entwicklung eines Backend-Tools, das in der Lage ist, Text zu erkennen, der als PDF-Tabelle formatiert ist, um eine automatisierte Verarbeitung der in PDF-Dateien enthaltenen Daten zu ermöglichen. Das Tool würde ein PDF in CSV oder andere Formate konvertieren, die von Analysetools geparst werden können, die unser Kunde verwendet, um wertvolle Erkenntnisse aus Daten zu generieren.

ENGAGIERTES PROJEKTTEAM

PDF ist heute eines der beliebtesten Formate für Berichte, da es die Kompatibilität zwischen den verschiedenen Anwendungen garantiert. Wir stellten ein engagiertes Projektteam zusammen, zu dem auch ein erfahrener Software-Ingenieur gehörte, um dem Unternehmen dabei zu helfen, seine Analysefähigkeiten zu verbessern und seine Konkurrenz zu schlagen. Unser Entwickler analysierte das Problem und lieferte einen Proof of Concept, der der Analyselösung unseres Kunden hinzugefügt werden sollte.

codete fintech2

LÖSUNG

Die von unserem Team entwickelte Lösung besteht aus zwei Komponenten. Die erste konvertiert PDFs in ein Binärformat, das in der Backend-Programmiersprache verwendet werden kann und Tabellen erkennt. Die zweite erkennt, wann sie eine Tabelle parst, indem sie eine Vielzahl von Kriterien verwendet. Unser Team hat die Lösung mit leistungsstarken maschinellen Lernfähigkeiten ausgestattet, die den Umgang mit komplexen Fällen ermöglichen - zum Beispiel mit Berichten, die mehrere Bilder und Tabellen enthalten.

MÖCHTEN SIE MEHR DARÜBER ERFAHREN?

Hinterlassen Sie uns Ihre E-Mail-Adresse und Sie werden bald von uns hören.