Onlangs werd in Brussel de Euroclear Text Mining Hackathon gehouden. Tijdens dit door European Data Innovation Hub georganiseerde evenement destilleren deelnemers met text mining-technologie specifieke financiële informatie uit zevenduizend juridische documenten. Na twee dagen van text-mining kwam het team van Teradata als winnaar uit de bus.
De European Data Innovation Hub is een Belgische organisatie die dataprofessionals in heel België ondersteunt met onder andere netwerkactiviteiten, evenementen, trainingen en een e-learning platform. Een van de initiatieven is het organiseren van text-mining hackathons, die als doel hebben tekstanalyse naar een volgend niveau te brengen. Dit moet bijdragen aan het ontwikkelen van tekstgebaseerde softwareoplossingen, die door middel van intelligente analyse helpen om operationele werkzaamheden te vergemakkelijken en organisaties efficiënter te maken.
Flinke concurrentie
De concurrentie tijdens het event was hevig, met grote namen onder de deelnemers, zoals IBM Watson, Anatella/Timi, Teradata en Hadoop Scala. Zij gingen met elkaar de strijd aan, maar ook met diverse teams van jonge python-programmeurs. Het winnende team van Teradata was bijzonder gelukkig met de overwinning tussen deze getalenteerde experts en hun indrukwekkende technologische middelen.
Slimme mix
Om hun overwinning veilig te stellen gebruikten de teamleden van Teradata een mix van machine learning-algoritmes, bestaand uit robuuste feature extraction en engineering-technieken, samen met een uitgebreide set van op regular expressions gebaseerde regels. Op het technologische vlak gebruikte het team vanaf het begin het Aster data science platform, waarmee de winnende resultaten in een recordtijd werden opgeleverd. Het Aster-platform staat bekend om de hoge prestaties, en dit bleek een belangrijke de reden te zijn voor het succes van het team van Teradata dat zowel in de training- als de laatste testfases veel eerder dan de andere teams de eindstreep wist te halen.
Aster
Het winnende team bleef gedurende de hackathon Aster gebruiken om de koppositie vast te houden. Gedurende een paar uur in de vroege ochtend moest die eerste plek even afgestaan worden aan het ‘machtige Python’-team, dat toen een onverwachte uitbarsting van creativiteit had. Maar nadat de nummer-1 positie werd terugveroverd door het Teradata-team, hield het deze vast tot de uiteindelijke overwinning.
Meer informatie: European Data Innovation Hub
14 en 15 mei 2025 Organisaties hebben behoefte aan data science, selfservice BI, embedded BI, edge analytics en klantgedreven BI. Vaak is het dan ook tijd voor een nieuwe, toekomstbestendige data-architectuur. Dit tweedaagse seminar geeft antwoord op...
19 t/m 21 mei 2025Praktische driedaagse workshop met internationaal gerenommeerde trainer Lawrence Corr over het modelleren Datawarehouse / BI systemen op basis van dimensioneel modelleren. De workshop wordt ondersteund met vele oefeningen en praktij...
20 en 21 mei 2025 Deze 2-daagse cursus is ontworpen om dataprofessionals te voorzien van de kennis en praktische vaardigheden die nodig zijn om Knowledge Graphs en Large Language Models (LLM's) te integreren in hun workflows voor datamodelleri...
22 mei 2025 Workshop met BPM-specialist Christian Gijsels over AI-Gedreven Business Analyse met ChatGPT. Kunstmatige Intelligentie, ongetwijfeld een van de meest baanbrekende technologieën tot nu toe, opent nieuwe deuren voor analisten met innovatie...
17 t/m 19 november 2025 De DAMA DMBoK2 beschrijft 11 disciplines van Data Management, waarbij Data Governance centraal staat. De Certified Data Management Professional (CDMP) certificatie biedt een traject voor het inleidende niveau (Associate) tot...
Alleen als In-house beschikbaar Het Logical Data Warehouse, een door Gartner geïntroduceerde architectuur, is gebaseerd op een ontkoppeling van rapportage en analyse enerzijds en gegevensbronnen anderzijds. Een flexibelere architectuur waarbij snell...
Deel dit bericht