Classificatie: Deze module classificeert teksten in verschillende categorieën. Bijvoorbeeld het classificeren van nieuwsartikelen naar: sport, economie, cultuur, medisch, etc. De categorieën kunnen zelf worden bepaald en zullen voor iedere organisatie verschillen.
Thema identificatie: Het Machine Learning model deelt teksten in naar clusters met min of meer gelijksoortige teksten. Sleutelwoorden geven een indicatie wat de thema’s van de verschillende clusters zijn. . Indien veel sleutelwoorden in een cluster bijvoorbeeld over klimaat gaan, label je dat cluster ‘Klimaat’.
Sentiment analyse: Met sentiment analyse bepalen we wat het sentiment over onderwerpen, personen, organisaties is.
Named Entity Recognization: Named entities zijn in nederlands vaak eigennamen, stukjes tekst die een specifiek object duiden als: personen, organisaties, datums, evenementen, locaties, etc. In combinatie met de andere modules geeft named entity veel inzicht. Bijvoorbeeld welke personen worden vaak in teksten van een bepaald thema genoemd en is dit in positieve of negatieve zin.