Blog
Auto NER
Het herkennen van persoonsnamen, bedrijven en locaties is een veelvoorkomende taak in natuurlijke taalverwerking (NLP). Deze taak wordt ook wel Named Entity Recognition (NER) genoemd.
Beter samenvatten
“Maar ChatGPT kan toch samenvatten?”. Die vraag krijg je natuurlijk als je zelf geavanceerde samenvattingstechnologie ontwikkelt. Maar we zouden natuurlijk niet iets bouwen als het makkelijk met een andere tool oplosbaar is. Zou ons namelijk een hoop tijd schelen!
Kleine handen dragen veel werk.
Large Language Models (LLMs) hebben de populariteit en inzet van AI een flinke boost gegeven, maar ook zien we dat LLMs nu worden ingezet voor taken waar het veel handiger is juist een klein toegespitst AI model in te zetten. Of eigenlijk de "saaie" AI toepassingen die we al jaren kennen.
Tekstverbanden verbeteren met wereldkennis
Stel ik leg aan een verzekeraar de situatie uit: “Ik ben met mijn auto gebotst [...] De ruit heeft lichte schade opgelopen.” Dan begrijpen wij mensen dat met “de ruit”, “de ruit van de auto” wordt bedoeld en dat schade het gevolg is van de botsing.
Article Discovery: Schonere data door automatische artikeldetectie
In veel projecten met conversational AI en taalverwerking in het algemeen speelt content-aggregatie een belangrijke rol. De vaardigheid van een AI-systeem wordt beïnvloed door de content (data) die je in het systeem kunt stoppen en het is belangrijk dat dit kwalitatief en met structuur gebeurt.
Eerdere publicaties
Het (verborgen) belang van het lidwoord in taaltechnologie.
In de Nederlandse taal zijn onze lidwoorden (de, het, een) een van de meest voorkomende woorden. Ze worden gebruikt om een zelfstandig naamwoord te introduceren en komen daardoor in vrijwel iedere zin wel voor. • (2023) Lees verder →
Het belang van context.
Ben je wel eens in een schoenenwinkel naar de kassa gelopen, waarbij de medewerker het gesprek startte met "Ik ben Sem, een behulpzame en vriendelijke assistent". Nee? Toch is dit gemiddeld hoe een gesprek start met een gemiddelde chatbot of voicebot. • (2023) Lees verder →
Guided Summaries
Vraag een LLM zoals ChatGPT of PaLM een lange tekst samen te vatten, dan rolt er een kortere tekst uit. Simpel en krachtig toch? LLM's zijn wat dat betreft wonderbaarlijke transformatie machines waar tekst zonder slag of stoot wordt omgezet. Maar deze stille transformatie zonder enige uitleg brengt ook beperkingen met zich mee. • (2023) Lees verder →
"Wat een wolf anders maakt dan een hond"
Een veelgebruikte toepassing van machine learning is het classificeren van data. Classificatie is automatisch herkennen of indelen van data in (voorgedefinieerde) categorieën. Dit kunnen bijvoorbeeld afbeeldingen zijn. • (2023) Lees verder →
Tests en monitoring in een tijd van AI
Veel developers kennen wel de meme 'It works on my machine'. Software die perfect op de ene machine werkt, kan op een net andere machine of in een veranderende omgeving compleet falen. • (2023) Lees verder →
"Wie A zegt moet ook B zeggen"
Een zeer bruikbare en nuttige toepassing van taaltechnologie is het maken van samenvattingen. Dagelijks krijgen we zoveel informatie te verwerken dat er steeds meer behoefte komt aan het filteren en beknopter maken van informatie. Toegang tot beknoptere informatie helpt ons efficiënter keuzes te maken aan welke informatie we onze tijd moeten besteden. • (2023) Lees verder →
Reductie in complexiteit
Een fascinerend aspect van de totstandkoming van de baanbrekende transformer architectuur (Google Brain team, 2017), sindsdien het dominante component in de huidige AI-revolutie, is het destijds streven naar meer eenvoud. • (2023) Lees verder →
Innovaties
Cornelistools B.V. is een techbedrijf waarbij innovatie een van de belangrijkste peilers is. Onze slogan is niet voor niks 'Next Generation Tools' omdat we met onze ontwikkelingen op het gebied van o.a. conversational AI willen voorlopen in relevante functionaliteit t.o.v. de huidige generatie producten. • (2023) Lees verder →
Richting Voice Marker II
In onze producten speelt taal een belangrijke rol. Zo maken we het met onze taaltechnologie het mogelijk dat kinderen educatieve spelletjes kunnen spelen met hun stem via voicebots, zetten we met taal- en dialoogtechnologie websites om naar de meest uitgebreide leerzame chatbots • (2023) Lees verder →
Streaming NLP
Traditionele Natural Language Processing (NLP)-systemen verwerken documenten op een gelaagde manier: In een zogeheten verwerkingsstraat ondergaat de tekst stap voor stap logische bewerkingen om tot het eindresultaat te komen, denk aan een rijtje dominostenen. • (2023) Lees verder →
Richting een betere technische oplossing voor coreferentie in taal
Een belangrijk en uitdagend vraagstuk binnen Natural Language Processing is coreference resolution (coreferentie). Coreferentie is in simpele woorden gezegd het verwijzen naar hetzelfde in tekst. Verwijzingen kunnen zich op vele manieren manifesteren en we gebruiken verwijzingen continu. • (2023) Lees verder →
LLM's en compute: De stand van zaken
Large Language Models (LLM’s) hebben in het afgelopen jaar interessante nieuwe eigenschappen laten zien in de NLP-industrie. LLM’s zijn tot stand gekomen met een zeer grote hoeveelheid data en in het bijzonder veel rekenkracht (compute). Het budget om deze modellen te trainen kan • (2022) Lees verder →
Timing in voicebots
Is jouw voicebot performant of ervaar je een gesprek als een trage satellietverbinding? In dat geval is het goed om eens de timing van de voicebot te optimaliseren. Met timing van de voicebot bedoelen we o.a. de reactiesnelheid, spreeksnelheid en rust tussen zinnen. • (2022) Lees verder →