NWO/ToKeN2000 project:
Spreekbuis: Automatische Taal- en Spraakgeneratie in het Nederlands

Uitvoerders: LIACS, Universiteit Leiden,
Camiel van Breugel, olv prof. G. Kempen.

Het omzetten van gegevens uit een databank naar een begrijpelijk stuk geschreven of gesproken Nederlandse tekst wordt een steeds belangrijker onderdeel van informatiediensten. Momenteel wordt deze functie voornamelijk gerealiseerd door middel van 'ingeblikte teksten' die aan de gebruiker worden gepresenteerd. Dit is echter zeer kostbaar, vooral als er veel mogelijke antwoorden zijn en als er veel manieren zijn waarop het systeem het antwoord moet kunnen geven. Bovendien is het ingeblikte resultaat erg kunstmatig als er meerdere zinnen geproduceerd moeten worden. Het zou dus veel beter zijn wanneer een dialoogsysteem ter plekke een antwoord in het Nederlands kan genereren, aangepast aan de context. Hierbij is van belang om te weten wat de gebruiker al is verteld, zodat er geen zinloze herhalingen optreden. Daarnaast is ook de intonatie (prosodie) voor de menselijke luisteraar van groot belang om spraak snel en foutloos te kunnen interpreteren. Automatische taal- en spraakgeneratie kan onder meer de volgende doelen dienen:

1. Flexibele gesproken berichtmelding: snel wisselende actuele informatie ten behoeve van informatiediensten, bijvoorbeeld spraakdiensten voor mobiele telefoons.

2. Vraagbeantwoording: Nederlandse weergave van informatie die een informatiesysteem heeft opgediept uit een kennisbank in reactie op specifieke gebruikersvragen en -opdrachten, waarbij rekening gehouden wordt met de taalkundige vorm van de vraag en kenmerken van de vragensteller.

3. Objectbeschrijving: het ter plekke componeren van korte, goedlopende teksten ter beschrijving van multimediale objecten die de computergebruiker op het beeldscherm geselecteerd heeft.

4. Opdrachtbevestiging: het herformuleren in goed Nederlands van vragen en opdrachten die de gebruiker aan een kennisbank heeft voorgelegd; dit helpt de gebruiker om na te gaan of een ingevoerde vraag/opdracht door het systeem goed is geonterpreteerd.

5. Taalonderwijs: diverse toepassingen ten behoeve van het automatisch nakijken en verbeteren van de zinsbouw in teksten geschreven door (vreemde)taalleerders.

In het onderzoek zal een aantal componenten worden ontwikkeld door de Universiteit Leiden:

  • Er is een Conceptualisator nodig die kennis (begrippen) kan vastleggen met behulp van een logisch-semantisch formalisme.

  • Een Grammatische Encoder is in staat om zinsbouw- en woordvorming te realiseren.

  • Een Lexicon (groot on-line woordenboek) is nodig, met per woord alle benodigde grammaticale en semantische codes).

  • Een Intonator en Spraaksynthetisator die goed verstaanbare en verantwoorde spraakuitvoer garandeert, met de juist intonatie.

Met name het derde onderzoeksdoel: "objectbeschrijving" is een centraal onderdeel van het overkoepelende I2RP-project waar Spreekbuis deel van uitmaakt.