Uitvoerders: LIACS, Universiteit Leiden,
Camiel van Breugel, olv prof. G. Kempen.
Het omzetten van gegevens uit een databank naar een begrijpelijk stuk
geschreven of gesproken Nederlandse tekst wordt een steeds belangrijker
onderdeel van informatiediensten. Momenteel wordt deze functie voornamelijk
gerealiseerd door middel van 'ingeblikte teksten' die aan de gebruiker worden
gepresenteerd. Dit is echter zeer kostbaar, vooral als er veel mogelijke
antwoorden zijn en als er veel manieren zijn waarop het systeem het antwoord
moet kunnen geven. Bovendien is het ingeblikte resultaat erg kunstmatig als er
meerdere zinnen geproduceerd moeten worden. Het zou dus veel beter zijn wanneer
een dialoogsysteem ter plekke een antwoord in het Nederlands kan genereren,
aangepast aan de context. Hierbij is van belang om te weten wat de gebruiker al
is verteld, zodat er geen zinloze herhalingen optreden. Daarnaast is ook de
intonatie (prosodie) voor de menselijke luisteraar van groot belang om spraak
snel en foutloos te kunnen interpreteren. Automatische taal- en
spraakgeneratie kan onder meer de volgende doelen dienen:
1. Flexibele gesproken berichtmelding: snel wisselende actuele informatie ten
behoeve van informatiediensten, bijvoorbeeld spraakdiensten voor mobiele
telefoons.
2. Vraagbeantwoording: Nederlandse weergave van informatie die een
informatiesysteem heeft opgediept uit een kennisbank in reactie op specifieke
gebruikersvragen en -opdrachten, waarbij rekening gehouden wordt met de
taalkundige vorm van de vraag en kenmerken van de vragensteller.
3. Objectbeschrijving: het ter plekke componeren van korte, goedlopende teksten
ter beschrijving van multimediale objecten die de computergebruiker op het
beeldscherm geselecteerd heeft.
4. Opdrachtbevestiging: het herformuleren in goed Nederlands van vragen en
opdrachten die de gebruiker aan een kennisbank heeft voorgelegd;
dit helpt de gebruiker om na te gaan of een ingevoerde vraag/opdracht door
het systeem goed is geonterpreteerd.
5. Taalonderwijs: diverse toepassingen ten behoeve van het automatisch nakijken
en verbeteren van de zinsbouw in teksten geschreven door (vreemde)taalleerders.
In het onderzoek zal een aantal componenten worden ontwikkeld door de
Universiteit Leiden:
- Er is een Conceptualisator nodig die kennis (begrippen) kan vastleggen
met behulp van een logisch-semantisch formalisme.
- Een Grammatische Encoder is in staat om zinsbouw- en woordvorming te
realiseren.
- Een Lexicon (groot on-line woordenboek) is nodig, met per woord alle
benodigde grammaticale en semantische codes).
- Een Intonator en Spraaksynthetisator die goed verstaanbare en
verantwoorde spraakuitvoer garandeert, met de juist intonatie.
Met name het derde onderzoeksdoel: "objectbeschrijving" is een centraal
onderdeel van het overkoepelende I2RP-project
waar Spreekbuis deel van uitmaakt.
|