NWO/CATCH programma - project SCRATCH

SCRipt Analysis Tools for the Cultural Heritage

[English version] [Dutch version]

Het nationale onderzoeksprogramma NWO/Catch (Continuous Access To Cultural Heritage) wil methoden en technieken ontwikkelen waarmee collectiebeheerders hun collecties, het Nederlandse culturele erfgoed, digitaal toegankelijk kunnen maken. Het deelproject SCRATCH houdt zich specifiek bezig met het ontsluiten van grote collecties beeldmateriaal van handgeschreven documenten.

"Googelen" in handgeschreven archieven

Het automatisch lezen van aan elkaar geschreven tekst is nog steeds een bijzonder grote uitdaging voor wetenschap en techniek. Wanneer het gaat om de handgeschreven historische collecties bij het Nationaal Archief, dan is deze uitdaging nog groter. Ook mensen hebben moeite met het lezen van oud handschrift. Toch liggen hier grote mogelijkheden voor het inzetten van de computer. Immers, de hoeveelheden beeldmateriaal zijn erg groot. Dat maakt het mogelijk om met moderne methoden regelmatigheden te ontdekken. In het project wordt niet gestreefd naar het bouwen van een perfect lezende machine, dat is nog te moeilijk. Wel worden er methoden ontwikkeld die het zoeken ("Googelen") in grote handgeschreven archieven mogelijk maken.

Onderzoek

Het onderzoek kan worden opgesplitst in (a) het bestuderen van de lettervormen (patroonherkenning) en de statistische eigenschappen van de vormenruimte en (b) het bestuderen van de tekstuele ("talige") regelmatigheden van de inhoud van documenten in een bepaald, homogeen archief (statistische computerlinguistiek). Het voorbeeldarchief dat hierbij gebruikt gaat worden is van het Kabinet van de[n] Koning[in]. Dit archief is handgeschreven door een beperkt aantal ambtenaren, die zorgvuldig de genomen besluiten hebben geindexeerd en vastgelegd. Als de automatische methoden van schriftherkenning hierop goed werken, wordt er in een latere fase van het project overgestapt op andere collecties om de ontwikkelde methoden te toetsen.

Illustraties

Participerende instanties

Research Team

Resultaten

Informatie

Meer informatie kunt u opvragen bij:
prof. Lambert Schomaker
Kunstmatige Intelligentie
Rijksuniversiteit Groningen
Grote Kruisstraat 2/1
9712 TS Groningen
Tel: 050-3637908