Afgeronde Bachelorprojecten bij Axel Brink

Handwriting

Afgeronde projecten

Slant Correction

Frank de Zeeuw (afgerond in juli 2006)
"Slant is one of the characteristics that make handwriting harder to process automatically than printed text. For this reason slant correction is a standard step in systems for processing written text. In this article I will present an algorithm for automatically correcting slant. It works by first segmenting the text into words using horizontal and vertical projection histograms. Each word is then sheared by the angle that maximizes the height of peaks in the vertical projection histogram of the word. I will argue that the presented method is simple and fast, yet produces results similar to more advanced approaches. The algorithm has been incorporated into a system that uses an evolutionary algorithm to preprocess images of handwritten text for writer identification." Download scriptie (PDF)

Text area marking

Stefan Renkema (afgerond in augustus 2006)
"One of the difficulties facing handwriting recognition and writer identification software is dealing with non-text objects in their input. Stains and paper edges for example can be mistaken for actual text and thus lead to inaccurate results. I will propose a method for dealing with such side-effects by reducing the area in which recognition and identification will be performed to a rectangle slice, sized by the outer edges of the detected text. This greatly reduces the influence of non-text objects present in the original document, as well as objects added in the scanning process." Download scriptie (PDF)

The effect of Forced Slant on Automatic Writer Identification Performance

Roeland van Batenburg (afgerond in augustus 2007)
"The most common method used to forge handwriting is changing one's slant. Forensic experts ignore slant and automatic writer identification programs usually simply shear the handwritten text to an upright orientation. However, this last method has never been evaluated and there might be changes to the handwriting other than slant. The purpose of this research is to find out if there are such changes. In this research the performance of an automatic writer identification program on texts with changed slants is compared to texts with natural slant. This program uses the techniques ‘hinge’ and ‘run-length’ to identify handwriting. Without any preprocessing the program matches half of the authors of text with a changed slant to their original handwriting. When the text is deslanted before processing, the performance increases. However, there are indications that the forced slant causes changes to the handwriting, depending on the direction in which the slant is changed."
Download scriptie (PDF)

Tekstgebied zoeken in een pagina met handschrift

Popke Altenburg (afgerond in september 2007)
"Er is veel onderzoek naar zowel tekstherkenning als automatische schrijversidentificatie op basis van geschreven tekst. Op ingescande documenten staat echter vaak veel meer dan alleen tekst, zoals perforatiegaatjes, vlekken, of plaatjes. Deze onderdelen kunnen de automatische herkenningsmethoden erg verstoren, en hun prestaties verlagen. Mijn methode analyseert een gedigitaliseerd geschreven document om zo voor verdere toepassingen aan te geven wat wél tekst is en wat eventueel genegeerd kan worden. Van elk zogenaamd verbonden component (aaneengesloten vorm, zoals een letter, een woord, of een vlek) wordt een lijst van de volgende eigenschappen bepaald: hoogte, breedte, omtrek, lengte van het skelet en gemiddelde pendikte. Op basis van deze eigenschappen worden de verbonden componenten met 'k-nearest neighbor' classificatie geclassificeerd als tekst of non-tekst, en wordt zo het document gefilterd. Ook wordt er gekeken hoe belangrijk de afzonderlijke kenmerken zijn voor de classificatie." Download scriptie (PDF)

Scheiden van tekstregels

Job Zondag (afgerond in juli 2008)
"Een belangrijke stap in automatische handschriftherkenning is het opdelen van geschreven documenten in losse tekstregels. Geen enkel bestaand algoritme kan echter goed omgaan met slordig geschreven tekst. In dit artikel wordt besproken waarom huidige algoritmes niet goed werken en of het mogelijk is betere algoritmes te maken. Een van de beste huidige algoritmes werkt op basis van projectiehistogrammen. In dit artikel wordt aangetoond dat dit algoritme kan worden verbeterd met twee eenvoudige aanpassingen. Het algoritme behoudt echter het fundamentele probleem dat een schatting moet worden gemaakt van de schaal van het te verwerken document. Een alternatieve methode op basis van een Kohonen self-organizing map (KSOM) en een methode op basis van een genetisch algoritme worden geïntroduceerd. Deze algoritmes vormen geen betere oplossing dan het algoritme op basis van projectiehistogrammen. Uit een evaluatie van deze vier algoritmes blijkt dat het voor automatische regelscheiding van belang is meerdere kenmerken van tekstregels te benutten. Het integreren van deze verschillende kenmerken in een enkel systeem is problematisch." Download scriptie (PDF)

<< terug naar thuispagina van Axel Brink

Laatste wijziging: 6 augustus 2008.