1887

n Literator : Journal of Literary Criticism, Comparative Linguistics and Literary Studies - Die ontwikkeling van 'n fleksievormgenereerder vir Afrikaans

USD

 

Abstract


In this article the development of an inflected form generator for Afrikaans is described. Two requirements are set for this inflected form generator, viz. to generate only one specific inflected form of a lemma and to generate all possible inflected forms of a lemma. The decision to use machine learning instead of the more traditional rule-based approach in the development of this core-technology is explained and a brief overview of the development of LIA, a lemmatiser for Afrikaans, is given. Experiments are done with three different methods and it is shown that the most effective way of developing an inflected form generator for Afrikaans is by training different classifiers for each affix. Therefore a classifier is trained to generate a plural form, one to generate the diminutive, one to generate the plural of diminutive, et cetera. The final inflected form generator for Afrikaans (AIL-3) reaches an average accuracy of 86,37% on the training data and 86,88% on a small amount of new data. It is indicated that, with the help of a pre-processing module, AIL-3 meets the requirements that were set for an Afrikaans inflected form generator. Finally suggestions are made on how to improve the accuracy of AIL-3.

In hierdie artikel word die ontwikkeling van 'n fleksievormgenereerder vir Afrikaans beskryf. Twee vereistes waaraan hierdie fleksievormgenereerder moet voldoen, word gestel, tewete om slegs een spesifieke fleksievorm van 'n lemma te kan genereer en om alle moontlike fleksievorme van 'n lemma te kan genereer. Die besluit om masjienleertegnieke te gebruik in die ontwikkeling van hierdie kerntegnologie in plaas van reël-gebaseerde metodes, wat die tradisionele benadering in die ontwikkeling van fleksievormgenereerders is, word verduidelik en 'n kort oorsig oor die ontwikkeling van LIA, 'n lemma-identifiseerder vir Afrikaans, word gegee. Daarna word geëksperimenteer met drie verskillende ontwikkelingsmetodes en uiteindelik word die fleksievormgenereerder ontwikkel deur verskillende klassifiseerders vir elke moontlike fleksievorm af te rig; dit wil sê daar is uiteindelik 'n klassifiseerder wat meervoudsvorme genereer, een wat diminutief genereer, een wat die meervoud van die diminutief genereer, een wat die attributiewe vorm van adjektiewe genereer, ensovoorts. Hierdie fleksievormgenereerder (AIL-3) bereik 'n gemiddelde akkuraatheid van 86,37% op die afrigtingsdata en 86,88% op 'n klein hoeveelheid nuwe data. Daar word aangetoon dat 'n voorverwerkingsmodule tot AIL-3 toegevoeg kan word om te verseker dat dit voldoen aan die vereistes wat vir 'n fleksievormgenereerder vir Afrikaans gestel is en uiteindelik word voorstelle gemaak oor hoe om die akkuraatheid van hierdie fleksievormgenereerder verder te verbeter.

Loading

Article metrics loading...

/content/literat/29/1/EJC62005
2008-04-01
2016-12-03
This is a required field
Please enter a valid email address
Approval was a Success
Invalid data
An Error Occurred
Approval was partially successful, following selected items could not be processed due to error