1887

n Lexikos - Revisiting lemma lists in Swahili dictionaries

Volume 27 Number 1
  • ISSN : 1684-4904
  • E-ISSN: 2224-0039

Abstract

When compiling a dictionary, a lexicographer has a set of decisions to make - starting with drawing up a lemma list to such issues as formatting a dictionary entry. Relying on corpus data while designing a lemma list and describing entries is standard in present lexicography, but there are still decisions - like the choice of a lemma or how to treat derivatives - that are often intuition-based. This article aims to investigate whether decisions put forward in Swahili diction-aries comply with users' expectations. We analyse log files from the new Swahili-Polish dictionary to investigate why looking up words goes wrong, and evaluate the choice of a lemma and the treatment of derivatives in Swahili dictionaries. Based on such data we intend to expand or modify the existing electronic dictionary to adapt to users' level of grammar and dictionary structure knowledge. During this research we identified a list of lemma lacuna that cause the majority of unsuccessful Swahili searches. The study shows that users know and understand the lemmatisa-tion strategy of the dictionary but also reveals which word forms cause the most problems and how the lemma list of Swahili dictionaries could be expanded.

Die herbesoek van lemmalyste in Swahili-woordeboeke.

Wanneer 'n woordeboek saamgestel word, moet 'n leksikograaf 'n reeks besluite neem — van die opstel van 'n lemmalys, tot kwessies soos die formatering van 'n woordeboekinskrywing. Om staat te maak op korpusdata wanneer 'n lemmalys opgestel en inskrywings beskryf word, is standaard-praktyk in die huidige leksikografie, maar daar is steeds dikwels besluite - soos die keuse van 'n lemma of hoe om afleidings te hanteer - wat op intuïsie gebaseer is. Hierdie artikel beoog om te ondersoek of besluite wat in Swahili-woordeboeke geneem is, voldoen aan gebruikers se verwag-tings. Ons analiseer loglêers van die nuwe Swahili-Poolse woordeboek om te ondersoek waarom die opsoek van woorde skeefloop, en evalueer die lemmakeuse en die hantering van afleidings in Swahili-woordeboeke. Ons beoog om die bestaande elektroniese woordeboek op grond van hierdie data uit te brei of te wysig om aan te pas by gebruikers se vlak van kennis ten opsigte van gramma-tika en woordeboekstruktuur. Tydens hierdie navorsing het ons 'n lys van leemtes ten opsigte van lemmas geïdentifiseer wat die meerderheid van onsuksesvolle Swahili-soektogte veroorsaak. Die navorsing toon dat gebruikers die woordeboek se lemmatiseringstrategie ken en verstaan, maar openbaar ook watter woordvorme die meeste probleme veroorsaak en hoe die lemmalys van Swahili-woordeboeke uitgebrei kan word.

Loading full text...

Full text loading...

Loading

Article metrics loading...

/content/journal/10520/EJC-bdfa2aa51
2017-12-01
2019-04-24

This is a required field
Please enter a valid email address
Approval was a Success
Invalid data
An Error Occurred
Approval was partially successful, following selected items could not be processed due to error