Steps for Creating a Specialized Corpus and Developing an Annotated Frequency-Based Vocabulary List

  • Marie-Claude Toriida

Abstract

This article provides introductory, step-by-step explanations of how to make a specialized corpus and an annotated frequency-based vocabulary list. One of my objectives is to help teachers, instructors, program administrators, and graduate students with little experience in this field be able to do so using free resources. Instructions are first given on how to create a specialized corpus. The steps involved in developing an annotated frequency-based vocabulary list focusing on the specific word usage in that corpus will then be explained. The examples are drawn from a project developed in an English for Academic Purposes Nursing Foundations Program at a university in the Middle East. Finally, a brief description of how these vocabulary lists were used in the classroom is given. It is hoped that the explanations provided will serve to open the door to the field of corpus linguistics.

Cet article présente des explications, étape par étape, visant la création d’un corpus spécialisé et d’un lexique annoté et basé sur la fréquence. Un de mes objectifs consiste à aider les enseignants, les administrateurs de programme et les étudiants aux études supérieures avec peu d’expérience dans ce domaine à réussir ce projet en utilisant des ressources gratuites. D’abord, des directives expliquent la création d’un corpus spécialisé. Ensuite, sont présentées les étapes du développement d’un lexique visant le corpus, annoté et basé sur la fréquence. Les exemples sont tirés d’un projet développé dans une université du Moyen-Orient pour un cours d’anglais académique dans un programme de fondements de la pratique infirmière. En dernier lieu, je présente une courte description de l’emploi en classe de ces listes de vocabulaire. J’espère que ces explications ouvriront la porte au domaine de la linguistique de corpus. 

Published
2017-05-01
How to Cite
Toriida, M.-C. (2017). Steps for Creating a Specialized Corpus and Developing an Annotated Frequency-Based Vocabulary List. TESL Canada Journal, 34(1), 87-105. https://doi.org/10.18806/tesl.v34i1.1257
Section
In the Classroom