A criação de um Corpus Informatizado de Textos Portugueses Medievais - o CIPM - teve início em 1993. Este corpus inclui textos latino-romances do século IX ao século XII e textos portugueses do século XII ao século XVI. Até 2003, foram integrados textos de tipo notarial, crónicas e textos de prosa didáctico-moralista, já publicados ou fornecidos pelos próprios editores (v. referências das fontes). Os textos que integram o CIPM são tratados segundo uma metodologia criada com vista a uniformizar as anotações relativas a referências e comentários e a normas de transcrição (v. anotações do CIPM). Através da etiquetagem automática de textos e da posterior correcção de erros produzidos pelo etiquetador morfossintáctico, está a ser construído um corpus etiquetado.
|
Projecto financiado por FCT-MCES. |