A criação de um Corpus Informatizado de Textos Portugueses Medievais - o CIPM - teve início em 1993. Este corpus inclui textos latino-romances do século IX ao século XII e textos portugueses do século XII ao século XVI.

Até 2003, foram integrados textos de tipo notarial, crónicas e textos de prosa didáctico-moralista, já publicados ou fornecidos pelos próprios editores (v. referências das fontes).

Os textos que integram o CIPM são tratados segundo uma metodologia criada com vista a uniformizar as anotações relativas a referências e comentários e a normas de transcrição (v. anotações do CIPM).

Através da etiquetagem automática de textos e da posterior correcção de erros produzidos pelo etiquetador morfossintáctico, está a ser construído um corpus etiquetado.

MAPA DO CORPUS

Projecto financiado por FCT-MCES.