O eDictor é
A ferramenta combina um editor de XML e um etiquetador morfossintático, e permite a geração automática de versões correspondentes a edições diplomáticas, semi-diplomáticas e modernizadas (em html), e de versões com anotação morfossintática (em texto simples e xml). Um módulo para a anotação sintática está em desenvolvimento.
eDictor 1.0 beta 10
[ Download ]
[ Manual (2010) – PDF ]
Desenvolvimento:
P.P.F. Faria; F.N. Kepler; M.C. Paixão de Sousa
O eDictor (versão 1.0 beta) é utilizado pelos seguintes grupos e projetos de pesquisa:
- Corpus Anotado do Português Tycho Brahe (Universidade Estadual de Campinas)
- Grupo de Pesquisas Humanidades Digitais (Universidade de São Paulo)
- Laboratório de História do Português Brasileiro (Universidade Federal do Rio de Janeiro)
- P.S. – Projeto para o Arquivo Digital de Escrita Quotidiana em Portugal e Espanha na Época Moderna (Universidade de Lisboa)
- Corpus Eletrônico de Documentos Históricos do Sertão, CEDOHS (Universidade Estadual de Feira de Santana)
- Memória Conquistense (Universidade Estadual do Sudoeste da Bahia)
- Projeto do Libolo (Universidade de Macau e Universidade de São Paulo)
Atualmente, uma versão web-based do eDictor está sendo desenvolvida
pela equipe do Corpus Tycho Brahe, na Unicamp:
http://www.tycho.iel.unicamp.br/redmine/projects/e-dictor/wiki
Publicações:
- PAIXÃO DE SOUSA, M. C.; KEPLER, F. N.; FARIA, P. P. F. E-Dictor: Novas perspectivas na codificação e edição de corpora de textos históricos. In: Tania Shepherd; Tony Berber Sardinha; Marcia Veirano Pinto. (Org.). Caminhos da linguística de corpus. Campinas: Mercado de Letras, 2010. [PDF]
- FARIA, P. P. F.; PAIXÃO DE SOUSA, M. C.; KEPLER, F. N. An Integrated Tool for Annotating Historical Corpora. The Fourth Linguistic Annotation Workshop (LAW IV) at The 48th Annual Meeting of the Association for Computational Linguistics (ALC 2010), Uppsala, 2010. (Congresso). [PDF (poster)]
- PAIXÃO DE SOUSA, M. C.; KEPLER, F. N.; FARIA, P. P. F. O Processamento automático de textos antigos: Desafios e Experiências. Workshop de Linguística de Corpus do Projeto Para a História do Português Brasileiro (PHPB), São Paulo, 2010. (Conferência). [PDF (slides)]
- PAIXÃO DE SOUSA, M. C. Desafios do processamento de textos antigos: primeiros experimentos na Brasiliana Digital. I Workshop de Linguística Computacional da USP,2009. (Conferência). [PDF(slides)]
- PAIXÃO DE SOUSA, M. C.; KEPLER, F. N.; FARIA, P. E-dictor: Novas perspectivas na codificação e edição de corpora de textos históricos. VIII Encontro de Linguística de Corpus, Rio de Janeiro, 2009. (Comunicação).
- PAIXÃO DE SOUSA, M. C.; KEPLER, F. N.; FARIA, P. E-dictor: Novas perspectivas na codificação e edição de corpora de textos históricos. In: VIII Encontro de Linguística de Corpus, 2009, Rio de Janeiro. Resumos, 2009. [PDF (slides)]
- PAIXÃO DE SOUSA, M. C.; KEPLER, F. N. E-Dictor: Uma ferramenta integrada para a anotação de edição e classe de palavras. VI Encontro de Lingüística de Corpus, São Paulo, 2007. [abrir página]
Fuente: eDictor.