开发者社区  >  数据文档  >  自然语言处理

Longman Corpus

朗文语料库委员会(Longman Corpus Committee)


January1981- November 1990


设计原则:

1)尊重本族语言者的直觉和语料库权威

 

2)向研究人员提供语料(英国50%,美国40%,其它国家10%)

 

3)书面语 

选自1900~的20世纪英语:知识性(informative)文本

60%,想象性(imaginative)文本40%


10个分布广泛的领域:自然和纯科学、应用科学、社会科学、世界事务等


2800万词



精彩评论