所属分类:多国语言处理 开发工具:Visual C++ 文件大小:2KB 下载次数:164 上传日期:2006-10-16 17:17:25
说明: NLP技术实现,对语料库进行自动统计生成分词词典,对训练集进行分词,列出所有的分词可能并计算每种可能的概率。请使用者自行加入语料库和测试集。 (NLP technology to automatically Corpus Health Statistics ingredients dictionary, the training set for segmentation, list all the sub-term may calculate the probability of each possible. Requests for users to set and test sets.)