所属分类:
多国语言处理
开发工具:Java
文件大小:8KB
下载次数:44
上传日期:2009-02-07 16:57:18
说明: 中文自动分类。使用spider抓取网络信息,利用lucene的分词及KNN方法。
(Chinese automatic classification. The use of spider crawl network information, the use of Lucene sub-word and KNN methods.)
文件列表:
text_category
.............\Category.java
.............\ChineseTokenizer.java
.............\FirstSupport.java
.............\KNN.java
.............\package.properties
.............\Result.java
.............\Spide.java
.............\text_category
.............\.............\Result.class
.............\WVTManager.java