P>V1.1改进
加入搜索风云榜、搜索代码、索引目录管理、网页权重设置等功能,改进检索提高搜索速度。
系统简介
K-PageSearch是由Kwindsoft在2007年自主研发的专为行业、专类信息检索设计的网页搜索引擎。主要功能特点:网络蜘蛛、定向采集、正文提取、中文分词、全文索引、相关度排序、网页快照、相关搜索、竞价排名;后台数据库采用Microsoft SQL Server,静态化搜索系统设计采用XML数据岛缓存搜索结果提高系统的稳定性和性能、节省服务器资源减轻系统负担。
网络蜘蛛
K风蜘蛛组件包括三大功能模块:链接采集、网页分析、无效网页扫描;
自动识别GB2312、BIG5、UTF-8、Unicode等网页编码;
文件类型证察防止非文本类型文件采集;
K风蜘蛛可以采集ASP、PHP、JSP等动态数据网页和HTML、SHTML、XHTML等静态网页;
支持续采功能,如果因系统、网络等故障问题终止采集,系统将在下次启动采集时提示您是否“继续采集”或“结束任务”;
采集任务管理功能可以设置多个采集任务安排计划工作,每一个采集任务将会顺次运行;
定向采集
指定采集特定的网页,进行专类信息网页采集是垂直搜索引擎提高内容质量和相关度的关键技术。
链接包含关键字:链接中必须包含的关键字;例如:download|mp3|soft;可以使用“|”分隔多个包含关键字;
链接排除关键字:链接中不包含的关键字;例如:download|mp3|soft;可以使用“|”分隔多个排除关键字;
网页包含关键字:网页中必须包含的关键字;例如:K风|网页|搜索;可以使用“|”分隔多个包含关键字;
网页排除关键字:网页中不包含的关键字;例如:K风|网页|搜索;可以使用“|”分隔多个排除关键字;
正文提取
Kwindsoft自主研发的正文提取组件,它的功能是把一个网页的主题中心内容提取出来并把与该网页主题无关的信息(广告、导航、栏目等非网页正文内容信息)过滤。此项技术有效保证网页信息采集的质量提高检索相关度,智能识别、准确提取网页正文,内容网页提取识别准确率达到80以上。
中文分词
Kwindsoft自主研发的中文分词组件,可以识别中、英文字。带有特殊符号过滤功能。
分词效果演示
原文:Kwindsoft Search World! K-PageSearch★专为行业、专类信息检索设计的网页搜索引擎。主要功能特点:网络蜘蛛、定向采集、正文提取、中文分词、全文索引、相关度排序、网页快照、相☆♀◆关搜索、竞价排名;后台数据库采☆用Microsoft SQL Server,静态化搜索系统设计采用XML数据岛◆缓存搜索结果提高系统的稳定性和性能、节省服务器资源减轻系统负担。
分词:Kwindsoft Search World KPageSearch 专为 行业 专类 信息 检索 设计 的 网页 搜索 引擎 主要 功能 特点 网络 蜘蛛 定向 采集 正文 提取 中文 分词 全文 索引 相关 度 排序 网页 快照 相关 搜索 竞价 排名 后台 数据 库 采用 Microsoft SQL Server 静态 化 搜索 系统 设计 采用 XML 数据 岛缓存 搜索 结果 提高 系统 的 稳定 性和 性能 节省 服务 器 资源 减轻 系统 负担
全文索引
全文索引是目前搜索引擎的关键技术之一,本系统采用Microsoft SQL Server全文引擎。通过索引指定数据库中的每个单词,全文索引实现了强大而快速的检索方式。
相关度排序
系统按照相关度计算决定结果的排序,根据关键词权重与出现频度排序使搜索结果更加准确。
网页快照
如果无法打开某个搜索结果或打开速度慢该怎么办?“网页快照”可以帮助您解决问题。网页快照是以文本格式存储在服务器上,如果原网页进行了修改、删除或屏蔽后,我们还可以使用“网页快照”功能来浏览原网页的内容。网页快照需要大量的存储空间,可以设置开启或关闭网页快照功能,关闭时系统将不保存网页快照。
相关搜索
相关搜索是指与搜索关键词相似、相近的关键词,这些相关搜索的关键词是根据过去所有用户使用过的关键词记录计算出来的。当用户搜索的关键词符合条件时系统会自动记录下来并统计,可以点击“更多相关搜索”查看关键词的搜索统计情况。相关搜索能帮助您更快地找到更有价值的结果。
竞价排名
一个方便实用的专业竞价排名系统,可以对会员提交的网站排名、右侧推荐、E点通信息进行竞价排名,出价越高排名越前,会员注册以后可以一站式自助管理竞价信息。合理的计费模式,同一IP客户端同一天里多次点击同一条竞价信息只计费一次。系统可以设置最低的充值和IP点击消费金额,会员可以自助在线实时充值帐号或系统管理员代办。