设为首页 网站地图 联系我们
 
 
  产品中心
   
·深拓CMS
·现代化办公平台
·量化考核评估系统
·排队叫号和服务评价系统
·发票查询系统
·网上审批系统
·税收管理员平台
 
 
  解决方案
     
·[现代化办公平台]电子政务系统解决方案
·[农业]乡村信息上网平台建设方案
·[政府]内外网门户网站解决方案
·[企业]集团公司国际化互联网站建设方案
·[税务]税务行业政府网站解决方案
     
 
您当前所在位置: 首页 >> 产品中心
全文检索系统
 
 

  如何有效地管理、检索和使用大量的文本型数据信息,已经成为目前十分迫切的需求,专门处理文本型数据的全文检索系统便应运而生。全文检索系统的使用,可大大改善办公环境,提高企事业单位的办公自动化水平,帮助企业和事业单位在信息化办公过程中游刃有余的管理海量信息和资讯。目前,全文检索系统与输入系统、编辑器、排版系统、数据库管理系统一样,已成为办公室自动化系统的重要组成部分,而且也将成为常用的家庭软件。全文检索系统成为企业办公自动化和网站数据管理的必需帮手。

  据统计,在所有的存储数据中,有85%采用的是非结构化格式,非结构化信息每三个月增长一倍。由于信息格式的差异很大,所以基本无法整合为统一的接口供企业员工、政府工作人员或广大群众方便使用。

  全文检索系统以先进的信息整合处理技术为核心,为政府及企业建设高性能信息搜索平台,能够将分散的多种信息集中到统一的界面中进行搜索,让用户在一个搜索界面即可对特定的全部信息进行查找和管理,不论是内网的网页、办公的文档、行业的数据库,问天都能提供给您完美的检索解决方案。

产品概述
  全文检索系统是一个功能强大、高性能、灵活的全文索引和检索平台,核心功能是实现对结构化、非结构化信息的检索和统一存储。全文检索引擎的主要目标是实现文本索引的快速构建(Index Construction),动态文档集的索引维护(Index Maintenance),短语查询(Phrase Query)以及检索模型(IR Model)等。高性能和灵活可定制的架构使全文检索系统也可用于内外网检索、专业系统资料检索、行业专业数据库检索等领域。
  全文检索引擎支持办公文档、动静态网页、多种数据库等格式,系统也可以通过插件扩展。

产品架构
 

  总体上,全文检索系统可分为四个部分:(1)网页预处理部分。对所有网页进行正文提取,获取网页的标题文本以及其他网页指向该网页的链接文本信息。(2)索引部分。对全部文本信息分词和建立索引。(3)查询处理部分。实现对主题集的查询输入构造。(4)检索部分。实现对检索结果取出、排序和后处理。

功能特点

强大的信息采集能力
  全文检索系统是以先进的搜索技术为核心,并可针对专业用户所要求的搜索深度、采集精度和抓取速度等进行特殊优化。

毫秒级的实时检索
  全文检索系统采用增量实时索引技术保证信息即时采集即时检索,使用户随时检索到行业/地区最新的信息。
快速的检索响应
  全文检索系统可实现秒级的检索速度以及每秒上百次的并发检索支持,保证全面快速的响应用户检索需求。

精确的检索结果:
  全文检索系统采用智能中文切词技术,避免中文检索的歧义与多义现象,采用相关性算法对网页进行排序,保证检索相关性最高的页面放在最前面。同时,也可以根据客户要求,按照更新时间来源等分别排序。
丰富的检索结果展示:
  全文检索系统为用户提供丰富的检索结果展示,能够根据每个网站的不同风格和要求定制结果显示模版。检索结果包括智能动态摘要、独有的网页快照,以及多种检索结果排序方式等。能够极大的方便用户对检索结果的浏览查看,提高用户对检索效果的满意度。

产品特点和优势
可用于网站站内检索、数字图书馆、档案馆、专业数据库、行业数据库检索;
支持本地和远程多格式文档:TXT、DOC、HTM、WPS、XLS、PPT等文件;
支持MySQL 数据库统一检索查询;
无论是网页、文档、数据库均能实现增量检索,同步信息的变化;
每秒上百次的并发量支持;
可根据用户需求,加入专业领域词典,保证智能词语切分,更精准的检索;
对远程网页信息和文档等则可提供完整的快照效果和自动摘要;
先进的自有版权分词技术,避免中文检索的歧义与多义现象,确保检索结果的准确;
支持大数据量的网页、文本索引;
丰富的检索结果排序和显示方式,用户可选择自己适用的方式查看检索结果。

 
联系我们 | 网站地图 |  业务合作 | 友情链接
销售热线:0551-5232611  5232613
版权所有:合肥深拓计算机系统集成有限公司@2003-2010
皖ICP备04324580号 地址:合肥市高新区顶间花园东京座1205室
 
Produced By STCMS PublishDate:2010-05-20 15:24:22