军队内网互联网新闻收集发布解决方案是以Goonie信息采集系统为核心,根据军队的内外网隔离特点而提出的网络信息雷达解决方案。根据军队保密的规定:“涉及国家秘密的计算机信息系统,不得直接或间接地与国际互联网或其它公共信息网络相联接”。为军队与军工单位拥有内网或专网但不能直接上外网(互联网)的用户,推出一种集Internet信息采集、安全导入内网,和内网信息搜索相结合的信息雷达系统,提供“互联网+内网”的信息采集、实时动态监测本单位用户所关心的大众新闻、行业新闻、地方新闻、军事动态等,推动党、政、军等涉密单位的信息化建设,为机关办公和领导决策提供多渠道、多种媒体的信息源。如何才能在确保内部网络和信息安全的前提下,将互联网信息安全导入内网,充实涉密单位的内部网站,使其“活”起来;如何在较短的时间内搜索内部网络的新闻信息,同时建立“互联网+内网”的实时互联网新闻图文库,以成为各级军队与军工单位的迫切需求。
Goonie信息采集系统采用领先的信息采集技术,能够自动智能化完成指定信息的采集、分类和发布等一系列信息处理过程,让这些分散在互联网上各个角落的数以亿计的海量信息为我所用。
同时Goonie信息采集系统具有丰富的接口,可以为网站、多种软件系统提供强大的信息处理应用,提高系统的应用价值。
应用领域
网络舆情形成迅速,对社会影响巨大,不仅需要各级党政干部密切关注,也需要社会各界高度重视。面对信息量日渐膨胀,如何快速高效的捕捉有价值信息来支持自身的发展,辅助工作、业务需要和战略决策,已成为军队的很重要一项目工作。
满足各军队官兵第一时间了解到互联网舆情动态、国内外网的军事报道、监测我军网后勤体系正负面的报道、兄弟单位的动态、国家的政策动态、突发事件、社会热点问题、政府决策、公众人物言行等等。
产品架构

Goonie信息采集系统由信息采集、数据存储、管理发布三部分组成。
1、外网信息采集服务器实现对目标网站的信息进行实时监控,并把最新的网页及时采集到本地,进行内容分析和过滤等操作;数据库服务器提供采集信息的存储服务。
2、通过光盘刻录将外网采集服务器的数据(新闻数据库+图片)拷贝到内网发布服务器。
3、内网管理发布服务器上,实现网页信息的统一发布,导航和检索功能。
产品功能
监控和采集
自定义URL来源及采集频率
用户可以设定采集的栏目、URL、更新时间、扫描间隔等,系统的扫描间隔最小可以设置成1分钟,即每隔一分钟,系统将自动扫描目标信息源,以便及时发现目标信息源的最新变化,并以最快的速度采集到本地。
支持多种网页格式
可以采集常见的静态网页(HTML/HTM/SHTML)和动态网页(ASP/PHP/JSP),还可以采集网页中包含的图片、等文档格式信息。
支持多种字符集编码
采集子系统能够自动识别多种字符集编码,包括中文、英文、中文简体、中文繁体等,并可以统一转换为GBK编码格式。
支持元搜索模式采集
元搜索模式集成了不同性能和不同风格的搜索引擎并发展了一些新的查询功能。查一个元搜索引擎就相当于查多个独立搜索引擎。
内容抽取、去重
内容抽取
系统可对网页进行内容分析和过滤,自动去除广告、版权、栏目等无用信息,精确获取目标内容主体。
信息归类
支持按采集栏目设置分类,并为分类设置相应属性,只要属于该栏目的信息即送到相应分类中。
自动去重
通过内容相关识别技术自动判别分类中文章的关系,如果发现描述相同事件的文章自动去除重复部分。
发布管理
对采集的信息可通过发布管理模块实时发布到网站上,并提供信息分类导航和检索功能;对于发布的信息,用户既可以查阅本地数据库中经过自动过滤的内容,也可以对照查阅原始网页。
支持自动发布和审核发布两种方式,在自动发布方式下,采集到的网页将自动发布到网站上,审核发布方式下,采集到的网页需要经过维护人员的选择才能发布到网站上。
产品优势
采用先进的数学模型和算法建立一个安全、稳定、准确、及时的信息智能采集系统。系统在总体设计上遵循稳定、开放、可扩展、经济、安全的原则,从而使整个系统结构合理,技术先进,易于扩展,既能满足当前的业务数据处理要求,又能符合长期发展的需要。
低耦合性:检索系统与门户网站及发布系统彼此间相对独立,直接采用XML进行数据交换,保证整体系统的底耦合性,系统彼此之间不会受到较大影响。
先进性:软件的投资要考虑到今后的发展,不能使用落后的产品与技术,避免投资的浪费;在系统软件选型、开发技术上,达到国内、外行业先进水平。
高效性:采集分类系统对系统的效率要求较高,本系统在底层的技术实现上采用C语言,运行效率卓越。同时对发布管理系统在数据处理和网络的稳定性上没有任何影响。
经济性:本系统在平台架构、技术选择上具有很高的先进性、可扩充性、开放性,从而极大的增加了系统生命周期,使得经济性原则得以保证。
易维护性:整套系统的数据维护简单,容易操作,完全通过WEB方式完成,降低维护的技术难度,也减少了人为隐患的发生。
运行环境
Microsoft Windows XP/NT/2000/2003/linux
SQL Server/Oracle/Mysql
应用案例
中国人民解放军总后勤部
中国人民解放军空军司令部
媒体报道
从谷尼国际软件飞速发展看软件产品口碑营销 天极网 2009-12-29 11:45 谷尼国际软件,中国定向搜索与舆情监测专业软件提供商,通过口碑营销,从行业代表企业入手,建立行业口碑,进而深入更深更广的领域。...品牌客户的应用案例和高度评价,为谷尼软件带来良好口碑,成为谷尼进军政府软件市场的敲门砖。在此后一年多的时间,... 7条相同新闻>> |
美国《时代》周刊采访谷尼国际软件 天极网 2009-12-22 11:00 谷尼国际软件:针对用户对个性化搜索的业务应用方向不同,目前我们的技术有三种搜索方式:全网搜索、定向搜索、专业数据库搜索,这个也是有别于目前国内公众搜索引擎服务的地方,...放眼目前中国定向搜索市场,谷尼人认为我们最大的竞争对手是自己,要始终在市场保持领先一步,只有实现自我突破才能保证技术持续进步。 ... 10条相同新闻>> |
新媒体时代的传统媒体路在何方? 凤凰网 2009-12-29 09:52 基于这种智能搜索技术,方正、谷尼等公司开发出互联网舆情监管软件系统,实现网络舆情和危机信息的实时监测和预警。...人立方关系搜索则以网上的各种文本内容为依据,对人们在网上的关系结构进行直观地展示,对于研究社会网络结构具有重要启示。... |
新媒体时代的传统媒体路在何方 新浪 2009-12-18 14:40 基于这种智能搜索技术,方正、谷尼等公司开发出互联网舆情监管软件系统,实现网络舆情和危机信息的实时监测和预警。...人立方关系搜索则以网上的各种文本内容为依据,对人们在网上的关系结构进行直观地展示,对于研究社会网络结构具有重要启示。... 3条相同新闻>> |
南京大学与谷尼联手打造复合型网络舆情实验室 深圳新闻网 2009-7-3 10:00 南京大学网络传播研究中心将与谷尼国际将共建舆情监控研究基地,打造全国首家探索性、前瞻性、复合型网络舆情实验室。 ...而谷尼国际软件(北京)有限公司是国内知名的定向搜索与网络监控技术供应商,先后成功开发了网络舆情监控系统、企业竞争情报系统等软件产品,... 2条相同新闻>> |
“网络舆情监控实验室”落户南大 为长三角首家 龙虎网 2009-7-3 09:55 昨天,谷尼国际软件(北京)有限公司与南京大学网络传播研究中心共同宣布,共建“舆情监控研究基地”,...网络舆情监测与分析实验室共同主任杨溟说:“未来媒体的竞争主要是信息源的竞争,Goonie网络监测系统将改变传统的媒体运作模式,信息的来源上,将线人报料改为网络搜索,... |
本文关键词:信息采集、网页采集、网页抓取、互联网信息采集