《互联网信息搜索与监测系统-网络舆情.docx》由会员分享,可在线阅读,更多相关《互联网信息搜索与监测系统-网络舆情.docx(18页珍藏版)》请在优知文库上搜索。
1、互联网信息搜寻与监测系统白皮书江苏金鸽网络科技有限公司2014年7月书目一、 开发背景1二、 系统概述1三、 系统结构2四、 功能简介3(一)信息采集3(二)信息监测4(三)智能分析5(四)信息预警6(五)统计报告7(六)舆情导控8(七)协助功能9(八)系统管理10五、 系统特色10(一)深度与广度相结合的信息采集方式10(二)基于语义的负面信息过滤技术11(三)智能的行业核心智能体11(四)信息采集智能倜度11(五)属性自动提取技术11(六)来源规则匹配技术11(七)黑名单网站自动发觉技术12(八)移动终端信息展示技术12六、 运行环境12七、公司资质14八、联系方式16一、开发背景依据第3
2、3次中国互联网络发展状况统计报告,截至2013年12月,中国网民规模达6.18亿,瓦联网普及率为45.8%。其中,手机网民规模达5亿。中国进入“大众麦克风”时代,各类网络媒体如微博、微信等新兴媒体层出不穷,导致社会舆论格局发生巨大改变,每一位网民和手机用户都可能成为“公民报道者“,在一些突发公共事务中常常成为第一信源。特殊是微博客、微信的异军突起,成为新闻曝光和舆论发酵的重要平台,信息的传播速度足以在数小时内传遍全球,因此,刚好驾驭舆论相关信息,无论对政府还是企事业单位,都有若至关全要的意义。由丁互联网具有虚拟性、隐藏性、发放性、渗透性和随意性等特点,越来越多的网民乐意通过这种渠道来表达观点、
3、传播思想。但是,网络信息存在很大的不行控性,使网络更简单成为种非理性的表达渠道,任何个被关注的事芬,都筒单在网上产生舆论风暴效应,短时间内形成新闻热点,进而对政府、公众产生巨大的舆论压力。为了有效的解决舆情管理工作中存在的滞后、被动的弊端,达到全面、刚好的获得互联网信息的目的,须要建立1.i联网信息搜寻与监测系统,形成全方位的监测网络体系,实现手工监测模式向信息化监测模式的转变。二、系统概述:联网信息搜寻与监测系统软件,是一款集信息的搜寻、采集、分析、预瞽、整合、呈报、导控为体的海量信息挖掘工具软件,以实现“发觉信息源头,追踪传播路径,监控传播主体,导控舆论倾向”为总体目标。系统针对不同行业的
4、业务需求,在领域专家的帮助下,实现对互联网上的论坛、博客、新闻、贴吧、微博、搜寻引擎、微侑等各类媒介信息的精准搜寻与实时监测:系统采纳自然语言理解、学问挖掘、本体构建等核心技术,对信息进行有效的提取、分析、过滤、聚类、分类和预警,以满意广阔用户对信息“刚好性、全面性、智能性、精准性”的运川要求:系统供应仃方信息权威发布和精准信息定向回豆功能,以达到“早监测、早发觉、早处置,、早导控”的目的。三、系统结构系统采纳B/S(BrouserZServer,阅读器/服务器系统结构。数据的分析和存储由位于网络中心的服务涔处理,不管是系统管理员还是终端用户,都通过阅读器来访问本系统获得、分析和处理信息。这种
5、结构能做到真正的分布式网络计算,有效降低网络流量,减轻客户端负担,还能平安、便利地与互联网接口。另外用户分布或行走于全国各地.通常都有移动办公需求,系统供应移动终端访问接口,用户只需随身携带移动通信设备,就可以访问系统,获得最新舆情信息。信息采JftKM(31.*%*)1.f1.2)采鬃信mmIiIf1.信息IR力搜索平台管理信息监制系统结构图四、功能简介系统首页(一)信息采集系统采纳定向采集和全网搜集相结合的信息采集方式,针对与日常业务具有亲密关系的网站进行实时监控,使网站的任何新的信息能快速刚好的被采集。(1)内置的搜寻信息整合功能系统内置了儿十个搜寻引擎,支持对知名新网媒体、论坛、贴吧及
6、微博网站、微信平台的站内垂直搜寻,扩大了信息采集的范围.管理抗依据系统的运行状态、服务耦资源运用状况,敏捷设置搜?引擎的启用或暂停,提升系统搜?引擎的臼动调度实力。采纳基于学问库的信息提取技术,过滤掉部分无效的信息,提取出关键、敏感的信息,达到精确搜寻。(2)新闻、资讯类网站的采集系统支持对新闻网站上的新闻、资讯信息的采集,可以采集信息中的标题、作拧、来源、时间、正文、点击率等信息项,可采集网站包括新华网、人民网、中国政府网、新浪新闻、搜狐新闻、联合早报、路透中文网、中国网、环球网、网易新闻、正义网等等。(3)博客类网站的采集系统支持对博客网站上的博文信息进行采集,可以采集博文标题、发表时间、
7、内容、标签、分类、评论、评论人、阅读人次、转发量等信息项,可采集网站包括新浪博客、博客网、网易网客、搜狐博客等等。(4)论坛、贴吧类网站的采集系统支持对论坛、贴吧网站上的发帖回帖信息进行采集,可以采集帖子标题、发表时间、发帖人昵称、帖子内容、阅读次数、回复次数、回帖人昵称、每个回帖内容等信息项,可聚集网站包括强国论坛、天际社区、西祠胡同、新浪论坛、百度贴吧等等.(5)微博、微信类网站的采集系统支持对新浪、腾讯、搜狐、网易等各大微博网站上的信息进行采集,同时支持对微信平台信息的搜寻采集,可以采集微博网站首页的热点信息、各行业及政府机关的官方微博信息、指定用户ID的微博上的信息。(6)特性化采集目
8、标的一便式配置过程用户除了可以在公共采集目标中勾选自己所关注的采集目标外,还可以自己新增自定义采集目标,自定义采集目标是用户特性化的,只有管理员可以看到,其他用户是看不到的。系统采纳自动化的采集目标配置过程,用户只须要辘入网站的地址,就可以实现的对该网站的采集。网站的类型、编码、时间格式以及版面、子版面等信息参数系统都能自动获得,无需用户配置。(二)信息监测系统将互联网的信息监测分为六种:本我监测、业务监测、行业监测、人员监测、事务监测、定向监测。本我监测,主要监控网络上与本单位亲密相关的信息,比如信息中提到本单位的某个人、某个部门或拧某件事,只要涉及到本单位的信息,就可以监测到,并自动In集
9、到预先设定的本我监测类别。业务监测,主要监控网络上与本单位业务范B1.亲密相关的佶息,比如检察院,关注的就是检察系统工作中感爱好的信息,为检察工作供应案件线索、分析事务发展态势等,比如反贪、渎职、公诉等等相关的信息,只要与本单位业务相关,就可以监控到。行业监测,主要监测互联网上同行业兄弟单位的最新信息。人员监测,主要用来对本单传主要领导、关健岗位岐对本单位影响较大的相关人员的监测,采纳智能化生成规则的方式,可依据用户须要,生成几十、儿白、甚至上千条监测规则.事务监测,主要是针对已发生的或者将来可能发生的重大突发性事务进行监测。用户可以选取系统内巴的特征词,也可以自定义需监测事务的特征词,用来完
10、成对网络上舆情信息的有效挖掘、刚好监测。定向监测,可以对新浪、搜狐、脚讯、网易等主流微博进行定点监制,还可以对百度贴吧、微信进行定点监测,保证第一时间获得关注对象的信息。(三)智能分析系统采纳多维的信息分析统计技术,对网络突发事务从发生、扩散、高潮和缓和各个阶段的信息分布、媒体传播趋势.媒体分布及起源信息进行分析,并以图文并茂的形式直观展示网络舆情的动态。智能分析(四)信息预警监测预警是一种时效性要求很高、重要程度要求很高的精准网络舆情监测功能。监测预警包括监测和预警两个过程,当系统监测到舆情信息后将刚好发出预警,让相关人员第一时间驾驭舆情状况。本系统预警方式分为三种:在线弹框预警、手机短信预
11、警和电子邮件预警.系统采纳信息分预警机制,用户可依据自身需求自由设置信息的覆警方式、预警周期、3(警对象以及fi(警条件。用户可以设置当系统监测到突发事务发生时,以短信、邮件等方式刚好通知相关人员,实现刚好预警、快速处理舆情的效果。用户无需时刻盯在电脑桌前就可查看和处理最新的监测信息,真正实现把用户从繁忙的舆情监测工作中解放出来。预警设置(五)统计报告系统供应典情专报、简报和典情统计汇总表三种报告形式,用户可以针对某个舆情事务生成专报,记录事务的来龙去脉,也可以从信息列表中勾选一些重要的信息生成信息简报,向相关领导汇报,还可以统计段时间内的舆情具体信息,便利管理人员整理归档,此外系统还支持专报
12、的自动生胜利能.系统供汽媒体统计、专题统计和覆警统计三项综合统计功能。媒体统计功能可以直观的反映出近阶段用户的工作重点偏向于哪些媒体,在舆情引导工作方面做到“有的放矢专题统计功能可对比反映出各个专题监测的当前网络转播态势,指导用户开展处理工作的优先。媒体统计(六)舆情导控舆情导控包括典情管理、导控日志两个功能。舆情管理实现单位全大舆情信息的归集管理功能。本功能供应论坛、贴吧、微博的官方权威信息发布功能。结合系统中的媒体分布分析、信息起源追踪等功能,系统可以通过发布官方声明、事实真相、表明看法等信息,预防舆论激化、舆论一面倒的状况出现,除了官方权威信息发布,系统还供应各大论坛、微博、贴吧的定向回
13、复功能,对于个别信息进行有针对性的一对一对话,通过回发网上的帖子、微博、贴吧等澄清事实真相、警告煽风点火的网民,从而到达引导舆论走向、将不好的苗头扼杀下萌芽状态的目的。邯粉便国:-iftn9r“-j三twr&三七8幺-CI7JM134T7.t=S)E女计停云.殛口电散ART女火第,蝴1,.Rif1.htWrCK;JD*NxWrM主停应14日权威信息发布导控日志记录用户的官方权威发布、信息定向回宏的操作日志,同时记录舆情导控操作的反馈结果,如某某论坛发布信息胜利等。(七)协助功能账号管理账号管理功能用于微博、论坛、贴吧等账号信息的新增、修改和删除,添加的账号可用于系统采集信息、发布信息和回复信息
14、。通讯录通讯录功能用于设理当前用户的通讯录信息,包括联系人的姓名、人员类型、手机号码、邮箱地址等信息。通讯录设厘的信息可用于用户推送信息时,推送目标的选取:预警设置时,预警目标的选择:报告生成时,推送目标的选择。规则管理规则管理功能用于新增、修改、删除系统的专题规则,包括正文规则、来源规则和预警规则。媒体管理媒体管理功能可以自定义媒体来源中的网站行业分类、地域分类和媒体类型,系统在检索信息时可依据网站域名自动过滤信息。快捷检索快捷检索功能用于检索系统信息,支持四元组搜寻。用户可通过已知关注点的检索结果发觉新的关注点和关注信息,从而时系统监测进行查漏补缺“(八)系统管理包括用户管理、网络设置、参
15、数设置、登录日志等,可对用户账号进行管理,也可对系统网络环境进行设置“权限限制系统供应完善的用户权限管理机制,既充分保证了系统的平安性,又保证了各用户之间信息的私密性。用户创建的监测专题、预警方式、专报、简报等实行相互隔高,其中系统管理员可以统一管理用户创建的监测专题,帮助用户维护监测专题。用户可以将获得到的信息推送给指定的联系人,实现舆情信息协同处理。系统状态用手查看系统设备当前的各项性能指标,包括CP1.内存、硬盘,网络资源运用状况,系统线程调度状态、采集规则队列状况、采集信息数、授权信息等。五、系统特色(一)深度与广度相结合的信息采集方式系统采纳搜寻要合和定向采集相结合的信息采集技术,既可以做到对网络舆情信息的全面搜寻,又可以有针对性的对指定的论坛、博客、新闻、贴吧、微博等媒体的深度采集,K正做到网络典情的全面采集,不留死角。(二)基于语义的负面信息过源技术由网络学问工程专家细心搜集分析整理的一套涵盖了公职人员工作、生活特征、职位、行业特征、地域等各方面的本体学问库。基于学问库,系统动态内置套涵盖了全部系统用户所属行业