《大学生心理健康舆情分析系统实现.docx》由会员分享,可在线阅读,更多相关《大学生心理健康舆情分析系统实现.docx(37页珍藏版)》请在优知文库上搜索。
1、摘要近年我国高等教育急速发展,竞争压力越来越激烈,大学生的心理健康问题也明显增加,因心理健康问题导致的大学生自杀等令人惋惜的沉痛事件时有发生。根据对北京23所高校的调查,16%的学生存在心理问题,达到严重程度的占3%到5%,这使大学生的心理健康问题成为社会焦点。大学作为培养全面发展高素质人才,更应该承担起大学生心理健康相关任务。传统的心理辅导教育过程,包括线下对学生进行心理测试,根据心理测试结果和谈话方向建立心理档案,这不仅对部分同学来说有压力,对于心理辅导员同样是很大的工作量。而借助网络进行心理健康教育作为一种新的心理教育方式,越来越受到导师和学生们的喜爱,网络的形式使心理教育过程拥有更好的
2、私密性,同时也能让导师花费更少的精力获取更多的信息。本文从大学生心理健康状况的实际出发,结合所学习的软件开发的知识,设计出相对比较适合当前发展需要的大学生心理健康管理平台。本文重点分为两部分,第一部分以SCL-90症状自评量表为测量工具,对学生进行心理测试,作为对学生心理状况的初步了解,从各个维度评判学生状态,找出学生心理异常的侧重点。第二部分则对于第一部分心理测试成绩不理想的同学进行进一步的社交状态考察,本文以微博为例,利用PythOn爬虫对某同学的特定的微博文本进行爬取保存;而后对原文本运用jieba工具进行中文分词和词频统计,使之更容易为后续的文本分析所用;最后用WOrdClOUd和Sn
3、oWNLP对分割的词语进行情感分类,以词云的形式输出消极方面的词语和积极方面的词语,帮助导师找到可能导致学生心理状态异常的相关信息。关键词:大学生心理健康;舆情分析;情感分析;中文分词AbstractInrecentyears,withtherapiddevelopmentofhighereducationinourcountry,thepressureofcompetitionismoreandmoreintense,andthementalhealthproblemsofcollegestudentsarealsosignificantlyincreased.Becauseofthemen
4、talhealthproblems,droppingoutofschoolorevensuicidesoftenoccur.Accordingtothesurveyof23collegesanduniversitiesinBeijing,16%ofthestudentshavepsychologicalproblems,accountingfor3%to5%oftheseriousdegree,whichmakesthementalhealthproblemsofcollegestudentsbecomethesocialfocus.Asthetrainingofall-rounddevelo
5、pmentofhigh-qualitytalents,universitiesshouldundertakethetasksrelatedtocollegestudentsmentalhealth.Asanewwayofpsychologicaleducation,mentalhealtheducationwiththehelpofnetworkismoreandmorepopularwithteachersandstudents.Theformofnetworkmakestheprocessofpsychologicaleducationhavebetterprivacy,atthesame
6、time,itcanalsomaketeachersspendlessenergytogetmoreinformation.BasedontherealityofCollegeStudents,mentalhealthandtheknowledgeofsoftwaredevelopment,thispaperdesignsamanagementplatformforcollegestudentsmentalhealthwhichisrelativelysuitableforthecurrentdevelopmentneeds.Thispaperisdividedintotwoparts.Int
7、hefirstpart,theSCL-90symptomchecklistisusedasameasurementtooltotestthestudents*psychology,asapreliminaryunderstandingofthestudentspsychologicalstate,tojudgetheStudents1Statefromvariousdimensionsandfindoutthekeypointsofstudentspsychologicalabnormality.Inthesecondpart,thestudentswhosescoresinthefirstp
8、artofpsychologicaltestarenotidealarefurtherinvestigatedonsocialstatus.Thispapertakesmicroblogasanexample,usesPythoncrawlertocrawlandsavethespecificmicroblogtextofacertainStudentithenusesthejeebatooltomakeChinesewordsegmentationandwordfrequencystatisticsfortheoriginaltext,makingiteasierforsubsequentt
9、extanalysis;finallyuseswordcloudandSnOwnlpclassifiesthesegmentedwordsbyemotion,andoutputsthenegativewordsandthepositivewordsintheformofwordcloudtohelpthetutorfindtheinformationthatmayleadtotheabnormalmentalstateofstudents.Keywords:CollegeStudents,mentalhealth;publicopinionanalysis;emotionalanalysis;
10、Chineseparticiple第1章引言1.1 选题的目的及意义大学生即将踏入社会,一面为以后的工作生活积累经验,一面还留在最后的校园保持着天真的学生气息,两方面的舆论信息同时对学生的思想和心理进行冲击,很容易导致学生自己无法消化产生消极和错误的想法,让一些心理防线本就脆弱或偏激的学生做出无法挽回的举动I?。这不仅对个人的生活产生影响,也给学校相关方面带来隐患,甚至在他们走向社会的时候给社会稳定和国家安全带来隐患。探究大学生受社会舆情影响的心理变化,把握高校舆情危机的内在特点与外在影响因素,构建系统的高校网络舆情危机应对机制,更有利于了解大学生在应对社会舆情时可能做出的反应,便于学校心理辅
11、导员与需要帮助的同学及时联系、解决问题,在帮助大学生正确看待社会问题的方面具有很大的促进作用,从而更好的维护高校的良好形象,保障大学生的身心健康18。1.2 国内外研究现状在许多的西方国家,从孩子开始学业就创建了他们自己的心理档案,学校里也有心理工作者对孩子进行观察与评估,定期的为学生进行日常心理辅导、心理诊断、心理咨询、心理评估和心理干预。学生的档案保存在网上,可供学生个人或专门的心理人员查阅,但同时遵循保密原则,无关人员无法查看。综上,国外许多国家对于心理相关问题相当重视,也建立了相对完善的管理体系,这些对我国学校心理健康教育有很大启发意义。相比而言,根据中国青少年研究中心2010年对大学
12、生心理问题的研究,大多数大学生在出现较常见的心理问题时,更倾向于向自己的朋友、家人甚至素未谋面的网友进行倾诉,却很少人选择专业的心理机构进行正规的心理辅导。大众对于心理辅导的传统印象也是更偏于负面的、无用的,这种刻板的印象可能会导致一些想要进行心理辅导的人选择放弃。大学生可以接触到的心理知识,主要来源于网络和各类心理讲座,接触途径少,导致学生不能很好的判断自己的心理健康情况,也无法及时的做出自我诊治与求助,致使许多悲剧发生。如今随着信息化的发展,为大学生建立一个心理健康系统平台以保证学生能拥有更好的心理状态成为心理问题一条有效的解决途径。网络平台可以通过专业的心理测试以便导师和学生自己了解每个
13、学生的状况,也通过舆情分析帮助导师及时发现学生可能存在的问题。有关文章中表示:“加强复杂环境下大学生心理健康舆情信息的搜集、整理、追踪、引导、服务,提供教育工作具有针对性的决策保障,是新时期学生思想政治工作和大学生管理服务工作的新课题。”由此可以看出大学生心理健康舆情引导的意义与价值,值得我们更多人关注与参与到其相关的工作方面中去6。1.3 主要研究内容舆情分析是根据具体问题的需要,对舆情进行深入思考、分析和研究,推导出相关结论的过程。随着多元化发展,越来越复杂的社会环境影响着学校环境,也对大学生心理产生了许多隐蔽的影响,因此舆情分析系统越来越多的被应用于大学生心理健康分析相关领域用。本文从当
14、前相关研究状况出发,主要考虑以下儿个方面的问题:(1)数据采集与预处理。选择学校心理测试结果和微博平台数据作为数据集,运用微博API和数据爬虫实现对微博数据的实时采集,去除无关数据和噪声数据,处理空缺值,为后期数据分析提供准确简洁的数据集。(2)对数据文本进行关键词检索。利用分词工具对微博文本进行文本分词、停用词过滤、特征提取,检索文本数据中有关焦虑、抑郁等关键词信息,结合心理测试结果,得到心理状态异常的相关学生信息。(3)对于心理异常学生的相关数据进行检索,找到可能影响学生心理状态的事件与原因,方便教师与学生交流。第2章相关技术分析2.1数据采集技术数据收集是舆情分析的第一步。能否及时、全面
15、地获取数据,直接影响到舆情分析的后续工作。本系统运用两种工具来进行数据采集,一种是网络爬虫技术,另一种是对外开放的微博API。2. 1.1网络爬虫网络爬虫是一个能够根据检索要求自动抓取互联网信息的程序,它通过访问互联网中的链接地址,按照一定的策略,在Imernet中搜索并收集需要检索的内容。网络爬虫是搜索引擎的重要组成,它能以特定的关键词查找并返回所找到的信息的资料清单,搜索引擎对原始网页的信息进行重新组织,建立信息库,再由关键词查找到相关文件,并对文件进行整理排序,将整合完成的结果返回给用户。大部分网络爬虫的通用框架如图所示:J种子URL .读取URLDXS解析Q 网页下载将已下载URL放进
16、5抓取URL队列待抓取URL抽取出新的URL放人待抓取URL队列口已下载网页库已抓取URL网络爬虫作为应用程序是十分脆弱的,因为它涉及到数以万计的web服务器和许多域名服务器的交互,而这些内容都远远超过了系统的控制范围。网站爬行速度是由自身的Internet连接速度和爬行的站点的速度共同决定的。特别是当一个站点从多个服务器抓取数据,且多个下载并行时,总抓取时间可以显著减少。尽管有许多的网络爬虫程序,但它们的核心本质上都是一样的,以下为网络爬虫的工作流程:(1) 下载网页。(2) 解析下载的网页并检索所有链接。(3)对于每个检索的链接,重复上述过程。由此,我们可以将所有网页分为五个部分:(1)已经被下载还没有过期的网页。(2)己经被下载但己经过期的网页:得到的页面事实上是检索到的内容的复制,Internet的网站是不断变化的,下载网站的许多内容产生了变化,这