《《数据仓库与数据挖掘》实验指导书.docx》由会员分享,可在线阅读,更多相关《《数据仓库与数据挖掘》实验指导书.docx(20页珍藏版)》请在优知文库上搜索。
1、数据仓库与数据挖掘试验指导书数据仓库与数据挖掘技术课程在计算机数据管理、维护中有着相当重要的作用。数据仓库系统在企业信息管理系统中应用特别广泛,数据挖掘技术对数据仓库的管理与维护、完善数据仓库、发挥数据仓库的作用有着特别大的作用。本课程主要内容为:数据仓库的概念与体系结构,数据仓库数据处理过程,数据仓库系统的设计与开发,各种数据挖掘技术(关联规则,数据分类,数据类聚,贝叶斯网络,粗糙集,神经网络,遗传算法,统W分析,文本与Web挖掘)与其应用。本课程既有理论也有实践,实践环节主要是基SQ1.SerVeI2005示例数据仓库环境下进行各种数据挖掘技术的试验。为使学生能在SQ1.Server200
2、5示例数据仓库环境卜进行各种数据挖掘技术的试验,首先必需创建一个SQ1.Server2005示例数据仓库环境,但考虑到学院试验室管理要求和培育学生的独立动手实力,因此第个试验(试验一:SQ1.SerVer2005示例数据仓库环境的配置,综合性试验)分两方面进行,一方面由试验室对SQ1.Server2005示例数据仓库环境的配置完成,供应应学生进行数据挖掘试验,另一方面,学生可利用自己的计算机环境进行课外试验,交试验报告,其他试验可依据课程内容与课时支配在试验指导老师的指导下在试验室完成。书目1、试验一:SQ1.Server2005示例数据仓库环境的配置页码2、试验二:运用SQ1.Server2
3、005建立多维数据模型页码3、试验三:SQ1.Server2005中的关联规则应用页码4、试睑四:SQ1.Server2005中的决策树应用页码5、试验五:SQ1.Server2005中的k-means应用页码6、试验六:SQ1.Server页码2005中的贝叶斯网络应用7、试验七:SQ1.Server“页吗2005中的神经网络应用8、试脸八:SQ1.Server页码2005中的线性回来应用9、试验九:SQ1.Server:2005中的1.ogistic回来应用页码10、试验报告基本内容要求页码试验一:SQ1.Server2005示例数据仓康环境的配置试验学时:2试验类型:综合试验要求:必修一
4、、试验目的通过本试验的学习,使学牛.驾取配置SQ1.Server2005示例数据仓库环境的学问,训练其独立配置数据仓库环境的技能,为今后接着配置数据仓库环境的学习奠定基础。二、试验内容安装SQ1.SerVer2005,并在安装过程中进行示例数据库安装配置,由于本试验为综合性试验,试验中涉与到计算机系统(硬件、软件环境要求,涉与软件系统安装学问,涉与到软件系统安装配置正确与否进行检验的学问。三、试验原理、方法和手段通用微型计算机环境与Windows操作系统环境下系统软件的安装与配置。四、试验组织运行要求依据本试验的特点、要求和详细条件,采纳“以学牛.白主训练为主的开放模式组织教学”。五、试验条件
5、见MicroflSQ1.Server2005简体中文企业版系统光盘供应的“SQ1.Server2005安装要求”。六、试验步骤参照MicroftSQ1.Server2005简体中文企业版系统光盘供应的“SQ1.Server2005安装说明”与教材数据仓库与数据挖掘P72-P74的内容。七、思索题1、为什么要配置示例数据库?2,如何验证配置示例数据库的正确性?八、试验报告1.试验要求:细致阅读ViCroftSQ1.Server2005简体中文企业版系统光盘供应的“SQ1.Server2005安装说明”、“SQ1.Server2005安装要求”与教材P72-P74的内容2、试验目的、试验内容、试验
6、原理按本试验指导的内容填写3、试验仪器:按试验计算机的硬件配置参数填写4、试验步骤:按教材P72-P74中(1)、(2)、(3)填写5,试验数据:无6、试验总结:回答思索题以与本次试验的心得九、其它说明试3ft二:运用SQ1.Server2005建立多维数据模型试验学时:2试验类型:验证试验要求:必修一、试验目的通过本试验的学习,使学生驾取在SQ1.Server2005示例数据仓库环境下建立多维数据模型过程的学问,训练其把教材上的内容应用到实际中的技能,为今后接着数据挖掘技术的学习莫定基础。二、试验内容在SQ1.Server2005示例数据仓库环境下建立多维数据模型。三、试验原理、方法和手段数
7、据仓库环境下多维数据模型建立的方法。四、试验组织运行要求依据本试验的特点、要求和详细条件,采纳“集中授课形式”。五、试验条件SQ1.Server2005示例数据仓库环境。六、试验步躲参照教材数据仓库与数据挖掘P75-P87的内容。七、思索题1、度量值的不同对多维数据集的结构有何影响?2、维度的层次结构和有关属性对提高多维数据集的可用性和易用性有何意义?八、试验报告1.试验要求:预习教材P75-P87的内容2、试验目的、试验内容、试验原理按本试验指导的内容填写3、试验仪器:按试验计算机的硬件配置.参数填写4、试验步骤:按教材P75-P87的17填写5、试验数据:各试验步骤中的维度、层次等详细数据
8、6、试验总结:回答思索题以与本次试验的心得九、其它说明试验三:SQ1.Server2005中关联规则的应用试验学时:2试验类型:验证试验要求:必修一、试验目的通过本试验的学习,使学生驾取在SQ1.Server2005示例数据仓库环境下关联规则的应用的学问,训练其把教材上的内容应用到实际中的技能,为今后接着关联规则学问的学习奠定基础。二、试验内容在SQ1.Server2005示例数据仓库环境下关联规则的应用。三、试验原理、方法和手段关联规则,项目与项集,关联规则的支持度与最小支持度,关联规则的可信度与最小可信度.四、试验组织运行要求依据本试验的特点、要求和详细条件,采纳“集中授课形式”。五、试验
9、条件SQ1.Server2005示例数据仓库环境。六、试验步骤参照教材数据仓库与数据挖掘P99-P105的内容。七、思索题kMlNIM1.iMSUPPORT的取值不同对关联规则的挖掘结果有何影响?2、YINIMUM_PROBABI1.iTY的取值不同对关联规则的挖掘结果有何影响?八、试验报告1.试验要求:预习教材P9要P105的内容2、试脍目的、试验内容、试验原理按本试验指导的内容填写3、试验仪器:按试验计算机的硬件配置参数填写4、试验步骤:按教材P99-P105的17填写5、试验数据:试验步獴5中的详细数据,至少2组6,试验总结:回答思索题以与本次试验的心得九、其它说明试验四:SQ1.Ser
10、ver2005中决策树的应用试验学时:2试验类型:验证试验要求:必修一、试验目的通过本试验的学习,使学生驾取在SQ1.Server2005示例数据仓库环境下决策树的应用的学问,训练其把教材上的内容应用到实际中的技能,为今后接着决策树挖掘技术学问的学习奠定基础。二、试验内容在SQ1.Server2005示例数据仓库环境下决策树的应用。三、试验原理、方法和手段精确度,查全率和查准率,信息增益,信息增益比C四、试验组织运行要求依据本试验的特点、要求和详细条件,采纳“集中授课形式”。五、试验条件SQ1.Server2005示例数据仓库环境。六、试验步躲参照教材数据仓库与数据挖掘PU8-P123的内容。
11、七、思索题1、VlNlMUMSUPP0RT的取值不同对决策树的挖掘结果有何影响?2、SCORE.METHOD的取值不同对决策树的挖掘结果有何影响?八、试验报告1.试验要求:预习教材P118-P123的内容2、试验目的、试验内容、试验原理按本试验指导的内容填写3、试验仪器:按试验计号机的硬件配置参数填写4、试验步骤:按教材P118-P123的(1)-(7)填写5、试验数据:试验步蟀5中的详细数据,依据思索题的取值要求选取数据,至少2组6、试验总结:回答思索题以与本次试验的心得九、其它说明试殴五:SQ1.Server2005中的k-neans应用试验学时:2试验类型:验证试验要求:必修一、试验目的
12、通过本试验的学习,使学生驾驭在SQ1.Server2005示例数据仓库环境Fk-means的应用的学问,训练其把教材上的内容应用到实际中的技能,为今后接着聚类学问的学习莫定基础。二、试验内容在SQ1.Server2005示例数据仓库环境下k-means的应用。三、试验原理、方法和手段相像度计算方法、kmeans思想。四、试验组织运行要求依据本试验的特点、要求和详细条件,采纳“集中授课形式”。五、试验条件SQ1.Server2005示例数据仓库环境。六、试验步骤参照教材数据仓库与数据挖掘P139-P143的内容。七、思索题1、CIXSTER工OUNT的取值不同对决策树的挖掘结果有何膨响?八、试验
13、报告1.试验要求:预习教材Pl39-P143的内容2、试验目的、试验内容、试验原理按木试验指导的内容填写3,试验仪器:按试验计算机的硬件配置参数填写4、试验步骤:按教材P139-P143的(1)-(7)填写5、试验数据:试验步骤5中的详细数据,依据思索题的取值要求选取数据,至少1组6、试验总结:回答思索题以与本次试验的心得九、其它说明试验六,SQ1.Server2005中的贝叶斯网络应用试验学时:2试验类型:验证试验要求:必修一、试验目的通过本试验的学习,使学生驾驭在SQ1.Server2005示例数据仓库环境卜.贝叶斯网络的应用学问,训练其把教材上的内容应用到实际中的技能,为今后接着贝叶斯网
14、络学问的学习莫定基础。二、试验内容在SQ1.Server2005示例数据仓库环境下贝叶斯网络的应用。三、试验原理、方法和手段先验概率、后验概率、条件概率、全概率公式、贝叶斯公示四、试验组织运行要求依据本试验的特点、要求和详细条件,采纳“集中授课形式工五、试验条件SQ1.Server2005示例数据仓库环境。六、试验步骤参照教材数据仓库与数据挖掘P160-P165的内容。七、思索题八、试验报告1.试验要求:预习教材P160-P165的内容2、试验目的、试验内容、试验原理按本试验指导的内容填写3、试验仪器:按试验计算机的硬件配置参数填写4、试验步喔:按教材P160-P165的(1)-(8)填写5,试脍数据:试验步骤5中的详细数据6、试验总结:木次试验的心得九、其它说明试验七:SQ1.Server2005中的神经网络应用试验学时:2试验类型:验证试验要求:必修一、试验目的通过本试验的学习,使学生驾次在SQ1.Server2005示例数据仓库环境下神经网络的应用的学问,训练其把教材上的内容应用到实际中的技能,为今后接着神经网络学问的学习奠定基础。二、试验内容在SQ1.Server2005示例数据仓库环境下神经网络的应用。三、试验原理、方法和手段神经元模型、BP算法。四、试验组织运行要求依据本试验的特点、要求和详细条件,采纳“集中授课形式”。五、试验条件SQ1.Server2005示