本科生课程简介

数据挖掘导论

Introducation to Data Mining

       数据挖掘是从大量数据中发现知识的一门新兴学科,具有广阔的应用前景。通过本课程的学习,可以使学生掌握数据挖掘的基本概念、原理和技术,能应用数据挖掘工具如R语言、Python、SPSS Modeler等对现实数据进行分析,并解释数据挖掘的输出结果。培养学生进行深层次信息分析的能力。

       该课程既包括数据挖掘理论和方法的讲授,也包括数据挖掘软件的演示、实际案例的分析,注重与学生所学专业的结合,让学生感到学习该课程有用,学完后会用,对实际问题的解决管用。本课程将会给学生留有一定数量的思考题,实践案例等,以充分调动学生学习的积极性,提高学生解决实际问题的能力。

 

课程主要内容:

• 绪论

• 数据与数据预处理

• 探索性数据分析

• 关联分析:关联规则挖掘

• 聚类分析:聚类方法、簇评估

• 分类:基本分类算法、模型评估

• 异常检测:基本方法

• 简单介绍:复杂类型数据的挖掘方法如Web数据、社会网络分析、时序数据、可视化、知识图谱等

研究生课程简介

社会网络分析

Social Network Analysis

       社会是一个由多种多样关系构成的一个巨大网络。社会网络分析是对”关系”网络进行量化分析,进而揭示关系的结构,解释一定的社会现象。

       目前,社会网络分析已成为一种非常流行的社会科学研究方法,在许多领域都有成功的应用,如情报学领域的研究人员利用社会网络分析方法研究了竞争情报、知识管理、企事业单位的资源配置、学科热点、引文分析、科研人员合著、机构合作、网络链接、博客网络等方面的各种关系网络,取得了许多新颖的研究成果。

        本课程讲解社会网络分析的基本概念、原理和方法,并介绍该方法在一些重点学科领域的典型应用案例,特别是在情报学和信息管理中的应用范例。此外,也会对社会网络分析的软件工具如 Pajek、Ucinet、Gephi;某个编程环境下的函数包,如 Python(NetworkX),R(igraph)进行一定程度的介绍。课程最终目的在于培养学生利用社会网络分析方法解决实际问题的能力。

Web数据挖掘

Web Mining

       Web数据挖掘是指从海量的Web数据中提取和产生知识的技术与方法。主要内容有:Web内容挖掘,Web结构挖掘,Web使用记录挖掘等。Web挖掘在电信、零售、农业等多个领域有着广泛的应用,在情报学中web挖掘也有诸多应用,如信息分析、舆情分析、主题探测、信息传播、信息安全、个性化推荐、评估与评价等。

       本课程分为基本内容和专题内容。基本内容包括基本概念、挖掘的一般过程、基本理论、技术、方法、应用等,专题内容则包括数据搜集等10个web数据挖掘专题。课程最终目的在于培养学生完成从web数据获取到挖掘这一过程并解决实际问题的能力。