CCF走进高校——关于开展数据流挖掘研究及其进展系列学术报告的预告

作者：发布时间：2022年05月06日 14时46分

应沙巴足球（中国）股份有限公司官网计算机与信息安全学院和广西图像图形与智能处理重点实验室的共同邀请，德国洪堡学者，国家级人才入选者邵俊明教授、合肥工业大学李培培副教授、山西大学郭虎升副教授、上海大学余航老师、广州大学张鹏教授将于2022年5月14日分别在腾讯网络会议（会议号：943-137-922）进行在线讲学，欢迎广大师生踊跃参与。

会议安排：

时间	题目	报告人	主持人
5月14日上午 8：30-9：40	Reliable Learning on Evolving data Streams	邵俊明	文益民
5月14日上午 9：45-10：55	数据流分类方法研究	李培培
5月14日上午 11：00-12：10	含概念漂移数据流的优化建模与高效计算	郭虎升
5月14日下午 14：30-15：40	概念漂移的检测、理解、适应	余航
5月14日下午 15：45-16：55	数据流挖掘：采样、分类和索引方法研究	张鹏

主讲人:邵俊明

题目：Reliable Learning on Evolving data Streams

时间：5月14日上午8：30-9：40

地点：腾讯会议943-137-922

报告人简介：邵俊明, 教授/博导，德国洪堡学者，国家级人才入选者。一直致力于数据挖掘与机器学习的基础理论及应用研究。迄今共发表论文100余篇，包括KDD, ACL, WWW, TKDE等CCF A及中科院一区论文28篇。其中，四篇文章分别获最佳论文奖。受邀出版英文专著一本。此外，担任Frontiers in Human Neuroscience评审编辑、VDS 2021会议PC Chair，第四届模式识别与人工智能国际会议（PARI 2021）Special Session主席，国际著名期刊/会议TPAMI，TKDE，KDD，IJCAI，AAAI等审稿人并获IJCAI 杰出评审人。入选德国洪堡学者，CCF大数据专委通信委员，省千人计划特聘专家。2018年获教育部霍英东教育基金，2020年获四川省科技进步二等奖、2021年获四川省科技进步一等奖。近五年主持国家重点研究计划课题，军科委基础加强重点项目课题，国家自然科学基金，军委装备部预研基金项目，四川省杰出青年基金等20余项。同时聚焦行业领域共性技术问题，与华为、电信等建立长期预研合作，三次获华为项目优秀合作奖。

报告内容：Data streams are characterized by their unique properties such as massive, real-time and evolution, and the complex evolution characteristic poses great challenges to the reliability of data stream learning. This talk focuses on the complex evolution scenarios including concept evolution, feature evolution and label evolution, and explores new methods and frameworks to improve the reliability of data stream learning. Especially, for concept evolution, new measures and techniques for effective concept drift detection and learning are given. Afterwards, the concept convolution with feature evolution is introduced. The novel detection and reliable semi-supervised learning on concept-drifting data streams are finally explored and studied.

主讲人:李培培

题目：数据流分类方法研究

时间：5月14日上午9：45-10：55

地点：腾讯会议943-137-922

报告人简介：李培培，博士，合肥工业大学副教授，硕士生导师。2012年毕业于合肥工业大学计算机与信息学院计算机应用专业，获博士学位。2008.04- 2009.04在新加坡管理大学作助理研究员，2010.08-2012.12在微软亚洲研究院实习。主要研究方向：短文本/多标签数据流挖掘、概念漂移检测方法及应用。主持国家重点研发计划项目子课题1项、国家面上基金项目1项、国家青年基金项目1项、博士后基金项目1项、安徽省青年基金1项。在国内外期刊与国际会议上发表学术论文40余篇，其中被SCI、EI检索计30余篇，申请专利10余项，已授权4项，软著2项。担任TCYB、TKDE、TKDD、ICDM、AAAI等国际期刊/会议的审稿人与程序委员会成员。

报告内容：实际应用领域涌现的数据流隐含着丰富的有价值的知识亟待挖掘。然而，这些数据流除具有快速性、无限性、连续性、多变性等特征，还存在概念漂移、标签缺失或者含多个标签以及特征高维稀疏等问题，使得已有的分类方法面临精度与时间等挑战。针对上述分类问题，本报告主要围绕以下几个方面展开讨论：1）数据流分类挖掘的背景与相关概念；2）面向不同数据特点的数据流分类方法，如：面向交易数据流的分类方法、面向短文本数据流的分类方法与面向多标签数据流的分类方法等，探讨不同数据类型数据流环境下，分类的框架与概念漂移检测机制；3）数据流分类的未来研究趋势。

主讲人:郭虎升

题目：含概念漂移数据流的优化建模与高效计算

时间：5月14日上午11：00-12：10

地点：腾讯会议943-137-922

报告人简介：郭虎升，博士，副教授，硕导，山西大学计算机与信息技术学院人工智能系副主任，主要研究方向为数据挖掘、机器学习等，“三晋英才”青年优秀人才。CAAI知识工程与分布智能专委会委员、CCF人工智能与模式识别专委会委员。担任基金委通讯评审专家，担任《Pattern Recognition》、《Neural Networks》、《Applied Intelligence》、《软件学报》、《计算机研究与发展》等杂志审稿人，担任CCFAI、CCML、CCDM等会议的大会秘书、论坛主席或程序委员等。近年来，主持国家自然科学基金项目1项、省部级项目多项，以第一作者在《Neural Networks》、《Pattern Recognition》、《Information Sciences》、《EAAI》、《AI Review》、《软件学报》、《计算机研究与发展》等发表论文20余篇。曾荣获教育部宝钢教育奖、ACM理事会太原分会优博、山西大学十佳青年教师。指导多名研究生荣获山西省省级优秀学位论文。

报告内容：流数据作为一种典型数据类型，在多个应用领域大量涌现。概念漂移是流数据在现实世界中的一个重要特性，也是流数据分析挖掘中不可避免的困难问题，它打破了传统学习任务中数据分布固定的假设，其典型特征是当环境因素发生变化时，数据分布会随之改变，导致不同时刻数据不符合传统分布特性，因此深入研究面向包含概念漂移的流数据优化建模与算法设计具有重要意义和价值。本报告将围绕数据流中的概念漂移问题，从数据处理和模型构建两个层面介绍报告人及其团队近年来在流数据的漂移位点监测、漂移类型识别、数据流降噪、集成与深度网络建模等方面的主要工作。

主讲人:余航

题目：概念漂移的检测、理解、适应

时间：5月14日下午14：30-15：40

地点：腾讯会议943-137-922

报告人简介：余航，上海大学讲师，上海市海外高层次人才，长期从事不确定环境下的计算智能相关研究。以第一作者身份发表SCI/EI 论文 15 篇，其中包括中科院一区期刊IEEE-TNNLS、 IEEE-TFS、IEEE-TCYB和CCF推荐的A类期刊IEEE-TKDE等。并且，长期担任IEEE TNNLS、IEEE TCYB等多个 IEEE 汇刊的审稿人，以及IJCAI、IJCNN等国际顶级会议的审稿人。此外，主持并参与多项军工项目，并入选上海市启明星培养专项-扬帆计划。

报告内容：概念漂移描述了数据流随时间的变化，其潜在数据分布也发生了不可预知的变化。这种潜在数据分布发生变化，导致从历史数据学习到的模型已不再适用新的数据流，从而引起学习模型表现的下降，大量的数据分析已经揭示了数据流环境下的机器学习如果不考虑漂移的话会导致很差的学习结果。基于该原因，大量关于概念漂移的研究方法被提出，而这些方法主要集中在概念漂移的检测，理解和适配。漂移的检测主要指何时发现数据流潜在数据分布的变化，解决when的问题，漂移的理解主要指如何识别数据流潜在数据分布变化的方式，解决how的问题，漂移的适配是指知道何时发生概念漂移，以及如何发生概念漂移后，该怎样调整模型，使得模型能够适应新的潜在分布，解决learn的问题。为了帮助研究者们定义哪些研究课题是重要的以及如何在数据分析中使用相关技术，本次报告将会就概念漂移检测、理解和适配的方法技术进行分享。

主讲人:张鹏

题目：数据流挖掘：采样、分类和索引方法研究

时间：5月14日下午15：45-16：55

地点：腾讯会议943-137-922

报告人简介：张鹏，广州大学教授，先后在中科院计算所/信工所、澳洲悉尼科技大学、美国德克萨斯州大学、阿里巴巴及蚂蚁集团工作，获得2项国家自然科学基金、以及美国和澳大利亚的多项基金支持，连续担任KDD、ICLR、ICML、NeurIPS、AAAI、IJCAI等A类会议的（高级）程序委员会成员，担任Springer期刊Journal of Big Data、Annals of Data Science的副编。

报告内容：数据流是一种常见的数据形态，广泛存在于网络通讯、社交媒体等实时应用中，如何面向数据流建立数据挖掘模型一直是研究难点，其面临的挑战包括大规模流数据处理、数据流模式无规则变化、以及数据流实时判别决策等问题。本报告围绕以上挑战，从数据流采样、数据流模式分类、数据流模式索引这三个方面开展讨论，阐述基于主动学习的流采样算法、基于集成学习的流模式分类算法、以及基于模型决策空间的索引结构，最终实现适用于数据流的模式挖掘和实时预测方法。

导航

学术信息

CCF走进高校——关于开展数据流挖掘研究及其进展系列学术报告的预告