韩家炜教授做客“信息讲坛”
12月28日,ダファベット 入金不要计算机系有幸邀请到数据挖掘泰斗-美国伊利诺伊香槟分校计算机系的韩家炜教授做客“信息讲坛”,为广大师生带来精彩的学术报告。本次报告由学院党委书记陈红主持。
韩教授在此次报告中分享了他的团队近年来的一系列工作。其主旨思想是如何将非结构化的文本语料转变为结构化的Information network以及TextCube,再进一步从结构化信息中挖掘有用的知识。
韩教授表示,要将非结构化文本语料转变为结构化信息,一个重要手段是关键词抽取。韩教授介绍了一系列基于频繁模式挖掘算法的完全统计方法来识别关键词,效果可以与考虑语言特征的自然语言方法相媲美。随后,需要将抽取的关键词赋予语义,即实体类别与关系识别。他介绍了用图嵌入的方法来同时识别实体类型以及实体之间的关系,比之传统的Bootstrapping以及Label Propagation的方法,体现了显著的优势。这些实体以及关系可以很好地组织成一个Information network。
同时,韩教授介绍了利用元模式驱动的文本属性发现,以及多方面层次分类体系挖掘,这些结果可以用来构建多维的TextCube。韩教授认为,想把Big data变成Big knowledge,一条重要途径就是数据结构化。他认为Information network和TextCube这两种结构是进行知识挖掘的强有力方法。韩教授团队近二十年一直在沿着这一思路进行知识挖掘,希望越来越多的学者能够在此方向上有所突破。
报告精彩纷呈,在座老师与同学纷纷提问,希望韩教授能够对自己的学术研究有所指点。最后,党委书记陈红教授与院长文继荣教授代表学院为韩教授颁发了ダファベット 入金不要客座教授的续聘证书。
据悉,韩教授享有“数据挖掘第一人”之称,他是伊利诺伊大学香槟分校具有国际影响力的著名科学家。其著作《数据挖掘:概念与技术》一书已经成为国内外挖掘挖掘领域的经典教材。