探查社会媒体潜在价值的数据挖掘方法
发布时间: 2011-07-27 11:23:00 浏览次数: 供稿:未知
演讲人:参考下方
讲座时间:0000-00-00 00:00:00
讲座地点:--
讲座内容

演讲人: Matin Ester

讲座时间: 2011年7月29日(周五)上午10:00—11:00

讲座地点: 信息楼4层学术报告厅

讲座内容: Data Mining Methods For Exploiting the Full Potential of Social Media

摘要:

社会媒体是反映社会相互作用的媒介,通常是使用一些Web技术创建生成的。有各种不同类型的社会媒体,如协同项目(诸如Wikipedia、博客和微博(如Twitter)),内容社区(诸如Youtube)和社会网络站点(诸如Facebook)。当传统媒体(诸如报纸和电视)限制为只能由专业作家来生产,且生产成本昂贵时,社会媒体显示具有低成本且允许普通人生产他们内容的优点。社会媒体的另一个特征是采用Web 2.0技术,支持各种形式的内容生产和用户之间的交互(例如,对用户生产内容的共享、评价和评定)。当社会媒体网站潜在有价值内容快速增长时,其巨大的规模使得用户难以找到他们最相关的内容,与传统媒体相比,其低质量的内容又难以自动化的处理。因此,研究人员正在开发新颖的数据挖掘方法以最大程度地利用社会媒体的潜在价值。

在本报告中,先讨论社会评价网络(social rating networks,SRN)。本报告的第一部分是介绍报告人提出的一个社会评价网络的概率生成模型。该模型在评价的效果和社会关系上是双向的,它是第一个能表示全部四种效果的模型,即评价的社会关系(社会影响力,social influence),社会关系上的社会关系(传递性,transitivity),社会关系上的评价(选择性,selection),以及评价上的评价(相关影响,correlational influence)。与现有的把SRN整个演变看成是静态演化来考虑效果参数的工作不同,该模型中的每个效果强度是动态变化的。该模型可以对用户行为提供一种动态有意义的观察,并能创建反映现实世界网络关键特性的综合数据集。

本报告的第二部分谈论推荐系统,该系统基于用户的偏好(无论是显式或隐式表达的)推荐他们感兴趣的内容。通过利用网络中的社会影响力(如用户对朋友的信赖),朋友的意见和偏好的影响力,社会网络能够提高推荐系统的质量。特别是,基于社会网络的推荐系统可以更好地处理冷启动问题。报告人提出一种基于模型的推荐方法,该方法将社会网络和信任传播的全过程合并为矩阵分解结构。在各种在线社交网络数据集上的实验表明,与目前的一些先进方法相比,该方法有明显的性能提高。意见挖掘是对大量的网上产品评论进行汇总,评论总有相互矛盾的意见,意见挖掘的一项重要工作是对产品和它们的评价进行抽取。报告人提出了Interdependent Latent Dirichlet Allocation(ILDA)模型,这是一种考虑特征(aspect)和评价(rating)之间相互依赖性的概率图模型,实际数据集上的实验表明ILDA模型的有效性。

讲座结束前演讲者还对其他的数据挖掘研究和社会媒体数据挖掘未来的一些有意义的研究方向做一简短的讨论。

报告人简介:

Martin Ester教授是国际知名学者,他现在是Simon Fraser大学计算机学院的教授,且是计算机系的教授委员会主任。Ester教授1990年于瑞士ETH Zurich大学计算机系获得博士学位,1993年成为慕尼黑大学的Assistant Professor,2001年成为Simon Fraser大学计算机学院的Associate Professor。他现在是Simon Fraser大学数据库和数据挖掘实验室的主任,他在国际顶级会议和期刊上发表大量论文(如ACM SIGKDD,VLDB,ICDM和ICDE),其著名的DBSCAN论文有超过2900次的引用。他目前的研究兴趣是social network analysis、recommender systems、opinion mining、biological network analysis和high-throughput sequence data analysis。Martin Ester教授还与很多实验室、工业界和政府部门有广泛的研究合作。

演讲人简介