智能技术与系统国家重点实验室博士生秦利静撰写的论文“Functional Dirichlet Process”(指导教师:朱小燕)被网络应用领域高水平国际会议The 22nd ACM International Conference on Information and Knowledge Management (CIKM 2013)会议录用为长文。因其天然的灵活性和自适应性,贝叶斯非参数模型帮助克服传统固定参数模型在模型选择上的不足,正成为机器学习与数据挖掘领域的研究热点。狄利克雷过程混合模型(Dirichlet Process mixture model,简称为DPMM)是最常用的贝叶斯非参数模型之一,广泛应用于各种数据聚类问题。论文在传统狄利克雷过程混合模型的基础上提出可以对随时间、空间等任意协变量变化的数据建模的函数式狄利克雷过程,有效扩大了传统模型的应用范围,提高了建模能力。

博士生房磊的论文“Exploring Weakly Supervised Latent Sentiment Explanations for Aspect-level Review Analysis”(指导教师:黄民烈,朱小燕)也被该会议录用为长文。该论文的主要工作是在细粒度的情感分析,模型能够从评论中提取出最能体现评论的维度信息和观点信息的句子,提高了文档级别的情感分类的性能,同时由于引入先验知识,也大大提高了维度分类的性能。

博士生邢千里的论文“Incorporating User Preferences into Click Models”(指导教师:刘奕群,张敏,马少平,聂建云)被该会议录用为长文。用户在使用搜索引擎时的行为千差万别,提交同样的查询之后,不同用户检验的结果条目数差异巨大,对结果是否点击的选择也不一致。在讲席教授聂建云老师的合作指导下,该论文提出一种对用户偏好进行建模的方法,对Cascade,UBM,logistic等模型都有明显的提升作用。

此外,实验室硕士生刘健撰写的论文“A Study of Long-term Search Engine Users’ Behavior”(指导教师:刘奕群,张敏,马少平)被该会议录用为短文。随着技术的进步,搜索引擎一直在提升进步;搜索用户行为在搜索引擎技术改进的推动下也发生了显著的变化,借助搜狗联合实验室合作平台提供的长期数据资源,论文分析了较早接触搜索的专家用户与新手用户在行为习惯上的差异,搜索在进步,用户也在随之协同进化。

CIKM是相关研究领域重要的高水平国际会议,今年共收到投稿848篇,其中143篇论文(16.8%)被录用为长文。大会将于2013年10月在美国旧金山召开。