近日,智能技术与系统国家重点实验室的学术研究迎来了一个丰硕的成果收获期,实验室共有10篇论文被相关领域的高水平国际会议IJCAI(2篇)、SIGIR(3篇)、ICML(2篇)、ACL(2篇)、AAAI(1篇)等录用为长文。分别是:

博士生秦利静的论文“Promoting Diversity in Recommendation by Entropy Regularizer”(作者:秦利静,朱小燕)被IJCAI’2013录用为长文。本文研究如何使推荐系统的结果既与用户的兴趣相关,同时在一定程度上多样化。论文主要解决两个问题,一是如何衡量多样性,二是如何设计高效的算法。论文提出在目标函数中引入熵正则化因子,在理论上论证该正则化因子可以自然地衡量一个对象集合的特征矩阵的多样性,并设计了有精确理论上界的近似算法。在通用电影推荐数据集上的评测结果表明该方法领先于最先进的推荐技术。

实验室博士后陈宁的论文“Generalized Relational Topic Models with Data Augmentation”(作者:陈宁,朱军,夏飞,张钹)被IJCAI’2013录用为长文(口头报告)。本文提出广义关系隐话题模型及其精确高效推理算法,解决已有方法在建模复杂稀疏关系网络时存在的模型表达能力不强、近似计算精度不高等难题,通过数据增广技术提出精确推理算法,显著提高在多个真实社交网络中的链接预测性能。
IJCAI’2013是计算机与人工智能领域的顶级国际会议,今年共投稿1473篇,其中包括正文和海报张贴在内共413篇(28%)被录用。会议将于2013年8月在北京召开。
博士生朱星玮的论文“Topic Hierarchy Construction for the Organization of Multi-source User Generated Contents”(作者:朱星玮,Zhaoyan Ming, Tat Seng Chua,朱小燕)被第36届ACM国际信息检索大会(SIGIR’2013)录取为长文。该论文为了对海量网络用户产生信息提供一个全面、准确且即时的结构化呈现。提出了使用自动生成的层次化话题结构来组织多源用户产生数据的方法与框架。论文揭示了不同数据源的特点及其作用,同时也表明所提出的话题层次化结构生成算法在性能上要显著优于现有的其他算法。

博士生王超的论文“Incorporating Vertical Results into Search Click Models”(作者:王超,刘奕群,张敏,马少平,郑美红,钱静,张阔)被第36届ACM国际信息检索大会(SIGIR’2013)录取为长文。该论文通过对比分析大规模商业搜索引擎点击日志行为,及在清华大学心理系眼动实验平台上追踪的用户行为,将用户行为变化归结为结果吸引程度、全局置信度、首位点击和检验顺序等四个偏差。提出了新的用户点击模型VCM(Vertical-aware Click Model)来刻画上述偏差并在大规模点击日志数据上进行实验验证了模型的有效性。这也是智能技术与系统重点实验室与我校心理系进行学科交叉研究的一个重要成果。

硕士生张永锋的论文“Improve Collaborative Filtering Through Bordered Block Diagonal Form Matrices”(作者:张永锋,张敏,刘奕群,马少平)被第36届ACM国际信息检索大会(SIGIR’2013)录取为长文。该工作指出了基于二分图的社区发现算法与近似或精确双边块对角矩阵之间的映射关系,并以此为基础使社区发现算法与基于协同过滤的推荐预测算法得到自然的融合,在提高预测精度的同时,降低预测的耗时。

SIGIR’2013是人工智能和信息检索领域的顶级国际会议,今年共投稿366篇,其中73 篇(19.9%)被录用。会议将于2013年6月22日-26日在爱尔兰都柏林召开。

博士生徐旻捷的论文“Fast Max-margin Matrix Factorization with Data Augmentation”(作者:徐旻捷、朱军、张钹)被第30届国际机器学习大会(ICML)录取为长文并作口头报告。该论文通过数据增广技术提出了快速准确的最大间隔矩阵分解方法,解决了最大间隔矩阵分解运算长期存在效率低下的问题,极大地提高了计算效率。同时,论文提出非参数贝叶斯的最大间隔矩阵分解方法,可以自动确定模型复杂度(即隐含因子的个数),避免了耗时的传统模型选择。

副教授朱军的论文“Gibbs Max-margin Topic Models with Fast Sampling Algorithms”(作者:朱军、陈宁、Hugh Perkins、张钹)被第30届国际机器学习大(ICML)会录取为长文并作口头报告。该论文提出了基于吉布斯分类器的最大间隔隐话题模型,及其高效准确推理算法;为构建隐变量最大间隔学习模型提供了新思路和计算框架。
ICML是机器学习领域的顶级国际会议,今年共投稿1200多篇,其中283篇(<23.6%)被录用,121篇(<10.1%)被录用为口头报告。会议将在2013年6月16日-21日在美国亚特兰大召开。

副教授朱军的论文“Improved Bayesian Logistic Supervised Topic Models with Data Augmentation”(作者:朱军、郑勋、张钹)被第51届国际计算语言学大会(ACL)录取为长文并作口头报告。该论文在正则化贝叶斯推理理论框架下通过引入正则化因子,解决了基于logistic回归分析的有监督话题模型中存在的严重不平衡问题;同时,基于数据增广理论提出了准确高效的推理算法。

副教授刘洋的论文“A Shift-Reduce Parsing Algorithm for Phrase-Based String-to-Dependency Translation”(作者:刘洋)被第51届国际计算语言学大会(ACL)录取为长文并作口头报告。该论文提出了基于短语的依存到串翻译模型,并为该模型设计了移进归约搜索算法,有效综合了短语模型和句法模型的优点:高覆盖率、低解码复杂度、可利用句法信息,显著超过了目前的主流翻译方法。

ACL是计算语言学领域的顶级国际会议,会议将在2013年8月4日-9日在保加利亚召开。

博士生李鹏的论文“An Extended GHKM Algorithm for Inducing Lambda-SCFG”(作者:李鹏,刘洋,孙茂松)被第27届美国人工智能协会年会(AAAI)录取为长文并作口头报告。该论文基于GHKM为语义分析提出了新的Lambda演算扩展的同步上下文无关文法,能够有效关联自然语言句子和一阶谓词逻辑,通过区分最小规则和组合规则实现了多粒度规则的抽取,增加了语义分析模型的推广能力,在标准数据集GEOQUERY上取得目前最高的准确率。

AAAI’2013是计算机与人工智能领域的顶级国际会议,今年共投稿690篇,其中包括正文和海报张贴在内共203篇(29%)被录用。会议将于2013年7月在美国召开。