学术交流

山东大学信息检索实验室代表参加ACM ICMR 2012多媒体检索国际会议

2012-06-18

山东大学信息检索实验室代表李丕绩同学于2012年6月5号到8号参加了在香港举行的2012年（第二届）多媒体检索国际会议(ACM International Conference on Multimedia Retrieval (ICMR))。主办方为ACM，协办方为香港城市大学。

ICMR 是由ACM CIVR(Content-based Image and Video Retrieval) 和 ACM MIR(Multimedia Information Retrieval )会议与2011年合并而来。第一届CIVR是2003年在美国的UIUC大学召开，最后一届是2010年在中国的西安召开。本次会议共收到投稿145篇，其中录用50篇，16篇Oral，34篇Poster。本人的文章《Learning to Summarize Web Image and Text Mutually》被录用为Poster。

会议第一天为Tutorial，一共三个Tutorial，本人去参加了第一个Tutorial《Foundations of Large-Scale Multimedia Information Management and Retrieval 》。两个主讲人都是大牛，其中Edward Chang之前在 University of California, Santa Barbara做全职教授，现在领导Google中国研究院。他主要是系统的回顾了一下机器学习和多媒体检索中的基本算法以及并行分布式计算的基本工具模型。第二个主讲人Chih-Jen Lin是台湾大学的教授，他的成名作品是开发了Libsvm，对业界和学术界都做出来卓越贡献，工具的引用率也是排在前几名。他主要从自己的实践出发，讲了各种机器学习算法能否并行以及如何并行的问题。听了之后对于即将进入百度工作的我有很大启发，因为知道了机器学习算法并行的一些基本的知识和方法。

会议第二天和第三天都是Keynote和Oral Session，三个Keynote都是多媒体检索、计算机视觉以及机器学习领域的大牛。第一个Keynote是哥伦比亚大学的Paul Sajda教授，他做了题为《Cortically-Coupled Computing for Media Retrieval》的报告，主要从人的视觉系统出发介绍关于他们在多媒体检索领域取得的成果。法国INRIA 研究院LEAR 组的教授Cordelia Schmid做了题为《Aggregating Local Image Descriptors for Large-scale Image Retrieval and Classification》的报告，主要是比较了业内常用的几种效果比较好的大规模下多媒体检索以及分类的方法，阐述了他们的结论。最后一天微软亚洲研究院MSRA的院长洪小文博士做了题为《The Road to Pervasive Multimedia Search and Multimodal Interaction》的报告，特别是关于多媒体检索过滤以及绘图检索的部分特别引人关注。通过三个Keynote的报告，本人了解了研究领域中的一些前沿难点，对以后的研究工作有很大帮助。

本人的工作《Learning to Summarize Web Image and Text Mutually》在7号下午海报的形式展出，并且同感兴趣的研究者一起讨论文章方法的方方面面，新加坡南洋理工大学的孙爱欣教授说他们组本来要做相关的工作，没想到本人已经发表了类似的文章，并且讨论了做这个研究点的一些瓶颈的问题。

会议间歇以及晚宴中，也认识了几位来自顶级实验室和研究组的同学，其中印象最深的是来自英国牛津大学VGG研究组的Relja Arandjelovic，他是优秀论文候选之一，做的工作非常出色，通过交流了解他们实验室做科研的态度和方法，知道了顶级实验室需要的一些基本素质和要求，对以后实验室的发展有所帮助。

今年的会议中多了一个Demo的部分，各种关于多媒体检索的Demo，让我印象比较深刻的是“Mobile Image Browsing on a 3D Globe”，将图像检索的结果展示UI设计为球体，这样就可以更加方便的在移动设备浏览，“World Seer : A Real-time Geo-Tweet Photo Mapping System”可以实时根据Twitter上图片去浏览当地的街景。

香港的这次参会之旅，不虚此行，见到并认识了圈子里的很多牛人，给实验室和自身发展起到一些促进的作用。