报告人:常毅博士

  常毅,现任华为美国研究所技术副总裁,华为搜索技术实验室负责人。2006-2016就职于雅虎研究院,任研究总监,负责其搜索研究部门, 主持雅虎公司的几乎所有重要搜索产品的应用研究。他在国际一流会议和期刊上发表了100余篇论文,出版了一本专著,获得30余项专利,并荣获了WSDM 2016最佳论文奖, KDD 2016最佳论文奖。他现担任TKDE副主编,WSDM 2018大会主席。更多介绍见个人主页 www.yichang-cs.com


报告题目:互联网搜索的相关性提高
报告摘要: 互联网搜索行业具有后发劣势,而搜索精准度是互联网搜索引擎的核心竞争力。 排序学习是提高搜索精准度的高效手段,然而,提高搜索引擎的精准度不仅仅只是排序学习, 而是一个系统工程。我们将介绍该领域的现状及其最新发展,并展示最近的研究工作成果(KDD 2016最佳论文奖), 从排序学习算法、多种语义匹配特征、查询重构这三个角度出发,提高搜索引擎的相关性。

报告人:华先胜博士

  华先胜,阿里巴巴iDST研究员/资深总监, IEEE Fellow,ACM杰出科学家,MIT TR35获得者, 国家“千人计划”特聘专家。在阿里负责云上的视频图像智能分析、识别、搜索、生成和挖掘服务。 在此之前先后在微软中国研究院、微软总部Bing搜索引擎、微软美国研究院和阿里 巴巴搜索事业部任主管研究员、首席研发主管、资深研究员和资深总监。 华博士曾是微软图像搜索引擎的关键贡献者之一, 以及阿里巴巴商品图像搜索产品“拍立淘”的技术带头人。2001年北京大学博士毕业。 发表论文200余篇,拥有50余项授权专利。曾任 ACM Multimedia、IEEE ICME等国际会议程序委员会主席, 还曾任多个国际会议多媒体领域主席(KDD,SIGIR,IJCAI,MM,ICME等), 曾任或现任IEEE Trans. On Multimedia及ACM Trans. On Intelligent Systems and Technology杂志副编, 曾获包括ACM Multimedia和IEEE Trans. On CSVT等在内的多项最佳论文奖。


报告题目:视觉大数据的识别、搜索和挖掘
报告摘要: 自从上个世纪末以来,视觉识别和搜索已经被研究了好几十年。 最近几年的分布式计算、高维索引、深度学习和大数据分析技术的快速发展让这个课题变得更加火热, 很多与视觉识别或视觉搜索相关的研究成果和创业公司纷纷出现。 但是,真实世界中的大规模视觉识别和搜索真的可以用了吗? 实时超多路视频分析能做到吗?大规模视觉数据的挖掘能挖出什么有价值的信息? 在这个报告中,我们将以阿里云视觉计算平台上的算法和应用为背景,深入探讨以上这些问题, 并寻求视觉识别、搜索和挖掘的未来的发展方向。

报告人:李青教授

  博士生导师,香港城市大学多媒体工程研究中心主任、电脑科学系终身教授, 主要研究领域包括多媒体数据管理、概念建模、数据挖掘、社交媒体与Web服务计算等。 他在相关领域的国际会议与期刊上发表了300多篇的学术论文,是NSFC 海外杰青获得者。 曾任ACM Transactions on Internet Technology, IEEE Transactions on Knowledge and Data Engineering 的副编, 目前是WWW journal, Data & Knowledge Engineering, Journal of Web Engineering 等期刊的编委。 他现任香港万维网科技学会会长、国际万维网信息系统工程(WISE)学会副会长、CCF数据库专委会常务委员、CCF大数据专家委员会委员等, 同时在多个国际会议(包括ACM RecSys, DASFAA, ER, ICWL, IEEE U-Media)出任指导委员会成员。


报告题目:基于社交媒体的事件多源检测与多维度分析
报告摘要: The publicly available data such as the massive and dynamically updated news and social media data streams (a.k.a. big data) covers the various aspects of social activities, personal views and expressions, which points to the importance of understanding and discovering the knowledge patterns underlying the big data, and the need of developing methodologies to this end, particularly to discover real-world events from such big data. In this talk we aim to provide insight on event detection and prediction underlying the Big Data. We propose to develop techniques for untargeted event detection (UED) and targeted event detection (TED) from multi-sourced data, and build event cube models to support various event queries and analysis thereon. UED aims to discover numerous varieties of real-world events while TED aims to discover domain-specific events. By discovering various kinds of real-world events from the big data, UED supports decision-makings by providing the newest and comprehensive knowledge about the events. Under many circumstances, the events discovered by UED may actually serve as the “context” of those discovered by TED which aims to foresee some domain-specific events and allows users to make responses in the first place. Specifically, active and passive data collecting will be employed to obtain the streaming data from multiple data domains, which will be cleaned by removing noisy and inconsistent data through crowd-sourcing techniques. To learn accessible data representations, multimodal fusion models will be devised based on dictionaries to be constructed over the event elements. Furthermore, clustering-based and classification-based event discovery models will be designed, respectively, for UED and TED tasks. Finally, an event cube model will be developed to organize the discovered events from multiple dimensions so as to facilitate mining the inherent relationships among them.

报告人:茹立云博士

  茹立云,清华大学博士,2005年加入搜狗,现任搜狗公司COO。 在搜狗工作的十一年间,领导团队完成多次技术升级及产品创新, 逐步将搜狗搜索打造为拥有5.6亿月活跃用户的中国第二大搜索引擎。 2013年,茹立云入选2013中国商业创新50人并获得“技术创新者”大奖,2015年获得北京市科学技术一等奖。 2016年,搜狗公司宣布向清华大学捐赠1.8亿元并联合成立“清华大学天工智能计算研究院”,茹立云博士出任副院长。


报告题目:人工智能时代的搜索——无处不在的问答引擎
报告摘要: 大规模商业搜索至今已发展20余年,经历了PC时代、移动时代直到今天的人工智能时代。 以更好、更便捷地满足用户的信息需求为目标,在大数据、多种算法和强计算能力的支撑下, 搜索始终站在科技前沿,在不同时代有着不同的形态和挑战。今天,随着人工智能时代的到来, 搜索正在逐渐从搜索过渡为问答,并广泛存在于多种产品中,帮助用户从获取信息到直接获取答案、直接作出决策。 这个报告中将介绍深度学习在搜狗搜索中的最新进展以及搜狗搜索在问答引擎上的探索。