特邀报告

人机对话技术前沿与发展

      ---- 科研歧路的选择

朱小燕 教授,清华大学
摘要:

在介绍人机对话领域的历史,现状,未来趋势的同时,分享我们近二十年的人机对话、交互研究经历。介绍本人进入该领域的诱因,通过一步一步不断地摸索,调整方向,取得一定成果过程。再幸运科研工作者也难得一生的研究路途都是一马平川。我们的人生就是一个遇到挫折,迷茫,艰难地寻找着通向光明途径的过程。

简历:

朱小燕,清华大学计算机系教授,智能技术与系统国家重点实验室主任,曾任计算机系副主任。位列 “人工智能全球女性榜单”, “2019年度中国人工智能100人榜单”。2019年获得吴文俊人工智能科技进步一等奖。从事人工智能领域相关工作30余年,主要研究领域为智能信息处理,包括人工神经网络、机器学习、自然语言处理、智能信息提取、智能问答系统等。获得国家发明专利十余项,在国际刊物和会议上发表论文100余篇,其中包括IJCAI 2018杰出论文、COLING 2012最佳学生论文、ACL 2010最佳论文等。近几年研究工作主要集中于新一代智能信息获取与人机对话/交互的研究,所研究的原型系统曾应用于多家知名企业。



谈谈机器翻译技术发展与产业应用
朱靖波 教授,东北大学
摘要:

本报告不是一个纯学术报告,属于“扯淡”类型,报告中的观点不一定正确,只是个人观点而已,涉及到三个方面,一是我与YSSNLP的渊源;二是我对机器翻译技术发展的一些观点;三是我对机器翻译产业化的一些看法。

简历:

朱靖波,博士、东北大学计算机学院人工智能系教授、小牛翻译创始人。曾在美国南加州大学USC/ISI做过公派访问学者,师从前国际计算语言学学会ACL主席、前国际机器翻译学会主席、Google翻译创始人Franz Joseph Och的博士后导师Prof. Eduard Hovy。主持研制了机器翻译开源系统NiuTrans和目前业内支持语种最多(304个语种)的机器翻译产品—小牛翻译,目标为全球用户提供多语种机器翻译服务,曾荣获国内自然语言处理领域最高科技奖—钱伟长中文信息处理科学技术一等奖。

专题报告一:预训练技术前沿进展

自然语言处理中的预训练模型
邱锡鹏 教授,复旦大学
摘要:

目前预训练模型在自然语言处理领域取得了广泛的成功。本报告的内容主要涵盖以下4部分内容:1)预训练模型的原理介绍,包括模型结构、学习准则、发展历程等;2)预训练模型的迁移方法:包括如何通过任务转换、多步迁移、改进精调等方法来进一步提高预训练模型在下游任务上的性能;3)预训练模型的改进模型:包括知识嵌入模型、多模态模型、多语言模型、语言特定模型、领域特定模型和模型压缩等;4)对预训练模型及其未来发展趋势进行展望。

简历:

邱锡鹏,复旦大学计算机科学技术学院教授,博士生导师,于复旦大学获得理学学士和博士学位。主要从事自然语言处理、深度学习等方向的研究,发表CCF-A/B类论文70余篇,获ACL2017杰出论文奖,CCL 2019最佳论文奖,主持开发了被广泛使用的开源自然语言处理框架FudanNLP和FastNLP,获中国中文信息学会“钱伟长中文信息处理科学技术奖青年创新一等奖”,中国科协人才托举工程,Aminer “2020年度AI 2000人工智能全球最具影响力提名学者”



RPA 时代的通用文档理解预训练模型
崔磊 博士,微软亚洲研究院
摘要:

随着许多行业的数字化转型,电子商业文档的结构化分析和内容提取成为一项热门的研究课题。电子商业文档通常包括两大类:一类是纸质文档的扫描图像件,另一类是计算机生成的数字文档,这些文档可以涵盖采购单据、行业报告、商务邮件、销售合同、雇佣协议、商业发票、个人简历等。一般来说,电子商业文档提供了公司对于内部和外部事物的处理细节,包含了大量与行业相关的实体信息和数字信息。在过去,电子商业文档的信息处理一般由人工来完成,然而,人工信息提取不仅耗时费力,其可复用性也不高,大大限制和阻碍了企业运行效率。因此,电子文档的自动精准快速处理对于企业生产力提升至关重要,这也促使了一些新兴行业的出现,帮助传统行业进行数字化转型并提高生产力。近年来,机器人流程自动化(Robotic Process Automation, RPA) 行业应运而生,正是利用人工智能技术帮助大量人工从繁杂的电子文档处理任务中脱离出来,与此同时提供了一系列配套的自动化工具提升企业生产力,其关键核心就是自动文档分析与识别技术。面对大量无标注电子文档,现有的大规模预训练语言模型能够在预训练阶段有效捕捉文本中蕴含的语义信息,但忽视了文档中的视觉结构信息。我们提出一种结合文档结构信息和视觉信息的通用文档预训练模型 LayoutLM,在表单理解、票据理解、文档图像分类等任务的测试中均取得了目前的最佳成绩。目前,LayoutLM相关模型、代码和论文都已开放下载。

简历:

崔磊博士是微软亚洲研究院自然语言计算组的主管研究员,他于2015年博士毕业于微软亚洲研究院-哈尔滨工业大学联合培养项目,并于同年加入微软亚洲研究院工作。迄今为止在重要的国际顶级期刊和会议上发表了30余篇论文(包括ACL, AAAI, IJCAI, KDD, EMNLP, COLING, ACM TALLIP等),并持有10余项美国专利。他的研究兴趣包括信息抽取、文档理解、文本生成、对话系统、机器翻译以及自动问答等,创新研究成果也被应用到了微软公司的许多重要产品当中,包括微软Azure云平台,Office办公软件,必应搜索引擎,微软小冰等。

EasyTransfer-ModelZoo的预训练技术研究及其在阿里的应用
邱明辉 博士,阿里巴巴
摘要:

预训练模型从海量无监督数据中提取通用知识,并通过知识迁移的方法提升下游任务的效果,在很多电商场景里取得了优异的效果。阿里PAI团队开发并开源了高效易用的预训练模型库EasyTransfer-ModelZoo,支持预训练技术的研究,主要包括下面三个方向。首先是大模型预训练技术优化。通常预训练模型尺寸越大,学习到的知识表征对下游任务越有效,带来的指标提升也越明显,然而超大的模型对于模型训练带来了很大的挑战。我们研究高效的数据并行策略,模型并行策略,和分布式优化器,提升了超大规模模型预训练的能力。其次是预训练模型压缩。大模型显然无法满足工业界应用的时效性需求,因此需要考虑模型压缩。 我们研究面向任务的预训练模型压缩,针对不同任务的特性自动压缩出适合该任务的效果好的小模型。最后,电商场景包含大量的多模态信息包括文本,图像,语音,视频等,因此多模态预训练技术有着非常多的应用。我们针对电商领域的图文信息进行预训练的研究,提出了FashionBERT多模态预训练模型,在多个跨模态检索和图文匹配等业务场景都有成功的应用案例。

简历:

邱明辉,新加坡SMU博士,美国卡耐基梅隆大学访问学者,毕业后加入阿里,现任高级算法专家。主要从事自然语言处理和深度学习算法和框架研究,迄今为止已发表40余篇自然语言处理和机器学习方向的顶会和期刊论文,Google学术引用1500+,H-index 20。曾获得Best paper runner-up award和Best demo award,并担任多个国际顶会的审稿人,例如NeurIPS,KDD, ACL, AAAI等。目前主要负责面向NLP场景的迁移学习框架EasyTransfer的开发和落地,目前该框架已经开源,并已服务阿里内部多个BU业务场景。

专题报告二:认知语言智能前沿进展

现代汉语演化的计量研究和语言规划议题
饶高琦 博士,北京语言大学
摘要:

目前几乎所有的语言智能应用均以现代汉语为处理对象,但现代汉语是怎样演化形成的,这一演化过程却缺乏研究。此外,不同于上古和中古汉语,现代汉语的形成在很大程度上是有意识语言规划的结果。各类语言规划的实施和效力也是值得探索的问题。(1)本报告将介绍北语建设的长时间跨度的报刊语料库项目,并综述近年来历时汉语发展方面的计量研究。(2)我们还将分享语言政策与规划中和语言智能相关的议题。

简历:

饶高琦,语言学及应用语言学专业博士,北京语言大学汉语国际教育研究院、语言智能研究院助理研究员,硕士研究生导师,中国中文信息学会青工委成员,主要研究领域为计算语言学、语言政策与语言规划、数字人文,长期组织中介语作文自动批改技术评测CGED,在《北京大学学报》《语言文字应用》《中文信息学报》等期刊发表论文二十余篇。



互动视角的语言智能研究
胡韧奋 博士,北京师范大学
摘要:

近年来,预训练语言模型在自然语言处理领域取得了丰硕的研究成果,其语言知识表征能力也获得了广泛关注。当下,语言学研究与语言智能技术可以产生怎样的互动?本报告拟从两个角度展开讨论:(1) 基于语言学知识构建探针任务,对深层语言模型在不同维度的知识表示能力进行探究;(2) 以语言智能技术为手段,对语言学现象和规律进行挖掘,从而丰富和促进语言本体研究。

简历:

胡韧奋,语言学及应用语言学专业博士,北京师范大学中文信息处理研究所、汉语文化学院讲师,硕士生导师,中文信息学会青工委成员,主要研究领域为计算语言学、计算机辅助语言教学、数字人文,在ACL、EMNLP、COLING、《北京大学学报》、《语言文字应用》、《中文信息学报》等国内外高水平会议期刊发表论文二十余篇。

言外之意的认知神经机制探索
张丹 副教授,清华大学
摘要:

言外之意现象在言语交流中普遍存在,然而其认知神经机制尚不明确。近年来新兴的多人脑扫描技术,通过不同个体间在相同知觉输入下的神经活动相似性和差异性对个体的知觉体验进行量化描述,有望为言外之意的认知神经机制探索提供支持。本报告介绍基于多人脑扫描技术的知觉体验个体差异研究前沿进展,讨论并展望这一研究方法在言外之意探索中的未来应用方向。

简历:

张丹,生物医学工程博士、清华大学心理学系副教授、博士生导师、脑与智能实验室兼职研究员。研究致力于运用脑电、近红外等神经生理信号开展心理状态与特质的评测方法与理论研究,近年来主要在情绪识别脑机接口、自然交互生理计算、教育神经科学等心理学与信息科学的交叉学科新兴方向上开展工作,在NeuroImage、IEEE Trans. Affective Computing、IEEE Trans. Biomedical Engineering、Journal of Neural Engineering等期刊发表SCI/SSCI论文20余篇,担任IEEE Trans. Affective Computing、Frontiers in Human Neuroscience等期刊编委。

专题报告三:科技抗疫,NLP青年在行动

天玑“智疫通”-大数据智能预测与问答助理平台
范意兴 博士,中科院计算所
摘要:

新一代信息技术迅猛发展,互联网尤其是大数据,在这一次新冠病毒疫情中正发挥着积极作用。在疫情期间,各级管理部门的干预举措也迫切需要理论数据支撑,其中最重要的几个问题就是:疫情何时能够出现拐点?到底什么时候可以安全复工?应该进行怎样的疫后管理?针对这些问题,中科院网络数据重点实验室天玑团队协调产品、工程、科研等多个部门组建技术攻关团队,成立疫情防控技术服务响应工作小组,针对疫情的传播规律,紧急开展基于大数据的疫情预测研究与舆情态势分析,搜集整理疫情服务信息,并根据相关成果研发了“智疫通”——智能预测与助理平台,为公众提供疫情趋势智能预测、疫情风险筛查、话题态势分析、疫情信息问答助手等各类相关权威内容及助理服务,并积极为有关政府部门提供数据分析和处理技术支撑,为疫情防控作贡献。本次报告将介绍“智疫通”平台的重点功能,包括疫情趋势预测、疫情信息问答、疫情谣言检测等,以及这些功能背后的关键技术模块。

简历:

范意兴,中科院计算所助理研究员,主要研究内容包括信息检索、自然语言处理等,在信息检索以及自然语言处理相关的顶级学术会议如SIGIR、CIKM、WSDM、AAAI、ACL上发表论文20余篇,在Google Scholar上累计引用670余次,获得了2017年CIKM的Best Long Paper Runner Up的奖项,多次获得CCIR会议最佳论文奖,获得了2018年中国中文信息学会优秀博士学位论文奖。在WSDM 2019会议上作为核心人员组织了第一届深度文本匹配的研讨会,同时还将相关研究成果实现成开源的文本匹配工具MatchZoo,在开源平台Github中得到研究人员的广泛使用与认可,累计获得3000+star。



搜狗AI助力科技抗疫
张奇 教授,复旦大学
摘要:

在疫情期间搜狗搜索利用自身的在大数据、人工智能等技术领域的优势,以“科技抗疫”履行企业责任,投入超过1000人/天的研发力量,快速上线了“全国实时疫情动态”、“新冠肺炎AI自测机器人”、“新冠肺炎智能问答机器人” 、“在线问诊聚合服务平台”、“海南省互联网医院新冠肺炎诊疗服务平台”等一系列疫情相关产品。截止6月底,服务覆盖超12亿人次,助力公众掌握最快最全面的疫情相关权威信息及服务。本次报告中将介绍搜狗搜索在AI助力科技抗疫所做的工作,并针对所面临的核心技术问题进行总结。

简历:

张奇,复旦大学计算科学技术学院教授、博士生导师、搜狗搜索首席研究员、医疗搜索与服务部技术负责人,主要研究方向是自然语言处理和信息检索。发表论文100 余篇,被引用次数2700余次。获得WSDM最佳论文提名奖、COLING最佳论文提名奖。作为第二译者翻译专著《现代信息检索》。获得上海市科技进步二等奖、教育部科技进步二等奖、ACM 上海新星提名奖、IBM Faculty Award、中国中文信息学会钱伟长中文信息处理科学技术奖--汉王青年创新一等奖。

数据智能技术在疫情防管治一体化的实践
李林峰 博士,医渡云
摘要:

新冠疫情期间,医渡云积极参与到武汉、北京等地的疫情研判和防控。基于精细化SEIR模型进行疫情预测及仿真;基于自然语言处理、搜索和可视化等技术,辅助疾控人员进行疫情溯源、聚集性事件发现、密接人群分析以及区域风险分析;基于临床指南和新冠专病库构建的疾病治疗和风险预测模型,辅助患者进行自筛、辅助医生进行疾病诊疗。最终,在上述工具和平台的基础上发布了城市免疫平台,助力疫情的防控。

简历:

李林峰,医渡云大数据应用算法总监,博士毕业于北京交通大学。2017年加入医渡云,负责医学数据智能平台、真实世界知识图谱构建及临床辅助决策等方向,拥有多项医疗人工智能领域专利及论文。曾在百度医疗负责医疗知识图谱、百度医学及智能问诊算法方向。