让人工智能研究走在世界前沿,让个体跟世界深度连接AI学院

来源: 微软研究院AI头条 / 作者:zz / 2018-02-12 22:22
你心目中的计算机研究员都是什么样子的?一天到晚除了敲代码就是写Paper? 本文科学匠人的主人公——微软亚洲研究院研究员张富峥就用自身经历打破了人们的这一刻板印象,他的生活

你心目中的计算机研究员都是什么样子的?一天到晚除了敲代码就是写Paper? 本文科学匠人的主人公——微软亚洲研究院研究员张富峥就用自身经历打破了人们的这一刻板印象,他的生活不仅不清冷,反而充满了与世界的亲密互动,他的研究都与用户有着紧密联系,他曾经创新地“用大数据预测女朋友的冲动购物行为”,并发表了利用大数据构建用户冲动度的模型,让高深的科研技术接地气的进行应用。发表论文、出书、与产业界交流合作,他也一个都没有落下。微软亚洲研究院所提供的平台和资源让张富峥在研究生涯中找到了自己的平衡点。

 

我们脑中或多或少都有一些关于计算机科研人员的刻板印象”,比如:一天24个小时,有8个小时在敲代码,有6个小时在看Paper、在写Paper,俨然一副与世隔绝的“世外高人”形象……

 

但其实他们一点也不刻板。微软亚洲研究院的张富峥博士表示,他们的研究生活一点也不孤冷清寂,相反,还充满与世界的高频亲密互动。在张富峥看来,与世界沟通和接轨才有可能迸发创新的想法,走在研究的最前沿。不问世事、闷头做研究的时代已经过去,尤其在AI时代,数据的获取与解读、算法的构建与优化,都必须与世界深度连接。

走在最前沿,这是研究的本质

 

张富峥的研究领域有两个:一是用户行为理解,即所谓的用户画像,二是个性化推荐。看名字就知道,他的研究是要通过大数据来理解用户行为,从而为用户推荐个性化的信息,因此,张富峥的研究必须要与用户发生紧密的联系。

 

在这个资讯纷繁的时代,从朋友圈里的旅行照片,到微博里的签到地址,甚至“手环”类的可穿戴设备,我们每个人都在主动或被动地与世界发生各种关联。每一个动作或者生活的环节,都在生成新的数据,然后再通过分享、传播,抵达更多人,成为亿万光纤中不断跳跃的信息源。张富峥所感兴趣的就是在这海量、无序的数据中,寻找有序的规律,将网络中的碎片拼凑成一个个完整的、有血有肉的个体。

 

 

很多人都觉得,研究工作就是每天埋头苦想,不问世事。但实际上,研究工作要跟世界进行非常广阔、频繁的互动。张富峥说:“因为我们的研究领域需要深刻理解用户,从研究对象来看,这是一个变化的时代,我们要随时关注不断涌现的新生事物,了解用户的生活方式以及兴趣等发生了如何的变化。从研究方法来看,如果想保持自己科研工作的最高水平,就必须要知己知彼,对产业界、学术界的最前沿进展做到了如指掌。

 

“刚来研究院的时候,我们整个组的重心其实都在轨迹数据的研究上,主攻用户移动的数据挖掘。但是,在2011年后,随着社交媒体的风起云涌,各种各样的用户数据不断涌现,为我们带来了深入了解每个用户的可能性。所以,我们意识到个性化的号角即将吹响,便抓住这个机会,投入更多的精力在‘用户画像和个性化推荐’这个应用前景更加广阔的领域”,张富峥说。

 

做起个性化之后,社交网站上人与人连接的数据、兴趣的数据、交易的数据等等,都有了新的观察维度。大家在做研究的过程中也愈发感到“这是一件好玩的事儿”。张富峥举了一个例子,在2016年美国大选的时候,特朗普的数字运营官会根据用户在Facebook上的行为对用户进行心理画像,为用户推送‘个性化’的政治讯息,从而提高用户对特朗普施政理念的认可度。以分析用户对枪支权利条款的态度为例,如果是神经质型和严谨型观众,就要突出入室抢劫的威胁,显示政策应该保证业主持枪,所以可以让他们看到“抢劫者一只砸窗户的手“这样的画面;另一边,如果是亲和型的用户,他们关心传统、习惯和家庭,不妨给他们看类似”大人带着孩子站在夕阳下举枪打野鸭“这样温馨的画面。

 

在用户理解做到了一定程度之后,研究自然会走向更深更广的方向。比如,现在张富峥的团队会引入知识图谱来提高个性化推荐效果,会引入增强学习来平衡推荐的长短期目标。“个性化最开始是从无到有,而之后就会越做越深。” 张富峥说到,“见证这些前沿技术不断的横向和纵向深入,并愈来愈接近人类本身的思维与审美冲动,也许就是做研究才有的成就感与喜悦吧。“

 

如今,张富峥和团队在用户画像和个性化推荐方面的研究成果也已融入到了微软的产品中,如,在必应搜索的新闻板块中个性化地为用户推荐感兴趣的新闻,让微软小冰基于用户的社交数据进行性格分析,等等。

 

 

微软小冰在“非你莫属”节目中对选手进行用户性格分析


不断解决痛点问题,这是研究的快乐

 

张富峥毕业后加入微软亚洲研究院已有近三年的时间,而他与微软的渊源更是在本科期间就已经开始了。他的本科毕业论文就是在微软亚洲研究院实习期间完成的,在本科毕业之前还获得了中国科学技术大学(中科大)与微软亚洲研究院联合培养博士生的资格,研究生一年级在中科大修完所有课程,他便“常驻”微软亚洲研究院,开始了他的研究生涯——既有昂扬得意,也有焦虑不安。

 

研究生初始阶段,是张富峥最为焦虑的时候,如何在研究的星辰大海中找准适合自己的方向并不是一件容易的事情。幸运的是,身处“世界上智商密度最高的地方之一“,有太多的良师益友可以碰撞出思想的火花。“在办公室早出晚归,跟各路大牛请教,再潜心钻研自己所在的领域,是自我提升最快的方法。张富峥说,“那时,我每天想的就是如何能够在最前沿研究的基础上走出一条属于自己的路”。功夫不负有心人,2013年初,他的第一篇论文在相关领域的国际顶级会议上成功发表。

 

经过了一段时间的积累,张富峥自我感觉得心应手了许多,对于做研究,已经从最初的好奇、焦虑进入到了兴奋和享受的状态。到了攻读期间,他对研究方向的把控开始有了更多的想法,当社交网络兴起的时候,他以及所在的研究组也及时把握住机会,把更多的精力从轨迹数据的研究转到了用户行为数据的研究。

 

 

微软亚洲研究院研究员 张富峥

 

博士毕业后,喜欢研究又希望将研究落地的张富峥毫无悬念地选择了正式加盟微软亚洲研究院。对他而言,研究的乐趣要同时具备两个层面——一是深挖下去,触碰到技术的最前沿,二是应用技术解决实际痛点问题,两者缺一不可

 

“在微软亚洲研究院,丰富的资源平台与高效的科研体系让你可以潜心钻研顶尖的科研方向,同时它又创造条件可以将你的各种技术产品化,这样的环境是其他研究机构所无法比拟的。对科研人员来说,在这里可以真正感受到研究的乐趣所在。”张富峥说。

在多元化的研究中,找到自己的平衡点

 

由于用户画像和个性化推荐这个领域的研究与人们的实际生活十分贴近,张富峥还曾经突发奇想地“用大数据预测女朋友的冲动购物行为”,并发表了利用大数据构建用户冲动度的模型,很受电商们的欢迎,让高深的科研技术有了接地气的应用。在2017年5月,他所在的微软亚洲研究院社会计算组还发表了《移动数据挖掘》一书,书中选取了当前学术界和工业界的热点主题,介绍了移动数据挖掘的基本概念和方法,包括移动数据预处理、用户移动模型、用户画像以及兴趣位置推荐等等,张富峥也是该书的主要作者之一,如今该书已经成为数据挖掘领域的新生代教材。

 

发表论文、出书、与产业界交流合作,张富峥一个都没有落下,正如他所说,微软亚洲研究院在研究和技术落地转化方面找到了一个平衡点,他也在研究生涯中找到了自己的平衡点。

 

现在,张富峥不仅自己在研究和应用的最前线,也带领着很多实习生一起冲锋陷阵,为同学们答疑解惑、指引方向,曾经执导的一位实习生还获得了含金量极高的微软学者荣誉。对于想要加入微软亚洲研究院的同学们,张富峥建议道,“在学校期间,一定要把数学、编程等基础打牢,这样在未来真正做研究的时候才会上手快。不仅如此,如今是一个资讯、资源极大丰富的时代,大家还应该及时、充分地利用互联网拓展视野、完善知识体系,不断深入学习。在这个时代,学与不学、用心学与不用心学所导致的差距会相当巨大,因此,需要学会给自己设立清晰的目标。”

 

加上实习及攻读博士的时间,张富峥在微软亚洲研究院已有将近8年,对他来说微软亚洲研究院的DNA已经渗入到了他工作与生活的各个层面。与世界连接,设立明确的目标,借助微软亚洲研究院所提供的平台与资源,通过自己的努力一步步将研究设想落地、实现,张富峥觉得自己很幸运。当然这也与他之前打下的扎实基础不无关系,正如人们常说的,机会总是留给有准备的人!

 

阅读延展

1
3