一个天才如何制造问题

一个天才如何制造问题 2019-11-24 19:14:49   阅读: 2472

戴文渊不是那种严格遵守规则,喜欢“玩花”的人

编程有多种规格。他经常不遵守规则,编写一些根本不遵守规则但执行效率极高的程序。当然,其他人不能跟随他们,这是不可维护的。

第四个范例中的前10,000行代码是他自己写的。那时,他刚刚开始自己的事业,白天作为创始人忙于各种事情。半夜12点钟,他正处于写代码的最佳状态。

他坐在黑暗中,开始敲击键盘,这是他一天中最舒适的时光。

海军部

编辑|刘斌

摄影|高远

生产|陈娇

视频制作

当你知道鸟会飞向哪里

2018年,中国平均每分钟出生28个婴儿。在每天发生的41000多起分娩中,每个妇女都必须面对一个重要的问题,无论是自然分娩还是剖腹产。这不仅关系到他们将遭受的痛苦,也关系到他们的生存。然而,这也是一个经常在最后一刻决定的问题。在这个繁荣的医学时代,主要依靠医生的经验是少数几件事之一。

今年春天,长春的一位妇产科医生发现了一种新的方法,这种方法可能会为缓解这种疼痛提供一种工具——医生偶然在网上看到了一个人工智能平台,想看看他们是否能更准确地预测新生儿的体重,以指导医生做出判断。这台机器不难操作。他把自己过去收集的孕妇体检的所有指标数据以表格的形式输入到机器中,很快得到了答案——不需要选择配方,不需要复杂的操作,机器已经自己完成了一切。

这种看不到过程的计算可信吗?结果也让医生感到惊讶——所有病例的误差都在0.2公斤以内。这甚至高于目前临床医学所达到的准确性。结果被写入一篇论文,并最终在顶级医学会议上发表。

所有这些,公司提供人工智能机器的第四个范例,事先并不知道。医生通过官方网站上的试用入口测试了这种叫做automl的产品,并完成了计算。

该公司创始人戴文渊得知此事时,比他们从银行拿到大额订单时更加激动。他还讲了另一个类似的故事。一天,一个朋友告诉他,他碰巧看到其他人在使用他们的产品。这是一个“候鸟迁徙”项目,机器被用来预测候鸟的飞行路线。当你知道鸟儿将要飞到哪里,并且知道它们将要经过的区域会有污染或烟雾时,你可以采取一些干预措施,使它们尽可能在安全的区域飞行。

在这些故事中,对戴文渊来说最重要的是具体的活生生的人。他们没有太多人工智能基础,也不会写代码。他们可能只操作excel表格,但他们可以通过基础学习用自己的工具使用人工智能。“我认为这代表着我们真的改变了世界。ゥ?

人们坐在一个奇怪的人工智能新工具前,困惑、尝试,最后自己使用它。这与多年前我们第一次接触电脑的过程相同。

1991年,苏州古城区小学二年级学生戴文渊参加了三次第一次数学考试,获得了加入计算机兴趣小组的资格。每周花在电脑上的时间非常宝贵。它用于编写程序,不能容忍任何浪费。他做了一个比喻:“例如,如果你花这么多钱和巴菲特共进午餐,你肯定会抓住所有时间问他问题,绝对不可能浪费时间和他聊天。ゥ?

10岁的时候,他已经开始在电脑室的电脑上写logo语言,家里的书架上有C语言的书。在那之前,他的父母要求他学习特殊技能,他总是半途而废。书法持续了一年,象棋只持续了一年,中国象棋是最长的,但他编造了六年来旷课的原因。只有他自己选择了电脑,并且坚持了28年。

似乎我终于找到了某种生活的入口。从那以后,我年轻时的自我发现和自我肯定没有改变。在高中的第一年,他凭借竞赛获得了步行去大学的资格,并决心只读计算机系。因此,他放弃了不能选择专业的清华。后来在上海交通大学,他获得了acm acm国际大学生编程比赛世界冠军。

另一个关键节点是香港科技大学的实验室。他第一次知道人工智能是什么,并把它作为他一生的追求。起初,我在纸上追逐它。后来,我离开学校,去百度练习广告推荐系统。然后去华为诺亚方舟实验室看看它在非互联网领域能走多远。后来,他发现成为一家公司可能是最好的方式,因此现在的第四种范式应运而生。

“最重要的是我在这件事上得到内心的快乐。我感兴趣并且有一个坚定的目标。我没想过别的。ゥ?

为队友准备可乐的工作。

采访前,戴文渊仍在凌晨1点工作,并在凌晨5点回复微信

在《人物》采访一位女演员之前,我们对他如何安排当天的工作感到好奇,她说她会安排早上最不想做的事情,这样她每天都会越来越开心,晚上也会过得愉快。但是戴文渊的回答是,“我不再记得我喜欢做什么了。”一切都从逻辑开始。逻辑出现并做它应该做的事情。例如,这台机器运转良好,非常适合。

合伙人陈玉强在评论他时提到了“逻辑”。戴文渊是陈玉强大学的小导师,也是他在百度实习的负责人。他认为逻辑是他从戴文渊学到的最重要的东西。“例如,形成描述或算法。他关心这里面的基本逻辑是什么;第二点是,你怎么做,别人能理解,别人能理解。ゥ?

这个极端的原因与戴文渊在acm比赛中接受的训练密切相关。

上大学之前,他的性格完全相反,他既紧张又情绪化。在他高中的第二年,他的计算机水平已经是江苏省最高的,代表全省参加信息学奥林匹克竞赛。经过10年的准备,当我到达现场时,我开始在第一次测试中感到紧张。第二次测试更好,但是经过全面分析,我在这个国家排名第23。当时,第18至第22名的分数相同。当他们进入国家训练队时,他错过了前20名。

加入国家队并代表中国参加世界信息学奥林匹克是他高中时代的理想。他认为自己也有这种力量。从他10岁开始,他的世界里只有电脑和问题,他花了很多时间做编程训练。比赛结束后从北京回到家中,他描述了当时的心情:“就像奥运会一样,一个非常有能力争夺体操冠军的人从平衡木上摔了下来。ゥ?

当时,高中有地方护送清华,但他不能选择专业。他不能接受不学习电脑。与此同时,上海交通大学的于勇教授向戴文渊的学校发送了一份填有他名字的推荐信。于勇说这种形式不能给别人。如果戴文渊不想要,它将自动失效。戴文渊接受了邀请。

高中毕业前的五月是每年举行acm比赛的时候。戴文渊不需要高考,所以他整晚呆在家里看比赛。当时,网络不能做现场视频广播,只有文字,只有一个网页可以打开,并不断刷新。这是上海交通大学第一次获得世界冠军。球员林辰唏后来成为戴文渊的教练,后来创立了现在著名的人工智能公司伊藤科技(Ito Technology)。

戴文渊的acm之旅开始得不太好。在比赛的第一年和第二年,他们没有得到一个好位置。当他准备大三时,他开始思考,“如何做出最正确的决定,如何非常理性地思考”——你不需要证明你比你的队友更好。我前一年参加的球队,他们三个都很强,都在努力证明我是队里最强的人,但我发现这件事实际上一点意义都没有。只有这支队伍才能强大,你比队友强还是弱并不重要。ゥ?

这是一个关键的答案。如果他以前认为自己是最好的,那么他开始接受自己可能没那么好的事实,“在那个水平上,世界上最好的少数人(相比之下),你会发现你自己不会拼写它。但是球队没有,我们仍然需要找到获胜的方法。ゥ?

从那以后,事情变得简单了。他和队友住在一起,肩负着让一个“喝可乐,写好代码”的成员随时喝可乐的任务。他也和其他成员一起看他不感兴趣的卡通片,只是为了和他们培养默契,达成相互理解。他的目标不再是解决问题,而是赢得比赛。

那年的决赛碰巧在上海。在第一个小时,他们已经被对手击败了。当时,戴文渊对他的队友说,“最后四个小时是我们最后四个小时。比赛结束后,我们将退休。我们不需要去想我们在前一个小时做了什么。我们只需要把握过去的四个小时,充分发挥我们多年积累的经验,不留下任何遗憾。”到第二个小时,第三个小时,第四个小时,他重复了这些话。当时,三个人的心态非常平静。

根据惯例,比赛结束前一小时,名单将被关闭,结果不会实时更新。当时他们是第四名。然而,在倒数第二分钟,他们通过使用看似不可能的“暴力枚举”方法解决了一个新问题,成为了在比赛中解决最多问题并赢得冠军的队伍。

之后,三个人筋疲力尽,瘫倒在房间里。戴文渊用这个代表世界最高水平的奖杯告别了acm比赛的三年历史。

更重要的问题

那时,他已经是一个初中生了,他的同龄人开始寻找生活的方向。选择冷清还是炎热,戴文渊也站在岔路口。

他面临的第一个选择是确定研究方向。在他的描述中,艾未未当时是一名“无火”少校。每个人最喜欢的是图形、cg渲染和去好莱坞的能力。什么是人工智能?被选中的剩余专业之一。他只能向人们解释有一部叫ai的科幻电影。上海交通大学也没有人工智能领域的教师。戴文渊被派往HKUST向杨强教授学习。

香港科技大学建在一座山上。实验室没有窗户,手机也没有信号。他被锁在里面了。他对白天和黑夜一无所知。他也持怀疑态度,觉得自己在做一些没人能做的事情。

然而,杨强教授是一个坚信并热爱人工智能的“疯子”。学生们总是开玩笑说他们是《西游记》的师傅和徒弟。除了师父之外,其他人只想到:“我要靠西边的天空,否则我就要回高老庄了。”每当学生们枯萎时,杨强都会给他们一个“K”。如果给他们更多的“K”,他们就会被感染我发现为什么这个人几十年来一直在做这样的事情,而这是如此遥远,为什么你仍然…?这个目标怎么了?你不能动摇。“随着时间的推移,他们跟着信走了。

戴文渊很快就取得了成就。即使在十年后打开他的谷歌学术页面后,他的学术成绩单仍然闪闪发光。在2007年至2008年的两年里,他总共发表了11篇论文,其中许多是顶级会议。迁移学习领域的唯一论文被列为世界第三。我的弟弟陈玉强记得,这一成就不仅在交通大学很罕见,在中国也很罕见。在那个时候,人工智能不那么受欢迎,一年只收到大约100篇文章,而中国人在那个时候不在人工智能圈子里。然而,戴文渊觉得他的成就得益于acm竞赛的基础、他做事的方式和目标定位。

他得到了学术界的认可,但很快发现事情并不完全正确。“我知道如何向最高会议发送论文,甚至知道如何发送许多人引用的论文,但我发现了一个问题——在这个领域什么都不能用。”人工智能是基于数据和算法来获得结果的,但是当时每个人都只关注算法。“不是说这个算法没用,而是如果你比任何一个算法对一段垃圾数据都要好,那么这个算法就没有商业应用价值。这就是为什么我们被嘲笑说你仍然是人工智能。ゥ?

解决这个问题的唯一方法是去工业部门。他在内心斗争:“当时从学术界进入工业界是一种耻辱。那时有一个词叫做“去工业”。什么是“走向工业”?如果你在学术界无法相处,就写代码。”但百度对他的诱惑是,它是当时数据质量最好的公司之一,而且由于商业化的需要,它肯定会失败。因此,他放弃了博士学位,加入百度,成为最年轻的t10科学家,投身于火热的现实。

他用一个词总结了自己在百度的四年工作:“点击率提升系统”。该系统的目的是提高百度搜索的商业实现。点击率的提升首先让商家满意,因为广告被点击了更多次。用户不再收到他们不感兴趣的东西。百度更加满意,因为百度是根据点击率收费的。关键在于机器学习技术,它将效率提高了8倍。

这项技术已经得到验证,戴文渊认为人工智能应该更有潜力。他打过多次仗,愿意调到其他部门做推荐系统、视频、问答,甚至去。当然,它立即被拒绝了——百度是一家上市公司,每个季度都有收入预期,而他才是实现预期的人。“我通常是公司每个季度最后一个月最忙的人之一。没有时间去想别的了。首先,完成财务报告。”不久之后,他决定离开百度。

因为我想促进整个人工智能产业的发展,所以我离开了。这个理由听起来太理想化了,看起来疏远了。然而,事实上,一切都有迹可循——2012年冬天,戴文渊仍在百度工作。一些人在微博上讨论了谷歌和脸书的区别,并提到一位脸书科学家已经离开,因为“他觉得自己的技能都被用来计算广告点击率,这太可悲了。”一位朋友艾特参观了戴文渊。他留下了“哭”的表情,说“去墙那边”。

陈玉强对戴文渊的理解是,他一直是一个“问题制造者”。他一直在挑战更重要的问题,更大的问题,那些尚未解决的问题,并且仍然不知道如何解决它们。陈玉强想起了一个细节。离开百度时,戴文渊正在思考机器人的操作系统是什么。这是一个尚未确定的问题,而且是超前的。不是因为他喜欢品尝新鲜食物,而是因为它是一种新的价值和重要的价值。

他们从学生时代开始一起创业。没有人做过戴文渊想做的任何事。“这并不是说已经有问题了。谁提出了A算法,谁就提出了另一个B算法。他不是,他会问一个新问题。这也有点痛苦,我们没有人复制,只有别人复制我们。ゥ?

闭着眼睛跳

2015年的一天,陈玉强突然收到戴文渊的一条信息,邀请他创业。陈玉强负责建立今天头条新闻中最关键的推荐系统。当他听说他要离开时,张一鸣每天都和他聊到深夜。

但是陈玉强重视两件事。首先,戴文渊是一位值得追随的领导人。其次,他想做的是成为一个纯粹的人工智能平台公司,这样更多的企业和个人可以闭着眼睛使用人工智能并跳下来。另一位联合创始人胡士伟当时也加入了。他们互相取笑:“你跳,我跳。”

戴文渊决定创业的原因很简单——他看到了巨大的人工智能市场,最终明白了他想在大公司里做多少限制。

离开百度后,他去华为看看华为如何为企业服务。有一次,他竞标华为为一家银行建造一个大数据平台。他发现,即使平台已经建成,数据已经放在平台上,也不能创造价值。他为该行进行了几次人工智能应用,将小额贷款的营销效率提高了25倍,最终该行收购了华为的大数据平台。然而,他所做的人工智能的应用实质上是一块“垫脚石”。他嘲笑自己是“演员”。

客户当时还说,他们想购买人工智能系统。戴文渊被鼓励与公司沟通。公司断定这不是我们的产品。如果我买了一个大数据平台,我可以把这个系统发给你。这件事让他意识到了现状——当时华为的主要渠道是“端、管、云”。他想做的是在主频道之外,无法改变。

就这样,一群具有人工智能理想的年轻人开始了在深圳福田口岸租房的第一步。当他们开始为第一个客户服务时,他们只有两名正式员工和两名实习生。服务结束六个月后,对方催促开发票。他们发现公司里没有人熟悉发票开具流程。

在创业的第二年,戴文渊就在站稳脚跟后提议从事汽车技术。这项技术的核心是在其中封装极其强大的算法,以便机器能够自动建模。“这听起来有点不可能,但可以实现。训练机器和训练小狗一样简单。客户定义目标,收集数据,为机器设置行为和反馈,然后提取规则和算法。”他在采访中说。

因此,许多需要手动完成的任务,如选择模型、调整参数和处理原始数据,现在都没有必要了。人们只需要组织数据并把它交给automl。这大大降低了普通公司的门槛和成本。用戴文渊的话说,任何能熟练使用excel的人都可以在经过几个小时的训练后使用automl。

这个门槛能降低多少?正如我们提到的妇产科医生和候鸟迁徙一样,也有一对夫妇经营的摄影工作室,它自己提供人工智能客户服务。

Automl今天的成功也不是一个自然的故事。当第四个范例决定做automl时,它的开发速度不是很快,有点像2005年戴文渊在HKUST实验室做的时候怀疑自己。但是到2019年的今天,它已经是陈玉强所说的“黎明”——自动驾驶已经是人工智能领域最热门的技术之一。第四种模式已经是五大银行投资的唯一风险。去年年底,它的价值超过10亿美元,被列入“独角兽”类别。

当谈到理想的明天时,戴文渊回到了过去。他记得,在微软制作excel、powerpoint和word等办公软件之前,打字也是一项非常专业的工作,这部电影仍然用于课堂展示。当我在苏州上小学的时候,老师让他们在计算机房里用旧版本的wps打这篇文章。当时,世界上只有少数人能够做到这一点。他想做的就像微软做的一样——每篇文章的作者怎么能自己打字呢?“如果你垂直比较的话,做自动测试要困难得多,但是如果你从历史的角度来看,那时做单词是非常困难的,不是吗?ゥ?

他有时认为,如果有一天他不再对公司的任何事情负责,他会回去做一名科学家,专注于研究汽车。

他不是那种严格遵守规则、喜欢“玩花”的人——编程有各种各样的代码。他经常不遵守规则,编写完全不遵守规则但执行效率极高的程序。当然,这些代码不能被其他代码遵循,也不可维护。第四个范例中的前10,000行代码是他自己写的。那时,他刚刚开始自己的事业,白天作为创始人忙于各种事情。半夜12点钟,他正处于写代码的最佳状态。他坐在黑暗中,开始敲击键盘,这是他一天中最舒适的时光。

今天,自他投身香港研究人工智能并在两年内发表了11篇论文以来,已经有10年了。这些年来,他进入了工业界,后来开始了自己的事业。他的论文产量不高。今年是一个高峰。他已经发表了三篇论文,戴文渊这个名字再次出现在谷歌的学术界。这些论文都和他最关心的汽车有关。

时间序列视频的力量

制片人|张寒郭兴安

规划|陈娇·刘斌

导演|刘军

视频摄影|刘子菲·刘俊利·子朔

编辑|刘子菲

混色

江西11选5 吉林快三 内蒙古11选5 内蒙古十一选五 幸运农场投注

上一篇:9月40房企融资大幅上涨87.25%“横盘震荡”行情最是让人
下一篇:《FIFA 20》PC版现已开始预载,Origin Prem

精彩推荐