网易科技讯 6月28日消息 由网易科技和网易新闻联合主办的“第三届网易未来科技峰会”今天在北京国贸大酒店召开。
搜狗cto杨洪涛认为,好的产品应该从场景出发思考产品。用户场景是:什么时间、什么地点,用户产生了什么欲望,之后才是用什么手段去满足用户。而不是手里有了什么技术之后,再去考虑怎么开发成产品。应当以“产品”为“原力”,推动技术和数据的进步。(温泉)
- |
- 查看图集 |
以下为杨洪涛在网易未来科技峰会现场演讲实录:
接下来有请到的是搜狗的cto杨洪涛。他所负责的桌面软件团队先后发布包括搜狗输入法、搜狗高速浏览器、搜狗号码通等一系列产品,获得了业界和网民的极大认可,并持有二百余项国家专利,他演讲的题目是“人工智能里的产品观”,有请!
杨洪涛:大家好,今天非常高兴有机会能够跟大家来分享这样的一个产品观,我是一个产品人,跟大家分享在做产品时候的一些观点。人工智能是一个非常火热的话题,我也是从业者之一,这个话题现在媒体关注也非常多。很多电视台的娱乐节目组都在筹划做人机对战的项目。产品观是一种需要冷静思考的观点,在火热和冷静当中可能会有一些矛盾冲突,希望我讲的东西能够得到大家的认同。
先跟大家分享一个小细节,大概两三周前我去参加一个会,会上有一个重要的报告上,苹果负责操作系统的主管高级副总裁提到这样一句话,他说我的某样产品功能是用lstm功能实现的,这是苹果第一次在台上提到具体的技术。他说了这个话之后我非常惊诧,因为我们知道苹果是一个产品公司,不是像google那样的技术公司。后面的会场中专门有一个讲怎么做速度的优化。我想这个也说明了人工智能技术在体验上的提升。
说到这儿我想问一个问题,在座的大家有谁了解lstm这项技术?人工智能两起两落,这一轮是深度学习,差不多十几二十年的新的话题。它是在现有的数据当中,让机器从现有的数据当中去学习规律,对未来的数据进行预测的方法。这个方法现在已经在很多领域有成功的应用,比如说刚才徐总说到的计算机视觉的方向,黄总说到云的方向。搜狗公司是做搜索引擎的,在搜索引擎技术里面,在自然语言里面有非常成熟的应用。黄总也提到说机器学习的方法或者深度的学习需要大量的数据,是数据驱动的领域,在数据驱动里面我想分享一个有意思的点,我们知道很多深度学习的方法,使用起来确实非常有效,但是好像很难以传统的理论来推导它为什么有效。
这个笑话可能很多人都听到过,谈到大数据的领域,说大数据每个人都在谈,但是不知道怎么做。今天的机器学习、深度学习是每个人都在做,但是为什么可以work不知道。应用角度非常关键的两个点在当下的时机都比较成熟了,一个是计算,有cpu、gpu,有各种各样的分布式计算,还有专用的计算平台。移动互联网的发展,特别是我们做互联网产品的时候,能够接触大量的数以亿计的用户,以及他们生产的数据。搜索引擎这样一个工具怎么来的?就是因为有搜索的需求,需要这样的工具。
我要谈的是产品化。我想补充一个元素,我认为要让这个闭环做得好,服务是非常关键的补充的元素。服务是什么?服务于用户以产生数据,数据消耗计算力,对它提出更高的要求,用计算力给用户带来更好的体验,推动用户使用你的服务,产生更多的数据。所以我觉得这个公式可以写成这样一个循环。怎么构建一个好的、健康的服务?这是我今天要谈的主要话题。
今天我们听到很多威尼斯5139手机版的介绍自己的时候,特别是创业公司说我们是人工智能公司,我们是一家机器人公司。对技术本身的关注是应该的,也是未来几十年的风口,但是以什么样的姿势参与这个行业是很重要的,就像没有哪家公司只是说我是一家互联网公司一样。我们看互联网20年的发展,有的公司是为互联网提供基础服务的,早期有门户的产生,资讯产生多了以后才有搜索引擎,把资讯索引起来提供服务。到今天生产出更多的内容,有视频、有直播、有游戏、有o2o服务,借助互联网的连接来产生服务。以什么样的方式参与到人工智能或者机器人这个行业当中去?你给用户提供什么样的服务?我觉得必须要在这句话之前或者之后加上一个后半句话。
该以什么样的方式参与?总结为两点,第一是推动这个技术本质的进步。我觉得有几种代表,首先是高效,人工智能也好,机器学习也好,深度学习也好,都是高效地完成的。这个地方我打一个小广告,在过去一段时间,搜狗跟清华大学成立天工智能计算研究院,也是在小的领域做工作,还有一些大的公司,google或者微软的研究院做了很多的工作,但是大多数还是以理论的进步怎么应用到实际当中。小公司有没有机会?今年比较典型的案例,小公司也在推动技术进步。其实它还是一个研究院,是雇了领域里面最好的研究员,大学里面最好的老师,以发论文来作为自己的成绩。
第二条是要关注用户场景做出好的产品,去生产数据。我觉得产生生产数据的循环推动技术产品的进步是一个做产品要关注的问题,这方面的例子也很多。前几年苹果发布siri,后来又不断增强能力,在服务用户的时候其实是生产数据的循环,然后再去改进它的产品。拿我自己的经验来举一个例子,搜狗两大产品之一,最被大家认可的产品就是输入法,做这个输入法的时候只做文字输入是不够的,语音输入是我们必须解决的问题,但是2012年的时候,有这个需求的时候,自己没有这项技术,怎么办?我也没有数据,我们首先看红线这段时间,我们是调用了google在国外的中文语音识别的接口,值大概是百分之四十几的字错率,是不太好的结果。这段时间没有任何数据,也没有技术,但是我就利用google这样一个接口,把自己的产品提供语音转写的功能,就上线了,体验不太好,但是可以work,可以用,用了以后就开始积攒数据,后面我们就看到大概半年之后,自己的语音识别技术就能够上线,而且不断开始生长,积攒语料规模,黄线是语料规模,今天语料已经不重要了,当你超过几万小时以后,语料已经不重要了。后面字错率一路下降,下降到目前的4%左右。这也说明了当你做一个产品的时候,你开始没有数据,没有一个好的体验,关键是能不能产生迭代数据的循环。
我把这个逻辑总结成下一条观点,人工智能本身并不创造价值,使用ai技术的好产品才创造价值。我记得前几天看到一句话,我还专门查了一下,mit实验室曾经的一个主管,非常资深的ai研究人员说的,人工智能就像面包里的葡萄干,其实吃饱主要还是靠面包。但是我们看到今天很多公司,特别是很多创业团队在介绍自己产品的时候说我的产品是ai服务,我的产品是个人助理,我的产品是机器人的时候,我就觉得稍微走偏了一些方向,因为他没有关注到面包是什么、你对用户产生的服务是什么。
下面我们要回答什么是好产品。我把它总结为三条,第一条叫好,第二条卖座,第三条赚钱。如果你的产品能够叫好,得到媒体、投资人的关注就会得到资源。如果你的产品能够卖座,获得用户,就有未来的发展想象力,哪怕目前不赚钱没关系。第三条赚钱很简单,企业的发展需要利润。我们看产品,我在这里举一个例子,比方说搜索引擎,如果我们去拿这个尺度看现在的产品是不是符合这个标准,搜索引擎是不是符合这三条标准?我觉得我的观点是说搜索引擎,国外的google也好,国内的百度,包括搜狗也好,是一个卖座的产品,但是不是特别叫好,因为没有人会因为用了搜索引擎而欢呼。目前很多o2o的服务,很多人在用,但是似乎也不叫好,也不赚钱。我们都说苹果的iphone是神一样的产品,因为它符合三项标准,又叫好,又卖座,又赚钱,这种神级的产品不多。微信符合两半,叫好、卖座,赚不赚钱还很难评价,它确实是广告体系做得非常好,但是腾讯主要业务是游戏业务。拿这个标准再去衡量一下,点评不好的产品,好像不好太批评别人,我来一个自我批评,批评搜狗前两年的产品,是2012年发布的搜索语音助手产品,当时真的觉得这是一个非常好的语音识别研究的方向,把它看作搜索未来跟人交互的可能发展方向,也去根据这个方向做了这样一个产品。我们看到语音互动的方式,可以调侃它、可以问它各种服务、问它各种信息,包括问各种问题。比如说孕妇能吃什么、不能吃什么,可以用一个答案直接回答你。还有这样比较精彩的案例,我们发现上厕所的需求和poi之间的关系,当用户问厕所在哪儿的时候,就会推荐附近的肯德基。很有意思,也获得了一些关注。但是我们发现这个产品其实不具有长的生命力,用户觉得很好玩,用了几天就不会长期用了。为什么?我觉得它比较关键的问题,就是没有从怎么去解决用户实际的场景需求出发思考问题。我想说的一个关键点就是怎么以场景出发思考问题,不是你有一项技术,因为你有自然语言理解的技术,因为有语音识别的技术,所以做这样的产品,也不应该说你的竞争对手做了什么功能,或者行业的老大做了什么功能,于是我就要去跟进。而是应该回到对用户场景的思考,用户场景是什么?是什么时间在什么样的地点?用户产生了什么样的欲望?要解决他的痛点,欲望产生之后才是我以什么样的技术手段来满足他的欲望。欲望是排在手段之前的,思考之前的一个问题,如果反过来,先看手里有什么技术,这是比较经典的错误,大家可能都听过这句话,当你手里有锤子,看什么都是钉子,不要去犯这样的错误。
批评自己之后,也给现在搜狗做的工作打一点小的广告。搜狗输入法做了语音识别功能之后是为什么?是为了解放用户双手,能够在文字输入的时候用语音的方式输入文字。解放双手,语音识别做到96%、97%的准确率还是有错误,要去改,对双手的解放还是不够彻底,在这样的场景、这样的用户欲望下我们怎么解放它?
杨洪涛:我想这个场景,这个产品的功能应该是符合刚才我的数据生成和解决用户欲望的这样一个观点,数据生成是什么?借助这个功能我们了解两个方面,第一个方面,知道用户的的错误发生在什么地方,第二个数据非常重要的是,我是知道用户是怎么认知和怎么去描述这个错误的。这两点数据对输入法也好,对语音识别也好,在未来的改进当中是非常有重要的改进作用的。再看一个视频,看看我们是怎么使用语音数据的。
杨洪涛:可以看到有了用户描述自己错误的数据,并开始正向的循环迭代之后,才有可能在更多的场景里把这种技术应用进去,给用户提供更好的服务。前面讲的是在产品当中对于数据的生成和正向的迭代。下面来看另外一个角度。
杨洪涛:不知道大家看懂这个视频没有,传统意义上的导航做的动作是什么?都是帮驾驶员从a地去b地,回到关于欲望和手段的思考。驾驶员坐上车是不是只是为了从a地去b地?不是,去b地才是需求,你可能要对背后的行为做分析。你去一个饭馆吃饭可能要考虑这个饭馆的地段,以及你喜爱的菜品;也可能是约了朋友在某个咖啡馆,约的时间对不对,所以导航产品要去考虑用户的意图,我觉得这个是驾驶员真正的欲望,我们以什么样的手段来解决它?我们对导航背后意图数据做足够的分析,把首都机场分为t1、t2、t3航站楼,对应什么样的信息,把它和语义技术结合在一起才能做出好的服务来。所以我把这句话总结下来,是这样两个挑战:第一个叫作自然的交互,第二个叫作知识的索引。自然的交互,可能是前面提到的无论是视觉也好,还是语音也好,在这里面做技术的进步。只有把人工智能技术与领域的知识结合得足够好,并且把这两个事情合并在一起,才能够真正的在场景下解决好用户的欲望。
今天这一场,我看主题叫作原力·感知,前面两位同仁讲的还是以感知为主,我想如果从我的观点出发,我认为原力是什么?原力就是为用户提供好的产品,从产品推动数据和理论技术的进步。谢谢大家!
6月28日,第三届“网易未来科技峰会”将在北京国贸大酒店举行。
本次峰会主题为“原力.感知”(force·sense),探寻商业发展和技术发展的内在原动力,感知vr、ar、人工智能和智能出行等领域的未来。
本次峰会将邀请国内外最具有未来感和前瞻性的企业家、科学家、科幻作家、创业者、投资人、跨界明星、文化名人一起,大脑激荡,探寻通往未来的神秘力量,体验感知力的能量场。