您当前的位置: 首页 > > 创业创新

小米科技黄江吉:我担心能否把人工智能带到生活

[ 导读 ] 小米科技黄江吉:光有大数据,其实有可能不但没有价值,它给你造成的成本是海量的,如果你存了大量的数据你不能够发挥价值的话,还不如不存。

由中国计算机学会(CCF)主办,雷锋网承办的《全球人工智能与机器人峰会》于8月12日在香格里拉酒店举办,作为媒体支持单位报道本次活动干货。

下面是小米科技联合创始人黄江吉的演讲干货(有删减):

6年前我们创办小米就是因为当时觉得有很多生活上的产品还不够智能,所以有这样一个使命希望可以去把它做得更符合我们的要求。今天很多专家已经提到了人工智能如果要落地,它有好几个前提,他们反复的讲到机器学习或者是人工智能最大的一个基础就是大数据,对吗?我非常同意,但是在做小米这几年实践的经验我会把它再往下来推一层,认为人工智能是大数据,但是大数据的基础应该是产品加上海量的用户,去使用这些产品真实产生出来的大数据,所以认为在三个前提里面应该从产品开始分享。

在三年前进入了更多的用户生活上使用的一些功能,第一个进入的产品是手环,当时出来之后变成了手机的最佳拍档,用户移动生活进一步了解,做了小米电视和盒子,因为在家庭里面电视还有娱乐的视频、电影这些需求是非常刚性的,在看了一圈当时的传统电视认为同样的理由,里面的用户体验非常不智能,里面有巨大的提升空间。所以决定继续认认真真的做电视和盒子。

两年前也进入了网络设备,一系列的路由器,在高配的路由器里面有1T到6T不等的硬盘,其实它是一个数据中心。接着通过生态圈的方式做了更多用户生活需要的产品,比如说智能净水器、灯、摄像头、智能插座等等,在做这个的时候恰好是IOT这个浪潮的爆发,在进入这个领域的时候要克服两个核心的问题。

第一个问题是用户当时觉得传统的硬件产品没有必要智能化,更简单的是这些产品没有必要去联网。第二个就是当时的所谓的智能硬件其实非常不智能,你要把它们弄好,再使用,其实比传统的更难用,当时做了两个事情去突破这个问题。

第一个事情是进入这个领域的时候,如果智能硬件可以联网的话需要一个wifi,加上一个CPU,如果一个硬件开发商要加这样一个的话需要60块人民币,你听起来这个数字不是很高,但是我告诉你如果一个传统的电灯的售价也就是十几二十块,一个传统的插座也就是几十块的时候,你再加上一个60块的WiFi模具,基本上就是一百多块的产品,这个在市场卖不出去,卖不出去后续的一系列的联网、智能化基本上是不可能,所以进入到今天,我们已经一步步把WiFi从当时的60块做到今年的10块,要把它做到10块有什么核心目标,核心目标就是只要做一个硬件产品不用影响把这个wifi加上去,不用想就是让产品联网,甚至不知道为什么要联网。把这个加上去它才是真正智能化的,当做完这些,包括电饭煲都是可以联网的,全部的电灯、摄像头等等。

第二点,两三年前IOT爆发的时候大家觉得用户的使用度不高,那是因为当时没有把应用型做好,我们可以做到这样的一个使用体验,你买了一个净化器也好,摄像头也好,回去一开箱你不需要看说明书,只需要把它往电上一插,你的手机就有一个说明,你允许不允许把它装到你的家庭智能网络,如果你选是的话,它就会自动的联入你家里的网络,所以我们当时突破这个的时候,发现智能硬件不单指联网度非常高,真的是接近全量,更关键的是活跃度也是非常高。

到今天不算手机,全部的智能设备的出货量已经超过了3700万,这个数字未来有可能是远大过智能手机,我们每个人可能是用一到两个手机,但是家里面物理的产品加起来是十几二十个,只是今天没有真的被智能化,真的被联网。

这个是你们关心的,当我们有这么一系列的硬件产品全部都联网,加上真的是可以产生各种各样的数据之后,才有机会建立一个真正的大数据,每天全部的产品是200个TB,我们也为这个数据量付出了巨大的成本,但是我觉得这个是最核心的基础。从产品上进去的第一天我们就知道数据多么重要,通过WiFi把它落地才有可能产生高质量的大数据。

这个就是刚才给你们描绘的,全线的产品或者是业务,大数据基本上汇总到一个数据工厂,我特别认同刚才杨强教授讲的一个点,光有大数据,其实有可能不但没有价值,它给你造成的成本是海量的,如果你存了大量的数据你不能够发挥价值的话,还不如不存,所以在数据的处理上面我们首先要清晰挖掘,如何用这个数据反过来训练算法,训练各种各样的产品,让它可以做到真正智能化。

当有海量的数据之后我们意识到,必须要以人为核心,花了两年的时间就是在建立一个用户画像,当然不同的公司有不同的用户画像,在小米对用户画像的定义其实就是围绕这个用户,不管是在使用手机移动页面也好,或者是在看电视,或者是在家庭使用各种各样的智能硬件,如何充分的捉住这个用户的需求,还有习惯,怎么样可以把他的特征建立出来,只有当你比这个用户更加了解和需求的话,才可以为他提供更多的智能服务。

在这个画像里面包含了云服务,MIUI里面的播放器,视频播放器等等,他们产生的特征真的是海量的,举个例子,如果你使用小米多看阅读这个应用,读书软件真的要很深刻读书的特征,它才可以很好的服务,我们必须知道这个用户喜欢哪一类书,喜欢哪一类作者,这些作者的哪一部分的书对他们有感觉,他们是喜欢在什么时候读书,是在在排队还是一些碎片时间去使用,我觉得只有去到这样一个画像的颗粒度的时候,才有可能为他提供智能度,如果只是知道的非常表象,每天知道阅读多少次,已经读过什么书,我觉得只可以做一些很基础的,而且是很粗颗粒的推荐,我认为这个不可以超过用户对智能手机的期望值。

今天已经有大概一千个用户,就是我对我的大数据团队我跟他们说为什么这个是一千,而不是一万,因为我们还没有把它更多的特征整合起来。

细说一个有趣的事情,在建立用户画像的时候发现高质量的数据会被计算出来,如果让一个用户去填写他全部的特征的话,这个是可以,但是没有用户愿意配合你做这样的事情,怎么样可以在他已经有的部分的特征里面,可以通过机器学习判断到底这个用户是男的还是女的,他的年龄是什么,如果可以保证一个高的准确度,有时候要牺牲到我们的覆盖率,如果不知道计算的精准度的话,我们放弃这个特征,还是回应刚才所说的高质量的大数据,可以通过足够的大数据判断用户的性能。

用手机的话你是完全不会告诉他,你是男还是女的,但是我们的准确率可以接近90%,用户的真实性,可能大部分行业的朋友都没有这个烦恼,但是小米每天都是跟黄牛在对抗的,大家骂我们说是饥饿营销,是因为我们的产能跟不上,当产能跟不上的时候,我们的小米网上每天有大量的黄牛,他们模仿各种技术手段来在网上抢我们的产品,我甚至认为他们有可能在使用深度学习模拟真人,把这个黄牛的工作做得极值,在半年前实验了一把,如何用足够的特征把一个用户的真实性判断出来。传统黄牛他们可以通过你的一个或者是两个漏洞让你以为他是一个真实的用户,其实你是防止不了他在某一些特征里面作弊,但是你会发现他不可能在30个或者是100个里面作弊,整个成本太高了,当我们使用了之后我们发现把黄牛打到下风了。

除了我们对用户越来越了解之外,其实也要对他们关注的内容越来越了解,所以在资源池里面把他们的内容整理,在里面提取足够的特征之后,可以把用户的画像一起放进去我们的积极学习里面,才可以作出全方位的一些推荐吧。

大家听到我讲到这里其实可以知道,要落实一个人工智能或者是机器学习真的不容易,我讲了那么长的篇幅才可以落地产品,才有可能产生真实的大数据,这些大数据之后可以被使用,真的把它给智能化,这个对于我们这几年在人工智能,还有机器学习上面这个行业取得的一些弯道成功。

第一个IOT出来的时候每个公司都想做智能灯,但是到今天为止都没有一个灯是真的符合你的需求,在你想它亮的时候它自动会亮,这么简单的一个需求如果做出来真的很难,我们过去看智能灯的做法,如果你想把它智能化的话,你会说只要这个用户一回家,只要是晚上你就把这个灯打开,只要他一离开家,这个门一打开有一个传感器,这个灯就会灭,只有10-20个传感器才可以把它做得靠谱,你可以想象机器学习就好像在我家里面的摄像头一样,它只看见我买了这个灯回来,我开始使用这个灯,使用了2个月,它会看到我在什么时候会打开灯,或者是什么时候关灯,是不是有时候你出去倒垃圾马上就回来的话,不要把那个灯又关又开了,其实机器只要给它足够的数据,它完全可以搭配三四十的特征,加上你自己在家里走来走去的状态,它就可以真的做一个智能的灯。

在我们这一代是不是可以落地人工智能,把人工智能真的是带入到家庭的每个角度,在我的客厅里面不用摇控器就可以控制电视,在我的洗手间里面,直接跟智能插座或者智能音响直接告诉它现在要去哪,然后它自动下单,或者是我的冰箱会直接的讲没有鸡蛋了,然后它就可以下单,或者是在我没有说时候,它会自动的预见,如果是能做到,人工智能是真的做到了生活上面,我担心的不是人工智能可以如何统治这个世界,我担心的是如何在我们这一代利用我们的技术把人工智能带到我们的生活。

上一篇: 俄航天集团对五角大楼禁止使用俄火箭决定表谴责

下一篇: 红米Note 7 Pro发布:搭载骁龙675 国行版有惊喜