钛媒体注:钛媒体T-EDGE国际年度盛典,作为钛媒体年度最重要、在科技领域最举足轻重的年度国际峰会,每一年年末希望能够对当年发生的和未来可能发生的做一些重要盘点和预判,同时,搭建一个平台通过线上线下交流,助力全球前沿创新者的价值发现与落地。
人工智能助手应该是什么样的?12月16日,在钛媒体T-EDGE国际年度盛典上,三星电子中国研究院,中国区 Bixby 开发总负责人张代君认为,学习型 AI 将会是大趋势,而落地到 2C 设备上,手机将会是最好的载体。基于这一理念,他们开发了 Bixby。
与其他的智能手机助手不一样,用户不必去记住任何语言指令,使用自然语言指令即可完成以前需要手动完成一系列任务——Bixby 的操作指令是跨应用层级的,不仅覆盖了30多个三星手机自带的原生应用,还支持目前国内主流的多数应用。Bixby 是学习型的 AI 助手,越用越聪明。
未来,三星还想要将之打造成为 IoT,智能家庭的控制中枢。
现场炫酷红包互动
以下是张代君在钛媒体 T-EDGE 国际年度盛典上的演讲全文,略经钛媒体编辑:
很荣幸到这边来给大家介绍 AI 落地于手机这么一个话题。我想很久以来我们都在思考 AI 落地于手机将会带来怎样的精彩。
61 年前人工智能更多地在实验室,距离人们的生活还非常遥远。很快随着计算机技术的发展,人工智能来到了 2B 领域,其实通过刚才前面几位演讲人的发言,我们可以看到人工智能在垂直行业领域,已经开始改善我们的生活。
尤其是最近 2013 年、2014 年以后,随着深度学习技术以及大数据、云计算这样的技术的依托,使得人工智能进入 2C 领域,让我们充满了期待。我们认为这样的一个爆发式增长已经到来。
那么什么才算是代表性的 2C 产品呢?我们认为手机上存在很大的机会:AI 技术落地与手机,将会带来怎样的变化?这是我们一直在思考的问题。
第一个问题是,现在我们使用手机有什么样的痛点?
科技本来应该是让生活变得更轻松。在很多情况下,现实情况下是终端的硬件功能、软件功能、APP 功能越来越多、越来越复杂,我们要去找到某一个功能的时候是非常不容易的,甚至觉得非常地烦琐。我认为今天基于 GUITouch 这样的一个人机交互,已经面临一个瓶颈。
回顾整个从人机交互到 GUI 这一领域,到多点触控这一领域,应该说让我们感受到了科技所带来的便利。通常情况下我们一直努力,要让人去学习各种复杂的操作和应用。但是我们能否换一个思路来考虑呢?我们是否可以考虑让机器主动学习来适应人类。这是我们这一轮的人机交互亟待变革,我们认为这是一个改革的思路。
非常幸运的是,我们认为 AI 技术为这次人机交互这样一个发展,提供了一个强力的支撑,而且这样的一个多模态交互会非常迅猛、非常迅速地改变你我生活。
我们为什么确认是多模态?实际上,大家可以看一下人本身,我们天生就是具有主观的一个高等级智慧生物(这是一个现实状况),我们举起一杯水这样一个微小的动作,我们就会启用触觉、听觉、视觉等等感觉。所以我说多模态确确实实为我们提供了一个先天的机会。
三星电子作为引领全球 ICT 行业的一个领军企业,我们一直以来是 AI 技术大胆的推动者和实践者,经过多年的技术储备,我们已经形成了非常完善的 AI 技术体。依托高性能云计算,以及神经网络等多种深度学习算法,我们已经实现了诸多的AI能力。比如说在手机的生物识别领域,我们可以提供指纹识别,还可以为用户提供虹膜识别,以及刷脸识别,这是目前全球在手机领域三星电子为用户提供了最多的选项,确确实实今年刷脸识别非常火爆(不仅在 B2B,甚至今年在手机领域),已经是非常现实的话题。
除此之外,除了在语言这方面的技术储备以外,我们在语言交互、视觉方面也取得了长足的进展。同时,三星电子作为全球不仅是领先的消费类电子厂商,以及全球最大的半导体厂商,也是一家 AI 技术公司。
S Voice(第一代人工智能语音产品)在 2013 年就上线了,正是由于这样的一个技术储备,应该说无论在技术、商业运营以及商业部署方面,我们积攒了所有的经验和教训。
除此之外,我们在手写识别、智能相册、生物认证以及智能相机,同时我们是唯一一家可以提供三种生物认证的公司。正是由于这种多种的 AI 技术,以及产品的落地。这样一个长期的厚积薄发,使得今天我们能够有幸给大家提供一个我们 AI 多模交互的产品——Bixby。它涵盖了语音识别、自然语言理解、计算视觉、用户画像、情景感知等多种 AI 技术,应该是能够做到能听、会看、懂你心。拥有BixBy,生活会变得非常轻松。
当然很多人会问,BixBy 比目前市场上的语音产品,究竟有什么样的区别?
首先我们思考一下目前市场上的语音产品,都有什么样的一个痛点?无论是各种智能音箱,还是刚才其他的产品,用户都不知道它支持什么样的应用,以及支持应用里面哪些功能。说一千道一万,我们认为目前的语音产品的功能点覆盖,是远远不够的。从根本上来讲很难改变用户使用这样的语音产品的交互的一种形式。
BixBy 则完全不一样,我们全面覆盖了各种功能,旨为用户消除这种烦恼。应该是说有什么想法你直接说就可以了。大家可以看一下尤其对于三星手机,我们的原生应用(我们支持 30 多个原生应用,涉及到了 7000 多个用户功能,扩展了 10 万多条语句),做到了可点即可说,也就是说你原来用触摸做的事情,基本上我们都可以用语音来进行操控。同时,我们和国内主流的 APP 厂商都进行了深度合作,基本上已经覆盖了主流的高频使用场景。
拥有 Bixby 用户都不需要去记住指令,我们有一个功能叫做认知容忍,我们自主研发的双模引擎,既使非常复杂的语句也能做到非常轻松应对。
现实生活当中自然语言,我们说话的时候,会非常随意,对话中拥有大量的“这个,那个”等等指代词,如何让机器也听明白呢?有了BixBy你不用特别背诵一些特别的指令,有什么想法说出来,它都能识别。
除了识别、除了语言理解之外,最终你怎么能够来执行这个用户的意图?我们做了深度集成。作为全球NO.1的手机厂商,我们三星需要做这样的事情。对于终端硬件的一切能力(包括硬件、软件、AI的技术能力)我们一切尽在掌握,我们把它进行了深度的整合,这是 BixBy 给大家带来的一个完全不一样体验的地方。
BixBy 对于手机的操控,可以说是深入到了骨髓、深入到了毛细血管级别,正是由于我们做了这样多的原生应用,以及 CP 应用,跨 APP、跨 CP 这样的应用,我们可以做到感知用户当前的环境,感知你当前应用的状态,能够做到在正确的时间、正确的地点做正确的事情。
我们还创造性地为 BixBy 设计了一个硬件按键,在业内,这应该说一个非常疯狂的举动。尤其大家可以看一下这样一个跨应用的操作,我拿起手机的时候,我直接可以通过人脸识别击穿后面所有的一切 APP 和 CP,直达我想要的一个操作指令,可以做到一键直达。
除此之外其实我们也发现,人类对 AI 的期许也在不断地变化,今天你想让它陪你下围棋、象棋,甚至我们还希望陪你玩儿后空翻等等,其实人类社会也在不断地进步和学习,今天人工智能也确实如此,也在不断地进化,需要不断地学习。我们认为学习型 AI,将会成为引领未来的一个发展的趋势。
三人行必有我师,我们怎么做到的呢?
对于拥有交互式学习的 BixBy 来说,用户实际上是消费者,你可以玩儿、你可以享受,但是事实上,你是 BixBy 的老师。随着用户的使用以后,我们会用后台的深度学习机制,BixBy 能够更加准确地理解到用户的意图,让用户感觉到 BixBy 不断适应用户,智商也在不断地提高。
除此之外,我们还具有用户画像的能力,随着你不断地使用BixBy以后,你会发现BixBy 越来越懂你,尤其最主要的是快捷指令,以及用户的自定义回复上。应该说这让 BixBy 感觉到,这是我们家的 BixBy,你可以感觉到 BixBy 的情商会越来越高,这是与其他 AI 非常不一样的。
除此之外,用户还可以自定义聊天,这是最受到他们喜欢的功能。这也是我们希望用户去玩儿的,因为用户比我们更有创造力。
群体是智慧的海洋,通过盖乐世社区,BixBy 可以通过用户共享,大家的创意相互形成传播,可以调教你的 BixBy,让它的智商和情商能够不断地获得提高,这是BixBy 给大家带来的一个乐趣。
除此之外,BixBy 通过网络效应,不断地学习,它会让你觉得,这周的 BixBy 和上周的 BixBy 好像有点儿不一样,不断地从量变到质变,你会觉得从此再也离不开它。
那么 BixBy 究竟是一个什么样的人物设定?
有人说是一个管家(或者说专家),而我们认为 BixBy 是一个你的最佳搭档,这是我们的人物设定,从功能设计、情绪感知、语言发音风格到一切的一切,都是我们进行打磨。到目前上市以来,我们收到了很多温暖的用户回馈,其中让我们最感动的,认为终于见到了最会说人话的语音产品,而且特别喜欢我们这个人物设计里面的小姐姐,大家有机会可以试一下。
三星应该说从未停止创新的步伐,今天我们推出 BixBy1.0,这是第一步。未来我们将会把 BixBy 打造成一个完全开放的 AI 平台,这里面不仅是智能手机,未来还会打通三星所有的家电设备。三星也是全球业界的领先的家电厂商,我们对未来 IOT 的布局,将都会通过 BixBy,它将成为成为智能中枢。
最后我想说 BixBy 将会成为一个开放的平台,不仅是三星电子,包括我们的用户,包括我们的合作伙伴,我们一起向业界赋能,我相信大家都希望一起来参与其中,让我们一起来挖掘它的所有潜能,共创未来。