当前位置:银河网普京社会阿里巴巴这个新技术 竟然让我爱上了上班
阿里巴巴这个新技术 竟然让我爱上了上班
2022-11-20

2019 年了,我们和机器是怎么交互的呢?

电脑,还是离不开物理按键——键盘。

手机、车载显示器,点触即可。

同时,有一种新的交互方式随着智能音箱的普及刷新了我们的生活——语音交互。

连屏幕都不用看了,想听啥歌张嘴就行,真正解放双手。

八过,这几种交互体验都非常单一。在小雷看来,它们都不会是未来的主流交互方式。

打个比方,语音交互就有个硬伤:必须喊唤醒词才能启动。

一个人工智能产品,非得喊名字才能用,这使用率能高吗?

说到这,大家肯定开起了脑洞,未来的交互方式会是什么呢?

电影里那些还摸不着边的科幻概念就不说了,有没有什么已经出现,又能引领未来的新技术呢?

有的有的。小雷就不卖关子了,那就是——

多模态交互技术

(图源:达晨创投)

小雷不负责任推测,有 88% 的人听到它都是介个表情

这啥玩意?干嘛的?下面小雷就用大白话给你们科普一下。

这个创新概念是在 2015 年 12 月,图灵机器人(14.920, -0.02, -0.13%)团队推出Turing OS 机器人操作系统时提出的。

手机有操作系统,机器人也要有操作系统。Turing OS 机器人和人之间的交互方式,就叫做“多模态交互”。

模态也就是英文里的“modality”,翻译过来就是感官。而多模态就是把“文字、语音、视觉、动作、环境”等多种方式融合在一起。

说白了,这个交互的本质就是“让机器也有感情”。

(图源网络)

小雷盘了一把国内 AI 领域,发现势头很猛的自动驾驶也有独立的操作系统,可以结合数据库做出决策,但它并不算“多模态”。因为在目前的技术条件下,自动驾驶并不能像人类一样完全独立思考。

(图源网络)

那问题来了,多模态交互难道又是一个摸不着边的概念吗?

在此之前,图灵机器人已经和好几家公司合作,推出了搭载 Turing OS 的智能机器人。

但是这个嘛,离我们的生活还是有点远,至少小雷作为一个单身狗是用不上的。

真正把“多模态交互技术”产品化的,是移动办公领域大佬钉钉。

就在快要召开“未来组织大会”的前几天,钉钉和阿里达摩院联手打造了全世界第一台“多模态交互技术”智能办公硬件——智能无人前台 M2S。

这不是钉钉第一次推出智能办公硬件了,各位大老板应该都听说过,钉钉出的智能打印云盒、智能门禁、智能会议盒子等产品。

作为一个积累了超过 700 万企业用户的平台,钉钉一直都深谙办公领域痛点,并为此布局了很久。

在 M2S 之前,钉钉曾推出过一台M2人脸识别考勤机 ,可以结合钉钉 App ,完成无人前台考勤。

M2 采用的是活体人脸识别技术,也就是说,不能用照片代打卡。

鹅且识别率精准,在1.5m内,可以五个人同时打卡,省去了员工排队打卡的麻烦。

它好是好,但假如公司来了访客,还是需要前台在门口登记迎接,并不是真的无人前台。

而采用了多模态交互技术的 M2S ,完美地解决了这个痛点。

为了方便大家理解,小雷先简单介绍下它的工作流程

就是说嚯,你走到 M2S 1.2 米处,它就会识别出你是员工还是访客,然后根据你的身份和预约情况,主动给你不同的反馈。

小雷举个例子:

假如我是员工,M2S 会记录好我的打卡时间,并主动打招呼“小雷早上好~”

假如我是第一次来的陌生人,M2S 会主动问我“请问你找谁呢?”,我说找“机老师”,然后录入信息,它就会通过钉钉帮我拨打机老师的视频电话。在机老师确认接待后,我就能刷脸进去了。整个过程完全不需要前台和纸质登记。

一顿操作猛如虎,就问你服不服?

它最大的亮点,就是具有精准识别身份然后提供定向服务的能力。

问题来了,定向服务都有哪些呢?

1.识别精准且快

能同时识别 10 个人,识别时间只需 0.5 秒。上班打卡争分夺秒,这个是妥妥的福音。

2.员工关怀

公司行政部小姐姐逢年过节要给大家发邮件发贺卡,要花很多时间去统计执行。

但有了M2S,我一打卡机器就会跟我说“小雷,生日快乐”“小雷,今天是你入职1周年纪念日!”有趣又省力。

3.真实对话,无需唤醒

小雷上面吐槽过了,市面上的语音助手,基本都需要念名字才能唤醒。

谁都知道,熟人交流是不需要念名字的。

至于 M2S ,是看到人来了就会自动打招呼,“xxx早上好”“辛苦了”“请问你找谁?”,就跟真人对话一样,没毛病。

鹅且它还能喊出不同人的名字,亲切程度堪比《超能陆战队》里的大白。

4.来访记录线上化

大家回忆一下,以前公司有客人来访,都是用一个厚厚的大本子手写记录。

字迹不容易辨认,而且填的信息也没法考证。最主要的是,导出还特别费时间。

如果用 M2S ,就不存在这个困扰了。因为来访者都是在钉钉 App 上登记自己的信息,而且只用登记一次,这个资料会自动上传到魔点访客后台。

这就有一个什么好处呢?

当访客第二次来时,M2S 可以准确地叫出他的名字,而且会问“这次还是来找xxx吗?”小雷只能想到一个词:一劳永逸。

如果是推销人员啥的,M2S 还可以把他拉黑,以后都甭想进门了。安全程度可见一斑。

5.自动算薪,软硬件一体化

这最最重要的一点呢,别忘了,钉钉的智能办公硬件,都离不开钉钉软件应用生态。

打个比方,M2S 和钉钉智能人事系统是打通的。手机只要登录钉钉 App ,全员考勤记录,甚至每月的员工工资,都可以自动统计,无需人工核算。

看到这,行政部的小姐姐应该都感动哭了吧?

这一切,只需要把钉钉 M2S 和魔点门禁关联起来,通过钉钉 App 就能实现。

M2S 的好处是显而易见的,小雷随手就能列出好几点:

打造一种全新的办公方式。员工不需要跑下楼去接人,公司也不用再制作门禁卡参观卡了,来访者无需手写登记表,真正做到无纸化办公。

最直接的一点,就是省钱。一个前台工资少说也要 3000 元,M2S 是完全可以省去这笔钱的。

提升公司形象。M2S 摆在门口,任谁看了都会赞叹一句“高科技”。

这个“多模态交互技术”产品对钉钉来说,是一次产品迭代。但在小雷看来,它对钉钉系统生态以及国内 AI 领域的发展,具有极其重大的意义。

钉钉智能硬件的负责人易统说过,钉钉做硬件不是为了将某一款硬件智能化,而是为了打造一个软硬件一体的生态,为企业提供从物理空间到信息系统,及管理思想的全链路数字化。

他介绍道,企业数字化就要求物理办公空间的数字化,空间数字化就需要 M2S 这样的智能办公硬件。

是的,对企业来说,M2S 真的是办公必备硬件了,我们老板看了都说要买一台。

别看小雷说得这么简单,但想要把“多模态交互技术”产品化并不容易。

钉钉能成功,最主要的原因是深度整合运用了阿里达摩院多项AI技术。

比如,在技术上,M2S 通过多模态语音前端处理引擎,解决了多人同时说话带来的身份分辨问题。

而在语义理解上,智能前台使用了最新的结合知识的神经网络模型,如 Knowledge-BERT 等,来检测说话人的行为意图,远远甩出“人工智障”几条街。

M2S 还顺便引入知识图谱技术,结合钉钉的组织关系和能力,实现智能匹配。

最后的结果,就是将多模态交互产品量产商用,送到我们的身边。

说实话,AI 这个词近几年已经有点烂大街了。阿里钉钉突然放出这么个大招,让小雷觉得,还是有人在默默地做一些牛逼事儿的。

钉钉这次野心不小,但作为一个推崇高效的办公平台,他们的技术突破,又完全在预料之中。