来自于技术方面的挑战是多轮对话。人的自然语言特别依赖上下文关系。比如说“我想订一个房间”, “什么位置?”, “中关村附近”,“什么时间?”,“周六”... ...这个例子里面,关于订房间的信息是散落在多轮对话之间的。如何综合全1面考虑上下文信息一直是学术界的一项挑战。
还有就是人类的对话行为模型非常复杂。因为在外呼机器人场景下,人们期待的是和另一个人之间的交流而不是一台机器。研究显示,人们自然沟通的场景中,发音会含糊,会省略很多字词,也会在句子中突然修改前面的对话信息,这些都给语音识别,语义理解造成了较大的困难
利用语音合成技术让机器能发出像人自然对话中的抑扬顿挫,并且骗过人是一件非常困难的事情。人的耳朵对于音频的敏感程度远**过人眼对图像的敏感程度,这也让语音合成这件事情的难度更高。
除了技术上的挑战之外,在业务层面外呼机器人的产品形态也存在着诸多风险。
我们今天大部分的外呼机器人都是以营销为主,如果外呼机器人普及而又没有加以限制的话,一般用户将不胜其扰。
今天外呼机器人的接通率已经很低了,接下来的情况可能更糟糕。一方面用户被长期培养出来的习惯是只要是陌生电话就完全不接。另外国家也不会坐视不理,甚至可能出现一刀切的管理,让整个行业都遭受重创。
外呼机器人是一种人工智能产品形态
数据、信息、知识、决策、行动是数据系统发展的几个重要阶段,也是一个递进关系。数据就是我们常说的0和1,是对物理世界的客观表现。信息是融合了更多上下文的数据,知识是信息中蕴含的规律,决策告诉你应该怎么做,而行动是决策的执行。
在语音数据系统中也可以得出产品不同的进化思路,录音数据在呼叫中心系统中保存下来,是数据层面的工作;
将录音数据与销售代表打通,可以把同一个座席的所有录音信息都找出来,AI电销机器人好用,这样的系统就在信息层面;
接下来如果我们做了一个统计分析的BI系统,或者智能质检系统,这些都是知识层面的能力;
外呼机器人是行动层面的产品,可以替代人工完成一段对话,所以说这是一种终1较的产品形态。