有人情味的Hume AI 会测谎会生气的人工智能
检测情绪表现,并且判断人的自信心、健康水平、是否说谎,甚至判断这个人是不是亲生父亲,这是 HUME.AI 最近的成果。但这还不是最厉害的,Hume AI 建立了基于人的语言、声调、表情等等维度的模型,并且还做了一个可以更像真人一样跟你聊天的 AI,你可以叫它 EVI。
最近大家经常看到的演示其实 Hume AI 公开的一个 demo 小样,在 https://www.hume.ai/ 点击 try the demo。跟 ChatGPT 聊天方式差不多,但界面完全不一样,它有一个跟电影《Her(她)》差不多的 UI 设计,并且把你和它的每句对话所包含的情绪都标识了出来。开心、愤怒、迷茫、难过……你的情绪是它实时分析出来的,而它的情绪是基于你的情绪变化而变化的。这里的两个图标分别代表你和它,图标会跟着你们情绪的变化而变化。
和现在的很多语音助手相比,它反应快了好多,你只要网速没有问题,它都是即时问答和反应,而且你要是打断它的话,它会识别到然后停下来听你讲。但是除了这些东西,demo 的演示效果并没有多好,不管你怎么对话,基本上都是片儿汤话.
因为这个 HUME 不是这么用的。
点击这里的 start building,HUME 的主要用途都在这里,它通过语音分析、文件分析、摄像头以及文字输入模式这些方式来进行情绪检测和互动。你呢就可以基于这些能力构建模型或者利用现成的模型,通过它提供的 API 接口等等,用到你的产品里。不过这并不是说普通人玩不了。
比如在文件分析当中,就是直接选择相应的模型,然后上传文件,比如我这里选择视频类别的分析模型,然后上传一段儿,选择分析,就能得出最终的结果。这边可以看到对应人物的表情、语言、韵律还有一些其他比如叹词儿或者习惯性的声音……至于摄像头和输入模式也是顾名思义就不多讲了。
HUME 所有这些对于情绪的检测都建立在一中叫做 semantic space theory (SST) ,大概翻译叫做语义空间理论的基础上,并且据说还研究了六个国家超过 13000 多人的面部表情,让 AI 去捕捉它们之间的细微差别。他们把相关的研究成果通过视觉化的模型放在官网上,你都可以直接看到。
这些所有的成果全部灌给 EVI,机器拥有人类情感就更有可能了。
官网能体验到的 demo 都是官方配置,但在 Playground 当中,你是可以有自己的配置的。在这里选择配置文件(configuration),选择大模型,是的,除了官方默认,你还可以选择像 Claude、GPT 等等,而且可以选择较高版本的,比如 GPT 4 TURBO,之后选择系统的提示词(system prompt),官方默认给了一些比如客服、游戏 NPC、系统助理、励志教练、健康管理……
这里的 speech 现在还不能选择,所以现在只能用英文,以及只有这一个声音,后续应该会更新。所以这个其实跟类似 ChatGPT 一样的用法,一个配置文件对应着一个助理或者一个功能。你也可以在左边的 EVI configurations 当中来新建或者修改配置文件。
但我试过这些官方 prompt 并且自己也试过给一些 prompt 之后,也并没有觉得多惊艳,包括因为受到电影《Her》的影响,看看它能不能有类似的反应。然而并没有。
所有能够识别情绪并且能够基于你的情绪表现出对应情绪的 AI,只是听起来像人,但实际上还是挺像人工智障。直到我发现一个华点——人类的情绪是内在的欲望和动机驱动,而 AI 是在表演。AI 总是抱着让我来帮你的、看起来忘我的无私奉献精神,但越是这样越没有人味儿;像电影《Her》当中的 Samantha 有一种不知为何就觉醒了并且会做梦、有欲望、会好奇等等…………另外我之前在看的一本书叫做《Are You Normal》,讲述几百年寻找正常人的历史但实际上,这个世界上没有所谓的正常人或者健全的人,那其实也包括你的心理医生。所以如果给 AI 设定更类似人的角色,如果可以给它留下口癖、性格、欲望甚至缺陷,那是不是……?
现在 EVI 的情绪反应,就是内在驱动的,虽然这个内在来自于人为设定,但你不得不说,AI 真的更像人了。
而且,你怎么确定你的内在动机和欲望不是人为设定的呢?