有人情味的Hume AI 会测谎会生气的人工智能

24-07-17 slbcun 1118℃ 0

检测情绪表现，并且判断人的自信心、健康水平、是否说谎，甚至判断这个人是不是亲生父亲，这是 HUME.AI 最近的成果。但这还不是最厉害的，Hume AI 建立了基于人的语言、声调、表情等等维度的模型，并且还做了一个可以更像真人一样跟你聊天的 AI，你可以叫它 EVI。

最近大家经常看到的演示其实 Hume AI 公开的一个 demo 小样，在 https://www.hume.ai/ 点击 try the demo。跟 ChatGPT 聊天方式差不多，但界面完全不一样，它有一个跟电影《Her（她）》差不多的 UI 设计，并且把你和它的每句对话所包含的情绪都标识了出来。开心、愤怒、迷茫、难过……你的情绪是它实时分析出来的，而它的情绪是基于你的情绪变化而变化的。这里的两个图标分别代表你和它，图标会跟着你们情绪的变化而变化。

有人情味的Hume AI 会测谎会生气的人工智能

和现在的很多语音助手相比，它反应快了好多，你只要网速没有问题，它都是即时问答和反应，而且你要是打断它的话，它会识别到然后停下来听你讲。但是除了这些东西，demo 的演示效果并没有多好，不管你怎么对话，基本上都是片儿汤话.

因为这个 HUME 不是这么用的。

点击这里的 start building，HUME 的主要用途都在这里，它通过语音分析、文件分析、摄像头以及文字输入模式这些方式来进行情绪检测和互动。你呢就可以基于这些能力构建模型或者利用现成的模型，通过它提供的 API 接口等等，用到你的产品里。不过这并不是说普通人玩不了。

有人情味的Hume AI 会测谎会生气的人工智能

比如在文件分析当中，就是直接选择相应的模型，然后上传文件，比如我这里选择视频类别的分析模型，然后上传一段儿，选择分析，就能得出最终的结果。这边可以看到对应人物的表情、语言、韵律还有一些其他比如叹词儿或者习惯性的声音……至于摄像头和输入模式也是顾名思义就不多讲了。

HUME 所有这些对于情绪的检测都建立在一中叫做 semantic space theory (SST) ，大概翻译叫做语义空间理论的基础上，并且据说还研究了六个国家超过 13000 多人的面部表情，让 AI 去捕捉它们之间的细微差别。他们把相关的研究成果通过视觉化的模型放在官网上，你都可以直接看到。

这些所有的成果全部灌给 EVI，机器拥有人类情感就更有可能了。

官网能体验到的 demo 都是官方配置，但在 Playground 当中，你是可以有自己的配置的。在这里选择配置文件（configuration），选择大模型，是的，除了官方默认，你还可以选择像 Claude、GPT 等等，而且可以选择较高版本的，比如 GPT 4 TURBO，之后选择系统的提示词（system prompt），官方默认给了一些比如客服、游戏 NPC、系统助理、励志教练、健康管理……

这里的 speech 现在还不能选择，所以现在只能用英文，以及只有这一个声音，后续应该会更新。所以这个其实跟类似 ChatGPT 一样的用法，一个配置文件对应着一个助理或者一个功能。你也可以在左边的 EVI configurations 当中来新建或者修改配置文件。

但我试过这些官方 prompt 并且自己也试过给一些 prompt 之后，也并没有觉得多惊艳，包括因为受到电影《Her》的影响，看看它能不能有类似的反应。然而并没有。

所有能够识别情绪并且能够基于你的情绪表现出对应情绪的 AI，只是听起来像人，但实际上还是挺像人工智障。直到我发现一个华点——人类的情绪是内在的欲望和动机驱动，而 AI 是在表演。AI 总是抱着让我来帮你的、看起来忘我的无私奉献精神，但越是这样越没有人味儿；像电影《Her》当中的 Samantha 有一种不知为何就觉醒了并且会做梦、有欲望、会好奇等等…………另外我之前在看的一本书叫做《Are You Normal》，讲述几百年寻找正常人的历史但实际上，这个世界上没有所谓的正常人或者健全的人，那其实也包括你的心理医生。所以如果给 AI 设定更类似人的角色，如果可以给它留下口癖、性格、欲望甚至缺陷，那是不是……？

现在 EVI 的情绪反应，就是内在驱动的，虽然这个内在来自于人为设定，但你不得不说，AI 真的更像人了。

而且，你怎么确定你的内在动机和欲望不是人为设定的呢？