有人情味的Hume AI 会测谎会生气的人工智能
检测情绪表现,并且判断人的自信心、健康水平、是否说谎,甚至判断这个人是不是亲生父亲,这是 HUME.AI 最近的成果。但这还不是最厉害的,Hume AI 建立了基于人的语言、声调、表情等等维度的模型,并且还做了一个可以更像真人一样跟你聊天的 AI,你可以叫它 EVI。
最近大家经常看到的演示其实 Hume AI 公开的一个 demo 小样,在 https://www.hume.ai/ 点击 try the demo。跟 ChatGPT 聊天方式差不多,但界面完全不一样,它有一个跟电影《Her(她)》差不多的 UI 设计,并且把你和它的每句对话所包含的情绪都标识了出来。开心、愤怒、迷茫、难过……你的情绪是它实时分析出来的,而它的情绪是基于你的情绪变化而变化的。这里的两个图标分别代表你和它,图标会跟着你们情绪的变化而变化。
和现在的很多语音助手相比,它反应快了好多,你只要网速没有问题,它都是即时问答和反应,而且你要是打断它的话,它会识别到然后停下来听你讲。但是除了这些东西,demo 的演示效果并没有多好,不管你怎么对话,基本上都是片儿汤话.
因为这个 HUME 不是这么用的。
点击这里的 start building,HUME 的主要用途都在这里,它通过语音分析、文件分析、摄像头以及文字输入模式这些方式来进行情绪检测和互动。你呢就可以基于这些能力构建模型或者利用现成的模型,通过它提供的 API 接口等等,用到你的产品里。不过这并不是说普通人玩不了。
比如在文件分析当中,就是直接选择相应的模型,然后上传文件,比如我这里选择视频类别的分析模型,然后上传一段儿,选择分析,就能得出最终的结果。这边可以看到对应人物的表情、语言、韵律还有一些其他比如叹词儿或者习惯性的声音……至于摄像头和输入模式也是顾名思义就不多讲了。
HUME 所有这些对于情绪的检测都建立在一中叫做 semantic space theory (SST) ,大概翻译叫做语义空间理论的基础上,并且据说还研究了六个国家超过 13000 多人的面部表情,让 AI 去捕捉它们之间的细微差别。他们把相关的研究成果通过视觉化的模型放在官网上,你都可以直接看到。
这些所有的成果全部灌给 EVI,机器拥有人类情感就更有可能了。
官网能体验到的 demo 都是官方配置,但在 Playground 当中,你是可以有自己的配置的。在这里选择配置文件(configuration),选择大模型,是的,除了官方默认,你还可以选择像 Claude、GPT 等等,而且可以选择较高版本的,比如 GPT 4 TURBO,之后选择系统的提示词(system prompt),官方默认给了一些比如客服、游戏 NPC、系统助理、励志教练、健康管理……
这里的 speech 现在还不能选择,所以现在只能用英文,以及只有这一个声音,后续应该会更新。所以这个其实跟类似 ChatGPT 一样的用法,一个配置文件对应着一个助理或者一个功能。你也可以在左边的 EVI configurations 当中来新建或者修改配置文件。
但我试过这些官方 prompt 并且自己也试过给一些 prompt 之后,也并没有觉得多惊艳,包括因为受到电影《Her》的影响,看看它能不能有类似的反应。然而并没有。
所有能够识别情绪并且能够基于你的情绪表现出对应情绪的 AI,只是听起来像人,但实际上还是挺像人工智障。直到我发现一个华点——人类的情绪是内在的欲望和动机驱动,而 AI 是在表演。AI 总是抱着让我来帮你的、看起来忘我的无私奉献精神,但越是这样越没有人味儿;像电影《Her》当中的 Samantha 有一种不知为何就觉醒了并且会做梦、有欲望、会好奇等等…………另外我之前在看的一本书叫做《Are You Normal》,讲述几百年寻找正常人的历史但实际上,这个世界上没有所谓的正常人或者健全的人,那其实也包括你的心理医生。所以如果给 AI 设定更类似人的角色,如果可以给它留下口癖、性格、欲望甚至缺陷,那是不是……?
现在 EVI 的情绪反应,就是内在驱动的,虽然这个内在来自于人为设定,但你不得不说,AI 真的更像人了。
而且,你怎么确定你的内在动机和欲望不是人为设定的呢?
-
不备案可以在微信中直接打开的域名后缀
微信对域名的态度级别最欢迎的,既备案又部署ssl又微信认证主体和网站主体一致的,然后是,备案了也ssl了但未认证的,再次之,仅仅备案了最... 1822 0 24-03-04 -
高性能MySQL
在互联网行业,MySQL数据库毫无疑问已经是最常用的数据库。LAMP(Linux+Apache + MySQL +PHP)甚至已经成为专有名词,也是很多中小网站建... 1015 0 24-05-28 -
小森平的免费下载音效素材
小森平的免费下载音效是一个由日本著名音效设计师小森平制作并分享的免费音效下载网站。该网站为用户提供了丰富的音效素材,适用于游戏开发... 1144 0 24-11-13 -
3C手机商城小程序
首页是用户进入小程序后看到的第一个界面,通常包含轮播图广告、热销商品推荐、新品上架等模块,目的是吸引用户注意力并引导他们进行浏览或... 1387 0 24-10-16 -
安卓时间天气效果
378 0 21-05-17 -
万彩AI,智能生成短视频、把照片变数字人、一键换脸等,嘎嘎好用!
小伙伴们,这个AI文案/短视频神器真的太牛了!不仅能写商业文书、种草笔记、爆款标题、脚本大纲、演讲稿等……还可以智能生成短视频、把照... 2067 0 24-05-07 -
Redi崩溃后,如何进行数据恢复的?
Redis 持久化是一个将内存数据转储到磁盘的过程。Redis 目前支持 RDB、AOF,以及混合存储三种模式。RDBRedis 的 RDB 持久化是以快照... 888 0 24-05-24 -
善用佳软:高效能人士的软件应用之道
世间万物,因缘而起,本书出版亦不例外。本书之产生,首先要感谢编辑王峰松先生。早在几年前,他就力荐我把博客内容整理出书。但我认为这是... 1082 0 24-05-24
发表我的评论
- 这篇文章还没有收到评论,赶紧来抢沙发吧~