为什么我国没有ChatGPT那样强大的AI智能系统
开发先进的人工智能系统,比如GPT-系列模型,研究资源、数据质量、算法以及人才等都是关键因素,不得不承认,这些都是国外长久以来具有的优势,咱们目前的确有一定差距。抛开技术不谈,就谈产品。从最早的操作系统,数据库,工业软件,到门户网站,搜索引擎,再到淘宝,微信,抖音。有哪一个是我们首创的?
一个是壁垒严重。各大APP林立且完全不互通,国内大量知识都被锁死在APP中,各大APP用户群体割裂,搜索引擎没有办法有效总地聚合信息互通。一个是风控严重,个人建站必须备案,且有各种条条框框限制,甚至不允许备案中出现“博客”,要求网站对评论区进行审核,从而事实上让大量网站关闭移除评论区,彻底断绝了知识的沟通和交流。抖音推荐算法的强大,是因为有远超对手的数据来用于研究。同样的道理,美国之所以强大,除了投入和理论的优势,更重要的还是用于训练、优化AI的数据优势太大了。你要训练一个足够聪明足够强大的语言模型,就必须用海量文本,尤其是优质文本去训练它。海量的优质文本需要海量的网站,而中文网站无论是数量还是质量跟英文网站都不在一个级别。
随着猫扑、天涯为代表的高质量的没落,以及豆瓣这些网站的水准一再下滑,中文互联网已经很难找到高质量网站了,大概也就知乎还勉强算是既有一些热度又有一定质量的网站。微博、贴吧、抖音这些热门网站无一不是充斥着饭圈、女拳、地域歧视等糟粕文化,说是粪坑也不为过,而大部分中文网站都跟微博、贴吧、抖音差不多,用这些文本训练出来的语言模型能聪明到哪儿去?另外所谓OpenAI,Open自然非常重要,而中文网站普遍存在着严格的审核机制,这导致我们的网络一点不Open,这对训练语言模型也是种巨大障碍。
在各种大厂APP上,你不知道哪个字会触发到系统,即使是友好和善的交流下也会被夹掉一些内容。很多网站用的敏感词扫描系统,跟智障没什么两样,所以经常闹出审查笑话,比如你说“黑夜总会过去”,它会给你审出“夜总会”来。国外的很多网站,都是靠各种兴趣爱好建立起来的,所以氛围也比较好,也可以讨论很多事情,但中文互联网,各种繁琐的备案绝对会打消你的兴趣,要是带评论功能还得额外备案,剩下愿意开网站的都是为了赚钱去开的,能有什么好的氛围。纯兴趣爱好的搞论坛或者博客的作者们可能只是分享资源或者所见所闻,也有可能触犯到审查机制,本来不赚钱还惹得一身骚,导致个人网站越来越少以前在简中互联网上找资源真的是“百度一下你就知道”,现在你得躲开一堆答非所问的百家号,躲开本来开源免费的程序在csd下载还得收费的坑,躲开一堆广告,最后使用某404引擎找到了。
二是商业化开发运营。在中国主要都是学校和营利性的商业组织在做这方面研究。从学校方面看,训大模型的投入太大,没有资源去做;对于学生而言,细微改进模型或者增加训练trick刷榜也来得更简单。从商业组织来看,就是投入回报的事情,在一些资源足够丰富的公司已经有了自己的大模型。华为有基于昇腾计算平台的鹏程、盘古、紫东、太初、悟道等,百度也提出了自己的文心大模型。其他规模小的AI相关公司,还在生存线上挣扎,每天都在焦虑商业化落地的问题,更加没有条件去搞大模型了。
三是政府的支持。因为AI不在中国的计划经济中。。。个人感觉,当中国很久之前用政府强制力扼杀游戏行业的时候,AI就和我们国家没什么缘分了。。。虽然说明面上中国现在实行的是市场经济,但是政府主导和干预的比重是非常多的。就拿新能源举例子,中国新能源行业和新能源车企这么发达,是市场的选择吗?不是,是因为政府想让这个行业发达…国家给各种各样的补贴,车企有补贴,消费者也有补贴,为的就是发展壮大这个行业。很多其他行业,比如近几年才大力发展芯片,等等,都是政府的计划。计划性经济如果都按照计划走,那就完美,怕就怕在出现预期之外的变故。谁也不知道游戏行业能催产出AI(因为显卡),当年政府也不知道啊,英伟达当年肯定也不知道…中国靠强大的政府资本发展这么多年的航空,谁也不知道马斯克这家伙仅靠市场资本就能实现商用航空…谁也不知道疫情会持续两年…AI这个行业是井喷氏发展,政府还来不及做计划就…咋说呢,政府强干预有利有弊。
四是中国人工智能研究和应用的重点不同。在美国,人工智能研究和应用的重点在于对语言、图像和视觉等人类感官进行模拟,比如创造自然语言处理系统、图像识别应用或智能助手等。而在中国,人工智能研究和应用的重点在于对工业、医疗、农业、金融等行业进行支持和提升,比如创造工业自动化系统、医疗诊断系统、农业预测系统、等。由于中国人工智能研究和应用的重点不同,在一些与人类感官相关的方面,中国的人工智能可能没有美国的人工智能那样复杂和成熟。
五是中国人工智能研究和应用的方式不同。在美国,人工智能研究和应用的方式多为开放式,包括基础研究、商业应用和社会公益三个方面。这意味着,美国的人工智能研究除了受到政府资助和企业投资的支持外,还受到社会组织和个人的参与和推动。而在中国,人工智能研究和应用的方式多为闭放式,具有一定的规范性和集约性。这意味着,中国的人工智能研究除了受到政府支持和企业投资的支持外,并没有太多的社会组织和个人参与其中。由于中国人工智能研究和应用的方式不同,中国的人工智能可能没有美国的人工智能那样多元和发展快。