我的生活随笔

chatgpt 翻译

  从去年11月开始,一款名为“ChatGPT”的聊天机器人开始在海外爆红。到今年2月,ChatGPT已经成为几乎每天都能看到相关热搜的“顶流”。

  在热烈的讨论中,很多人惊呼:“《流浪地球2》中不断自我学习并最终进化为独立思考的‘苔藓’,可能离我们不远了。”

  有人认为ChatGPT与Siri、萧艾、小杜等大家熟悉的智能助手没有本质区别,不值得过多关注。

  网友让它写诗,写小说,写工作简报,发朋友圈,甚至用它写代码,写论文……ChatGPT是一个什么样的产品?为什么会突然爆炸?它能做什么?会不会有人被“抢饭碗”?未来发展将何去何从?我们采访了行业专家和许多ChatGPT用户,试图回答这些问题。

  ChatGPT,全称是“聊天生成预训练变换器”,直译过来就是“用于会话的生成预训练变换器”。它是美国公司OpenAI开发的聊天机器人程序,可用于问答、文本摘要生成、机器翻译、分类、代码生成和对话AI。

  到今年1月,ChatGPT在不到两个月的时间里积累了超过1亿的用户,打破了之前Tik Tok 9个月积累1亿用户的速度。

  南开大学计算机学院、网络学院空副院长刘表示,虽然ChatGPT进入公众视野的时间不长,但OpenAI的产品在几年前就已经对从业者产生了很大的影响。从技术上来说,ChatGPT并不是什么新鲜事物。

  “2016年到2020年,OpenAI发布了GPT的1.0、2.0、3.0版本,去年11月底发布的ChatGPT可以算是GPT-3.5。虽然大多数普通人只是最近才知道“GPT”,这是一个使用大数据的大型预训练模型,但更早的GPT-3已经在计算机科学和工业中产生了巨大的影响。国内一些互联网公司早在这波热潮之前就有了自己的前期培训大型模型项目。”

  刘认为,ChatGPT突然火起来可能有几个原因:“第一,前几代是为商业界提供技术支持,而ChatGPT是直接面向大众的。任何人都可以提问,短短几秒钟就可以回答,更多人可以简单直观地了解它的作用;二是发布的时候恰逢国外大学考试季,很多同学用它写论文交作业。ChatGPT可以给出相对完整的答案,解决学生的实际问题,从而迎来用户的快速增长。当然,它热到一定程度后,也不排除科技巨头和科技媒体的过度关注和一些炒作。”

  去年12月,埃隆·马斯克(elon musk)公开表示ChatGPT“好得吓人”,认为危险强大的人工智能离我们并不遥远。微软联合创始人比尔·盖茨在接受媒体采访时表示:“ChatGPT将改变我们的世界。”近日,团副总裁何晓东在接受媒体采访时表示:“ChatGPT是第一个真正意义上的人工智能原创产品。就像第一代iPhone,一出来就表现出高完整性、高体验、平台性。”

  为什么行业巨头对ChatGPT评价很高?很多人不解。有网友在网上提问:“现在已经有Siri、萧艾同学、小迪等很多智能助手可以和人对话了。说到AI技术,几年前的AlphaGo也引起了极大的关注。ChatGPT有什么特别之处?”

  刘说,在很多计算机领域的人看来,ChatGPT的横盘空的诞生,给AI领域带来的冲击,超过了7年前AlphaGo与世界冠军、职业九段棋手李世石的人机大战。

  “从IBM研发的国际象棋计算机深蓝战胜世界冠军卡斯帕罗夫,到几年前AlphaGo战胜人类围棋冠军,虽然算法和计算能力有巨大差异,但本质上仍然没有跳出‘让计算机在固定场景下做固定事情’的范畴,而这正是计算机所擅长的。”刘说,“ChatGPT面对的是一个‘开放的世界’——数亿用户想问什么问题,这是完全无法预测的。ChatGPT需要根据具体场景自行组织各种回答。这恰恰是AI开发的难点,ChatGPT在很多情况下都表现得非常好。”

  关于AI在“开放世界”场景下的操作难度,刘做了一个简单的类比:“今天的智能驾驶技术还多用于某些封闭的环境,比如矿山、港口、室内工厂等,这种“‘封闭世界’”不会让AI遇到太复杂的问题。相比之下,在公共道路上实现智能驾驶要困难得多。原因之一是,当AI面对一个开放的、不可预测的环境时,其操作难度呈指数级上升。”

  刘认为,从核心理念上来说,ChatGPT相对于Siri、萧艾、小杜等智能助手来说还是一个语言模型,其核心技术并没有颠覆性。区别在于ChatGPT的模型足够大,训练的数据也更多,处理数据的软硬件能力更强,而Siri、萧艾等软件的学习能力和数据量就差很多,甚至是质的区别。

  “ChatGPT在学习能力和数据处理能力上的优势,大大拓宽了它所能处理问题的边界。甚至可以说是完全不同的产品。一些研究人员的观察和分析表明,ChatGPT显示了一个受过大学教育的普通大学生的知识水平。这是区别于之前同类产品的地方,也是震惊业界的地方。”

  值得注意的是,ChatGPT在中国互联网上爆炸后,迅速引发了一场意想不到的狂欢——用户们争相“戏弄”它。

  与苹果智能语音助手Siri在遇到复杂问题时经常回答“对不起,我好像听不懂”不同,ChatGPT表现出一种尽可能用自己的逻辑组织语言和回答问题的倾向。甚至对于很多人乍一看似乎很搞笑的问题,它都会给出答案。这种“认真强答”引起了用户的极大兴趣。

  有些“强答”反映出ChatGPT有时候并不能完全理解他回答的问题。比如,当被问及“房子为什么不建得结实”时,ChatGPT会“煞费苦心”地从空气不能流通、没有通风系统等方面论述这样的房子不利于健康,但似乎没有“意识到”这样的房子不能住人。

  涉及专业知识的问答也闹了不少笑话。一个在哔哩哔哩的UPP主人问了ChatGPT几个问题,得到的回答都是ChatGPT会把春秋战国七雄之一的魏,三国割据政权之一的曹魏,十六国时期鲜卑拓跋族建立的北魏搞混。无独有偶,ChatGPT也会让“南宋”和“南宋”骄傲。

  这样的结果往往是一个随机的答案。一位历史学博士告诉记者,这些“无厘头”的答案很搞笑,但奇怪的是,他们的答案在逻辑表达上很相似,不像是从网上随便抄来的。“我看到有人用chatGPT问一些学术问题,它给出的答案甚至包括了被引论文、论文编号等细节。结果查了一下,这些‘参考文献’都是ChatGPT自己编的,让人感觉很舒服。真不知道怎么会得出这个答案。”

  “要讨论ChatGPT废话’的原因,就不得不提到目前这类产品的一个缺陷,那就是可解释性很差——预训练模型中的神经网络有上千层,AI通过深度学习自行构建一个复杂的规则。人们能看到的往往只是它针对问题输出的一个结果。所以,无论答案是对是错,人们都很难解释为什么AI会得到答案。”刘对说:

  多位使用过ChatGPT的用户告诉记者,ChatGPT的回答很少出现“无句”的表述,但时有逻辑和事实错误。越冷门、越小众的领域,这个错误就越明显。

  这种现象可能与ChatGPT学习和训练的数据结构有关。“众所周知,一个产品用的人越多,它就会变得越好。这是因为用户的使用行为本身就是一种反馈机制,可以帮助产品自我完善。ChatGPT也是如此,在问题集中领域有更多的样本可以学习、训练和自我修正。在知识领域,ChatGPT缺乏足够的数据进行深度学习,所以会‘扯淡’。”刘说,在他最近使用ChatGPT的过程中,当他问一些常见的问题和新闻事件时,他往往会得到更准确的答案,而一旦他问到相对非常规的知识,ChatGPT就明显开始“放任自流”了。

  由此衍生的另一个话题是ChatGPT输出答案的可靠性——谁来判断它给出的结果正确与否?如果不能判断,就不能给出正确的反馈。众所周知,正确的反馈对于产品迭代非常重要。

  另一方面,大量“无厘头”的垃圾内容是由ChatGPT产生的,而那些似是而非、经不起二次修正的不可信内容的广泛出现,会削弱整个内容平台的可信度,让人质疑ChatGPT或类似产品的可靠性。

  自有AI技术诞生以来,类似的话题就不绝于耳。但要回答这个问题,必须跳出对AI技术的盲目崇拜和“调情”的戏谑心态,认真正视一个问题:ChatGPT现在能做什么,或者很快能做什么?

  针对这一问题,ChatGPT本身给出了聊天机器人、自动文本生成、自动翻译、情感分析、内容摘要、数据分析、虚拟助手等具体应用场景。其实在这些方面,ChatGPT已经证明了它比之前所有的产品都要好,而且好得多。

  刘认为,从长远来看,技术进步带来商业业态的调整是必然的结果。但是,一项新技术会不会带来就业冲击,会带来什么影响,归根结底还是要看技术的顺利落地。

  “目前,ChatGPT将对图像制作、文本生成、媒体内容制作、虚拟人服务、工作报告、翻译、编程、搜索引擎等领域产生巨大影响。2月7日,微软宣布推出由ChatGPT支持的最新版人工智能搜索引擎Bing和Edge浏览器,极大地改变了搜索引擎的竞争格局——毫无疑问,从‘逐个抓取数据’到‘直接向用户呈现答案’,这必然是更符合用户需求的方向。可见新技术的变革如火如荼,有时人们说大变革指日可待,并不夸张。”刘对说道。

  不过,刘也表示,正如前面指出的那样,ChatGPT仍然存在一些缺陷,其回答往往表现出不可靠性:“以ChatGPT呈现的文本表达为例,如果没有人的引导、检查和验证,就无法应用于实际场景。”

  从社会分工来看,面对ChatGPT的冲击,首当其冲的就是重复性工作多,创造性少的工作。创造力是AI不容易跨越的鸿沟,只是目前如何争权夺利,烧钱。

  “人为什么会有创造力?到目前为止,这个问题连人类自己都无法解释,更别说把创造力教给机器了。到目前为止,AI最擅长的仍然是‘按规则做事’,本质上还无法突破‘创造力’的层面,ChatGPT也不例外。”刘说,“如果有一天人工智能突破了创造力的水平,那么人们将不得不担心的不仅仅是某些行业的工作岗位——那么整个人类社会将面临翻天覆地的变化。”

  早在2015年,奥特曼、彼得·蒂尔、里德·霍夫曼、埃隆·马斯克等一批科技领军人物创立OpenAI的时候,OpenAI还是一家非盈利企业。公司创始人认为,要避免人工智能技术被少数巨头垄断,必须通过开源来促进技术开放。

  然而,随着项目的进展,训练机器学习模型所需的资金越来越庞大,OpenAI开始设立营利性的分支机构。2019年,风险投资家微软入局。今天,微软和OpenAI之间的金融命运和技术已经越来越融合。今年1月,随着ChatGPT的爆发,微软又向OpenAI追加了100亿美元的投资。

  目前ChatGPT还处于免费试用状态,但有消息称很快会推出付费版本。同时,必应搜索已经嵌入了ChatGPT,甚至有消息称微软将把ChatGPT嵌入到办公软件中,这将是对办公生态的又一次创新。

  “预训大模型”软件将何去何从?在业内人士看来,虽然ChatGPT的核心理论并不新鲜,但开发类似产品所需的资金和人力在某种程度上已经构成了新的门槛。

  “早在上一代GPT时期,模特培训费用就高达数千万甚至上亿美元,非常昂贵。OpenAI预计将在今年发布GPT-4,这将是备受期待的进一步升级,也意味着它需要更多的数据和更高的计算能力,这需要大量的资金和人力。所以开发类似产品的门槛也在不断变高。”刘对说:

  在大趋势下,国内计算机行业面临哪些机遇和挑战?刘认为,在开发预训练大型号产品的核心理论方面,国内外公司差距并不大,但在数据采集和数据分析处理能力上,“后来者”还有一段追赶的距离。

  “如果你把机器进行训练和学习所依赖的数据比作成分,那么这种成分需要被收集和处理,才能变得适合吸收。这不是一项简单的任务。无论文字、图片、视频,一般都需要人工标注,这不是短时间投入大量资金就能立竿见影的事情,而是需要大量的人力和时间积累。所以业内也有一种说法,数据是互联网公司最重要的资产,甚至有人把数据比作企业的‘护城河’。”刘对说:

  「预训大模型」软件未来会如何发展?刘认为可能指向三个特点:“一是数据量越来越大,计算能力越来越强,无所不包;二是向专业化领域进军,在某个细分领域把信息精准度做到极致,比如医疗、法律、体育、编程等垂直分类;第三,与具体应用场景深度结合,不仅仅停留在‘聊天’,而是与虚拟人表演、电商营销、售后客服、陪伴老少、文学创作相结合。ChatGPT的潜力表明,它有能力在这些领域大有作为。”

赞(0)
未经允许不得转载:我的生活随笔 » chatgpt 翻译

我的生活随笔我的生活随笔