对于ChatGPT来说,相信各位最近都被它铺天盖地的新闻报道所淹没,肯定还有不少人已经体验到了ChatGPT,大有人工智能已经高度进化之势。ChatGPT的出现,好像已经对当今互联网产生了巨大的影响,如果在这么发展下去,甚至看到了在未来能代替不少职业的趋势,比如客服、编程、广告、秘书工作等等。
什么是ChatGPT呢?ChatGPT,是美国OpenAI研发的聊天机器人程序,于2022年11月30日发布。ChatGPT是人工智能技术驱动的自然语言处理工具,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流。
首先
笔者认为不要轻视ChatGPT的出现,它不仅仅是一个会陪你聊天的AI机器人,或是什么新一代的AI搜索引擎,现在的ChatGPT已经可以帮你编程,帮你搭建一个论文、文章框架。虽然,目前ChatGPT的回答多少还是能看出一些机器人的痕迹,但是随着全世界上亿人对它不断的问答训练,它的迭代升级速度肯定也是十分惊人的。
其次
我们也不要过分神化ChatGPT,它现在离无所不能的状态还差得很远,目前的ChatGPT还是处在一种“很会唬人”的状态,乍一看它给出的答案十分厉害,但是一旦深入阅读就会发现,ChatGPT是一个给文章“注水”的高手,内容十分空洞,它只会单纯的填充内容,和我们人类的创作差距还有很大。
最后
合理使用ChatGPT确实可以帮助我们极大的减少工作量,比如让它为论文搭一个框架,我们再在这个框架之上进行修改,就可以让写论文这件事轻松不少;甚至,还可以利用ChatGPT去编写一些模块化的代码,程序员再做一些对应的修改,也会使得编程工作轻松不少。总之,合理使用ChatGPT可以让机械式的工作轻松不少,但是目前依然不能代替人来进行一些工作。我们不要神话它,但也不要轻视它,ChatGPT背后的人工智能AI,确实是下一个时代发展的趋势,我们一定要重视。本篇文章,笔者想重点聊一聊,AI中的自然语言处理。
自然语言处理
在于ChatGPT的交流之中,最令人印象深刻的就是它所给出的答案,对比于其它AI聊天软件来说,更像人类一些,甚至可以联系上下文进行流畅的交流,而做到这一切,就不得不提一项在人工智能中主要的领域——自然语言处理(NLP)。
对于自然语言处理而言,我们在理解这个概念的时候,不妨把这个词拆开来看。所谓“自然语言”就是人类发展过程中形成的一种信息交流的方式,包括口语及书面语,反映了人类的思维。比如,您现在在读的这篇文章,我就是在用自然语言书写,因此,世界上所有的人类使用的语言都是自然语言。我们为什么要强调“自然”呢,因为它要区别于计算机语言,计算机毕竟不是人,无法像人一样处理文本,需要有自己的处理方式,因此,所谓自然语言处理,简单来说,就是让计算机接受用户自然语言形式的输入,并在内部通过人类所定义的算法进行加工、计算等系列操作,以模拟人类对自然语言的理解,并返回用户所期望的结果。自然语言处理是人工智能下各个小领域的十字路口,是人工智能最重要的领域之一,被誉为“人工智能皇冠上的明珠”。
最早的自然语言处理需求源自美苏冷战时期,20世纪50年代,由于美苏之间有大量的外文翻译需求,而在美国精通俄语的人才数量有限,又赶上计算机刚刚开始发展,因此,使用计算机来翻译文件的项目就被提上了日程。但是,随着研究的开展,相关人员马上就发现了让计算机理解人类语言的困难极大。同一种语言下的句子都有不同的歧义,有着复杂丰富的文化因素,充斥着各种无规律的、约定俗成的俗语;再加上词与词之间、句与句之间都有复杂的逻辑关系,让当时算力孱弱的计算机完成这种工作,无疑是天方夜谭,就更不用说还要在不同的语言之间进行翻译了。因此最后,人们也只搞出了一种只能一词一词对应翻译的机器,与其说是翻译机,更不如说是早期的电子辞典。
直到90年代,IBM才提出了新一代的翻译模型——基于统计的机器翻译。简单来说,就是通过大量的样本数据,加以分析,统计词与词如何搭配概率最大,以此来找出词与词之间的关系。这样做有一种好处,就是可以让机器产生一种类似于人类的“语感”。比如,当统计了足够大的句子之后,当“芒果”和“吃”一起出现的时候,计算机很可能就会知道,这句话指的是水果,这时语言的准确性就会大大提高。但是,这里还有一个致命的问题:这种模型对于句子的顺序不敏感,也就是说它很可能给出你一个丝毫没有语法逻辑的结果。比如“What’s your name?”所得到的翻译结果很可能是“什么是你的名字?”读起来就十分怪异。
为了解决这个问题,那便要引入一个全新的AI算法——神经网络。虽然,其底层本质还是统计概率,但是它可以让计算机逐渐开始“理解”句子的含义。从此,自然语言处理将会逐步跳出翻译领域,开始逐渐拥有“智能”。具体的神经网络算法我们在这篇文章就暂时不展开了,感兴趣的各位可以移步这篇文章:
https://toutiao.le365.cc/127088.html
词向量
在这里,笔者只想说明一个概念,那就是:词向量。在人类眼中,当看到“苹果”二字时,可能想到的是一种红色或绿色的水果,也有可能是某科技公司;但是在计算机的世界中,它们只是一串毫无意义的0和1,计算机不会记录意义,它也不会理解意义,它只需要让操作它的人理解其中的意义就可以了。到了人工智能这里,对于计算机有了新的要求,它需要“理解”意义。那计算机如何才能“理解“呢?答案就是:向量化。
如何向量化呢?打个比方,就是“苹果”这个词,形状是球形的指数是0.9,味道是甜的指数是0.8,得到的坐标就是[0.9,0.8];“桃子”这个词,形状是球形的指数是0.8,味道是甜的指数是0.9,得到的坐标就是[0.8,0.9],那么这样它们就能在极坐标轴上被表示出来,就会很容易的看到,桃子和苹果,在坐标轴上关系很近,那它们很可能就有某些直接联系。当然了我们可以也可以添加更多维度的特征量,比如颜色、重量、体积等等,随着维度的增加,描述也会更加精确,计算机也就会逐渐“理解”一件事物,甚至能明白事物与事物之间可能的联系。就如同马克思所说:“人是一切社会关系的总和。”在计算机的世界里,词语也是一样的,我们往往用其他的词语来定义另一种词语,当计算机精确的知道了词与词在坐标系中位置,它也就能确定每个词之间的关系,那么计算机就能知道每个词之间的语义联系,也就“理解”了语言。
现在,还有一个问题,那么词之间的位置怎么确定呢?让我们来看看著名的词向量算法word2vec是怎么做的。其实,答案十分简单粗暴,就是通过大量的“完型填空”来训练人工智能。比如,先给人工智能一句话“我喜欢吃苹果”,然后隐藏掉“喜欢”,变成“我____吃苹果”,让人工智能去猜中间是什么,这时词向量的值都是随机生成的,人工智能自然猜不对,以此往复,直到猜中“喜欢”,这时随机出的词向量的数值就更加接近正确的值,就这么训练上几百、几千亿次,词向量的数值就会逐渐正确,从而AI的回答就会越来越智能。这时一个词就完成了词的向量化,这一过程,还有一个专有名词叫做“词嵌入”。
而本次大火的ChatCPT,则是基于谷歌改良的自然语言处理算法Transformer的底层魔改的产物,简单来讲,就是通过算法模拟人类的“注意力”,从而极大的提升了AI理解语义的精准程度,就像谷歌自己论文的标题所说“Attention is all you need(注意力是你的全部所需)”,而具体的Transformer模型概述,各位可以移步这篇文章:
https://www.jianshu.com/p/b40deff0ca63
写在最后
随着ChatGPT的讨论持续升温,现在在互联网上也出现了许多担心未来自己的工作会被AI取代的声音,就目前的情况来看,笔者认为还差得远,但是一定会出现善于使用ChatGPT辅助自己工作,从而极大提升自己工作效率的情况。当然,发展AI是未来的趋势,随着AI的迭代,一定会有大量从事琐碎的、重复的、机械式工作的人将会被取代,这是未来的趋势,我们任何人,都只能去拥抱这样一个时代趋势,也只能顺势而为。这样的AI替代,必然是有争议的,但好不好,都不影响AI发展的趋势。我们能做的只有积极学习AI、接受AI,让AI帮助自己更好地工作;同时努力提升自己,积极从事一些个人创造力占比大的职业。
祝各位都有一个光明的未来。
本文【自然语言处理包括哪些内容_自然语言处理的应用】由作者: 乐观锁 提供,本站不拥有所有权,只提供储存服务,如有侵权,联系删除!
本文链接:https://www.cuoshuo.com/blog/4262.html