自然语言处理包括哪些内容_自然语言处理的应用

对于ChatGPT来说,相信各位最近都被它铺天盖地的新闻报道所淹没,肯定还有不少人已经体验到了ChatGPT,大有人工智能已经高度进化之势。ChatGPT的出现,好像已经对当今互联网产生了巨大的影响,如果在这么发展下去,甚至看到了在未来能代替不少职业的趋势,比如客服、编程、广告、秘书工作等等。

什么是ChatGPT呢?ChatGPT,是美国OpenAI研发的聊天机器人程序,于2022年11月30日发布。ChatGPT是人工智能技术驱动的自然语言处理工具,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流。

首先

笔者认为不要轻视ChatGPT的出现,它不仅仅是一个会陪你聊天的AI机器人,或是什么新一代的AI搜索引擎,现在的ChatGPT已经可以帮你编程,帮你搭建一个论文、文章框架。虽然,目前ChatGPT的回答多少还是能看出一些机器人的痕迹,但是随着全世界上亿人对它不断的问答训练,它的迭代升级速度肯定也是十分惊人的。

其次

我们也不要过分神化ChatGPT,它现在离无所不能的状态还差得很远,目前的ChatGPT还是处在一种“很会唬人”的状态,乍一看它给出的答案十分厉害,但是一旦深入阅读就会发现,ChatGPT是一个给文章“注水”的高手,内容十分空洞,它只会单纯的填充内容,和我们人类的创作差距还有很大。

最后

合理使用ChatGPT确实可以帮助我们极大的减少工作量,比如让它为论文搭一个框架,我们再在这个框架之上进行修改,就可以让写论文这件事轻松不少;甚至,还可以利用ChatGPT去编写一些模块化的代码,程序员再做一些对应的修改,也会使得编程工作轻松不少。总之,合理使用ChatGPT可以让机械式的工作轻松不少,但是目前依然不能代替人来进行一些工作。我们不要神话它,但也不要轻视它,ChatGPT背后的人工智能AI,确实是下一个时代发展的趋势,我们一定要重视。本篇文章,笔者想重点聊一聊,AI中的自然语言处理。

自然语言处理包括哪些内容_自然语言处理的应用

自然语言处理

在于ChatGPT的交流之中,最令人印象深刻的就是它所给出的答案,对比于其它AI聊天软件来说,更像人类一些,甚至可以联系上下文进行流畅的交流,而做到这一切,就不得不提一项在人工智能中主要的领域——自然语言处理(NLP)。

对于自然语言处理而言,我们在理解这个概念的时候,不妨把这个词拆开来看。所谓“自然语言”就是人类发展过程中形成的一种信息交流的方式,包括口语及书面语,反映了人类的思维。比如,您现在在读的这篇文章,我就是在用自然语言书写,因此,世界上所有的人类使用的语言都是自然语言。我们为什么要强调“自然”呢,因为它要区别于计算机语言,计算机毕竟不是人,无法像人一样处理文本,需要有自己的处理方式,因此,所谓自然语言处理,简单来说,就是让计算机接受用户自然语言形式的输入,并在内部通过人类所定义的算法进行加工、计算等系列操作,以模拟人类对自然语言的理解,并返回用户所期望的结果。自然语言处理是人工智能下各个小领域的十字路口,是人工智能最重要的领域之一,被誉为“人工智能皇冠上的明珠”。

最早的自然语言处理需求源自美苏冷战时期,20世纪50年代,由于美苏之间有大量的外文翻译需求,而在美国精通俄语的人才数量有限,又赶上计算机刚刚开始发展,因此,使用计算机来翻译文件的项目就被提上了日程。但是,随着研究的开展,相关人员马上就发现了让计算机理解人类语言的困难极大。同一种语言下的句子都有不同的歧义,有着复杂丰富的文化因素,充斥着各种无规律的、约定俗成的俗语;再加上词与词之间、句与句之间都有复杂的逻辑关系,让当时算力孱弱的计算机完成这种工作,无疑是天方夜谭,就更不用说还要在不同的语言之间进行翻译了。因此最后,人们也只搞出了一种只能一词一词对应翻译的机器,与其说是翻译机,更不如说是早期的电子辞典。

直到90年代,IBM才提出了新一代的翻译模型——基于统计的机器翻译。简单来说,就是通过大量的样本数据,加以分析,统计词与词如何搭配概率最大,以此来找出词与词之间的关系。这样做有一种好处,就是可以让机器产生一种类似于人类的“语感”。比如,当统计了足够大的句子之后,当“芒果”和“吃”一起出现的时候,计算机很可能就会知道,这句话指的是水果,这时语言的准确性就会大大提高。但是,这里还有一个致命的问题:这种模型对于句子的顺序不敏感,也就是说它很可能给出你一个丝毫没有语法逻辑的结果。比如“What’s your name?”所得到的翻译结果很可能是“什么是你的名字?”读起来就十分怪异。

为了解决这个问题,那便要引入一个全新的AI算法——神经网络。虽然,其底层本质还是统计概率,但是它可以让计算机逐渐开始“理解”句子的含义。从此,自然语言处理将会逐步跳出翻译领域,开始逐渐拥有“智能”。具体的神经网络算法我们在这篇文章就暂时不展开了,感兴趣的各位可以移步这篇文章:

https://toutiao.le365.cc/127088.html

词向量

在这里,笔者只想说明一个概念,那就是:词向量。在人类眼中,当看到“苹果”二字时,可能想到的是一种红色或绿色的水果,也有可能是某科技公司;但是在计算机的世界中,它们只是一串毫无意义的0和1,计算机不会记录意义,它也不会理解意义,它只需要让操作它的人理解其中的意义就可以了。到了人工智能这里,对于计算机有了新的要求,它需要“理解”意义。那计算机如何才能“理解“呢?答案就是:向量化。

如何向量化呢?打个比方,就是“苹果”这个词,形状是球形的指数是0.9,味道是甜的指数是0.8,得到的坐标就是[0.9,0.8];“桃子”这个词,形状是球形的指数是0.8,味道是甜的指数是0.9,得到的坐标就是[0.8,0.9],那么这样它们就能在极坐标轴上被表示出来,就会很容易的看到,桃子和苹果,在坐标轴上关系很近,那它们很可能就有某些直接联系。当然了我们可以也可以添加更多维度的特征量,比如颜色、重量、体积等等,随着维度的增加,描述也会更加精确,计算机也就会逐渐“理解”一件事物,甚至能明白事物与事物之间可能的联系。就如同马克思所说:“人是一切社会关系的总和。”在计算机的世界里,词语也是一样的,我们往往用其他的词语来定义另一种词语,当计算机精确的知道了词与词在坐标系中位置,它也就能确定每个词之间的关系,那么计算机就能知道每个词之间的语义联系,也就“理解”了语言。

自然语言处理包括哪些内容_自然语言处理的应用

现在,还有一个问题,那么词之间的位置怎么确定呢?让我们来看看著名的词向量算法word2vec是怎么做的。其实,答案十分简单粗暴,就是通过大量的“完型填空”来训练人工智能。比如,先给人工智能一句话“我喜欢吃苹果”,然后隐藏掉“喜欢”,变成“我____吃苹果”,让人工智能去猜中间是什么,这时词向量的值都是随机生成的,人工智能自然猜不对,以此往复,直到猜中“喜欢”,这时随机出的词向量的数值就更加接近正确的值,就这么训练上几百、几千亿次,词向量的数值就会逐渐正确,从而AI的回答就会越来越智能。这时一个词就完成了词的向量化,这一过程,还有一个专有名词叫做“词嵌入”。

而本次大火的ChatCPT,则是基于谷歌改良的自然语言处理算法Transformer的底层魔改的产物,简单来讲,就是通过算法模拟人类的“注意力”,从而极大的提升了AI理解语义的精准程度,就像谷歌自己论文的标题所说“Attention is all you need(注意力是你的全部所需)”,而具体的Transformer模型概述,各位可以移步这篇文章:

https://www.jianshu.com/p/b40deff0ca63

写在最后

随着ChatGPT的讨论持续升温,现在在互联网上也出现了许多担心未来自己的工作会被AI取代的声音,就目前的情况来看,笔者认为还差得远,但是一定会出现善于使用ChatGPT辅助自己工作,从而极大提升自己工作效率的情况。当然,发展AI是未来的趋势,随着AI的迭代,一定会有大量从事琐碎的、重复的、机械式工作的人将会被取代,这是未来的趋势,我们任何人,都只能去拥抱这样一个时代趋势,也只能顺势而为。这样的AI替代,必然是有争议的,但好不好,都不影响AI发展的趋势。我们能做的只有积极学习AI、接受AI,让AI帮助自己更好地工作;同时努力提升自己,积极从事一些个人创造力占比大的职业。

祝各位都有一个光明的未来。

本文【自然语言处理包括哪些内容_自然语言处理的应用】由作者: 乐观锁 提供,本站不拥有所有权,只提供储存服务,如有侵权,联系删除!
本文链接:https://www.cuoshuo.com/blog/4262.html

(0)
上一篇 2023-03-11 09:04:45
下一篇 2023-03-12 08:04:37

相关推荐

  • Oracle创建用户的sql语句,oracle获取建用户的语句

    创建用户(简单版) 概述:在oracle中要创建一个新的用户使用create user语句,一般是具有dab(数据库管理员)的权限才能使用。 基本语法:create user 用户名 identified by 密码; 注意:oracle规定用户密码不能以数字开头 给用户修改密码 概述:如果给自己修改密码可以直接使用sql>password 用户名 如…

    2023-03-18
    000
  • 硬盘读写速度越快越好吗,固态硬盘速度多少正常

    很多小白在挑选固态硬盘时都想买到性价比最高的产品,既想要容量大、速度快的,又想要大牌、价格便宜的,这种天上掉馅饼的好事自然是没有的。那么性价比就真的无从谈起了吗? 大家不妨换一个思路想一想,在容量、速度、品牌、价格等诸多因素中,哪个对于自己而言是最需要的,哪个对自己的影响是比较小的。这样进行一下取舍,结合自己的需求选择最适合自己的,这就是对于自己而言最具性价…

    2023-03-19
    000
  • 冒泡排序算法c语言代码_输入n个数进行冒泡排序C语言

    C语言是过去几十年软件和硬件两个阵营之间,签署的最坚实的契约。硬件为C语言的语义提供了最能发挥其性能的基础构件,而软件虽然搞了很多的圆环套圆环般的层次,但最终都以C语言作为最后的沉淀收尾。—-后面也会有C版的迷你程序!!! 之所以起头写这样系列的文档,主要是锻炼自己的编码能力,类似于leetcode吧。 浅话到此,C版的迷你程序、Python版的…

    2023-03-09
    500
  • wince 软件 很难找(wince车载软件集合)

    车载现在的电动汽车除了是电动的以外,还有一个名字是智能汽车,在智能上除了辅助驾驶之外,最大的智能可能要属车载大屏,或者往细了说是娱乐,现在的汽车上基本上是在智能上卷了起来,既然是智能那就一定有系统,今天就来看看现在主流的一些车载OS。 1、WinCE系统: Windows CE操作系统是在PC Windows操作系统基础上研发而来的车载OS,对硬件要求不高,…

    2023-03-18
    000
  • js随机数生成10到100的一个数 js产生0到100随机整数

    这几天一直在研究前台DIV元素的随机定位的问题,而这里面涉及到了JS生成随机数的方法,就下功能研究了一翻,并整理了一些资料以防以后再用得到。 JS中Math对象 在JS中可以使用 Math 对像来实现随机数的生成,但是这个对像有几个方法,先了解一下 1、js中的 ceil() 方法 ceil():方法对数字进行四舍五入,向上取整 语法: Math.ceil(…

    2023-03-13
    800
  • jquery特效的设计与制作

    最近在学习jquery,发现jquery上手比javascript容易许多,因为有着良好的文档和帮助手册,如果遇到一些问题可以借助文档来解决。初步接触学习jquery,我发现学习jquery主要是学会如何使用内置的方法。 今天就跟大家一起分享下,我用jquery写的一个banner全屏特效切换的案例,以及制作它运用了哪些jquery内置方法。 思路: 注:这…

    2023-03-16
    300
  • IE无法打开internet站点(找不到internet选项)

    我们在使用浏览器上网浏览网页的时候,如果想要清理网页临时文件或者进行设置,我们需要在“internet选项”中进行操作。如果在你需要打开“internet选项”进行设置,却发现无法打开”Internet选项”。那么当出现在这种问题的时候怎么解决呢?下面我们就来了解一下出现在无法打开“Internet选项”时的解决方法。 首先按“WIN…

    2023-03-16
    100
  • 动态链接库dll初始化失败怎么弄

    首先在本机上安装了solid works软件,打开出现这样的情况,可以尝试重新启动在打开,还是没有效果的话不要慌张,这样的小问题是可以解决的! 不管是重启还是修复等一系列解决方法都没有解决的话,不妨试试我的解决方法吧! 不敢保证每个人都可以解决类似问题,但本人就是这样解决的 好了,不废话了,看下面的解决方法吧! 1:打开i控制面板上的电源选项 2:进入到选择…

    2023-03-09
    500
  • mfc进度条重绘_mfc怎么重绘

    界面绘制 复选框ID:IDC_CBX_Red、IDC_CBX_Green、IDC_CBX_Blue。 复选框绑定控件类型变量:m_cbx_red、m_cbx_green、m_cbx_blue。 单选框ID:IDC_RADIO_Rect、IDC_RADIO_Circle。 单选框绑定控件类型变量:IDC_RADIO_Rect、IDC_RADIO_Circle。…

    2023-03-21
    000
  • 小程序开发一个多少钱啊_小程序怎么开发自己的小程序

    现在移动端技术发展很快,微信作为一款承载大流量的即时通讯软件,受众面广泛。微信公众平台是企业在网上宣传自己产品的一个窗口,为了拓展公众号的作用,小程序应运而生。小程序的特点是用完即走,不占任何内存资源,并且能和公众号做关联。那么开发一款微信小程序需要多少钱呢?衡水优信网络科技有限公司简介 (1) 功能定制和需求 任何一款软件和程序,功能的增加会影响价格的增加…

    2023-03-21
    000

发表回复

登录后才能评论
返回顶部
错说博客上线啦!