新闻中心

聚量观察 | 机器人会抬杠,就问你怕不怕

2021.04.12

本期看点

① 机器像人一样听说读写

② 人工智能皇冠上的明珠

③ 自然语言处理在产业数字金融的应用与价值

苹果Siri、谷歌Assistant、亚马逊Alexa、微软Cortana、百度小度、天猫精灵、小米小爱、喜马小雅,相似之处是什么?

相似之处就是都是人机交互的产品,都用到了自然语言处理(NLP, Natural Language Processing)

1、机器像人一样听说读写

自然语言处理,就是让计算机具备理解和生成人类自然语言的能力,使人和计算机之间的沟通和交流直接通过自然语言就能够实现。自然语言指的是在人类历史发展过程中各民族形成的语言,如汉语、英语、法语、日语等,包括口语和书面语,与之相对应的是人工语言,如计算机所用的编程语言等;处理指的是计算机通过算法能够识别、分析、理解和生成自然语言,可以像人一样运用自然语言听、说、读、写。

自然语言处理的机制,涉及到自然语言理解(NLU, NaturalLanguage Understanding)和自然语言生成(NLG, Natural Language Generation),前者指的是计算机能理解自然语言的意思,后者指的是计算机能用自然语言表达意思。这就是说,比如,当你与你的智能音箱相互沟通的时候,你用普通话发号施令,音箱不仅听得懂,还能用普通话作答,做到令行禁止、应答自如。

就像人学习一门语言、分析一个句子是个过程一样,自然语言处理是一个循序渐进、层层递进的过程,先从词法分析到句法分析,再从语义分析到语境分析。

2、人工智能皇冠上的明珠

作为人工智能的重要领域,自然语言处理被认为是人工智能皇冠上的明珠,一则说明该技术之重要,在许多场景都有应用价值和潜力;再则说明该技术之艰难,聚焦的自然语言具有多义性和歧义性,一个词语和一句话具体是什么意思,与上下文和场景密切相关,与历史和文化不可分割。同样一个词语可能有多个意思,同样一句话可以有许多种解读。

和人工智能其他技术一样,自然语言处理发展受到数据、算法和算力的影响。这些年来,随着数据量、算法模型和运算力快速发展,自然语言处理技术取得重大进步。数据量方面,互联网和物联网发展产生海量数据,可用于自然语言处理模型训练和推理的数据集类型日益丰富,来自不同领域,涵盖各种场景;算法模型方面,机器学习尤其是基于深层神经网络的深度学习重塑了自然语言处理的发展轨迹;运算力方面,目前除了可以用于自然语言处理的常见芯片,还出现了针对自然语言处理深度学习的芯片。

随着技术进步,自然语言处理的应用需求和领域与日俱增。在文本领域,有搜索引擎、信息检索、机器翻译、自动摘要、文本分类、意见挖掘、舆情分析、自动判卷系统、信息过滤和垃圾邮件处理等应用;在语音领域,有语音助手、智能客服、聊天机器人、自动问答、智能解说和智能远程教学与答疑等应用。这些领域都需要借助于自然语言处理技术来理解和生成自然语言。

目前,在自然语言处理方面比较突出的企业,国内有百度、第四范式、阿里、科大讯飞、搜狗、思必驰等,海外有亚马逊、苹果、谷歌、惠普、英特尔、IBM、微软等。全球自然语言处理市场规模,2018年为86.1亿美元,2026年预计增至806.8亿美元,年复合增长率达到32.4%。

3、自然语言处理在产业数字金融的应用与价值

自然语言处理对自然语言进行处理,而百万亿级市场体量的产业数字金融领域同样涉及到对自然语言的处理,有着广阔的应用前景。

在产业数字金融的实践中,自然语言处理与计算机视觉、OCR、RPA等其他技术相互结合,进行文本分析、舆情分析、文本摘要、智能报告、资讯推送、智能客服等工作。

产业数字金融在获得用户委托和授权后,利用自然语言处理等技术,从多个维度上采集和生成数据,用于构建交易信用风控模型,贯穿贷前、贷时和贷后整个过程,赋能金融机构进行风险管控,帮助实体企业更好地获得金融服务,帮助金融机构更好地服务实体经济。

“机器能思考吗?”计算机科学与人工智能之父艾伦·麦席森·图灵在1950年发表的一篇论文开门见山如是问道。在论文中,图灵设定了一个模仿游戏,如果机器表现得与思考的人一样,导致裁判难以判断与自己互动的到底是机器还是人,就可以认为这台机器会思考。后来,图灵将判断的标准量化设定为70%,即三成以上的裁判误以为与自己互动的是人而不是机器。这就是现在所说的图灵测试。

随着人工智能的发展,越来越多的自然语言处理技术产品通过了图灵测试,甚至于有些产品居然会抬杠,意味着具备了一定的思考能力。与此同时,随着技术的成熟,自然语言处理技术成为许多人工智能设备的关键,促进生活和生产的便利化、自动化和智能化。时至今日,语音助手和智能音箱等已经飞入寻常百姓家,变得几乎随处可见和随时可用。

产业数字金融既为自然语言处理技术提供了应用场景,也发挥自然语言处理的功能,用于构建交易信用,赋能金融机构,服务实体经济。

参考文献:
   [1]头豹研究院:《2019年中国自然语言处理行业研究报告》
   [2]中金公司:《AI+5G 系列:自然语言处理成为企业数字化转型的重要手段》
   [3]清华-中国工程院知识智能联合研究中心:《自然语言处理研究报告》
   [4]德勤:《认知智能大门:企业如何构建NLP能力》
   [5]机器之心:《自然语言处理五年技术革新,快速梳理 NLP 发展脉络》
   [6]机器之心:《2020-2021全球AI技术发展趋势报告》
   [7]斯坦福大学:《2021年人工智能指数报告》
   [8]IDC:《IDC FutureScape:全球人工智能(AI)市场2021 预测——中国启示》
   [9]DeepTech:《权威发布:<麻省理工科技评论>2021年“全球十大突破性技术”》
   [10]艾媒咨询:《2020中国人工智能产业白皮书》
   [11]Nature Portfolio:《人类颤抖吧!会抬扛的机器辩手来啦 | 本周<自然>封面故事》
   [12]艾伦•麦席森•图灵:《计算机器与智能》
   [13]Nature:this AI sums up research papers in a sentence
   [14]Fortune Business Insights: NLP Market Size, Share | Natural Language Processing Market Report 2026
   [15]Markets and Markets:Natural Language Processing Market by Component,Type (Statistical, Hybrid), Application (Automatic Summarization, SentimentAnalysis, Risk & Threat Detection), Deployment Mode, Organization Size,Vertical, and Region - Global Forecast to 2026
   [16]Natural language processing https://www.britannica.com/technology/natural-language-processing-computer-science

微信公众号
扫码关注微信公众号
  • 上海总部

    上海市浦东新区樱花路868号建工大唐国际A座20楼

  • 北京分公司

    北京市朝阳区东三环光华路众秀大厦3903

打开微信扫一扫进行分享。

关闭