12月3日,由百易传媒DOIT主办的“2019 中国数据与存储峰会(DATA&STORAGE SUMMIT)”在北京悠唐国际盛大开幕,一览群智作为认知智能领域的领跑者,技术副总裁刘占亮受邀出席人工智能数据应用论坛,分享了《自然语言处理与行业应用》,受到广泛关注。
一览群智技术副总裁 刘占亮
本次峰会主题为“数智·未来”,为期两天,来自IBM、英特尔、华为等数十家知名IT厂商以及来自全球的知名学者,包含主论坛、CIO高峰对话,以及大数据、人工智能等十大主题论坛,超过100场的专业知识分享。初步统计,本届峰会吸引了来自政、企、产、学、研、媒体等各方参会者约2000人,在线直播观看观众再创新高,超过10万余人次。
过去十年,在计算机视觉、语音识别、棋类AI等计算和感知智能技术上,深度学习率先取得成功。而最近深度学习在认知智能/自然语言处理上的进展,特别是Transformer衍生模型加上两阶段训练语言模型范式的成功,正在将自然语言处理变成人工智能下一个最有可能的突破口。
在诸多自然语言处理的落地场景中,得益于技术的创新,人的工作效率和流程的执行效率都得到了极大的提高。虽然短期内我们无法实现“通用人工智能”,但在特定的场景下,AI技术转化为生产力的发展是志在必得,未来更是大势所趋。
一览群智在金融行业解决方案及产品主要分为两大类:智能审单与智能合规。
相比于大家熟知的反洗钱产品等智能合规产品,智能审单技术脉络多元化,应用场景更复杂。在银行国际结算审单业务中,不仅要面对多源异构的数据,还要将业务领域知识从数据中挖掘出来,并以知识图谱的方式进行承载。
在整个技术体系中,需要用到很多自然语言处理相关技术,除了常规的诸如“合同金额与发票金额相等”这样的固定审核点外,更为复杂的情况是审核点的内容以自然语言文本的形式体现在合同条款或信用证等文件中。此时,审核的内容是文本里的一段话所对应的语义。例如一段条款可能这样描述:一笔交易中合同明确指出付款约定分成三次,第一笔是要付货款的30%,在某个日期之前完成,第二笔支付30%,在某个日期之前完成,尾款40%在某日期之前完成支付;与此条款对应的智能自动审核动作就是要检查供货方是否开具有三张发票,并且每个发票的金额与需要支付的百分比完全对应,同时还要保证发票的时间在条款约定日期范围内。
诸如此类的应用场景,难度是很高的,需要综合运用自然语言处理技术理解每句话的精确语义,同时做出分析、判断与决策,从而辅助人工把审核工作做得更快更准。
新技术的出现和逐步成熟,也使得更多的行业应用场景变成可能。在一览群智的技术落地过程中,对于常用的核心NLP基础任务,我们在实现当前一流算法模型的基础上,针对中文语言的特性进行了很多优化,并在多个任务上取得了领先的成绩。同时,立足中文,我们将工作扩展到了小语种上,研发了国内首个维吾尔语NLP平台,实现了包括分词、实体识别、文本分类、情感分析在内的功能模块,在多个维语 NLP任务上取得很高的精度。在一些新兴领域,一览群智也做了前瞻性的探索。在财经、法律、社交媒体等领域尝试实现多种问答机器人,在多个领域进行了文本生成的尝试。
“这是一条把技术转化为生产力的道路,”刘占亮说,“自然语言处理就如同机器与语言之间的桥梁,当它被成功架起,数智未来指日可待。”
END
转载自原文链接, 如需删除请联系管理员。
原文链接:一览群智出席“2019中国数据与存储峰会”,自然语言处理赋能认知智能未来,转载请注明来源!