nlp
-
波动因子:基于NLP的行业分类
基于TNIC行业分类计算的波动率指标是解释公司波动和收益的潜在因子可以发现随着TNIC波动的上升(从组1到组5),AbnormalReturn越来越大,也就是说TNIC波动大的股票有更多的AbnormalRe…
-
简单的中文分词算法
作者:邓旭东HIT 想了解点中文文本处理的底层一些的知识,在网上查了下跟python有关的文本分析书记,意外发现一本新书。 书籍简介 本书是一本研究汉语自然语言处理方面的基础性、综合性书籍,涉及NLP的语言理论、算法和工程实践的方方面面,内容繁杂。 本书包括NLP的语言理论部分、算法部分、案例部分,涉及汉语的发展历史、传统的句法理论、认知语言学理论。需要指出…
-
2021数据分析商业智能领域的十大流行词
在过去的十年中,商业智能发生了许多变化。每年,我们都会听到流行语进入社区,语言,市场,并推动企业和公司前进。这就是为什么我们准备了将在2021年占据主导地位的最杰出的商业智能流行语列表。
-
手把手教你解决90%的NLP问题
利用机器学习方法来理解和利用文本,从最简单的到state-of-the-art,由浅入深,循序渐进。
-
阿里巴巴高级算法专家威视:组建技术团队的一些思考
关机大厂数据技术团队管理的文章很少,从这篇文章可以一窥端倪,包括算法团队目标的设定、差异化竞争力的打造、如何做园丁、如何做连接、如何做招聘等等。
-
Kaggle最流行NLP方法演化史,从词袋到Transformer
Kaggle 竞赛史也是实践型 NLP 的历史
-
如何搭建一个聊天机器人?NLP 一节课帮你解惑
5个步骤的NLP流程可以帮助您设计简单的聊天机器人 顾名思义,“聊天机器人”是与您聊天的机器。诀窍是使它尽可能像人一样。从“美国运通客户支持”到Google Pixel的呼叫筛选软件聊天机器人,各种各样。 作者 Blake Wisz 图片来自 Usplash 它实际上如何运作? 聊天机器人的早期版本使用一种称为模式匹配的机器学习技术。与当今使用的高级NLP技…
-
NLP模型超越人类水平?你可能碰到了大忽悠
大数据文摘出品 来源:thegradient 编译:张睿毅、武帅、钱天培 一个军方训练的神经网络声称可以分类图像中的坦克,但实际上,它只是学会了识别不同的亮度,因为一种类型的坦克仅出现在明亮的图片中,而另一种类型仅出现在较暗的图片中。 一个游戏AI在学会了在第一关的最后故意死去,而不是在更难的第二关的开局死去,因为这样可以得到更高的分数。 AI通过某种让人啼…
-
哈工大教授刘挺:自然语言处理的十个发展趋势
CCAI 2017《自然语言处理的十个发展趋势》演讲实录摘编。
-
Facebook发布基于NLP的代码搜索工具
Facebook 开发出一种代码搜索工具,能够将自然语言处理(NLP)与信息检索(IR)技术直接应用于源代码文本。
-
从朴素贝叶斯到维特比算法:详解隐马尔科夫模型
本文将从简要介绍朴素贝叶斯开始,再将其扩展到隐马尔科夫模型。我们不仅会讨论隐马尔科夫模型的基本原理,同时还会从朴素贝叶斯的角度讨论它们间的关系与局限性。
-
NLP 与知识图谱的对接
本文整理自中国中文信息学会常务理事、白硕博士在杭州金融知识图谱论坛上的演讲。 两个问题 第一个问题是,为什么有人说“中文知识图谱”,难道知识图谱是有国籍的吗?它是有母语的吗?知识是无国界的,这个当然是理论上的说法。具体到一个国度,一个语言文化的大环境,我们就会发现,事实上知识是有母语的。理论依据就是所谓的 语言相对论。可能大家最近都看了《降临》,《降临》讲的…
-
机器学习与Dota2英雄属性
本文使用自然语言处理(NLP)方法对DOTA2 英雄角色属性做了简要的分析。