来源:华泰证券
华泰证券-金工深度研究:NLP综述,勾勒AI语义理解的轨迹(人工智能62)
华泰证券-金工深度研究:析精剖微,机构拆解看北向资金
华泰证券-金工深度研究:深挖分析师共同覆盖中的关联因子(人工智能61)
华泰证券-金工深度研究:量化如何追求模糊的正确,有序回归(人工智能60)
华泰证券-金工深度研究:固收+基金资产配置能力分析与筛选
华泰证券-金工深度研究:ESG评价体系与ESG SmartBeta
(PDF打包,大小13.9M)
人工智能 62:NLP 发展综述,勾勒 AI 语义理解的轨迹本文是华泰金工人工智能系列文本挖掘主题下的理论介绍篇,重点对 NLP发展历史上各阶段的代表模型进行理论介绍。近年来金融文本类数据的结构化程度越来越高,这一印象中的“另类数据”已不再另类,想要更充分的利用这类数据的 alpha,势必要求投资者对文本挖掘技术有更全面的理解。基于此,本文对 NLP 发展历史进行综述,帮助读者勾勒 NLP 的发展轨迹,以更好地识别契合量化交易需求的模型,达到知己知彼的效果。
将 NLP 历史划分为三阶段,从统计语言模型到预训练语言模型可以将 NLP 发展历史划分为三阶段,各阶段呈现出较为鲜明的特点。第一阶段以统计语言模型为主,各类词语&句子的表征方法层出不穷,没有哪种模型占据绝对优势;第二阶段以 Word2Vec 类的词向量模型为主,Word Embedding 技术大行其道,迁移学习的思想崭露头角;第三阶段预训练语言模型逐渐成熟,迁移学习的思想发挥到极致,BERT 等模型站在前人的肩膀上大放异彩,NLP 进入崭新的时代。
评论0