项目价格:¥
我们身处一个信息爆炸的时代,信息以更多的维度、更丰富的形态充满着我们的生活,影响着我们的决策。金融市场中,对传统的数字信息的分析已经不能满足学者、量化研究者的需要,借助于机器学习特别是自然语言处理相关工具、算法的发展,对文本信息的系统结构化解读是当今学界与业界的一大热点。
公司年报、分析师研报、新闻、社交媒体、管理层电话纪要……借助Python及相关自然语言处理工具,你可以从大数据文本海洋中自由地提取你需要的信息,在一行行代码中完成与其他市场参与者的交流,形成投资分析的决策。
//////////
本课程依托于最新的金融、会计学术研究成果,侧重于相关理论、算法的介绍与投资、应用的实践。
参与本课程,同学们将:
初步掌握Python基础数据分析、自然语言处理相关模块;
初步了解分类模型、基础的神经网络模型、语义模型、语言模型等在金融中的应用;
理解利用文本分析的最新金融、会计学术文献,激发思考,并在导师的指导下发现问题、提出解决方案,完整地完成基于文本的研究项目。关于导师HarvardBusinessSchool
商业管理项目博士
清华大学经济管理学院经济与金融专业本科毕业(辅修计算机科学),国内某对冲基金2年工作经验,目前哈佛大学商学院商业管理项目博士在读;
主要研究兴趣为信息的披露、传播,信息中介的作用与资产定价,擅长利用大数据文本信息与机器学习算法理解资本市场参与者的决策;
拥有丰富Python编程教学经验,将前沿金融相关数据与Python编程基础教学结合,侧重利用编程培养严谨、独立、有创造性的思维习惯;
项目安排本项目为线上基础科研,导师授课+练习实战结合,完成课题学习、研究实战探索及报告撰写。
Phase1
预习阶段(2-week)
导师提供必要的文献阅读材料、Python学习材料及练习题,为在线课程做预习,补充知识短板。
Phase2
导师授课(4-week)
Week1:Python数据分析模块、中英文文本处理模块基础
导师:本部分课程旨在让同学们掌握利用Python进行基础数据分析、简单处理中英文文本分析的能力。Python提供了大量的工具包帮助我们完成各种复杂的任务,掌握Python完成数据分析的逻辑,灵活运用各类工具,会帮助我们轻松的进入文本分析领域。课后作业将通过简单的文本预处理让同学们练习使用python以及文本分析工具包的技巧。
Python数据分析的基础逻辑(numpy、pandas)
金融领域应用文本分析的发展历史
文本预处理:分词、词性标注、词形还原等
Week2:情感模型在金融学术、投资中的应用
导师:我们会详解2-3篇近几年最经典的论文,细致解读文章的思路、技巧。此外,我们会回顾一系列发表在顶级期刊上应用文本分析的文章,主要