前不久有一则新闻称:一半的加拿大人被COVID-19的阴谋论所愚弄,这个消息真的令人心碎。
世界卫生组织(WHO)称,与COVID-19相关的信息流行病与病*本身同样危险。同样地,阴谋论、神话和夸大的事实可能会产生超出公共健康范围的后果。多亏了LeadStories,Poynter,FactCheck.org,Snopes,EuVsDisinfo等项目可以监视、识别和检查散布在世界各地的虚假信息。
假新闻检测任务对逻辑的判断,以及常识的学习都有着很高的要求。判断一则新闻是否是假新闻,需要判断文章内部的逻辑是否自洽,同时因为新闻多会涉及一些专有名词/专业术语,因此也需要学习外部的知识库来辅助判断。结合这两点特性,假新闻检测是当前的热点任务,也仍极具挑战性。
//////////
在本项目中,导师将以“虚假新闻识别”为课题,向同学们介绍深度学习和自然语言处理的基础知识,并引导大家在假新闻检测任务中应用学到的知识,探索新的算法、模型和技术。
通过这门课程的训练,同学们将:
?掌握基本的深度学习和自然语言处理知识,熟练使用Python语言编写深度学习程序;
?在导师的引导下完成从发现问题,提出解决方案,以及实验论证的科研流程,为今后的学习、学术发展打下坚实的基础;
·项目导师·
AmazonAlexaAI丨Researchscientist
MIT人工智能方向博士
·项目安排·
本项目为线上Workshop,导师授课+练习实战结合,完成课题学习、研究实战探索及报告撰写。
Phase1
预习阶段
导师提供必要的阅读材料、课程及练习题,为在线课程做预习,补充知识短板。
Phase2
导师授课
Week1:深度学习与神经网络基础
本部分课程旨在让同学们了解神经网络的基本原理,通用的神经网络架构,神经网络的训练/优化。课后作业将通过简单的图片分类任务让同学们体验神经网络的搭建和训练,并借此练习使用python以及深度学习工具包的技巧。
神经网络基本概念
通用神经网络结构
神经网络的训练/优化
Week2-3:自然语言处理中的深度学习
偏重于讲解深度学习模型在自然语言处理任务中的应用;概述分布式词表示模型,卷积神经网络及循环神经网络,端到端生成模型,记忆神经网络,在一系列自然语言处理任务,包括词表示学习、文本分类、情感分析、机器翻译、智能问答、阅读理解、对话系统等任务中的实际应用;介绍自然语言处理领域重要的工具包和数据集,为大家今后的科研学习做准备;
自然语言处理任务概述
词表示模型
句子/文本建模
端到端模型
预训练语言模型
Week4:自然语言处理应用专题
介绍针对自然语言处理的一系列最新的研究和学界、业界提出的新任务;讲解已有的科研工作、产品以及数据集;同时提出可能的科研方向供大家探讨;
情态分析
自然语言推理
智能问答
机器翻译
文本总结
*最终课题:虚假新闻识别系统
Phase3
线上研讨
Week5:导师介绍虚假新闻识别系统的研发意义以及现有的方法概述,布置课下科研任务,选择某一公开数据集作为任务目标,鼓励学生课下做文献调研并提出自己的系统构建想法。
Week6:学生分组进行课上答辩,介绍文献调研情况并展示自己构建的模型。课下开始针对自己的想法进行代码实现,并通过实验得到模型的效果。
Phase4
报告撰写+导师反馈
week7:完成报告撰写,导师做出最终反馈。
项目适合希望申请国外计算机科学、数据科学等相关学科,但相关经历不够丰富,或者转专业科研入门的本科生;
有Python计算机语言基础(我们可提供网课进行学习);
项目收获导师签字的项目结业证书;
通过分组合作,锻炼团队合作的能力,提前适应海外高效的学习模式;
收获一段与AI相关的实战科研经历,产出一份AI相关的实战科研报告;
项目费用:请咨询BG学术顾问更多科研项目,尽在下方BG小程序
?
在本项目中,导师将以“虚假新闻识别”为课题,向同学们介绍深度学习和自然语言处理的基础知识,并引导大家在假新闻检测任务中应用学到的知识,探索新的算法、模型和技术。
?T?H?E???E?N?D?预览时标签不可点收录于话题#个上一篇下一篇