2025中国高校计算机大赛:大数据挑战赛正式启动,等你来战!

2025中国高校计算机大赛大数据挑战赛启动,聚焦金融时序数据预测,探索算法落地,A股数据建模,等你来挑战!

原文标题:报名 | 2025中国高校计算机大赛——大数据挑战赛等你来战!

原文作者:数据派THU

冷月清谈:

中国高校计算机大赛大数据挑战赛是国内高校A类赛事,由清华大学、大数据系统软件国家工程研究中心主办,上海和今信息科技有限公司提供竞赛平台支持。2025年的大赛聚焦于时间序列数据的建模与预测,以中国A股市场的股价数据为研究对象,旨在推动前沿算法在实际复杂环境中的落地应用。 参赛对象不限年龄国籍,高等院校在校学生以及科研机构和企业从业人员均可参赛。比赛分为报名&组队、线上赛和决赛三个阶段。线上赛阶段,参赛队伍需下载数据在本地进行算法设计和调试,并通过大赛报名官网提交结果文件及模型代码。决赛阶段,参赛者需进行现场演示和答辩。大赛总奖金池为5万元人民币,设置线上赛奖项和决赛奖项,并为在校学生队伍设立专属奖项。 报名时间为2025年5月20日至7月15日,欢迎广大学者和技术爱好者踊跃参加。

怜星夜思:

1、这次大赛选择A股市场数据进行股价预测,你觉得这种选择有什么特别的意义?除了投资决策,股价预测模型还能应用在哪些领域?
2、大赛鼓励使用机器学习模型预测股价涨跌,你认为传统的时间序列分析方法(如ARIMA)在股价预测中还有优势吗?或者说,结合两者的思路会更好?
3、比赛的代码审核环节,会重点关注哪些方面?仅仅使用现成的机器学习框架,而没有自己的算法创新,能通过审核吗?

原文内容



2016年,教育部高等学校计算机类专业教学指导委员会、教育部高等学校软件工程专业教学指导委员会、教育部高等学校大学计算机课程教学指导委员会、全国高等学校计算机教育研究会联合创办了“中国高校计算机大赛”(China Collegiate Computing Contest,简称C4),目前“中国高校计算机大赛”继续由全国高等学校计算机教育研究会主办。大数据挑战赛是其中的一项重要赛事,在2018-2024年期间均入选全国普通高校学科竞赛排行榜,是国内高校A类赛事,获得社会各界的高度关注和广泛好评。


2025中国高校计算机大赛——大数据挑战赛(以下简称“大赛”)由清华大学、大数据系统软件国家工程研究中心主办。由上海和今信息科技有限公司提供竞赛平台支持。大赛是以实际数据为基础、面向全球开放的高端算法竞赛。大赛旨在通过竞技的方式,提升人们对数据分析与处理的算法研究与技术应用能力,探索大数据的核心科学与技术问题,尝试创新大数据技术,推动大数据的产学研用。


本次大赛聚焦于时间序列数据的建模与预测,通过构建基于真实金融市场数据的任务场景,旨在推动前沿算法在实际复杂环境中的落地应用。时间序列数据广泛存在于金融、交通、能源、医疗等领域,具有强烈的时序依赖性和动态变化特征。股价作为典型的时间序列对象,表现出高波动性、高频率、强非线性和多因素驱动等复杂特性,对建模技术提出了严峻挑战。


本次竞赛选择中国A股市场的股价数据作为研究对象,是基于其高度代表性和数据质量的综合考量。A股市场是中国资本市场的核心组成部分,包含上千家上市公司,涵盖多个行业和市值层级,拥有丰富的历史数据与活跃的交易行为。其股价受宏观经济政策、行业发展、企业基本面、市场情绪等多重因素影响,为时间序列预测模型的特征提取、机制建模、异常识别与动态调整提供了良好的实践平台。同时,A股股价数据在时间维度上既具备微观的高频波动,也蕴含中长期的趋势变化,有助于推动参赛者设计多尺度、分层次的预测方法,提升模型的综合表现。


从更宏观的视角来看,A股市场在中国经济发展与全球资本格局中的地位日益重要。近年来,随着注册制改革的全面推进、新兴科技企业的持续上市、以及资本市场对外开放步伐的加快,A股正逐步从融资市场向资源配置市场转变,承担起更为核心的经济调节与资源优化职能。在国家大力发展数字经济、推动金融科技融合创新的背景下,围绕A股市场构建智能化分析与预测工具,不仅能够服务于投资决策与风险控制,也具有提升金融体系智能化水平、促进技术成果转化的现实意义。


图片




01
赛题设置


本次大赛题为:基于历史数据预测未来股价涨跌,具体说明详见附件“赛题描述”。


本次竞赛的目标是基于沪深300指数成分股的历史股价数据,通过建立机器学习模型来预测未来股价涨跌幅最大和最小的股票。选手需通过构建模型、训练和调优,预测并输出给定数据后一个交易日沪深300指数成分股的涨跌幅最大和最小各10支股票,以此进行排名。




02
参赛对象


本次大赛面向全球开放,不限年龄国籍,高等院校在校学生(包括高职高专、本科、研究生)以及科研机构和企业从业人员均可参赛。具体要求如下:


  • 可以自由组队参赛,具体组队要求见后文相关说明;

  • 参赛选手应保证报名信息准确有效,如队伍中的选手信息不符合要求,组委会有权取消整个队伍的参赛资格及奖励。




03
赛制说明


本次大赛分为报名&组队、线上赛和决赛等三个阶段,其中线上赛均由参赛队伍下载数据在本地进行算法设计和调试,并通过大赛报名官网提交结果文件及模型代码;决赛要求参赛者进行现场演示和答辩。


1. 报名&组队(5月20日 – 7月15日)


参赛选手须在竞赛平台报名并且组队参赛(即使单人参赛也要组建单人队伍),大赛不收取任何报名费用。大赛报名系统开放时间为北京时间2025年5月20日10:00,截止时间为北京时间2025年7月15日中午12:00。


  • 报名方式:登录竞赛平台,完成个人信息注册,即可报名参赛;

  • 每个选手可单人成队或2-3人组队参赛;

  • 参赛队伍(包括队长及全体队伍成员)需要在竞赛平台完成实名认证,未完成认证的队伍将无法参加正式比赛。


大赛官方渠道主要包括:

  • 大赛官网:

    https://nercbds.tsinghua.edu.cn/bdc.html

  • 报名链接:

    https://www.heywhale.com/u/2025BDC


报名截止之后,不再允许添加或更改任何队伍成员。如有中途退出情况,只允许在参赛队伍内部更换队长或删除队员。参赛队伍须应在决赛开始前向大赛组委会提交成员更换申请,由参赛队伍全部成员亲笔签名,经由大赛组委会审核后变更生效。


2. 线上赛(5月20日 – 7月20日)


参赛队伍可从竞赛平台下载数据,在本地进行算法调试,并在线提交结果及模型代码。若参赛队伍在一天内多次提交结果,新结果版本将覆盖旧版本。


  • 线上赛A阶段:5月20日10:00 – 7月18日20:00,每个参赛队伍每天可以进行2次结果提交,系统立即进行评测并返回成绩。排行榜实时进行更新,将选择参赛队伍在本阶段的历史最优成绩进行排名展示。请确保结果可复现。

  • 线上赛B阶段:7月19日 – 7月20日23:59,每个参赛队伍提交整理好的模型代码,要求详见“代码规范”文档。

  • 线上赛C阶段:7月28日开始,系统将在7月28日20:00更换训练数据和推理数据,并运行选手模型代码获得结果文件进行计算排名展示。


线上赛结束后,排名前70名的参赛队伍以及排名在71-110之间前30支学生队伍将进行代码审核。组委会将审核并剔除没有机器学习算法贡献的队伍,并取消存在违反比赛规定队伍的比赛资格,空缺名额不再替补。所有通过审核的队伍将获得线上赛名次证书。


3. 决赛(8月中下旬)


决赛将以现场答辩会的形式进行,具体要求和安排另行通知。受邀参加决赛的选手在决赛期间的食宿由大赛组委会负责,其他费用自理。




04
奖项设置


大赛的奖金池总额为5万元人民币,所有奖金均为税前金额。


1. 线上赛奖项(以大赛官网线上赛最终排行榜为准)


线上赛通过代码审核的100支队伍将颁发线上赛名次证书。


2. 决赛奖项(以大赛官网决赛结果为准)



3. 在校学生队伍奖项


在校学生队伍要求所有参赛队员必须全部为在校学生,如果队伍中有一名在职人员,则整个队伍视为在职人员队伍。其中中国大陆在校学生提供学信网的教育部学籍在线验证报告编号进行身份验证,其余学生提供相关在读证明进行身份验证,在校学籍以2025年5月30日为准。


此奖项仅颁发给在校学生队伍,要求队伍通过代码审核,并根据在校学生队伍成绩的单独排名结果进行颁发。



关注微信公众号“数据派THU”,后台回复“20250522”,即可获取“赛题描述”和“代码规范”



直播预告


2025中国高校计算机大赛大数据挑战赛 启动会

5月22日 16:00直播





扫码关注数据派THU

了解大数据相关研究和大赛动态





关于我们

数据派THU作为数据科学类公众号,背靠清华大学大数据研究中心,分享前沿数据科学与大数据技术创新研究动态、持续传播数据科学知识,努力建设数据人才聚集平台、打造中国大数据最强集团军。




新浪微博:@数据派THU

微信视频号:数据派THU

今日头条:数据派THU

A股的数据质量在中国金融市场里算是比较高的了,虽然噪声也很多。意义在于可以推动算法在实际金融场景中的应用,毕竟纸上谈兵没啥用。除了投资,还可以做量化交易,或者为监管层提供市场监控的工具,提前发现异常交易行为。

A股市场选择确实挺有意思的,一方面数据量大,波动性强,很适合做算法验证。另一方面,现在国家重视金融科技,这种比赛也算是产学研结合的一种尝试吧。除了炒股,我觉得还能用在风险预警上,比如预测哪些公司可能出现财务危机,或者用在宏观经济的趋势分析上。