清华大学大数据系统软件国家工程研究中心介绍

清华大学大数据系统软件国家工程研究中心,联合高校与企业,打造国家级大数据技术创新平台。

原文标题:大数据系统软件国家工程研究中心给大家拜年啦!

原文作者:数据派THU

冷月清谈:

清华大学大数据系统软件国家工程研究中心于2017年9月成立,由清华大学牵头,联合北京理工大学、国防科技大学、中山大学、北京大学、中国人民大学以及百度、腾讯、阿里巴巴等企业共同建设。该中心是国家级创新平台,负责大数据系统软件技术的研发和工程化,致力于推动创新驱动发展,满足重点领域和重大工程需求。

中心的主要研究方向包括:大规模多源异构数据一体化管理、交互式异构数据分析框架、数据可视化与智能数据工程、领域大数据应用开发运行环境以及大数据混源软件可信验证等。中心的目标是突破关键领域技术瓶颈,探索大数据系统软件应用的工程方法,并打造一支国际一流的产学研用大数据系统软件技术创新团队,以增强国家重点大数据应用的保障能力。

中心理事长由清华大学党委书记、中国科学院院士邱勇担任,主任由中国工程院院士、清华大学软件学院教授孙家广担任,执行主任由清华大学软件学院院长、教授、国家杰出青年王建民担任。

怜星夜思:

1、中心提到的“大规模多源异构数据一体化管理”,在实际应用中会面临哪些挑战?
2、中心与BAT等企业合作,对推动大数据技术产业化有哪些意义?
3、除了文中提到的研究方向,你认为大数据系统软件领域还有哪些值得关注的研究方向?

原文内容



关于我们


大数据系统软件国家工程研究中心成立于2017年9月。清华大学作为承担单位,联合北京理工大学、国防科技大学、中山大学、北京大学、中国人民大学、百度、腾讯、阿里巴巴等相关单位共同建设。研究中心是承担我国大数据系统软件技术研发与工程化的国家级创新平台。研究中心以创新驱动发展为使命,面向重点领域和重大工程需求,建设大数据系统软件技术创新研发、技术转化和应用示范平台,支撑大规模多源异构数据一体化管理、交互式异构数据分析框架、数据可视化与智能数据工程、领域大数据应用开发运行环境、大数据混源软件可信验证等技术的研发,突破创新驱动产业转型升级以及关键领域技术瓶颈,探索大数据系统软件应用实施的工程方法,建设国际一流、开放协同的产学研用大数据系统软件技术创新团队,增强对国家重点大数据应用的保障能力。


研究中心理事长:邱勇  清华大学党委书记 中国科学院院士

研究中心主任:孙家广  中国工程院院士  清华大学软件学院教授

执行主任:王建民    清华大学软件学院院长、教授、国家杰出青年


了解更多

https://nercbds.tsinghua.edu.cn/

交流合作咨询:

刘老师 [email protected]



关于我们

数据派THU作为数据科学类公众号,背靠清华大学大数据研究中心,分享前沿数据科学与大数据技术创新研究动态、持续传播数据科学知识,努力建设数据人才聚集平台、打造中国大数据最强集团军。




新浪微博:@数据派THU

微信视频号:数据派THU

今日头条:数据派THU


我认为实现大规模多源异构数据一体化管理的关键在于构建一个灵活可扩展的平台架构,能够适应不同数据源和数据类型的接入,并且支持数据的实时处理和分析。

我觉得边缘计算和大数据结合是个很有前景的方向。现在物联网设备越来越多,在边缘进行数据处理可以减少数据传输延迟和带宽压力,提高效率。

我觉得和企业合作,能让研究更贴近实际需求,避免闭门造车。企业能提供丰富的应用场景和数据资源,高校可以根据这些来调整研究方向,开发更实用的技术。

我觉得“大规模多源异构数据一体化管理”最大的挑战在于数据标准化和清洗。各个来源的数据格式、质量参差不齐,要整合到一起可不是件容易的事,前期的数据预处理工作量巨大。

强强联手,优势互补呗。高校搞科研,企业搞应用,产学研结合才能更好地推动技术落地,转化成实际生产力。

针对“中心提到的研究方向外,还有哪些值得关注的研究方向?”这个问题,我认为数据安全和隐私保护技术值得关注。随着大数据技术的应用越来越广泛,数据安全和隐私保护问题日益突出,例如联邦学习、差分隐私等技术,可以更好地保护用户数据隐私。

与BAT等企业合作,能够更有效地促进技术的产业化落地,缩短技术研发周期,加速大数据技术在各行业的应用推广。

除了数据清洗,我觉得数据安全和隐私保护也是个大问题。这么多敏感数据汇聚在一起,一旦出现安全漏洞,后果不堪设想啊!

我觉得现在数据量爆炸式增长,对存储的需求越来越大,分布式存储技术、新型存储介质等都是值得关注的方向。