互联网资讯 / 人工智能 · 2024年1月29日

数据科学发展:从1.0到3.0的进阶

在近日举办的“2023数据科学峰会”上,百分点科技董事长兼CEO苏萌谈到数据科学的发展。他表示,回顾过去50年的发展,数据科学经历过 “小数据时代”(数据科学1.0),走进了“大数据时代”(数据科学2.0),再从大数据时代走向了现在的“AI时代”(数据科学3.0),未来将迈向“数据原生时代”。

苏萌认为,大数据时代市场对于数据科学的需求,主要在单点的产品和单一场景上,比较典型的应用场景包括个性化推荐。

事实上,在百分点科技成立之初,第一个研究方向是做推荐引擎技术工程化的实现以及商业的落地。2009年12月31日凌晨,百分点推荐引擎1.0版本上线。

在此后短短几年的时间,百分点科技通过个性化推荐引擎服务了中国超过2000家的电商和媒体客户。2014年以后,百分点科技开始为更多传统企业提供服务,相继服务了媒体、金融、零售、制造、地产等领域的众多企业,帮助他们解决运营效率的问题。

2017年,数字化转型需求从企业端扩展到了政府端,百分点科技也正式开启了To G业务,将之前在互联网和企业服务中沉淀的数据科学产品与技术应用于政务领域。过去六年时间里,面向数字城市、公安、应急、生态环境、营商环境和统计等领域,构建智慧城市数字底座和场景智能应用,助力政府治理能力提升和治理体系现代化。

也是在这一年,百分点科技第一个国际业务项目落地,开启了新一代信息技术科技企业出海的新篇章。到目前为止,百分点用数据科学技术与产品服务了全球20多个国家。

苏萌表示,当下市场需求不再是断点式技术和工具,而是端到端的数据科学解决方案,在长链条里实现数据价值。这也是百分点推出数据科学基础平台DeepMatRix的意义。

展望数据科学未来的进展,苏萌表示:“数据科学在将来会进入数据原生的时代,这个时代数字技术的大融合将产生叠加态。在这个阶段,我们的数据模态更丰富、质量更高、时效性更强,算法会更先进、算力会更强大。在这个阶段数据已经变成像土地一样的生产要素,在其上会成长出一个数字的世界,也会成长出很多应用,而且这应用有可能不依赖于现实世界。”

对于数据科学的未来挑战和发展趋势,苏萌认为:

一是,AI生成数据会带来很多困扰。随着ChatGPT应用的不断普及,产生了有别于人类真实活动的数据。比如,人们用ChatGPT生成的论文、文学作品等,这些生成式AI数据是否会再次进入到下一轮的训练语料之中,如何评估这些数据的质量,如何实现它们的数据价值,这些都是需要重新考量的。

二是,领域知识的赋能。各个领域的科学和知识本身就是一个数据体,以数据的形式存在并且不断更新。未来数据科学将与领域知识进行更加深度的合,领域知识的自动抽取、构建和服务将成为主流,GPT终将从无所不知的写手走向知识渊博的领域高精尖专家。这也为数据科学的行业化细分带来无限商机。

三是,数据科学平民化。数据科学的通用工具的一体化和平台化,领域知识的计算机程序化和服务化,以及交互方式的自然化,这三件事情会导致未来业务和决策人员可以跨过程序员直接与数据进行交互,提高分析和决策效率,这将是革命性的变化。许多重复性工作将被智能技术替代,人们将从数据密集型、计算密集型、事务密集型的工作中被释放出来,专注于创造性高、艺术性高、价值密集型工作,追求自我实现。

四是,重塑生产关系和商业秩序。生产关系是由生产力决定的,数据科学技术在不断的迭代升级,它也会作为重要的生产力来推动商业模式和企业组织的变革。未来,全球80亿人和无数的物联网设备连接到网络并成为数据源,不断产生关于他们的活动、认知和智慧的大量数据。数据将变成普惠的生产要素,每个人都能通过数据的生产和使用获益,形成更加平等的生产关系,最终形成更加和谐的社会关系。

苏萌强调:“信息技术创造了数字世界,数字技术又在推动数字经济的不断发展,数字经济又推动了人类和组织社会的变革,而且变革又进一步为创新提供了土壤,让我们不断地在往前走。”

OpenMagic API

Need more than content? Move into the product flow.

If you are here for model access, pricing, developer docs, or the future API console, the dedicated product path now lives on api.openmagic.ai.

登录免费注册