Introduction to Data Science:数据科学发展的历史,总结其核心概念、方法论以及发展趋势,并着重阐述深入浅出地讲解数据科学中的核心概念、术语、算法以及具体操作步骤和数学公式

作者:禅与计算机程序设计艺术

1.简介

数据科学(Data Science)是一种应用数学、统计学和计算机科学等领域的交叉学科,旨在理解数据产生的现象并运用数据科学的方法进行预测和分析,从而有效提升企业的决策能力、改善业务结果、发现新的机会,并在各个行业实现商业价值。
本篇文章将探讨数据科学发展的历史,总结其核心概念、方法论以及发展趋势,并着重阐述深入浅出地讲解数据科学中的核心概念、术语、算法以及具体操作步骤和数学公式。

2.数据科学概览

数据科学的历史及主要角色

数据科学的发展史可谓五百年一遇。其主要参与者包括古希腊的雅典人、罗马天主教徒、埃及的希伯来人、中国的老子、英国的牛顿、美国的约翰·麦克唐纳、日本的桥本尚、德国的海德格尔、香港的李四光、台湾的何瓦普斯……这些人凭借对数据的深刻洞察和独特视角,把数据视作有用的信息源,推动了数据科学的形成和进步。
数据科学共分为三个阶段:数据驱动型、计算驱动型、应用驱动型。

  • 数据驱动型
    数据驱动型数据科学的特征是利用数据获取知识的过程,是以数据为导向进行研究。它从实际问题中抽象出通用模式,通过分析、挖掘、模型化和归纳,最终得出结论或预测。诸如电信领域的流量预测、风险评估、营销优化等都是数据驱动型的数据科学的典型案例。
  • 计算驱动型
    计算驱动型数据科学是指利用计算机技术及相关分析工具,对数据进行处理、分析和建模。这种方式更加关注数据的整合、转换、可视化、解释等方面,以生成模型为基础,进行数据分析、预测和决策。诸如金融、医疗、互联网、社交网络、移动应用等领域均属于计算驱动型的数据科学。
  • 应用驱动型
    应用驱动型数据科学则围绕在线服务、大数据平台、人工智能、物联网、工业自动化、健康保障等场景下&#x

猜你喜欢

转载自blog.csdn.net/universsky2015/article/details/132074708