Posts 接触数据化
Post
Cancel

接触数据化

How to measure anything

有的书只要翻了几页就知道值得一读,包括这本《数据化决策》。 开篇用三个量化小故事一下子抓住了我的心, 让我忍不住要看下去, 其中的这段摘要更是讲透了如何开展量化。 记住, 量化的概念是“减少不确定性”, 而且没有必要完全消除不确定性。 这是本书的核心观点。

对于如何量化,这里也做下笔记, 对一些常用的数据描述给给复习一下:

众数

数据中出现频率最高的数值

中位数

将数据从小到大排列, 位置处于中间的数值

方差

每个数据与平均值的差值的平方,再取平均值

极差

最大数减去最小数

上下四分位点

将数据从大到小排列, 位置处于前1/4或是后1/4的数值

数据分析是基于公司日常业务的观察,检测, 分析和优化,而数据挖掘是基于数据库已有数据使用各种数据挖掘算法进行深度挖掘与探讨。 机器学习算是数据挖掘的一个分支。

分析更像是对已有对象的全面描述,刻画,梳理后得出结论, 而挖掘更倾向于对对象的解剖,分解, 透视,发现不为人知的价值。

1
2
3
4
5
6
7
			数 据 库
			 |   |
			业务 算法
	  |—————|  |—————|
	数据分析       数据挖掘
	  |              |
	目的实现       业务探索

图表的使用

  • 折线图传递变化趋势的信息
  • 饼状图传递组成成分的信息
  • 柱状图传递数值大小的信息
  • 散点图传递数据集中度的信息
  • 面积图传递数值累计的信息
This post is licensed under CC BY 4.0 by the author.

Recent Update

    Trending Tags

    Contents

    Trending Tags