深入浅出数据分析-读书笔记

来源:互联网 发布:hits算法计算三轮 编辑:程序博客网 时间:2024/06/09 14:33

概要

本书是说明类的类型,主要内容是告诉我们该如何做数据分析。主要从一下几个方面进行阐述:

1数据分析的过程

确定问题-分解问题(将一个大问题分解为几个小问题)-评估(对每个问题使用数据评估)-决策 (循环执行这四个过程)。验证理论需要进行实验对比,检验理论(要注意对照组的设置)。

2数据图形化

  • 散点图: 找出数据的规律和特征。可以用来查看数据的总体分布趋势,探索原因。
  • 如何展示多种变量的关系:将多张相似的散点图相邻排放。

3假设检验:

  1. 列出各种可能。
  2. 利用证据排所有的不可能的假设。证伪法。
  3. 排出没有用的证据,然后考虑证据的诊断性,即时相对似然性。给剩下的的可能性排序。
  4. 具有新的证据之后重新进行检测。

4贝叶斯统计。

基础概率随着实验的进行会不断变化。

5主观概率。

将概率使用具体的数字描述,能减少分歧。

6线性回归

  • 线性回归可以将数据分区,提高进度。
  • 分隔的目的也有助于管理误差
  • 线性回归预测需提供提供均方根提供误差范围和描述数据范围。
0 0
原创粉丝点击