数据挖掘的广告作弊行为分析
来源:互联网 发布:淘宝抢购时间 编辑:程序博客网 时间:2024/06/02 11:59
反作弊方法
反作弊方法
1 基于异常值分析的方法
1.1 基于统计学的异常值检测
含义:数据集若服从正态分布,与均值之间的偏差达到或超过3倍标准差,可以对点击率,转化率,对话时间差进行分析
缺点:只能检测单个变量值,每次检测只能局限于单个指标
1.2 基于距离和密度的异常值检测
优点:可以结合多指标进行分析
1.3 基于偏差的异常值检测
概念:通过检查数据的主要特征来确定异常对象。如果一个对象的特征过分偏离给定的数据特征,则是异常对象
主要方法:
1.OLAP数据立体方法:利用在大规模的多维数据中采用数据立方体确定反常区域,如果一个立方体的单元值明显不同于根据统计模型得到的期望值,该单元被认为是孤立点
2.点击流分析:发现不规则的点击过程,可以作为点击欺诈的怀疑对象
2 基于规则的识别方法
2.1 同一IP的用户单日点击次数超过多少即可视为作弊
2.2 某个广告位的点击率突然大幅增加可能存在作弊
3 基于分类的方法
概念:根据数据挖掘分类算法对历史数据进行模拟,通过构建分类器来对点击行为进行预测
缺点: 1.需要事先对历史点击行为进行分类,即标注出作弊的数据 2.对数据的完整性和质量要求较高
名词解释
跳出率:
1.定义:指进入某一网站之后不再继续浏览,而直接离开网站的访客比例
2.意义:跳出率越高,网站的粘性就越低
二跳:
1.定义:当网站页面展开后,用户在页面上产生的首次点击被称为“二跳”,二跳的次数即为二跳量,二跳率=二跳量/浏览量。
2.意义:二跳率越高,网站的粘性越高
八月 19, 2015.
- 数据挖掘的广告作弊行为分析
- 关于广告防止作弊行为的处理
- B2C 网站的行为分析与数据挖掘
- B2C 网站的行为分析与数据挖掘
- 面向移动互联网的用户行为分析和数据挖掘
- 微博特征与行为的大数据挖掘分析
- 百度联盟发现作弊行为的分析以及应对作弊行为的措施
- 数据挖掘进行用户行为分析
- 基于用户行为的数据分析与挖掘+分布式日志管理系统
- Google AdSense互点广告作弊分析
- 利用数据挖掘技术分析用卡行为
- 互联网广告作弊的危害,以及如何反作弊
- 百度对作弊行为的惩罚
- 搜索引擎如何鉴定seo的作弊行为
- 从Google Analytics分析AdSense的广告点击行为
- 广告联盟的几大防作弊技术
- 移动广告作弊流量的浅潜规则
- 【大数据部落】(数据挖掘)如何用大数据做用户异常行为分析
- rotate list
- HDU 5396 Expression (数学期望+区间DP)
- 九度OJ 题目1072:有多少不同的面值组合?
- python之路-----web应用的创建(python3.4下,django连接mysql)
- java之Cookie详解
- 数据挖掘的广告作弊行为分析
- Spark+Kafka的Direct方式将偏移量发送到Zookeeper实现
- HDU 2821 DFS
- 编译Hadoop source code
- 有向图的强连通分量的tarjan算法总结
- 运用Autoconf和Automake生成Makefile 2
- 采用SharedPreferences保存用户偏好设置参数
- 查找字符串中的单词并替换
- hdu 5396 区间dp+组合