欢迎您来到懒之才-站长的分享平台!   学会偷懒,并懒出境界是提高工作效率最有效的方法!
首页 > 经验分享 > 其他经验 > 常见的数据挖据之路径分析

常见的数据挖据之路径分析

2018-07-31 566 收藏 0 赞一个 0 真差劲 0 去评论

路径分析是常用的数据挖据方法之一, 是一种找寻频繁访问路径的方法,它通过对Web服务器的日志文件中客户访问站点访问次数的分析,挖掘出频繁访问路径。

cf724082af5c4385a3982fb28dbd5f75.png

路径分析常见思路与方法

1.Sunburst Partition可视化分析探索

通过解析布点获得的用户行为路径数据,我们可以用最简单与直接的方式将每个用户的事件路径点击流数据进行统计,并用数据可视化方法将其直观地呈现出来。

2.基于关联分析的序列路径挖掘方法

提到关联规则分析,必然免不了数据挖掘中的经典案例“啤酒与尿布”。暂且不论“啤酒与尿布”是不是Teradata的一位经理胡编乱造吹嘘出来的“神话故事”,这个案例在一定程度上让人们理解与懂得了购物篮分析(关联分析)的流程以及背后所带来的业务价值。

将超市的每个客户一次购买的所有商品看成一个购物篮,运用关联规则算法分析这些存储在数据库中的购买行为数据,即购物篮分析,发现10%的顾客同事购买了尿布与啤酒,且在所有购买了尿布的顾客中,70%的人同时购买了啤酒。于是超市决定将啤酒与尿布摆放在一起,结果明显提升了销售额。

我们在此不妨将每个用户每次使用App时操作所有事件点看成“购物篮”中的“一系列商品”,与上面提到的购物篮不同的是,这里的所有事件点击行为都是存在严格的前后事件顺序的。我们可以通过改进关联规则中的AprIOri或FP-Growth算法,使其可以挖掘存在严格先后顺序的频繁用户行为路径,不失为一种重要的用户路径分析思路。我们可以仔细考量发掘出来的规则序列路径所体现的产品业务逻辑,也可以比较分析不同用户群体之间的规则序列路径。

3.社会网络分析(或链接分析)

早期的搜索引擎主要基于检索网页内容与用户查询的相似性或者通过查找搜索引擎中被索引过的页面为用户查找相关的网页,随着90年代中后期互联网网页数量的爆炸式增长,早期的策略不再有效,无法对大量的相似网页给出合理的排序搜索结果。

现今的搜索引擎巨头如Google、百度都采用了基于链接分析的搜索引擎算法来作为这个问题的解决方法之一。网页与网页之间通过超链接结合在一起,如同微博上的社交网络通过关注行为连接起来,社交网络中有影响力很大的知名权威大V们,互联网上也存在着重要性或权威性很高的网页。将权威性较高的网页提供到搜索引擎结果的前面,使得搜索的效果更佳。

一、推荐使用迅雷或快车等多线程下载软件下载本站资源。

二、未登录会员无法下载,登录后可获得更多便利功能,若未注册,请先注册。

三、如果服务器暂不能下载请稍后重试!总是不能下载,请点我报错 ,谢谢合作!

四、本站大部分资源是网上搜集或私下交流学习之用,任何涉及商业盈利目的均不得使用,否则产生的一切后果将由您自己承担!本站将不对任何资源负法律责任.如果您发现本站有部分资源侵害了您的权益,请速与我们联系,我们将尽快处理.

五、如有其他问题,请加网站设计交流群(点击这里查看交流群 )进行交流。

六、如需转载本站资源,请注明转载来自并附带链接

七、本站部分资源为加密压缩文件,统一解压密码为:www.aizhanzhe.com

大家评论