如何用数据挖掘的方法做比较准确的用户画像?

论坛 期权论坛 期权     
莫小璟   2018-9-28 00:21   5368   6
分享到 :
0 人收藏

6 个回复

倒序浏览
2#
观察家  1级新秀 | 2018-9-28 00:21:28
STC(微信公众号:Social Talent)

具有哪些特征的人群在关注着 iPhone6S 的发布?
坚果手机的七彩背壳到底打中那一群用户?
吴亦凡的粉丝里到底有多少是潜在手游玩家?

移动时代的营销,得用户者得天下。营销战役早已不仅仅停留在创意层面,企业从用户角度的思考越来越深入。似乎不谈精准投放、数据分析、用户画像,都不好意思说自己还在做营销。诚然,移动社交、大数据技术为营销行业展开了一幅全新的画卷,让营销人第一次有机会从另一个视角接触和分析用户,第一次在数据中看到了我们未曾接触的、让我们感到无比兴奋的信息宝藏。但热潮之后更多是冷静下来的思考,用户画像的本质是什么?用户画像可以有什么用?制作用户画像的逻辑是什么?更多深层次的问题值得我们进一步思考和探讨。


用户画像是标签化的用户行为特征交互设计之父Alan Cooper最早提出用户画像(persona) 的概念:“Personas area concrete representation of target users.”用户画像是从真实的用户行为中抽象出来的的典型用户模型,企业通过收集与分析消费者的社会属性、生活习惯、消费行为的主要信息之后,完整描述产品(或服务)的目标用户特征,为企业中所有与用户有关的决策过程提供信息基础,指导企业的产品服务研发和市场营销。

用户画像的核心在于给用户“打标签”,每一个标签通常是人为规定的特征标识,用高度精炼的特征描述一类人,例如年龄、性别、兴趣偏好等,不同的标签通过结构化的数据体系整合,就可与组合出不同的用户画像。



用户画像源于企业对用户认知的渴求所谓用户画像的提出,根本上是源于企业对用户认知的渴求,在营销决策的过程中,企业关注的重心不外乎两类,“如何做出用户更喜欢的产品”,“如何把产品卖给对的人”,解决这两个问题离不开对用户需求的洞察,因此决策者不可避免的要考虑两类人:

现有用户- 我的现存用户是谁?为什么买我的产品?他们有什么偏好?哪些用户价值最高?

潜在客户- 我的潜在用户在哪儿?他们喜欢什么?哪些渠道能找到他们?获客成本是多少?

为了回答这些问题,企业必须通过各种方式不断的收集用户信息,最初可能只是通过问卷调查、用户访谈等少量、定性分析的方式进行,当样本的数量逐步提升,这些用户的信息将会以更加标准化、更简单的方式描述出来,形成一个一个“标签”,这也就形成了用户画像的雏形。因此,用户画像并不是大数据时代的“专利”,大数据技术的应用,拓展了企业获取数据的来源和处理数据的方法,让企业有机会得到更多的用户样本,从海量数据中找到那些真正对自己有价值的数据,从更多维度描述自己的用户画像。

对内指导完善产品 对外推动精细营销用户画像作为企业目标用户的真实写照,在企业的不同决策环节中都将发挥作用,归纳起来主要是以下两个方面。


1对内完善产品,优化用户体验

指导产品研发:改变闭门造车的生产模式,生产逻辑从“造什么用户买什么”逐渐转变为“用户需要什么就造什么”。通过用户需求的调研,设计制造更加适合用户的产品,提升用户体验。产品研发初期没有销售数据的时候,用户画像将直接反应企业对用户的了解程度,决定产品定位。

完善产品运营:产品(或服务)的销售过程中,用户画像将帮助企业改善产品运营,优化与用户交互的流程与体验,提升已有用户的平台粘性和交易转化率。

2对外促进销售,拓展商业模式

精细化营销:根据产品特点,更加精准地找到目标用户,在用户偏好的渠道上进行内容投放,适时交互促成购买行为,实现精准获客。

数据服务:平台的用户信息和用户行为将成为重要的数据源,指导新业务的拓展或为他所用。

数据是构建用户画像的核心1三类基础数据整合

1、用户数据



静态信息数据:用户相对稳定的信息,主要包括人口属性、商业属性等方面数据。这类信息,自成标签,如果企业有真实信息则无需过多建模预测,更多的是数据清洗的工作。

动态信息数据:用户不断变化的行为信息,用户搜索了什么商品,浏览了哪个页面,赞了哪条微博消息,发布了积极或消极的评论……这些都是互联网上的用户行为,将成为用户画像中偏好特征和消费行为特征的主要依据。

2、商品数据


客观商品属性:商品的功能、颜色、能耗、价格等事实数据。

主观商品定位:商品的风格、定位人群等。

商品数据可以认为是商品的标签,需要和用户标签进行关联和匹配。

3、渠道数据



信息渠道:用户在信息渠道上获得资讯,如微信、微博等社交网络。

购买渠道:用户在购买渠道上进行商品采购,例如商品官网、电商平台等。

不同类型的用户对渠道有不同的偏好,精准的选择对应的渠道才能提高效率和收益。

2数据建模方法

有了上述三类数据之后,需要根据用户行为构建相应的数据模型产出标签权重。每一次的用户行为,可以详细描述为:什么用户,在什么时间,什么地点,发生了什么事。

什么用户:即用户识别,其目的是为了区分用户。互联网主要的用户识别的方式包括Cookie,注册ID,微信微博,手机号等,获取方式由易到难,不同企业的客户信息数据化程度有所不同,用户识别的方式也可按需选取。

什么时间:在用户行为中,普遍认为近期发生的行为将更反映用户当下的特征,因此过往行为将表现为在标签权重上的衰减。

什么地点:即用户的接触点,包含了两个潜在信息:网址和内容。内容决定标签,网址决定权重。例如,一瓶矿泉水,超市卖1元,景区卖3元,酒店卖5元,商品的售卖价值,不在于成本,而在于售卖地点,这里的权重可以理解为用户对矿泉水的需求程度不同,相应的也有不同的支付意愿。类似的反映到互联网,用户在天猫浏览了iPhone6的信息和在苹果官网浏览也将存在权重的差异,因此,网址的内容反映了标签信息,网址本身则表征了标签的权重。

做了什么:用户的行为类型,例如浏览、搜索、评论、点赞、收藏等,同样反映的是标签的权重。



从上述建模方法中,我们可以简单勾画出一个用户行为的标签权重公式:

标签权重=时间衰减(何时)×网址权重(何地)×行为权重(做什么)

举个直观的例子,“B用户今天在苹果官网购买了iPhone6”反映出的用户标签可能是“果粉1”;而“A用户三天前在天猫收藏了iPhone6”反映出的标签可能只是“果粉0.448”,这些不同用户的标签及相应的权重将在后续的营销决策中发挥指导作用。



3算法输出

通过数据建模,企业可以有效地为能覆盖到的用户打上标签,之后结合渠道信息和商品信息,企业可根据需求定向地选择数据挖掘的方法输出结果,在营销决策中,可能得到的结论例如“具有标签a的人集中购买了商品A”、“购买商品B的用户同样会对商品A感兴趣”、“商品A的购买人群主要集中于渠道c”等等,这些信息将直接指导企业完成营销决策。在这个过程中常用的算法包括聚类和关联规则等,本文不深入展开,这些算法的核心逻辑可以认为是利用现有事实对未来进行预测的过程。



通过上述介绍,本文简单阐释了用户画像及其构建逻辑。但归根到底,技术只是载体,其最终还是为了服务于企业基于用户的营销决策。在市场的迷雾中,用户画像像是一座桥梁,跨越企业与用户之间的信息鸿沟,大数据的手段把用户错综复杂的消费行为和难以捉摸心理状态通过更加理性的方式为企业呈现出来,让未来企业营销决策真正做到“有理有据”。
3#
小草莓  4级常客 | 2018-9-28 00:21:29
1、通过网站后台埋点,有网站数据库;
2、然后通过用户数据分析了解用户行为、用户特征,甚至用户建模,分享一些用户维度的数据模板,比较简单,只是提供一些思路。
https://me.bdp.cn/share/index.html?shareId=sdo_a77fa6b9e48a19e02cc2923f46618344
3、要是你会SPSS建模那就更好了。
4#
Terry Meng  3级会员 | 2018-9-28 00:21:30
5#
姚凯飞  1级新秀 | 2018-9-28 00:21:31
举个例子



七步人物角色法也可以借鉴

6#
刘凯  4级常客 | 2018-9-28 00:21:32
画像主要有两部分,人口学基本属性和行为偏好。

基本属性包含性别,年龄,地域,职业等。最准确的还得是直接获取用户的基本信息,如果通过数据挖掘的化基于用户历史行为分析,可以是简单统计,也可以是基于一部分种子数据的有监督学习。

行为偏好方面要想准确的描述用户画像,我觉得基本的是要进行多维度,多粒度的刻画,把影响本场景下能体现用户对item不同偏好的维度尽量覆盖到,同时在同一个维度下展现多粒度偏好。这样,描述一个用户既有广度又有深度,这些特征具有足够的泛化能力,又有精准性,方便不同的使用需求。
7#
蛋解创业蛋蛋  4级常客 | 2018-9-28 00:21:33
蛋解创业的小密圈趋势报告分析上线已经20天了,到现在为止已经有了近200个小伙伴加入到了这个私密的小圈子里和我们一起把握未来的趋势,但光看每天推送的报告我相信还是有很大一部分小伙伴没有看出其中的门道,今天我就给大家普及一个小小的知识点,什么是用户画像,用户画像对你的重要性是什么。
下面我从以下这四点来重点来说说:
1、什么是用户画像?
2、用户画像有什么用处?
3、如何进行用户画像分析?
4、在做用户画像分析中的难点是什么?
首先,什么是用户画像呢?
其实这个很好理解,所谓用户画像就是用不同的标签或维度来定义一个人。而这些维度既可以是实际的,也可以是抽象的。比如:年龄、性别、体重、学历、财富,也可以是星座、性格、生活习惯等等。归根结底就是说,所有一切你可以想到的维度都可以建立或组成一个用户画像,而建立用户画像的目的就是用来更好的用同一纬度的数据来划分、梳理、描述这个区间内的用户。
第二,用户画像有什么用处?
很多时候我们在做事情前都要搞清楚一点就是我这件事情的服务对象是谁,他想要什么?如果做一个产品都不知道目标用户是谁,用户的使用习惯和使用场景是什么,那这个产品上线后就很可能面临着失败。
举个例子,当年我做了一款基于iphone4的双卡双待手机壳,当时仅仅是觉得这个技术很好,一定可以大受欢迎,然后就去工厂打样做货了,我们当时的用户画像都是建立在假想的基础上,认为购买这个产品的用户会是商务人士、大老板,因为大家要有一个工作号和一个生活号。但结果可想而知,产品一共才销售出去了几百个,那么我们的问题到底出在了哪里呢?
第一个问题在于建立用户画像的参考维度过于单一,我们仅仅列出了用户的职业维度,而忽略了用户的年龄、收入状况、日常使用手机的习惯、用户阅读广告的偏好,颜色偏好等等这些维度。因此我们设计出的产品可能在定价、款式、颜色、推广区域、营销文案上都没能直达精准用户的所在区域。
第二个问题在于我们忽略了iphone手机用户的购买心理和使用习惯,所以做出了一个既厚又不够简洁的手机壳。
从上面的例子就可以看到用户画像的建立和分析到底有多么的重要,如何产品定位、如何拓展用户、如何提高用户的满意度都离不开用户画像的精准。
总结下,用户画像承载着两个重要的使命:
1.如何精准的找到你的目标用户。
2.如何精准的了解你的现有用户。
第三,如何进行用户画像分析?
这一点取决于你想要什么样的用户和掌握了怎样的数据源。有了以上两点才能够进行你自己的画像设计和分析。这就好比你想和一个姑娘约炮,要先知道她喜欢什么,然后再看你哪个领域比较擅长,然后才能确定你到底是拉着她去吃西餐听歌剧还是带她去滑雪然后泡温泉扑倒她的几率更大一些。
举两个商业场景你来参考:
如果你是一个做内容的微信公众号,希望可以提高用户的转发,那么你的核心维度应该涉及到性别、年龄、阅读时间、热门关键词等展开,数据收集的来源有很多网络上公开的地方,如新榜这样的垂直数据发布平台。
如果你是一个线下餐厅的经营者,希望可以提高用户的粘性,你的核心维度应该涉及到收入状况、消费时段、年龄、口味偏好、活动区域等,数据来源可以根据进店人群做信息采集。
由上可见针对不同的行业,不同的应用场景,不同的目标,需要建立不同维度的用户画像,也要从不同的来源获取数据并分析。而每个维度都会有不同的标签属性,下面我就给大家归纳出几个主要的区域:
1,人口维度:包含性别、年龄、体重、星座、血型等基本特征。
2,资产维度:收入、学历、车辆、房产、人脉关系等基本特征。
3,兴趣维度:运动、学习等基本特征。
4,消费维度:线上消费、线下消费、品牌粘性、消费偏好等基本特征。
5,位置维度:省份、城市、区域、住址、工作地等基本特征。
6,设备维度:手机终端、电脑终端等基本特征。
然后我们再来说数据来源,首先现在很多的互联网平台和垂直领域都可以获得相关的数据,这里不做过多的阐述。
大概的来源可以分为以下几类:
1.自行收集数据(如调查问卷)
2.外部官方渠道的数据(如行业趋势报告)
3.市场采集数据(如进店自生成数据)
从数据类型上看有以下几类:
1.社交数据
2.交易数据
3.位置数据
4.运营数据
5. ······
有了以上的标签维度、来源渠道和分类,我们做一个用户画像的建设到底需要怎样的步骤呢?
1.数据的抽取:从不同数据源抽取要计算的数据素材。
2.数据标准化:针对抽取的数据将其修改成你自己设定的标准格式,同时将错误数据和无效数据剔除。
3.数据关联:不同来源的数据有不同的主题和属性,将所有不同渠道收集的数据关联起来是建立数据的核心步骤,比如我从喜马拉雅FM获取到了目前喜马拉雅的用户地域分布,又从新榜收集到了关于音频用户的收听场景,同时从我自己的《蛋解创业》节目中收集到了用户内容偏好,因此我就可以通过这一步串联出大概我的内容制作方向、频率、上线时间、节目时长等等。
4.模型设计:针对不同数据内容和业务目标设计不同规则和算法进行模型的建立,然后使用小样本数据来验证模型的可靠性。
5.标签计算:在模型可靠性验证的基础上,安排生产运营等工作来进一步验证并改善或重新计算模型。
还是拿我们自己的产品来举例子,我们因为做了《蛋解创业》这样一档创业类节目,获取了一定的用户数据,同时通过行业内的趋势报告分析获取了整个大市场的用户数据后,我们制作了一档基于目前用户感兴趣的,且和行业趋势吻合的付费内容《众创实战派》,然后又根据众创这个节目的用户分析出,趋势报告分析可能是这部分用所需要的内容,因此我们建立了一个每天精选发布最新的趋势报告的小密圈,由此进一步转化和留存住用户。
一个不好的例子是我们推出了一款周边定制的瓜子产品,销量就很一般,原因就在于这个产品和我们目前的用户画像偏差略大。
以上的例子就很好的诠释了用户画像的重要性和应用的流程和场景。
第四,在做用户画像分析中的难点有哪些?
在现实生活中,一个人可能有多重身份,也可能有多部手机,也可能有多个爱好和多个qq号。比如一个家庭可能有两个手机、一台电脑,一个笔记本、一个ipad,爸爸用笔记本办公,妈妈用台式机淘宝,孩子用iPad玩游戏,一个产品终端代表了多个实体特征,且无法拆分。所以要想唯一完整的定义其中一个用户的画像很难。因此在业务领域中追求标签的完整性有时是不可能完成的,我们应该更多的关注标签的代表性,无论是一对多还是多对一,只要通过标签筛选出想要的目标群体就好,即使是一台公用的ipad,游戏也表明了家庭中有成员有该方面的兴趣偏好。
另外该如何获取和找到那些有价值、且正确的数据呢?我之前有写过一篇如何发现并判断一份报告质量的文章,大家可以去蛋解创业的微信订阅号搜索:《不看趋势报告的创业者都挂了,因为》那篇推文。
谢谢大家的观看,希望和大家一起共同把握未来,我是你们的拆报告小能手蛋蛋。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:
帖子:
精华:
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP