您当前的位置:主页 > 文化 > 本刊禁止抄袭,雷同率10%内,请勿一稿多投,文责自负,点击论文查重。
基于数据挖掘的互联网企业用户画像分析
我要投稿 论文查重 时间:2019-01-23 来源:现代经济信息
摘  要:数据的价值不断提升,对用户行为数据的分析可以更精确快速地形成用户标签,为企业发展提供数据信息基础。论述了关于用户画像的研究现状,探究了在数据挖掘基础上利用聚类分析方法和python语言对互联网企业的用户画像构建,对用户画像的应用领域进行了介绍,并总结了用户
关 键 词:数据挖掘;用户画像;标签
作  者:王苗苗
单  位:安徽大学管理学院
正  文:

大数据时代,许多实体企业已经争先开始向互联网企业进行改革。在第41次《中国互联网络发展状况统计报告》中显示,数字经济繁荣发展,电子商务持续快速增长2017年电子商务等行业的收入水平增速均在20%以上,发展势头良好。中国已经上市的互联网企业超百家,电子商务的服务模式不断创新、信息技术能力迅速增强[1]。在竞争如此激烈的环境下,互联网企业必须以满足消费者需求为导向,以智能化技术为抓手,向用户提供个性化服务,才能在群雄逐鹿的时代健康发展并且占领一席之地。
用户画像也称为用户角色,是用来勾画用户(用户背景、特征、性格标签、行为场景等)和分析用户需求并且满足用户的产品设计的有效方法之一,旨在从海量数据中尽可能分析提炼出有关用户的信息全貌,从而帮助企业将数据转化为商业价值[2]。通俗的来讲,用户在互联网上的基本信息、社会交往以及浏览、点击、评论等碎片化的数据被组织存储起来,形成一系列的标签,即用户信息标签化。这是在互联网发展下逐渐产生的一种用户行为分析方式,其应用也同时促进了互联网市场的不断发展。
大数据分析技术在各企业以及政府部门中应用越来越广泛。文章探究了基于数据挖掘技术的互联网企业用户画像的构建,并综合分析了用户画像技术的应用情况。
1相关研究综述
1.1概念
数据挖掘,也叫数据采集,是基于统计分析基础上的一种数据分析技术。从技术角度来定义:指在大量的、不完全的、有噪音的数据中,提取人们事先不知道的、潜在有用的信息,是一种特定信息的搜索过程[3]。从商业角度来定义:是一种商业数据信息处理技术,主要对商业数据库中的业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据并指导商业决策[4]。利用数据挖掘技术,用户在互联网中的行为可以被生动的描述出来。
1.2用户画像研究现状
近年来随着大数据的发展,用户画像也被越来越多的学者所研究,并且被应用到各种领域以满足不同的需求。其中An J, Cho H, Kwak H等人,设计了一种基于社交媒体实时数据的自动分析方法,实现了实时创建用户画像[5]。Jiabin Li, Zhi Xue 提出了一种利用大数据技术分析用户画像的新方法,建立了一个数据存储和搜索模块的封装系统[6]。Zhang X, Brown H F, Shankar A提出了一种定量的自下而上的数据驱动方法来创建用户画像,以便能够更好的反映用户在产品使用过程中的实际工作流程[7]。刘海等人提出以4C理论为基础构建“用户画像”数据库,通过数据挖掘来达到对消费群体进行细分的目的,能够准确的定位消费者群体的需求[8]
1.3数据挖掘在用户画像中的作用
我国许多学者在此方面进行了一些研究。黄章树等依据数据挖掘技术提出了一种新的营销策略,该营销策略结合内容提供企业的实践经验及用户的实际数据,在保留重点客户、激活潜在客户、降低客户流失率等方面取得良好的效果[9]。李鹏,陈晓东等提出基于客户端用户浏览行为的数据采集方式,进行Web使用记录挖掘,并且其实用性得到很好的验证[10]。陈泽菡对客户细分、客户价值、交叉销售及客户流失方面等电信业务进行主题分析,通过数据挖掘技术得到大量的用户数据和业务数据中的潜在商业价值信息,实现精准营销使企业效益最大化[11]
一般来说,用户画像已经成为企业增强竞争力的有效技术方法之一,数据挖掘技术能够准确识别和分析目标用户,对用户群体的差异化可以进行细分。然而,不同行业的目标用户及不同的领域有较大的差异,所以我们需要有针对性的构建用户画像。
2用户画像构建
构建用户画像的关键是利用本体对用户画像领域中的标签进行表示、验证、推理和解释。本体一般包括类、属性、实例、公理和推理规则[2]。这里将用户画像的构建分为数据采集、用户行为建模、构建用户画像三个部分。
2.1数据采集
一般情况可以将用户数据分为用户属性数据和用户行为数据。用户属性分析,主要涉及静态数据,如姓名、性别、年龄、籍贯、薪资、职业、教育程度、消费水平等,这些基本属性信息往往由用户注册使用某网站或者APP后就可以通过统计直接获取,一般用于刻画静态用户画像以便对用户群体进行差异化的细分。用户行为分析,主要涉及用户动态特征及动态变化趋势,如点击率、访问时间、访问深度、收藏率、购买率、评价等用户行为时所产生的数据,这些数据则可以根据挖掘相应网站的用户行为日志或相关数据来获得。为了全面的分析用户画像获得更准确的用户信息,这两个方面都必须具体考虑。
2.2基于数据挖掘技术的用户行为建模
以满足用户的需求为目标,要以用户原始数据为基础,需要对用户行为进行建模,从而为分析用户偏好等重要商业信息提供大量的数据基础。用户画像建模往往就是用户信息标签化,将用户的行为偏好数据及潜在的兴趣意愿等进行存储和分析,形成精准的语义信息。
数据挖掘的方法有很多,文章简单介绍一下聚类分析方法。聚类分析是指在没有任何先验知识的前提下,依据一定的研究和处理将数据聚合成不同的类[12],并且描述了类间的差异性及同一类中的相似性,是认识和探索事物内在联系的一种有效手段[13]。从数据集生成不同类别概念的过程,实质上就是一种概念的聚类分析过程。互联网企业将每天产生的大量用户数据进行聚类分析,通过对这些信息进行分析处理,可挖掘到用户的某些行为特征及相似用户群体,以便进行科学的商业决策。
数据挖掘是通过统计数据、在线分析处理等诸多方法来实现一系列统计分析目标[14]。Python是一种程序设计语言,语法简洁而清晰、可读性比较强、便于维护,并且具有丰富和强大的类库,是实现数据挖掘方法的一种工具[15]。数据挖掘的算法,可以由python具体实现,简单方便。
2.3构建用户画像
通过统计分析建模、数据挖掘技术形成一整套用户标签体系,能够预测用户未来数据,极大地支持了精准营销的实现,从对潜在用户的挖掘到吸引新用户,再到老用户的培养与流失用户的回流,体现了其巨大的商业价值。
3用户画像的应用
3.1精准营销
用户画像可以帮助互联网企业较为精准的发现客户类型,包括忠实客户、普通客户、潜在客户等,针对不同的客户类型可以提供不同的服务。首先,能够准确识别和分析目标用户。比如某女性在某电商平台上搜索了化妆品和衣服的商品信息,留下了个人足迹,平台就会针对用户所留下的浏览痕迹进行精准的商品推荐,使用户在更短的时间内就可以准确的定位到他们可能喜欢的商品,从而达到增加电商销售额的目的。其次,能够在精准服务中避免用户流失。随着互联网的发展,各大电商企业竞争日趋激烈,应该利用用户画像提取用户的隐含信息,充分反映客户的潜在需求、及时跟进服务,在针对性服务中吸引新用户、挽留老用户[16]
3.2征信
由于用户画像提供了丰富的用户标签,其中包括个人基本信息、购买记录、消费水平、薪资水平、受教育水平、工作单位等,这些记录可以为个人信用评价提供详细的数据参考,对用户的信用度进行较为全面的评估分析。例如支付宝中的芝麻信用、蚂蚁花呗和蚂蚁借呗。支付宝是我国互联网支付的领跑者,其附带的芝麻信用能够客观呈现个人的信用状况。用户的芝麻信用分数越高代表其信用度越高,并且已经在信用卡、消费金融、融资租贷、酒店、租房、出行、公共事业服务等上百个场景为用户和商户提供服务[17]。比如,当某人芝麻信用的分数达到一定等级后可以享受共享单车免押金服务。另外,平台在分析了用户的芝麻信用度、购买行为、评价行为、以及账号等级等因素之后,可以丰富该用户标签,这些标签决定了用户蚂蚁花呗和蚂蚁借呗的具体额度。
3.3搜索引擎
随着互联网用户数量的不断增加,对于信息的需求也在呈持续上涨的趋势。如何更有效的利用信息技术为用户提供更好的服务是现在互联网企业的一个重要研究问题。
搜索引擎是一种重要的服务模式,其技术的不断完善很大程度上降低了用户的搜索成本。以百度收索引擎为例,当用户开始注册使用,就可以通过采集该用户的搜索记录、点击率、日常访问日志等行为数据构建相应的用户画像,分析用户接下来想要了解的相关信息,进而将用户可能感兴趣的内容按照结果的相关性排列在搜索结果的前列,优化用户体验。其基本思路是将行为相似用户聚类,为不同类别的用户给出不同排序的结果,同时还考虑了用户的位置等信息。    
3.4个性化业务定制领域
大数据时代信息数量激增,同时信息冗余量也在不断上升,用户很难从海量的数据信息中快速的检索到个人感兴趣的信息内容。对于互联网中的内容服务商来说,需要针对用户的需求及时提供相应的服务,提高用户体验,增加用户的满意度[18]。因此,开发了个性化业务定制功能,用户画像通常被应用到此领域。例如《今日头条》,这是一款基于数据挖掘的推荐引擎,为用户推荐信息,提供连接人与信息的服务的产品[19]。其宣传标语为:你关心的,才是头条!根据用户的行为习惯、阅读记录及兴趣偏好为其定制个性化服务,为不同的用户推送不同方向的信息内容,极大程度满足了用户的需求,从而提升用户忠诚度与黏性。
4结语
用户在互联网上的行为轨迹和数据被充分的记录下来,企业利用这些近乎完整的标签能够更精确的勾画出用户画像,从而制定发展战略。值得注意的是,在享受用户画像带来的利益的同时,也带来了前所未有的挑战。互联网企业掌握着用户的几乎全部信息,“信息安全”、“数据隐私”、“大数据杀熟”诸如此类的词汇开始逐渐出现。首先,在信息安全方面,共享充电宝的出现缓解了不少手机用户的燃眉之急,但是其中也存在诸多隐患。2017年3·15晚会曝光了用户在使用充电桩时恶意软件直接被下载安装的现象,用户的信息安全得不到保障,黑客由此便可窃取用户手机内的个人信息包括,甚至能够远程控制支付软件,不输密码就可以购物。此外,数据隐私也是一个让人担忧的重大问题,用户数据的泄漏会导致公众信任的缺失。互联网企业应加强信息技术的利用,在技术上保证用户隐私数据的安全,防范可能出现的风险,如数据丢失,数据非法获取等。其次,互联网企业可以通过用户的日常消费行为,能够判断出用户经常使用什么品牌的手机以及处于什么样的消费水平,然后看人下单,但用户是被蒙在鼓里的。然而个性化服务不是看人叫价,企业要避免技术的贪欲,应该构建与大数据发展相适应的消费权利观念。
参考文献
[1].中国互联网络信息中心.第41次中国互联网络发展状况统计报告[EB/OL]. [2018-04-15].       http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201803/t20180305_70249.htm
[2]. 牛温佳,刘吉强,石川等.用户网络行为画像[M],2016
[3]. Dunham H.Data Ming-Introductory and Advanced Topics [M].New Jersy: Prentice Hall, 2003.
[4]. 安子中.电信行业数据挖掘案例分析[D].北京:北京大学,2005
[5]. An J, Cho H, Kwak H, et al. Towards automatic persona generation using social media[C]//Future Internet of Things and Cloud Workshops (FiCloudW), IEEE International Conference on. IEEE, 2016: 206-211.
[6]. Jiabin Li, Zhi Xue .A Network Datagram and Big Data Based Research on Method of User Profile[C]// International Conference on Computer Engineering.EECS,2017:26-32  
[7]. Zhang X, Brown H F, Shankar A.Data-driven Personas:Constructing Archetypal Users with Clickstreams and User Telemetry[C]//Proceedings of the 2016 CHI Conference on Human Factors in Computing Systems. ACM, 2016: 5350-5359.
[8]. 刘海,卢慧,阮金花,田丙强,胡守忠.基于“用户画像”挖掘的精准营销细分模型研究[J].2015(12):37-47
[9]. 黄章树,王前辉.基于数据挖掘的电信增值业务营销策略研究[J].福州大学学报,2005(4):32-35
[10].李鹏,乔晓东,韩峰,王继田,梁健,张寅生.基于用户浏览行为的数据采集及应用[J].现代图书情报技术,2008(11):56-59
[11].数据挖掘技术在电信精确化营销分析中的应用[D].江西:南昌大学,2010
[12].孙凌燕.基于密度的聚类算法研究[D].山西:中北大学,2007
[13].李雪梅,张素琴.数据挖掘中聚类分析技术的应用.武汉大学学报(工学版),42(3):396-399,2009 
[14].狄浩林,面向精确营销基于数据挖掘的3G用户行为模型及实证研究
[15].赫特兰.Python基础教程[M].2版.北京:人民邮电出版社,2010
[16].张丽娟.基于大数据分析的用户画像助力精准营销研究[J].电信技术,2017(01),61-65
[17].张钰.互联网金融企业的盈利模式——以蚂蚁金服集团为例[D].河北:河北经贸大学,2017
[18].杨双亮.用户画像在内容推送的研究与应用[D].北京:北方工业大学,2017
[19].李源.个性化推荐类新闻客户端推送模式研究[D].黑龙江:黑龙江大学,2017
作者:王苗苗(1993.3.10),女,汉族,籍贯:山东省济宁市,安徽大学管理学院硕士,研究方向:情报学

上一篇:我国服务型政府建设问题与对策 ——以遵义市延安路街道办事处为例

下一篇:信息化教学评价系统下对学生课题学习的影响


版权所有© 2010-2015 《现代经济信息》杂志社 京ICP备15020639号

编辑手机:182-4514-6964,咨询电话:(0451)58863789,投稿邮箱:[email protected]

本站所有文字及图片文责自负,并均受版权法保护,仅供学术交流与参考,未经同意,不得转载!