Git中展示的是本人在唯都工作时期经手的部分项目代码与报告截图,且与简历中项目经验一栏对应。主要目的是展示编码能力与数据分析与建模思路。代码均是本人独立编写,数据报告分析思路由本人与业务同事沟通后得出。
其中内容主要分为数据分析、数据建模与报表自动化三类。数据分析项目与报表自动化项目代码的产出结果为各类报告,数据建模项目的结果直接回传到数据库。所使用的语言根据对应项目不同,由SQL或Python完成。其中前者在SQLserver环境中取数完成。后者主要使用数据分析、自动化与建模的模块,如numpy, pandas, scipy, sklearn,win32com等。
以下将对代码与分析报告做简要说明。所有代码均已删除敏感信息,且下文所展示的报告页截图大部分数据均以"XXX"代替,数字也经过修改,但数据所体现的趋势与真实的保持一致。
工作环境中,所有的功能函数均以模块形式放置并调用。Git中为展示方便将所有内容都放在一起,并使用"if name = main:"分割功能函数与调用函数。SQL代码主要用在不固定的分析报告上,故没有使用存储过程拉取数据,根据分析思路整理。此外各个项目中均有注释说明代码意图或分析思路。
以下是对三类项目实现的功能与实现方式的说明:
- 数据分析类项目:数据均存放于数据库中,所有取数与分析均在SQLserver环境中进行,并将数据与分析结论整理在Excel或PPT中。
- 报表自动化类项目:从Excel或数据库中拉取数据数据,并根据报表逻辑处理数据后将结果自动刷入Excel或PPT中。
- 数据建模类项目:使用的历史数据训练模型,并通过sklearn中joblib模块固化保存。项目上线后,客户将数据以数据流形式传入数据库,通过设置定时任务自动从调用Python拉取数据并进行处理,最后回传数据库。代码中没有建模调参的过程,但提供用于查看调参结果的函数。
项目对应的业务均是某美妆品牌,而唯都是该品牌CRM部门服务商。该公司每年都会举办不间断的小样申领活动,如A小样的申领期为1.1-2.1,B小样的申领期为2.2-3.1,如此不间断举行。以下报告中涉及到的业务字段说明:
- 申领&核销:品牌线上线下等多个渠道投放广告吸引客户申领小样,但用户申领后核销渠道只能是线下门店。唯都数据库中有所有活动的申领和核销数据明细。
- 已购买:数据库中没有用户购买明细,仅有其他服务商推送的用户属性标签用以判断客户是否购买。已购买人数为Active,Lapse,History User三类标签数总和,其中Active又可分进一步为HV/MV/LV三类。
客户作为CRM部门,主要的业务目的是提高品牌知名度并吸引客户申领与核销小样,将流量引导至品牌公众号。故报告也是基于此业务目标分析、整理数据并出具。以下是每一页PPT逻辑的简要说明。
主要用于区分客户价值的PPT页。按照分析结果,将客户分别按照申领次数与是否购买分别切分,随后按照已购买客户与潜客的各自行为或标签进行进一步拆解以形成体系,如下图:
| 按是否购买划分 | 按申领次数划分 |
|---|---|
| 已购买 | 按照标签进一步拆解 |
| 未购买 | 按照行为进一步拆解 |
PPT2中关于小样申领的进一步细分,通过具体活动的申领核销情况查看用户价值。

客户品牌公众号上线新功能,用户与公众号进行互动后48小时,后者推送邀请申领小样的卡片信息。报告分析功能是否提高申领量,是否产生负面影响。



