商旅用户画像系统设计

admin2022年03月31日 11:22
cover

用户画像作为让大数据“走出”数据仓库的典型落地应用之一,是企业精细化运营和精准营销服务的基础服务设施。

商旅用户画像标签体系:

深刻理解 To B 和 To C 的场景差异有助于指导后期标签建模。

To B 场景下用户画像是由公司(corp id)和用户(user id)共同构成的画像,主要包括公司维度的画像,用户维度的画像。To C 场景下,一个 user id 就是一个用户,用户与用户之间大部分场景下的行为是相对独立的。To B 场景下,一个corp id 对应一个公司,一个corp id 包含多个 user id,user 与 user 之间的行为信息很多时候是可以互补的。

商旅用户画像数据流转结构:

用户画像数据的生产与消费通常涉及数据收集、数据清洗、特征生成、标签建模、标签应用等多个环节。整个工程实现方案中离线计算主要涉及Spark、Hive等框架 ,实时计算采用的是Flink、Kafka等框架,数据存储主要涉及Hive、Redis、MongoDB。下图为携程商旅用户画像的数据流转整体结构图。

商旅用户画像查询服务架构:

用户画像查询服务作为基础数据服务,由于被业务运营、风控、算法等多个需求方依赖调用,对响应时间和服务可用性都提出了非常高的要求。

用户画像标签体系的构建是一项系统工程,踩过很多的坑。许多标签和业务强相关,研发同学需要深刻理解业务场景才能做好画像,此外为保障服务的可用性,双IDC部署,服务熔断、服务降级都是必须要做的。

用户画像在B端应用场景主要有反弊行为识别、产品个性化推荐排序、客户精细化运营管理等,应用的上线可以检验画像标签是否合理完善。

数智赋能每一个岗位