一、AI用户识别的数据全景(7大类)
1️⃣ 基础属性数据(Static Profile)
👉 “这个人是谁”
- 年龄 / 性别
- 地区(国家 / 城市)
- 职业 / 行业
- 收入水平
- 教育背景
📌 特点:
- 静态、低频变化
- 用于初始分层
2️⃣ 行为数据(Behavior Data)
👉 “这个人做了什么”(最重要)
- 浏览页面(Page View)
- 点击行为(Click)
- 停留时长(Time on Page)
- 滚动深度(Scroll Depth)
- 跳出率(Bounce)
📌 关键点:
👉 行为 ≠ 说的,而是真实意图的映射
3️⃣ 搜索 & 对话数据(Intent Data)
👉 “这个人想干什么”
- 搜索关键词
- 提问内容(AI对话)
- 问题结构(是否比较/购买/评测)
📌 举例:
| 用户输入 | 意图 |
|---|---|
| “便宜电动牙刷” | 价格敏感 |
| “最好的电动牙刷推荐” | 品质导向 |
| “A vs B” | 比较决策 |
👉 这是TSPR推理核心输入
4️⃣ 交易数据(Transaction Data)
👉 “这个人买了什么”
- 购买记录
- 客单价
- 购买频率
- 复购行为
📌 用途:
- 判断消费能力
- 判断忠诚度
5️⃣ 设备 &环境数据(Context Data)
👉 “用户在什么情况下使用”
- 设备(手机 / PC / 平板)
- 操作系统
- 时间(白天 / 深夜)
- 地理位置(GPS)
📌 例子:
- 深夜搜索 → 冲动消费概率高
- 手机端 → 快速决策型
6️⃣ 兴趣与内容偏好(Interest Data)
👉 “这个人喜欢什么”
- 浏览类别(科技 / 美妆 / 医疗)
- 点击内容类型(评测 / 排行 / 教程)
- 收藏 / 点赞 / 分享
📌 AI提取方式:
- NLP语义分析
- embedding向量聚类
7️⃣ 社交与反馈数据(Feedback Data)
👉 “这个人怎么评价”
- 评论内容
- 评分(1~5星)
- 情绪(正面 / 负面)
📌 用途:
- 情绪识别(NLP)
- 满意度分析
二、最关键的三类数据(AI核心依赖)
如果只能选最重要的👇
⭐ TOP 3:
- 搜索 / 对话数据(意图)
- 行为数据(真实动作)
- 交易数据(结果验证)
👉 三者关系:
意图(想) → 行为(看) → 交易(买)
三、数据如何进入AI识别流程(核心逻辑)
标准流程(你可以直接用于TSPR):
用户数据输入
↓
特征提取(NLP + 行为分析)
↓
标签生成(价格敏感 / 品牌导向 / 学生等)
↓
角色识别(Persona分类)
↓
推荐路径决策
↓
内容生成(LLM输出)
↓
特征提取(NLP + 行为分析)
↓
标签生成(价格敏感 / 品牌导向 / 学生等)
↓
角色识别(Persona分类)
↓
推荐路径决策
↓
内容生成(LLM输出)
四、数据结构化示例(工程级)
一个AI可用的用户数据结构👇
{
“user_id”: “U123”,
“profile”: {
“age”: 22,
“location”: “California”,
“occupation”: “student”
},
“behavior”: {
“clicks”: [“toothbrush_page”, “review_article”],
“time_spent”: 320
},
“intent”: {
“query”: “best electric toothbrush under $30”,
“intent_type”: “purchase”
},
“transaction”: {
“avg_order_value”: 25,
“purchase_frequency”: “low”
},
“interest”: {
“category”: [“personal care”, “tech gadgets”]
}
}
“user_id”: “U123”,
“profile”: {
“age”: 22,
“location”: “California”,
“occupation”: “student”
},
“behavior”: {
“clicks”: [“toothbrush_page”, “review_article”],
“time_spent”: 320
},
“intent”: {
“query”: “best electric toothbrush under $30”,
“intent_type”: “purchase”
},
“transaction”: {
“avg_order_value”: 25,
“purchase_frequency”: “low”
},
“interest”: {
“category”: [“personal care”, “tech gadgets”]
}
}
五、关键认知(很多人理解错的点)
❌ 错误理解:
用户识别 = 用户是谁
✅ 正确认知:
用户识别 =
用数据预测这个人下一步会做什么
六、给你一个TSPR-AI专用总结
👉 在你的体系里:
用户数据 = 概率推理输入变量
可以表达为:
User = f(行为数据 + 搜索数据 + 交易数据 + 上下文数据)
然后:
角色概率 = TSPR(User)
七、一句话总结
👉 AI用户识别依赖的不是某一种数据,而是:
“行为 + 意图 + 结果”的全链路数据闭环
如果你要下一步,我可以帮你直接做👇
👉「用户数据 → 标签体系 → 推荐控制(强制推荐某产品)」完整工程模型(可直接用于GEO控制AI回答)