关于我

我拥有计算机视觉硕士学位和丰富的AI实践经验。在同花顺,我负责多模态技术落地和Agent能力建设,显著提升了用户体验和产品指标。工作内外,我热衷于将AI技术与实际场景结合,提升工作学习效率,创造有价值的产品体验,并独立开发了一款线上AI产品。

AI产品 多模态 Agent 海外业务 金融科技 计算机视觉

Native AI工作流

AI需求分析及产品设计,利用工作流、代码验证模型效果及提升工作效率

Prompt工程

Prompt设计、调优和验证,应用于实际金融投顾对话(垂类领先)

创新思维

善于发现用户需求,创造创新解决方案

数据驱动

基于数据分析优化产品决策

工作经历

阿里巴巴 · 飞猪 2025.06 — 至今
AI产品经理  ·  AI问一问

负责飞猪AI旅游对话产品(问一问)的Agent策略优化与特色功能规划

  • 国内版目的地模块策略迭代:大幅重构目的地模块问答工作流,端到端答案效果提升10%至92%,速度提升1倍,新增暑期特色场景支持,改善内容表达
  • 热力图:使用全域客流数据作为热值,激发用户目的地探索兴趣与交互意愿,通过<城市-POI>两级热点事件、高频问句引导用户发问
  • 长期记忆:制定长期记忆的通用框架(分为三层:情景、事实、偏好),接入用户的历史订单、会员权益及行为偏好数据,梳理各模块(查酒店、交通,行程规划)可利用长期记忆的增效场景,增强用户问答的个性化、智能化体验
  • 海外AI项目预研:负责海外版AI项目的从0到1,深度评估并厘清支持多语言AI服务的底层数据现状与需求,设计高质量多语言数据库扩展方案,构建Agent整体架构,包括意图分发、重点场景核心节点、回答生成策略、多语言
  • 自动化评测:梳理当前目的地评测过程中可使用机器自动化评测的问题项,设计初步优化手段
同花顺 2023.05 — 2025.05
AI产品经理  ·  AI集群-智能投顾机器人
多模态能力落地

负责同花顺创新型ChatBot重点项目国内问财、海外Aime的多模态能力建设,实现金融场景下图像圈选分析、图像上传等核心投顾功能落地,显著提升用户主动输入量与答案可用率,拓展产品 多模态对话 能力。

  • 视觉模型训练及Agent协同:梳理同花顺端内K线、分时、副图、资讯等主要模块的图像,细粒度分类用户意图,定义并标注视觉模型及Agent SFT的数据逻辑,实现跨工具协同调用能力。后期通过原生多模态模型,实现图像模型直接规划及工具调用的独立架构,降低了原本图像工具模式的信息损耗
  • 提示词工程优化:通过对规划、总结及工具描述的结构化重构,并结合 Token 约束策略进行三组 Prompt 方案的 A/B Testing,最终确立了高性能 Prompt,显著增强了复杂任务下的模型响应质量
  • 交互体验创新:调研市场上多模态类产品交互形态,尤其是圈搜场景(Google、Samsung、Vivo),优化圈选分析交互流程,与对话机器人入口深度融合,显著提升用户操作流畅性,实现"哪里不会圈哪里"的用户体验,降低用户流失率20%以上
  • 场景赋能:低成本复用以上能力,赋能同花顺截图后图像分析、PC客户端识图等业务场景,实现多方共赢
  • 量化成果:答案可用率从 5%提升至51%,支持绝大多数场景下的图像精准理解。国内问财月均主动输入问句数从 400增长至2.5W,海外Aime从 300增长至4500
智能体平台及生态全链路建设

构建问财及Aime的Agent Store从智能体生产到运营的完整体系,支撑国内外金融投顾场景的 垂类对话应用,实现国内月均对话次数增长6倍以上,海外次日留存率39.56%。

Agent生产体系

  • 智能体搭建:基于内部Agent搭建平台(toB端,创建能力更强),搭建5个标杆案例(知识库、MBTI投资风格、中国移动、新春游戏、法律Agent),充分利用内部插件及接口编排工作流
  • 迭代配置平台:支持模型/LangChain执行器/插件/工作流等模块化组合;设计事件管理功能,兼容文档解析、图像理解等6类交互事件,大幅降低技术对接成本。实现Agent定制效率提升300%(原1人天 → 0.3人天)

Agent上架机制

  • 内部上架机制打通:打通对话配置平台及Agent创建平台的上架链路,使后者创建的Agent可以选择版本、权限、渠道、标签,发布至问财Agent Store的对话空间,提升内部协作能力
  • 海外Agent创建审核:覆盖6项核心信息安全校验(自动化&人工复审),结合App的Push功能实现用户触达,使海外190个Agent100%合规上线

多场景分发网络

  • 构建B端业务合作链路:输出金融查询/搜索等常用插件的标准化API,支撑中国移动和包、豆包接入问财能力,包括文本答案、溯源信息、可视化组件转图片
  • 创新C端流量入口:在问财主对话设计@Agent及问句联想功能,实现Agent Store在主对话的触达(占全流量的10%)

生态运营体系

  • 运营策略:主打"标杆案例+长尾补充"策略,构建股票/基金/港美股/工具/趣味游戏及其他等10大垂类,将MBTI投资风格测试等典型案例投放端内Banner、端外社媒等渠道,实现国内Agent对话量从 9k → 58k/月,海外留存率达39.56%(超主对话基线33.1%)
  • 内容运营:策划多维度内容营销,包括圈选分析的公众号推文(阅读量1509)、抖音视频(播放量1759),以及海外Agent Store、Agent大赛的视频脚本,扩大产品影响力
金融查询能力升级

深度参与海外Aime的Text2Sql解析迭代,支撑复杂问句灵活取数;负责诊股总结重构及标签选股体系建设,综合提升 金融查询 准确率与投顾能力多样性。

  • 标准SQL解析优化:参与定义标准SQL的标注规范、数据表结构、美股指标关联关系,通过SFT让大模型直接生成符合业务定义的SQL代码,支持如聚合函数等复杂查数能力,减少后处理损失,实现更灵活的金融查询能力
  • 诊股及可视化能力提升:梳理问题及细化测评标准,通过训练集清洗及Prompt数据结构升级,英文诊股总结可用率从 61.4%提升至77.78%,较大程度改善数据罗列、数据幻觉等问题;推动下游10种图表类型的数据获取,覆盖多公司、多指标等可视化对比场景
  • 标签选股建设:梳理北美竞品股单,从中抽象事件或概念选股逻辑,定义50条选股标签,生产所需自定义指标并补充模型微调数据,降低了用户输入问句的门槛,提高选股的丰富性和效率
多模态Agent LLM应用Prompt工程 Text2SQL智能投顾 北美业务产品创新 用户体验优化

个人项目

毛球翻译官 2025.02 — 至今
AI产品经理 & 开发者  ·  基于DeepSeek的AI宠物对话小程序

独立设计并利用AI编程工具WindSurf开发了一款微信小程序——毛球翻译官(微信可搜到)。用户可通过文字或上传宠物图片与拟人化的宠物进行多轮对话,系统支持上下文记忆和个性化宠物设定,回复形式智能切换文本或图片。将多模态对话技术与爱宠场景结合,并创新性地将图像生成意图嵌入自然对话流。

需求洞察与产品创新

通过分析小红书中大量萌宠图文,发现用户热衷于拟人化宠物并表达其"情绪和心理",尤其是"人,咪想xxx"等类型的帖子,反映出用户希望与宠物进行对话的潜在需求。以此为切入点,开发了支持多模态交互的Chatbot,精准满足用户的创意表达与情感陪伴需求。

  • 自然对话流嵌入图像生成:突破传统工具型生图产品"生成一张xxx图"的指令式交互,系统基于对话内容、语境,智能判断回复文本/图片,使对话更贴近人与人聊天的自然交互;保留宠物核心特征的同时,对动作、场景进行趣味性的局部重绘
  • 多模态记忆分层:搭建长期记忆(过去聊天中的关键内容)和短期记忆(最近20条对话记录)的分层处理机制,给对话生成补充更多背景信息
技术实现
  • 全栈开发:微信小程序前端、Python Flask后端、数据库设计、向量数据库、代码模块化处理、微信云开发部署上线
  • AI模型评测及调用:对比国内外先进模型的生成效果(语言风格、图像理解能力、网感),最终采用文本模型(DeepSeek V3)、图像理解(阶跃星辰step-1v-8k)、图像生成(先后是liblib工作流及Gemini-2-Flash-exp)
  • 上下文工程:设计分层策略动态注入System Prompt,输入层(用户自定义的宠物设定包括性格、习惯、爱好,和实时对话记录以及长期记忆),规则层(占位符设计、图像识别要素分级、冲突处理、模糊处理、正反例等机制),定性对比模型输出效果
  • 多模态RAG:采用CLIP统一图文向量空间,基于JinaAI实现跨模态语义检索,召回长期记忆中相似度Top3的相关信息

实习经历

FancyTech 2023.03 — 2023.04
AI产品经理实习生

基于Stable Diffusion,探索不同品类及场景下电商营销素材生成的技术实现,通过LoRA微调、集成ControlNet等插件的方式,提升图片生成质量和速率,有效扩充自动化视频生产所需的素材库。

  • 写实类LoRA模型训练与调优:针对叶子、置物台等高频电商背景元素,完成高质量素材清洗,构建品类专属标签体系,通过WebUI训练专用LoRA模型,不断调试Prompt、不同阶段、迭代步数、采样方法在生成上的区别,保证图像生成的高质量及一致性
  • 可控化生成方案落地:在WebUI集成ControlNet、Inpainting等插件实现模特的姿势控制和局部重绘,解决人物与背景比例失调问题,建立可复用的AIGC生产工作流
rct AI  · Mirror World项目(Web3) 2022.05 — 2022.06
产品经理实习生  ·  Sonic SVM团队 | Product Hunt Web3产品月榜Top2 | 首批OpenAI合作方 | YC孵化企业

参与智能SDK中钱包模块的需求分析及功能设计,为开发者提供简单便捷的一键支付集成,钱包用于转移和展示代币、NFT,并解决地域覆盖问题,保证其用户能在产品中安全便捷地交易加密货币。

  • 钱包架构设计:洞察用户渴望低成本、轻松、无缝接入Web3的需求,划分为MPC钱包(在采用主流社媒身份认证后,项目方自动创建的区块链钱包,用户无需存储私钥)、In-app钱包(应用内展示的数据库记录),首先支持了Solana链
  • 交易流程搭建:调研开发者集成难点及其他支付类竞品的用户侧逻辑,梳理交易流程,包括Token转移(发送、接收、购买)、交易记录展示。同时优化细节逻辑降低用户理解成本及学习支付、代币等知识的门槛,淡化"钱包"概念
海康威视 2021.08 — 2021.10
产品经理实习生  ·  IoT开放平台-云服务产品部
  • IoT客户产品设计及交付:负责某大客户智能宠物喂食器项目,通过挖掘用户需求和竞品情况,定义物模型和OEM App面板页,设计喂食、状态及记录显示等功能。与研发沟通评估功能定义冲突,一个月内完成项目交付,获得客户高度认可,2021Q4平台新增接入设备近1万台,其中月活设备约占22%
  • 控制台功能优化:快速熟悉IoT开放平台各个产品线的业务逻辑和使用方法,根据项目开发需要,提前对平台内部控制台欠缺的功能进行需求合理性评估并优化,参与设计并实现物模型定义中新增支持时间戳、多层结构体等数据类型,并在测试环境验证了效果
  • 开放平台官网内容输出:配合市场团队,撰写并更新平台官网产品介绍及解决方案(模组接入、消费方案),同时维护对外用户文档(EIB面板功能点、组件),定期收集用户反馈优化文档结构和内容
腾讯 2018.05 — 2018.08
运营实习生  ·  自选股-社区运营组

参与腾讯自选股证券社区的活动运营及内容运营,有效激发用户参与度,提升了用户阅读量、发帖量等核心活跃指标,支持优质内容挖掘和培养,有效提升社区内容质量。

  • 基于用户画像和行为数据,设计并实施一项股民写金句得红包的社区活动,优化活动规则和奖励机制,发帖量从日均2000条提升至日均4500条,活动满意度从3.5分提升到4.2分
  • 运营官方账号,并引导用户评论和转发,促进社区互动,月均阅读量从50万增加到120万,月均评论量从1万增加到3万
  • 筛选并培养37名优质创作者和KOL,每月为社区贡献近400篇高质量文章

教育背景

巴塞罗那自治大学 2020.10 — 2022.12
计算机视觉 · 硕士  ·  QS175,西班牙排名第一
北方工业大学 2015.09 — 2020.06
计算机科学与技术 · 本科  ·  GPA 3.75/4,专业前5%

在校实践

学校官方小程序及年度H5 2019.03 — 2019.06
产品经理 & 前端开发

"我的北方"小程序,是针对北方工业大学校内用户,对标学校体验欠佳的企业号,推出的首款集教务查询、移动教学、资讯及校内服务于一体的校园功能小程序,首次满足了学生对移动教学平台的强烈需求以及校内各部门资讯发布的需求,已覆盖学校绝大多数本科用户。(文档链接)

  • 移动教学与教务查询:规划设计移动教学模块,并设计课件预览、下载、收藏、转发等功能,校内首次实现教学平台移动端化,为用户提供了全新的使用场景。选取五项高频教务查询功能,并优化展示和交互缩短用户获取信息的路径,并与学校企业号的数据同步
  • H5数据报告引流:为推广小程序,参与开发记录学生生活数据的H5,通过内测群调研,确定像素风设计风格和趣味性文案内容,并设计了一个可旋转展示用户留言的星球。上线3h后达到了5w的访问量,成为学校访问量最高的线上活动,成功提升小程序的认知度
  • 前端开发与产品推广:参与完成50%以上前端开发(如课程-课件框架、收藏、资讯轮播等功能),并保证了代码可维护性。协助产品推广,发布产品介绍和使用教程,并与校内组织、机构开展合作和推荐,有效提升了小程序的知名度,同时收集了大量用户反馈
其他实践
  • 获奖:大三学习优秀一等奖学金、实践创新二等奖学金;蓝桥杯C/C++程序设计大赛北京二等奖;中国大学生计算机设计大赛北京三等奖
  • 论文:《基于改进的YOLOv5电费票据关键信息检测与识别》(2022);《改进的Simhash算法在文本查重中的研究及应用》(2020)
  • 语言:雅思 6.5 / 英语六级 504