PostHog 将训练自有 AI 模型:从会话回放到合成用户测试
PostHog 宣布将利用平台数据训练自有 AI 模型,以提升现有产品智能性并构建新产品如 PostHog Code。用户可选择退出,数据将匿名化且不分享给第三方。
训练我们自己的人工智能模型内容我真的认为我们即将在未来六个月内完成一些最好的工作。在过去的一年里,我们开始在 PostHog 中构建更多 AI 功能,例如 AI 安装向导、PostHog AI 和我们的 MCP。
它们都非常受欢迎,但这只是开始。PostHog 的下一章是关于构建更主动、更自主的产品——那些能为你提供答案和解决方案、采取行动并随时间改进的产品。这就是 PostHog Code 的愿景,该产品现已进入测试阶段。
为了实现这一目标以及更多类似产品,我们想尝试一些新东西:我们希望在 PostHog 中基于数据训练模型。
我们想要构建什么我们有两个目标:- 让现有产品更智能、更主动、对您更有用- 构建全新产品,例如 PostHog Code,帮助团队更快地打造更好的产品我们感兴趣的第一个领域是会话回放分析。PostHog AI 已经能够检测回放中的问题,但成本高昂且扩展性不佳。
我们希望回放在大规模场景下也能像诊断单个用户问题一样强大,我们认为基于驱动回放的底层数据训练的模型将帮助我们实现这一目标。另一个我特别兴奋的想法是合成用户测试——即在您发布到生产环境之前,利用我们对用户行为的了解来识别用户可能感到困惑的地方,或哪些流程可能出错。
随着编码模型的改进,许多人发现测试和审查工作量大幅增加。我们希望实现自动化,这样您就可以专注于产品。此外,如果我们能更好地预测用户行为,我们应该能够建议改进措施,从而提高转化率、减少用户挫败感,即使是针对您已发布的功能。
如果我们能为您自动化这项工作,您将花更少的时间进行手动分析,并在过程中消耗更少的 token。我们这里的想法是实验性的。需要反复迭代才能弄清楚如何有效训练模型以及哪些数据真正有用。
但到目前为止,每次我们以让产品更简单或更强大的方式加入 AI,效果都很好,所以我们认为值得尝试。这将如何运作我们花了很多时间从用户角度思考这个问题,特别是权衡利弊。好处是上述各种改进。大多数工具专注于为您提供最好的代码;
我们希望集中精力让您的产品做到最好。这就是为什么我们将 PostHog Code 描述为产品编辑器。缺点在于这涉及使用 PostHog 中的数据来训练模型。
大多数公司会把这个变化藏在看似无聊的条款更新中,但我们重视透明度,所以这里是你需要知道的,以互联网友好的编号列表形式呈现:- 我们欧盟云实例上的用户默认选择退出- 同样,那些有协议(例如 BAA、MSA 或类似协议)阻止训练的用户也默认退出
- 我们美国云实例上的所有其他用户默认选择加入- 我们会在所有数据用于训练前进行匿名化处理- 我们只会使用您 PostHog 实例中已有的数据- 我们将自行完成所有模型训练,
这意味着……我们不会将您的数据出售或发送给第三方模型提供商- 您可以随时通过 PostHog 中的组织设置选择退出(需要管理员权限)- 训练要到 6 月 29 日才开始,
所以有充足时间做决定在沟通方面,我们:- 会向所有客户发送邮件,并让邮件主题一目了然- 通过应用内通知通知所有用户(以防您不看邮件)- 非常公开地传达我们的计划(就像这篇博文一样)我想强调的是,我们的目标是改进 PostHog 这个产品,使其对客户更有用,
而不是公开或出售基于您数据训练的模型,也不是将您的数据变现。为什么是选择退出而非选择加入简而言之,因为否则我们将没有足够的数据来训练真正有用的模型。如果您选择退出,我们使用这些模型构建的新功能将无法为您所用,因为它们依赖于这些数据。
如果您默认选择退出(例如,因为您在我们的欧盟云实例上),只要您与我们之间的任何法律协议不排除此选项,您可以选择手动加入。
我们选择坦诚相告,而不是悄悄推出,因为我们认为这是正确的做法。如果您想讨论此事,我是 James,邮箱您能猜到。我们也在招聘 AI 研究员,如果您想和我们一起做这件事,请联系我们。PostHog 是一个用于构建成功产品的一体化开发者平台。
我们提供产品分析、网站分析、会话回放、错误追踪、功能开关、实验、调查、AI 可观测性、日志、工作流、端点、数据仓库、CDP 以及一个 AI 产品助手,帮助您调试代码、更快地发布功能,并将所有使用情况和客户数据保存在一个堆栈中。