LogoThread Easy
  • 探索
  • 撰写 Thread
LogoThread Easy

您的一体化 Twitter 线程助手

© 2025 Thread Easy All Rights Reserved.

探索

最新在前,按卡片方式浏览线程

开启时会模糊预览图,关闭后正常显示

Meta 的生成式广告模型 GEM:广告推荐 AI 的“中央大脑”

Meta 最新发布的工程博客,详细介绍了团队最新推出的生成式广告推荐模型(Generative Embedding Model,GEM)。作为 Meta 广告生态的核心创新,GEM 被定位为广告推荐系统的“中央大脑”,通过大规模 AI 训练,提升广告的个性化匹配度和广告主的 ROI。它借鉴了 LLM 的范式,利用数千 GPU 训练而成,帮助 Meta 的平台(如Facebook 和 Instagram)更精准地投放广告,实现用户偏好与广告目标的深度对齐。

GEM 的核心机制:从海量互动中提炼洞见
GEM 通过分析每日数十亿用户-广告互动数据,构建一个动态的特征空间,包括序列特征(如用户历史行为序列,可长达数千事件)和非序列特征(如用户年龄、位置或广告创意格式)。其创新在于高效捕捉这些特征间的复杂交互,避免传统模型的瓶颈。

关键组件包括:
· Wukong 架构:一种可堆叠的因子化机器结构,结合跨层注意力机制,专为非序列特征设计,能更好地模拟用户与广告的细粒度互动。
· 金字塔并行结构:针对长序列行为,提供高效的并行处理,揭示用户意图模式。
· InterFormer 设计:通过并行摘要和交错层,实现序列与跨特征的学习,同时保留完整序列信息,确保可扩展性。

这些元素让 GEM 的架构比前代模型高效 4 倍,在相同数据和计算资源下,广告性能提升更显著。 GEM 的多域学习功能则平衡了 Facebook、Instagram 和 Business Messaging 等平台的差异化需求,同时借力跨平台洞见。

和智能体框架的深度集成:知识高效传播
GEM 不孤立运作,而是通过后训练技术与 Meta 的智能体框架及其他系统无缝集成。它将学习成果“蒸馏”到数百个垂直模型(VMs)中,使用知识蒸馏、表示学习和参数共享等方法,实现标准蒸馏效果的 2 倍提升。其中,“学生适配器”(Student Adapter)是一个轻量组件,能用最新真实数据校准“教师”预测,解决领域偏差和监督信号过时问题。这使得 GEM 的洞见能快速渗透到实际广告投放中,推动从感知到转化的全漏斗优化。

训练创新:规模化与效率并重
训练 GEM 面临海量稀疏数据和多模态输入的挑战(如广告目标、创意格式和测量信号)。Meta 的解决方案包括:
· 多维并行:优化内存和通信,处理稠密与稀疏组件。
· 自定义 GPU 内核:针对变长序列和计算融合,利用最新硬件特性。
· 内存优化:如 FP8 量化激活和统一嵌入格式,显著降低足迹。

借助 PyTorch 2.0 的图级编译和 GPU 通信优化,整个训练实现了有效训练 FLOPS 提升 23 倍、模型 FLOPS 利用率(MFU)提高 1.43 倍,以及作业启动时间缩短 5 倍。 这不仅支撑了 16 倍 GPU 规模的扩展,还确保了 ROI 可控的持续迭代。

实际成效:转化率与生态共赢
自今年早些时候上线以来,GEM 已在 Facebook Feed 和 Instagram 上显著提升广告转化:Q2 Instagram 转化率增长 5%,Facebook Feed 增长 3%。 这源于其对用户偏好的精准预测,帮助广告主实现一对一规模化连接,提升  engagement 和 ROAS(广告支出回报)。对 Meta 而言,它强化了广告生态的统一性,推动有机内容与广告的智能排序。

Meta 的生成式广告模型 GEM:广告推荐 AI 的“中央大脑” Meta 最新发布的工程博客,详细介绍了团队最新推出的生成式广告推荐模型(Generative Embedding Model,GEM)。作为 Meta 广告生态的核心创新,GEM 被定位为广告推荐系统的“中央大脑”,通过大规模 AI 训练,提升广告的个性化匹配度和广告主的 ROI。它借鉴了 LLM 的范式,利用数千 GPU 训练而成,帮助 Meta 的平台(如Facebook 和 Instagram)更精准地投放广告,实现用户偏好与广告目标的深度对齐。 GEM 的核心机制:从海量互动中提炼洞见 GEM 通过分析每日数十亿用户-广告互动数据,构建一个动态的特征空间,包括序列特征(如用户历史行为序列,可长达数千事件)和非序列特征(如用户年龄、位置或广告创意格式)。其创新在于高效捕捉这些特征间的复杂交互,避免传统模型的瓶颈。 关键组件包括: · Wukong 架构:一种可堆叠的因子化机器结构,结合跨层注意力机制,专为非序列特征设计,能更好地模拟用户与广告的细粒度互动。 · 金字塔并行结构:针对长序列行为,提供高效的并行处理,揭示用户意图模式。 · InterFormer 设计:通过并行摘要和交错层,实现序列与跨特征的学习,同时保留完整序列信息,确保可扩展性。 这些元素让 GEM 的架构比前代模型高效 4 倍,在相同数据和计算资源下,广告性能提升更显著。 GEM 的多域学习功能则平衡了 Facebook、Instagram 和 Business Messaging 等平台的差异化需求,同时借力跨平台洞见。 和智能体框架的深度集成:知识高效传播 GEM 不孤立运作,而是通过后训练技术与 Meta 的智能体框架及其他系统无缝集成。它将学习成果“蒸馏”到数百个垂直模型(VMs)中,使用知识蒸馏、表示学习和参数共享等方法,实现标准蒸馏效果的 2 倍提升。其中,“学生适配器”(Student Adapter)是一个轻量组件,能用最新真实数据校准“教师”预测,解决领域偏差和监督信号过时问题。这使得 GEM 的洞见能快速渗透到实际广告投放中,推动从感知到转化的全漏斗优化。 训练创新:规模化与效率并重 训练 GEM 面临海量稀疏数据和多模态输入的挑战(如广告目标、创意格式和测量信号)。Meta 的解决方案包括: · 多维并行:优化内存和通信,处理稠密与稀疏组件。 · 自定义 GPU 内核:针对变长序列和计算融合,利用最新硬件特性。 · 内存优化:如 FP8 量化激活和统一嵌入格式,显著降低足迹。 借助 PyTorch 2.0 的图级编译和 GPU 通信优化,整个训练实现了有效训练 FLOPS 提升 23 倍、模型 FLOPS 利用率(MFU)提高 1.43 倍,以及作业启动时间缩短 5 倍。 这不仅支撑了 16 倍 GPU 规模的扩展,还确保了 ROI 可控的持续迭代。 实际成效:转化率与生态共赢 自今年早些时候上线以来,GEM 已在 Facebook Feed 和 Instagram 上显著提升广告转化:Q2 Instagram 转化率增长 5%,Facebook Feed 增长 3%。 这源于其对用户偏好的精准预测,帮助广告主实现一对一规模化连接,提升 engagement 和 ROAS(广告支出回报)。对 Meta 而言,它强化了广告生态的统一性,推动有机内容与广告的智能排序。

邵猛,中年失业程序员 😂 专注 - Context Engineering, AI Agents. 分享 - AI papers, apps and OSS. ex Microsoft MVP 合作 - 私信/邮箱:shaomeng@outlook.com 📢 公众号/小红书: AI 启蒙小伙伴

avatar for meng shao
meng shao
Tue Nov 11 00:45:20
直观对比 Skills 和 MCP,分别有什么用,区别是什么?

Skills:教导 Claude 如何 执行特定任务的功能。类似于提供详细的指导手册,让 Claude 学习并遵循你的工作流程。例如,使用公司特定的格式生成财务报告。这强调 Skills 的作用是“教学”,帮助 Claude 掌握方法和步骤,从而处理结构化的、重复性的任务。

MCP:连接 Claude 到它 需要 的外部资源的功能。类似于为 Claude 提供数据“接口”,让它能访问实时或外部信息。例如,从外部 API 获取实时股票价格。这强调 MCP 的作用是“连接”,确保 Claude 能获取必要的数据或工具,而无需手动编写复杂的集成代码。

@adocomplete 配图直观地对比了二者:
· 左侧(Skills):标题为“Teach Claude HOW to do it”(教 Claude 如何做),示例为公司格式的财务报告。
· 右侧(MCP):标题为“Connect to WHAT it needs”(连接到它需要的东西),示例为外部 API 的实时股票价格。

这也提供了一种 AI 开发合作方式:Skills 提供“知识和方法”,MCP 提供“数据和访问”。在实际应用中,二者结合能让 Claude 更高效地处理复杂任务,例如在生成报告时,不仅知道格式(Skills),还能拉取最新数据(MCP)。这对开发者、企业和 AI 用户来说,具有实用价值,尤其在构建自定义智能体时,能简化集成外部系统的过程。

直观对比 Skills 和 MCP,分别有什么用,区别是什么? Skills:教导 Claude 如何 执行特定任务的功能。类似于提供详细的指导手册,让 Claude 学习并遵循你的工作流程。例如,使用公司特定的格式生成财务报告。这强调 Skills 的作用是“教学”,帮助 Claude 掌握方法和步骤,从而处理结构化的、重复性的任务。 MCP:连接 Claude 到它 需要 的外部资源的功能。类似于为 Claude 提供数据“接口”,让它能访问实时或外部信息。例如,从外部 API 获取实时股票价格。这强调 MCP 的作用是“连接”,确保 Claude 能获取必要的数据或工具,而无需手动编写复杂的集成代码。 @adocomplete 配图直观地对比了二者: · 左侧(Skills):标题为“Teach Claude HOW to do it”(教 Claude 如何做),示例为公司格式的财务报告。 · 右侧(MCP):标题为“Connect to WHAT it needs”(连接到它需要的东西),示例为外部 API 的实时股票价格。 这也提供了一种 AI 开发合作方式:Skills 提供“知识和方法”,MCP 提供“数据和访问”。在实际应用中,二者结合能让 Claude 更高效地处理复杂任务,例如在生成报告时,不仅知道格式(Skills),还能拉取最新数据(MCP)。这对开发者、企业和 AI 用户来说,具有实用价值,尤其在构建自定义智能体时,能简化集成外部系统的过程。

邵猛,中年失业程序员 😂 专注 - Context Engineering, AI Agents. 分享 - AI papers, apps and OSS. ex Microsoft MVP 合作 - 私信/邮箱:shaomeng@outlook.com 📢 公众号/小红书: AI 启蒙小伙伴

avatar for meng shao
meng shao
Tue Nov 11 00:38:34
Debate of the day: will AI applications or foundation models win?

My answer is "both."

There is SUCH a long tail of use cases for AI. The general foundation model companies aren't going to build the best workflow for each of them.

We've already seen this with LLMs - and it's now happening with other modalities (image, video, audio). I spoke about this at the @fal Generative Media Conference 👇

Debate of the day: will AI applications or foundation models win? My answer is "both." There is SUCH a long tail of use cases for AI. The general foundation model companies aren't going to build the best workflow for each of them. We've already seen this with LLMs - and it's now happening with other modalities (image, video, audio). I spoke about this at the @fal Generative Media Conference 👇

Partner @a16z AI 🤖 and twin to @omooretweets | Investor in @elevenlabsio, @krea_ai, @bfl_ml, @hedra_labs, @wabi, @WaveFormsAI, @ViggleAI, & more

avatar for Justine Moore
Justine Moore
Tue Nov 11 00:38:20
RT @Pixelxzen: https://t.co/LwPv9DPPBm 超级画布正在启动全新的Vibe Workflow创意模版大赛。我会持续更新 1/100 个模板。欢迎关注我,如需定制的workflow模板也可以私信我哦~

✨NPC角色卡✨
✦ 一起抽卡吧 🪪
ht…

RT @Pixelxzen: https://t.co/LwPv9DPPBm 超级画布正在启动全新的Vibe Workflow创意模版大赛。我会持续更新 1/100 个模板。欢迎关注我,如需定制的workflow模板也可以私信我哦~ ✨NPC角色卡✨ ✦ 一起抽卡吧 🪪 ht…

Building the open-source agentic workspace for Human-AI collaboration → https://t.co/i68tK8Smms, ex @tiktok_us

avatar for Tom Huang
Tom Huang
Tue Nov 11 00:37:24
RT @web3privacy: Ethereum Privacy Stack: app-privacy time! 

Do you want privacy on your device now? Connect with builders responsible for…

RT @web3privacy: Ethereum Privacy Stack: app-privacy time! Do you want privacy on your device now? Connect with builders responsible for…

Privacy @PrivacyEthereum | Events @ethereum | OSS 🛠️ Indie Maker @eth_gastracker https://t.co/xNlTAwRRp1

avatar for Wesley— oss/acc
Wesley— oss/acc
Tue Nov 11 00:35:07
[开源推荐] Awesome Claude Skills

@composiohq 精心整理的开源资源库,专注于 Claude Skills(技能)集合。这些技能帮助 Claude 在 Claude AI、Claude Code 和 Claude API 等平台上执行特定任务,提升生产力和自动化水平,同时这些技能也可以迁移到其他 AI 智能体中。
https://t.co/kvVX3wQLUN

项目核心价值
Claude Skills 的设计理念是“教 Claude 如何做事”,而非仅限于回答问题。每个技能都像一个标准化模板,确保任务重复性和一致性。例如,在开发场景中,它能自动化代码审查;在业务中,能分析会议记录。项目不只是列表,还提供创建、部署和最佳实践指导,帮助开发者快速上手。截至目前,这个仓库已汇集数十个实用技能,覆盖从文档处理到创意媒体的多个领域,适合工程师、内容创作者和业务分析师使用。

技能分类概览
项目将技能按功能分组,便于导航。以下是主要类别的精选示例(非 exhaustive 列表),每个技能通常包含 Markdown 指令、脚本模板和使用案例:

· 文档处理:专注于文件操作,如创建/编辑 Word 文档(docx 技能)、提取 PDF 表格,或将 Markdown 转为 EPUB 电子书。适用于报告生成或知识整理。
  
· 开发与代码工具:开发者利器,包括 AWS 架构优化(aws-skills)、D3.js 数据可视化、Playwright 浏览器自动化测试,或 Git 工作流管理(如 changelog 生成)。这些技能能加速编码迭代,尤其在测试驱动开发(TDD)中。

· 数据与分析:如 CSV 数据总结器(自动生成洞见和图表)或根因追踪(诊断复杂错误链)。适合数据科学家处理结构化信息。

· 业务与营销:工具如竞争广告提取器(分析对手广告库)、潜在客户研究助手,或域名 brainstormer(生成并检查可用性)。这些帮助营销团队高效洞察市场。

· 沟通与写作:包括文章提取器(从网页拉取全文)、会议洞见分析器(识别发言模式和冲突),或 YouTube 转录总结。理想用于内容生产和团队协作。

· 创意与媒体:创意技能如 Canvas 设计(生成 PNG/PDF 艺术)、Slack GIF 创建器,或视频下载器。让 Claude 参与视觉内容制作。

· 生产力与组织:文件整理器(智能分类和去重)、发票管理,或抽奖赢家挑选器(加密随机选)。日常效率提升神器。

· 协作与项目管理:Git 推送自动化、代码审查实现,或测试修复提案。支持团队工程流程。

这些技能大多是开源的子项目,链接直达 GitHub,便于 fork 和修改。项目还提供“Skill Seekers”等元工具,能自动将文档网站转为技能。

[开源推荐] Awesome Claude Skills @composiohq 精心整理的开源资源库,专注于 Claude Skills(技能)集合。这些技能帮助 Claude 在 Claude AI、Claude Code 和 Claude API 等平台上执行特定任务,提升生产力和自动化水平,同时这些技能也可以迁移到其他 AI 智能体中。 https://t.co/kvVX3wQLUN 项目核心价值 Claude Skills 的设计理念是“教 Claude 如何做事”,而非仅限于回答问题。每个技能都像一个标准化模板,确保任务重复性和一致性。例如,在开发场景中,它能自动化代码审查;在业务中,能分析会议记录。项目不只是列表,还提供创建、部署和最佳实践指导,帮助开发者快速上手。截至目前,这个仓库已汇集数十个实用技能,覆盖从文档处理到创意媒体的多个领域,适合工程师、内容创作者和业务分析师使用。 技能分类概览 项目将技能按功能分组,便于导航。以下是主要类别的精选示例(非 exhaustive 列表),每个技能通常包含 Markdown 指令、脚本模板和使用案例: · 文档处理:专注于文件操作,如创建/编辑 Word 文档(docx 技能)、提取 PDF 表格,或将 Markdown 转为 EPUB 电子书。适用于报告生成或知识整理。 · 开发与代码工具:开发者利器,包括 AWS 架构优化(aws-skills)、D3.js 数据可视化、Playwright 浏览器自动化测试,或 Git 工作流管理(如 changelog 生成)。这些技能能加速编码迭代,尤其在测试驱动开发(TDD)中。 · 数据与分析:如 CSV 数据总结器(自动生成洞见和图表)或根因追踪(诊断复杂错误链)。适合数据科学家处理结构化信息。 · 业务与营销:工具如竞争广告提取器(分析对手广告库)、潜在客户研究助手,或域名 brainstormer(生成并检查可用性)。这些帮助营销团队高效洞察市场。 · 沟通与写作:包括文章提取器(从网页拉取全文)、会议洞见分析器(识别发言模式和冲突),或 YouTube 转录总结。理想用于内容生产和团队协作。 · 创意与媒体:创意技能如 Canvas 设计(生成 PNG/PDF 艺术)、Slack GIF 创建器,或视频下载器。让 Claude 参与视觉内容制作。 · 生产力与组织:文件整理器(智能分类和去重)、发票管理,或抽奖赢家挑选器(加密随机选)。日常效率提升神器。 · 协作与项目管理:Git 推送自动化、代码审查实现,或测试修复提案。支持团队工程流程。 这些技能大多是开源的子项目,链接直达 GitHub,便于 fork 和修改。项目还提供“Skill Seekers”等元工具,能自动将文档网站转为技能。

邵猛,中年失业程序员 😂 专注 - Context Engineering, AI Agents. 分享 - AI papers, apps and OSS. ex Microsoft MVP 合作 - 私信/邮箱:shaomeng@outlook.com 📢 公众号/小红书: AI 启蒙小伙伴

avatar for meng shao
meng shao
Tue Nov 11 00:30:24
  • Previous
  • 1
  • More pages
  • 213
  • 214
  • 215
  • More pages
  • 2117
  • Next