课程简介
话题概述:
大语言模型和多模态大模型技术日新月异,我将围绕团队近期发表的数十篇论文,详细介绍相关技术创新和落地实践成果。首先,分享情感陪聊的技术创新和产品落地经验,包括Agent驱动世界日志的主动记忆对话方法iPET,以及面向个性化ai搜索生成对话PaRT框架;接着,展示小红书翻译大模型的技术细节,包括利用强化学习思考推理快速唤醒大模型翻译能力MT-R1-Zero,社交生活化风格翻译大模型RedTrans,以及基于多模态多任务推理的图片翻译大模型MT3;最后,将介绍社交生活化领域大语言模型和多模态大模型的实际任务,以及我们提出的多模态推理大模型Vision-R1,领域大语言模型RedOne,以及在搜广推业务落地ScalingNote框架。
演讲题纲:
a. 多模态大模型技术创新(Vision-R1、Dynamic-llava、RedOne)
b. 多模态大模型在搜索、推荐、翻译、情感陪聊的应用(各1个案例 + 论文)。
话题亮点:
a、多模态大模型在小红书搜索、推荐、翻译等场景重要落地实践经验
b、大语言模型和多模态大模型的技术创新,包括Deepseek-R1多模态版本、大语言模型后训练的最佳实践方案等。
目标收益
a. 讨论大语言模型/多模态大模型前沿技术
b. 探索大模型的落地实践经验
c. 带来行业的最新动向、趋势和洞察。
培训对象
1
课程内容
案例方向
多模态技术前沿:跨模态理解与生成/大语言模型技术演进/AI Agent落地与前沿实践
话题概述
大语言模型和多模态大模型技术日新月异,我将围绕团队近期发表的数十篇论文,详细介绍相关技术创新和落地实践成果。首先,会分享首个多模态推理大模型Vision-R1:7B模型实现自我反思、72B取得同尺寸最佳效果,以及全新稀疏化推理框架:Dynamic-LLaVA,可降低50%计算开销;然后,将分享围绕业务领域的大语言模型Post Train最佳实践:RedOne,探索如何在保持通用能力基础上,大幅提升几十种业务能力,和在小红书搜索落地的规模定律:ScalingNote;接着,会介绍翻译大模型相关内容,包括MT-R1-Zero(RL冷启)、RedTrans(SFT+RLHF)两阶段,揭示社交生活化场景翻译风格塑造;最后,以情感陪聊、角色对话等agent相关成果收尾,包括iPET、PaRT等。
收益
a. 讨论大语言模型/多模态大模型前沿技术
b. 探索多模态大模型在搜推广翻译等场景的落地实践 c. 带来行业的最新动向趋势洞察。
演讲题纲
a. 多模态大模型技术创新(Vision-R1、Dynamic-llava、RedOne)
b. 多模态大模型在搜索、推荐、翻译、情感陪聊的应用(各1个案例 + 论文)。
话题亮点
a、多模态大模型在小红书搜索、推荐、翻译等场景重要落地实践经验
b、大语言模型和多模态大模型的技术创新,包括Deepseek-R1多模态版本、大语言模型后训练的最佳实践方案等。
近期公开课推荐