工程师
其他
创新
强化学习
ai
大模型
Deepseek
推荐课程
average > 0 ? $model->average . '分' : '10.0分' ?>

小红书大模型技术创新与落地实践

小红书 NLP算法负责人

小红书NLP负责人,负责大语言模型、多模态大模型后训练,以及大模型在搜索、推荐、广告、翻译、客服和情感陪聊等场景落地应用,获得2024年公司年度Extra Mile项目冠军。他带领团队首次实现Deepseek-R1多模态版本,曾提出中英文词向量SOTA算法,完成全球首个千亿参数图表征工业级训练系统。他发表论文30余篇,授权专利100余项,引用近4000次,获得ICDE 2023年最佳工业论文奖、CIKM 2015-2020年最高引用论文、AAAI 2016最具影响力论文。此外,他荣获了中国发明协会创新成果一等奖(排名1)、中国人工智能学会吴文俊科技进步二等奖(排名1),连续4年入选世界人工智能学者榜单AI-2000新星榜前100名、Elsevier中国区高被引学者,CCTV-13《新闻直播间》采访报道。

小红书NLP负责人,负责大语言模型、多模态大模型后训练,以及大模型在搜索、推荐、广告、翻译、客服和情感陪聊等场景落地应用,获得2024年公司年度Extra Mile项目冠军。他带领团队首次实现Deepseek-R1多模态版本,曾提出中英文词向量SOTA算法,完成全球首个千亿参数图表征工业级训练系统。他发表论文30余篇,授权专利100余项,引用近4000次,获得ICDE 2023年最佳工业论文奖、CIKM 2015-2020年最高引用论文、AAAI 2016最具影响力论文。此外,他荣获了中国发明协会创新成果一等奖(排名1)、中国人工智能学会吴文俊科技进步二等奖(排名1),连续4年入选世界人工智能学者榜单AI-2000新星榜前100名、Elsevier中国区高被引学者,CCTV-13《新闻直播间》采访报道。

课程费用

6800.00 /人

课程时长

50分钟以下及更短时间

成为教练

课程简介

话题概述:
大语言模型和多模态大模型技术日新月异,我将围绕团队近期发表的数十篇论文,详细介绍相关技术创新和落地实践成果。首先,分享情感陪聊的技术创新和产品落地经验,包括Agent驱动世界日志的主动记忆对话方法iPET,以及面向个性化ai搜索生成对话PaRT框架;接着,展示小红书翻译大模型的技术细节,包括利用强化学习思考推理快速唤醒大模型翻译能力MT-R1-Zero,社交生活化风格翻译大模型RedTrans,以及基于多模态多任务推理的图片翻译大模型MT3;最后,将介绍社交生活化领域大语言模型和多模态大模型的实际任务,以及我们提出的多模态推理大模型Vision-R1,领域大语言模型RedOne,以及在搜广推业务落地ScalingNote框架。

演讲题纲:
a. 多模态大模型技术创新(Vision-R1、Dynamic-llava、RedOne)
b. 多模态大模型在搜索、推荐、翻译、情感陪聊的应用(各1个案例 + 论文)。

话题亮点:
a、多模态大模型在小红书搜索、推荐、翻译等场景重要落地实践经验
b、大语言模型和多模态大模型的技术创新,包括Deepseek-R1多模态版本、大语言模型后训练的最佳实践方案等。

目标收益

a. 讨论大语言模型/多模态大模型前沿技术
b. 探索大模型的落地实践经验
c. 带来行业的最新动向、趋势和洞察。

培训对象

1

课程内容

案例方向


多模态技术前沿:跨模态理解与生成/大语言模型技术演进/AI Agent落地与前沿实践

话题概述


大语言模型和多模态大模型技术日新月异,我将围绕团队近期发表的数十篇论文,详细介绍相关技术创新和落地实践成果。首先,会分享首个多模态推理大模型Vision-R1:7B模型实现自我反思、72B取得同尺寸最佳效果,以及全新稀疏化推理框架:Dynamic-LLaVA,可降低50%计算开销;然后,将分享围绕业务领域的大语言模型Post Train最佳实践:RedOne,探索如何在保持通用能力基础上,大幅提升几十种业务能力,和在小红书搜索落地的规模定律:ScalingNote;接着,会介绍翻译大模型相关内容,包括MT-R1-Zero(RL冷启)、RedTrans(SFT+RLHF)两阶段,揭示社交生活化场景翻译风格塑造;最后,以情感陪聊、角色对话等agent相关成果收尾,包括iPET、PaRT等。

收益


a. 讨论大语言模型/多模态大模型前沿技术
b. 探索多模态大模型在搜推广翻译等场景的落地实践 c. 带来行业的最新动向趋势洞察。

演讲题纲


a. 多模态大模型技术创新(Vision-R1、Dynamic-llava、RedOne)
b. 多模态大模型在搜索、推荐、翻译、情感陪聊的应用(各1个案例 + 论文)。

话题亮点


a、多模态大模型在小红书搜索、推荐、翻译等场景重要落地实践经验
b、大语言模型和多模态大模型的技术创新,包括Deepseek-R1多模态版本、大语言模型后训练的最佳实践方案等。

课程费用

6800.00 /人

课程时长

50分钟以下及更短时间

预约体验票 我要分享

近期公开课推荐

近期公开课推荐

提交需求