课程简介
案例背景:
企业有很多专业知识(行业Know-how)和数据表,但是知识、数据的使用目前大部分采用搜索-阅读的方式进行,效率低,而数据库数据需要研发提需求开发,很多时候只能满足“领导”需求,大量需要观察数据的非技术人员的需求很难满足。随着大模型的出现,通过聊天的方式来获取知识是非常好的一个方式,但是面临诸多挑战,例如数据不能出域、权限问题、速度问题。
解决思路:
权限,通过数据权限域+embedding的方式来解决。
速度,流式生成。
实现原理:处理各种文件格式->将文章切片到段落->段落通过大模型转为embedding->将问题转换为embedding->召回排序->把提问和最接近的几个段落融合生成最终答案。
隐私,私有化部署来解决。
成果:
目前demo已有,但是还在进一步优化,预计到6月底可以有一版MVP
目标收益
1.PDF、Word、Excel、数据库,如何通过chat的方式获取想要的答案
2.大模型langchain在实际应用的坑与解决方案
3.大模型如何和企业私有数据结合使用
4.从需求到MVP如何一步一步磨出来
培训对象
课程内容
案例方向
AIGC / Web3 / 数据智能赋能企业 / 安全
案例背景
企业有很多专业知识(行业Know-how)和数据表,但是知识、数据的使用目前大部分采用搜索-阅读的方式进行,效率低,而数据库数据需要研发提需求开发,很多时候只能满足“领导”需求,大量需要观察数据的非技术人员的需求很难满足。随着大模型的出现,通过聊天的方式来获取知识是非常好的一个方式,但是面临诸多挑战,例如数据不能出域、权限问题、速度问题。
收益
1.PDF、Word、Excel、数据库,如何通过chat的方式获取想要的答案
2.大模型langchain在实际应用的坑与解决方案
3.大模型如何和企业私有数据结合使用
4.从需求到MVP如何一步一步磨出来
解决思路
权限,通过数据权限域+embedding的方式来解决。
速度,流式生成。
实现原理:处理各种文件格式->将文章切片到段落->段落通过大模型转为embedding->将问题转换为embedding->召回排序->把提问和最接近的几个段落融合生成最终答案。
隐私,私有化部署来解决。
结果
目前demo已有,但是还在进一步优化,预计到6月底可以有一版MVP