关于语言模型私有化部署的讨论 | AIGC实践

上周在与TC同行关于AIGC实践的线上交流中,大家普遍比较关心的一个实践切入点是:语言模型的私有化部署——简单来说,就是在企业内部,部署一个属于自己的“ChatGPT”,对于本行业/专业知识,以及企业独有的产品和技术信息有充分的了解,并且提供用户接口,通过自然语言交流,解答内外部用户的问题。

其实,在此前/此后的多次单点交流中,也有不同行业的朋友向我咨询相同问题。可见,任何人在体验过ChatGPT超强的语言能力后,都不难意识到,这种交互方式必将会成为未来非常重要的应用场景。

这段时间,我花了不少时间做调研;并且,由于我司主营AI计算设备及软件,也刚好具备相关技术背景,于是便近水楼台地与研发Lead和产品经理分别进行交流,看看是否有机会率先实施并落地一个内部应用。

在此梳理一下相关脉络,做一个简单的分享,希望可以给到有相同问题的朋友一点启发。

8d996e2a32a905c8bcfaf2af35286388.png

主题图Prompt:Privatization Deployment of Large Language Models. technological style. --ar 16:9

基本分析

语言模型私有化部署的应用场景,可谓显而易见。

典型场景包括:

  • 内部知识库:提供企业内部的知识共享平台。

  • 智能客服机器人:提供获取产品/技术信息的用户接口。

  • 专家咨询机器人:提供医疗、律师等专业领域的咨询服务。

应用范围非常广泛,几乎可以涵盖所有专业咨询行业,以及所有对外输出产品和服务的企业。应用价值就更不必说了:

  • 技术革新,全面推进AI化进程。所谓的“第四次工业革命”,具有划时代意义;

  • 降本增效。既然AI可以又快又好地完成任务,自然也就不需要付出人工成本。

实现部署的相关资源包括:

  • 硬件:LLM对算力有比较高的要求。

  • 模型:可采用免费的开源模型。

  • 语料库:包括但不限于行业/专业信息;以及企业的产品/技术信息。

  • 算法:需要比较专业的算法工程师参与进行模型训练/微调。

研发观点

从研发的角度来看,实现语言模型私有化部署,还是非常有希望的。

实现语言模型私有化部署的系统架构,主要包括:

  • LLM:语言模型;

  • KB:知识库;

  • 框架:将LLM和KB建立联系;

  • UI:用户界面。

677a2d839091c71adb4bbfc2b880c697.png

其中,LLM可采用2种方式实现:

  • 使用公共模型:通过调用API接口使用OpenAI GPT-3.5

  • 使用开源模型:使用开源模型ChatGLM,但开源不能商用。参考:
    https://github.com/imClumsyPanda/langchain-ChatGLM

部署逻辑分别为:

18480b083cd1f94f92675739e618a26f.png

使用公共模型部署逻辑

220d7d669b88651203043abbcff65d53.png

使用开源模型部署逻辑

KB的输入是语料库,然后经过一系列处理,成为可被LLM调取的知识。

语料库的准备比较简单,只需要保证:内容是以TXT或者Markdown等格式存储的纯文本信息(不包含样式)。

也就是说,如果采用xml类型的内容系统,应该可以比较容易做系统集成;如果采用Word类型的文档,需要转换成不包含样式的纯文本信息,并做必要的数据清洗,避免在转换后出现异常。

产品观点

产品经理的意见,与研发Lead有很大不同,会比较偏向于相对悲观的观点。在他看来:

现有ChatGPT和文心一言采用的语言模型,具有巨大数量的权重参数,并且在语料库上投入了巨大的开发成本——这绝对是开源模型和数据集,无法比拟的。

即便如此,ChatGPT与文心一言在回答问题时,表现出的实际效果,也不完全令人满意;何况是企业基于开源模型自行开发的应用。

第三,语料库的开发也会牵扯到比较大的投入成本,切不说是行业内的专业信息,即便是聚焦在企业产品和技术上的信息,也可能需要投入非常大的工作量。

所以,投入成本与实现效果决定了,可能不太值得去做这样的尝试。

未来,企业比较有希望实现落地的方式是,当文心一言或其他类似应用,最终达到了一个比较好的输出效果后,可能会对外输出toB业务支持,当然,是需要付费的。对于普通企业而言,这可能是相对比较经济的方式。

总结

以上内容基于本人有限的眼界和理解,仅供参考。如果你的企业找到了低成本、高收益的解决方案,实施并落地了应用,也非常期待听到你的分享。

相关文章:#AIGC实践

其他推荐:

实施:GitHub + MarkDown 文档系统的工作环境部署及工作流程说明 | 技术传播

6290c8c4f928f3a4798bfcff3c2b4087.jpeg

技术传播是一片蓝海 | 技术传播

访谈:TC无处不在,只是我们没有发觉 | 技术传播

这次他们说好要“讲真的” | 传播

在座都别吵了,你们还有我 | 技术传播

一本培养强迫症患者的说明书 | 技术传播

就像用心做好日本料理 | 技术传播

顽固的老头子与无聊的说明书 | 技术传播

转战新媒体 | 技术传播

评测:王者荣耀的用户帮助系统 | 技术传播

让爸爸妈妈也能享受到科技发展带来的便利 | 技术传播

企业级信息管理系统初创方案构思 | 技术传播

 bd6df06476029b8951a90783f7942dd0.png

睿齐

技术传播从业者

品牌内容策划

自由摄影师

自由撰稿人

汪力迪

公众号:techcomm / htstory

微信号:bgrichi

邮箱:[email protected]

12bb80f9f2d4eeeaa0060b77a6434e2e.jpeg

猜你喜欢

转载自blog.csdn.net/BGRichi/article/details/131098802