DCLM-7B PyTorch模型微调入门实战

10月26日,北京站源创会,聊聊高性能计算与大模型推理 1 引言 DCLM-7B是由苹果公司联合研究团队开发的一个开源AI语言模型,它基于PyTorch和OpenLM框架开发,采用decoder-only架构,上下文长度为2048,在53个自然语言理解任务上展现了出色的性能,在MMLU基准测试中的5-shot准确率达到了63.7%,显示了其强大的语言理解能力。此外,DCLM-7B的训练效率显著,使用的计算量比其他同等规模的模型要少40%。 2 环境准备 2.1 安装Ascend CANN To
分类: 其他 发布时间: 10-25 19:17 阅读次数: 0

首发!Open-Sora Plan来袭,魔乐社区带您探索新境界

10月26日,北京站源创会,聊聊高性能计算与大模型推理 近期,由北大-兔展AIGC联合实验室共同发起的项目Open-Sora Plan在魔乐社区重磅发布。项目希望通过社区的力量复现OpenAI的Sora,共同推动人工智能技术的发展。 此次,魔乐社区为Open-Sora Plan提供一个平台,为开发者体验提供极大的便利。开发者通过简单的API接口和社区提供的强大算力支持即可在线体验,也可以一键获取模型,轻松上手并快速开始项目。感兴趣的开发者可以通过魔乐社区了解更多信息,并参与到这一项目中来。 应
分类: 其他 发布时间: 10-25 19:17 阅读次数: 0

Llama-3.2-3B-Instruct PyTorch模型微调最佳实践

10月26日,北京站源创会,聊聊高性能计算与大模型推理 1 引言 Meta Llama 3.2多语言大型语言模型集合(LM)是一个1B和3B大小(文本输入/文本输出)的预训练和指令微调模型集合。Llama 3.2指令调整的纯文本模型针对多语言对话用例进行了优化,包括智能检索和总结任务。它们在常见的行业基准上优于许多可用的开源和闭源聊天模型。 2 环境准备 2.1 安装Ascend CANN Toolkit和Kernels 安装方法请参考安装教程或使用以下命令。 # 请替换URL为CANN版本和
分类: 其他 发布时间: 10-25 19:17 阅读次数: 0

基于openMind的MiniCPM PyTorch模型微调最佳实践

10月26日,北京站源创会,聊聊高性能计算与大模型推理 1 引言 2024年2月1日,面壁智能与清华大学自然语言处理实验室共同开源MiniCPM系列端侧大模型,主体语言模型MiniCPM-2B仅有24亿(2.4B)的非词嵌入参数量,总计2.7B参数量。 经过SFT后,MiniCPM-2B在公开综合性评测集上与Mistral-7B表现相近(中文、数学和代码能力更优),整体性能超越Llama2-13B、MPT-30B、Falcon-40B等模型。 经过DPO后,MiniCPM-2B在当前最接近用户
分类: 其他 发布时间: 10-25 19:17 阅读次数: 0

openMind背后的技术揭秘:镜像创新实践

10月26日,北京站源创会,聊聊高性能计算与大模型推理 一、openMind openMind 是一款应用使能开发套件,原生支持昇腾NPU处理器,为各大模型社区提供支持,提供海量模型/数据托管能力、在线推理体验服务,还支持接入内容审核、病毒扫描等服务,可以帮助平台伙伴快速构建社区。同时,openMind应用使能工具链还能提供模型训练、微调、评估、推理等全流程开发能力、开发者通过简单的API即可实现微调、推理等任务,极大缩短开发周期。具体来说,它提供下面的工具以及服务: openMind应用使能
分类: 其他 发布时间: 10-25 19:17 阅读次数: 0

openMind+LLaMAFactory:Qwen1.5-7B 微调及推理昇腾实践

10月26日,北京站源创会,聊聊高性能计算与大模型推理 一 概述 Qwen系列模型是由阿里巴巴开发的开源大语言模型,其被广泛用于自然语言处理的多种任务,包括文本生成、翻译、摘要生成等。本文的目标是使用 openMind 工具套件及 LLaMA-Factory 开源微调框架,在昇腾 NPU 上跑通 Qwen1.5-7B 模型的微调和推理全流程。 二 环境准备 安装 Ascend CANN Toolkit 和 Kernels 请参考安装教程或使用以下命令快速安装。 # 请替换URL为CANN版本和
分类: 其他 发布时间: 10-25 19:16 阅读次数: 0

10月26日,高性能计算与大模型推理沙龙,OSC源创会北京站

10月26日,北京站源创会,聊聊高性能计算与大模型推理 大模型推理与高性能计算是当今人工智能领域中的两个重要方面。大模型通常具有数亿甚至数万亿的参数,它们在推理时需要大量的计算资源来处理输入数据并生成输出。应用使能开发套件openMind提供海量模型/数据托管能力、在线推理体验服务,同时具备模型训练、微调、评估、推理等全流程开发能力,有效支持魔乐等AI生态社区的发展。开发者通过简单的API接口即可实现微调、推理等任务,极大缩短开发周期,让开发过程更加高效简洁。10月26日(本周六),OSC源创
分类: 其他 发布时间: 10-25 19:16 阅读次数: 0

没错,Go 语言的函数参数没有引用传递方式

10月26日,北京站源创会,聊聊高性能计算与大模型推理 这篇文章想浅浅地讲解 Go 语言函数参数传递的值拷贝。 一句话观点 Go语言中所有传递都是值传递,严格来说并不存在引用传递的概念。传递指针只是传递指针的值,并不是引用传递,只不过通过指针可以间接修改变量的值,从而达到类似引用传递的效果。 值传递 值传递就是将参数的副本传递给函数,因此在函数内部修改参数的值,不会影响到原始变量的值。 func modifyValue(person Person) { person.Name
分类: 其他 发布时间: 10-25 19:16 阅读次数: 0

技术峰会|58同城刘笠熙受邀参加2023SACC中国系统架构师大会

10月26日,北京站源创会,聊聊高性能计算与大模型推理 2023 SACC中国系统架构师大会 2023年11.24-25日,由IT168旗下ITPUB企业社区平台主办的中国系统架构师大会-专题研讨会·上海站,将在上海丽璟滨江酒店召开。本届大会以“数字转型 架构演进”为主题,由原来的大会演讲模式,变革为专题研讨会模式,设置八个专题研讨:企业架构演进之路、向量数据库技术探索、多云架构设计与管理、存储架构、大数据架构、智能运维以及云成本管理,AIGC智能化应用实践,云集国内CTO/CIO、技术总监、
分类: 其他 发布时间: 10-25 19:16 阅读次数: 0

58集团携手华为启动58同城、安居客鸿蒙原生应用开发

10月26日,北京站源创会,聊聊高性能计算与大模型推理 11月30日,生活服务领域头部企业58集团与华为举办鸿蒙原生应用开发启动仪式。此次仪式上,58集团宣布旗下58同城、安居客两款核心App将基于HarmonyOS NEXT启动原生应用开发。 双方团队积极进行联合技术创新,探索出跨平台框架鸿蒙化的技术路线,此举将帮助更多伙伴更快推进鸿蒙原生进程。 58集团作为生活服务平台的领跑者,也将助力鸿蒙生态进一步融入大众生活场景。 58同城成立于2005年,服务亿级用户和千万平台商家,其服务覆盖招聘、
分类: 其他 发布时间: 10-25 19:16 阅读次数: 0

技术峰会|58同城陈丽媛受邀参加第十二届全球软件案例研究峰会

10月26日,北京站源创会,聊聊高性能计算与大模型推理 第十二届全球软件案例研究峰会 全球软件案例研究峰会(简称“壹佰案例”)是科技界一年一度的案例研究榜单,旨在发现有案例教学意义的项目或方法论,如同商业领域的哈佛案例,科技界的壹佰案例榜单每年精选100件案例题材,有别于媒体的追逐热点和新奇概念,壹佰案例榜单更崇尚专业的力量和案例落地实践,通过邀请国内外享誉盛名的专家、各大公司技术委员会与设计委员会负责人担任联席主席,向领先公司和早期实践者征集年度里程碑或杰出成果背后的案例故事,通过组委会提供
分类: 其他 发布时间: 10-25 19:16 阅读次数: 0

基石可视化数据分析平台设计实践

10月26日,北京站源创会,聊聊高性能计算与大模型推理 1 概述 在当下数字化转型的大环境中,数据成为企业发展重要基石,如何利用好数据进行分析也成为更多企业面临的首要问题。 随着信息技术发展,数据分析平台作为一种新型的企业管理工具,可以帮助企业实现数据收集、处理、分析和应用的全过程,为企业提供全面、准确、及时的数据和决策支持。 部门内部自研的数据可视化分析平台-基石,基于传统BI多类型数据源管理,在自助式生成数据展示页面的基础上,加强了数据增强分析能力。其中异动分析、转化分析、漏斗分析等大大提
分类: 其他 发布时间: 10-25 19:16 阅读次数: 0

空间索引技术在58搜索中的落地实践 – BKD技术原理深入剖析

10月26日,北京站源创会,聊聊高性能计算与大模型推理 1 序言 一直以来,在涉及搜索引擎的空间数据检索、空间数值数据查询或范围查询问题领域,BKD或BKD-Tree技术作为空间索引技术的重要方面,一直是被讨论的一个绕不开的热门话题。在网络上有关BKD的技术文章或博客、贴文,虽然也有一些,然而多是言之不精,浅谈辄止,良莠不齐,让很多想学习、掌握BKD技术要点和技术内幕的人不得其法,徘徊在困惑迷茫的新手之路上。着眼于此,本文正是这样一篇全面、深入讲述BKD前世今生、技术内幕和算法本质的技术文章,
分类: 其他 发布时间: 10-25 19:16 阅读次数: 0

技术沙龙 | 58同城大模型技术探索和应用

10月26日,北京站源创会,聊聊高性能计算与大模型推理 ITPUB技术社区 联合58同城将举办一期技术沙龙《58同城大模型技术探索和应用》,本次沙龙由58同城TEG-AI Lab负责人、技术委员会AI分会主席詹坤林出品,邀请了58同城TEG-AI Lab算法架构师孙启明、HRG招聘事业群平台算法技术部算法架构师马小林进行分享,欢迎观看。 直播时间:2024年1月16日(周二)19:00、2024年1月18日(周四)19:00 直播平台:ITPUB视频号(打开微信,发现,视频号,顶部搜索,输入I
分类: 其他 发布时间: 10-25 19:16 阅读次数: 0

基于service mesh的服务治理体系实现详解

10月26日,北京站源创会,聊聊高性能计算与大模型推理 1 序言 随 着微服务和容器化技术的迅速发展,传统的基于SDK和服务框架的微服务架构在面对多元化的技术和逐步增多的服务数量时弊端逐渐显现,为了解决这些问题,service mesh作为新一代的微服务框架逐渐展露头角。这种架构模式可以将其视为微服务时代的TCP/IP协议,通过将网络通信层下沉,来屏蔽分布式系统带来的复杂性。因此各大厂纷纷向这种微服务架构模式升级,用该种模式解决东西向流量(server-server)和南北向流量(client
分类: 其他 发布时间: 10-25 19:16 阅读次数: 0

技术峰会|58同城詹坤林受邀参加2024中国生成式 AI 大会

10月26日,北京站源创会,聊聊高性能计算与大模型推理 2024中国生成式 AI 大会 自 ChatGPT 面世以来,生成式 AI 已加速狂飙16个月,在学术界、产业界、投资界掀起滔天巨浪,冲击着千行百业。 AI 大模型飞速迭代,创新应用层出不穷。我们正处于技术野蛮生长的爆发时刻,见证着 AI 向通用人工智能全速冲刺的破竹之势。 值此之际,由智一科技旗下智东西联合智猩猩发起主办的2024中国生成式 AI 大会将于4月18日-19日在北京JW万豪酒店举办。今年大会以“重构世界 奔赴未来”为主题,
分类: 其他 发布时间: 10-25 19:16 阅读次数: 0

鲁班-58房产低代码平台设计与实践

10月26日,北京站源创会,聊聊高性能计算与大模型推理 1 导读 鲁班全栈式低代码开发平台(以下简称鲁班)是58房产自研的全栈式低代码开发平台,我们的目标是:人人都可以成为全栈开发工程师。让后端人员可以干一些简单的前端工作,让前端人员可以干一些简单的后端工作。2023年4月初上线,截止目前已经拥有300+的用户,开发了40+的应用,并上线了270+模型、900+页面、1600+的接口。 图1:鲁班目前的使用情况(这个图表也是用鲁班开发) 2 背景 2.1 传统开发模式的不足 场景1: 我是一个
分类: 其他 发布时间: 10-25 19:16 阅读次数: 0

WOT全球技术创新大会 | 詹坤林 | 大模型+智能体加速AI应用落地

10月26日,北京站源创会,聊聊高性能计算与大模型推理 WOT(World of Tech)全球技术创新大会是由51CTO开创的综合性高端技术会议品牌,自2012年首次举办以来,历时十余年沉淀,累计超过万名技术人员现场参与。“WOT全球技术创新大会2024·北京站”将于6月21日-22日在北京召开。自ChatGPT引爆AIGC热潮以来,社会各界都表现出了空前高涨的热情并纷纷投身其中。大量生成式AI领域的创新技术如雨后春笋般相继涌现,也将其广阔无边的应用场景展现在我们眼前。本届大会顺应大势,以“
分类: 其他 发布时间: 10-25 19:15 阅读次数: 0

A2M人工智能创新峰会 | 孙启明 | 58同城垂类大语言模型"灵犀"建设之路

10月26日,北京站源创会,聊聊高性能计算与大模型推理 A2M人工智能创新峰会由msup(麦思博)举办,旨在发现全球互联网领域在人工智能、大数据、互联网架构等领域的创新工程和杰出团队,整合国际前沿技术实践,构建行业案例研究智库,帮助中国企业在人工智能时代成功转型、升级。会议将于6月28-29日在上海明捷万丽酒店盛大举行。 大会官网:https://a2m.msup.com.cn/course?cid=17549&aid=4124 大会介绍:A2M大会议程 58同城AI Lab大语言模型算法部负
分类: 其他 发布时间: 10-25 19:15 阅读次数: 0

喜讯!58同城灵犀大模型正式通过生成式人工智能服务备案

10月26日,北京站源创会,聊聊高性能计算与大模型推理 2024年7月20日,58同城“灵犀大模型”正式通过生成式人工智能服务备案(模型名称:灵犀,备案单位:北京五八信息技术有限公司,上线备案编号:Beijing—LingXi—202407050027)。 58同城AI Lab基于开源通用大语言模型,使用58同城生活服务领域(房产、招聘、汽车、本地服务)数据继续训练,打造了垂类大语言模型——灵犀大模型(ChatLing),支撑了58同城各业务场景AI应用的落地。灵犀大模型通过生成式人工智能服务
分类: 其他 发布时间: 10-25 19:15 阅读次数: 0