实不相瞒，字节跳动的大模型、推荐、特效算法……都是在这里跑出来的 - 代码天地

实不相瞒，字节跳动的大模型、推荐、特效算法……都是在这里跑出来的

企业开发 2023-10-01 13:25:34 阅读次数: 0

在字节跳动，机器学习算法被应用在许许多多不同的场景：

在今日头条里，你被推荐的文章；

在抖音里，你用到的那些活灵活现的视频特效；

在飞书里，把你说的话转化为文字的功能；

在前不久公测的 AI 对话产品「豆包」里，AI 给你生成的文本段落；

……

这些算法模型，是怎样生产出来的？

或许你会回答：“收集数据，找预训练模型，在 GPU 上训练，然后各种微调……”

但当我们有很多位算法工程师、要训练许许多多模型、使用很多 GPU、管理海量数据的时候，又应该怎么办呢？

靠的是字节跳动的「机器学习平台」。

字节跳动工程师哈雷说：“我们机器学习平台的每天产出的模型应该有几万个，活跃在平台上的算法工程师可能也有两三千人。”此外，对于许多客户公司，诸如自动驾驶行业、大模型行业、电商行业的企业，火山引擎也在依靠机器学习平台来完成他们的模型训练需求。

字节跳动的机器学习平台能够让千卡规模的 GPU 集群稳定运行数百小时的时间，同时最大可能的节约资源，“如果在千卡规模的 GPU 上运行，可能一个月的成本都要四五百万的样子”字节跳动产品经理阳阳说。通过流量错峰、混合部署的方式，我们尽量提高资源利用率，就能把成本降下来。

今天，我们开启了「字节技术站」，一档介绍字节跳动技术实践与技术故事的视频栏目，本期视频先为你揭开字节跳动机器学习平台的神秘面纱。

字节跳动机器学习平台相关技术类岗位正在招聘中，扫描下图二维码或点击文末「阅读原文」，直达官网投递简历~

猜你喜欢

转载自blog.csdn.net/weixin_47098359/article/details/132820323

实不相瞒，字节跳动的大模型、推荐、特效算法……都是在这里跑出来的

实不相瞒，我就是鹤岗的女婿~

实不相瞒——看完你也能（10分钟内）手撸一个低代码框架

beeline跑出来的文件没有数据（这里的原因是跑出来的数据量比较大）

HelloWorld是怎么跑出来的?

div中的图片跑出来

idea run按钮跑出来

航带模式拍完之后用重建大师跑出来的模型是弧形的，怎么处理？

令人感到过分，又跑出来教人用python破解验证码，还是可训练模型

在这里

孩子在这里

hello我在这里

以后就在这里了

srsLTE 的仿真在这里

国家名称在这里

分享996个实用的JavaScript特效你要的全在这里

Follow your heart(189)---很多人跑出来了

二麻子，你们测试用例跑出来的 Bug 占比是多少？

mr和tez跑出来的数据不一样，mr丢数据？

[推荐]目前最好的微信域名防封技术都在这里！

火爆的人工智能项目都在这里了｜Gitee项目推荐

Android四大组件：关于Activity的知识都在这里了

华为云学院干货：服务创新大舞台在这里！

真兄弟在这里！重庆能上岸先要谢恒大！两功绩卓著

BAT 才不关心币价，19年的5大重点在这里！

大揭秘！热门报表工具Fastreport和Stimulsoft最新动态都在这里

PCB五大设计难题，解决方法都在这里了

收藏！代码调优的6大法则都在这里了！

UPC豁免流程精讲！你与大卖的距离，就在这里！

软件测试获得高薪的秘诀就在这里，不看亏大了！

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)