非常高兴能够成功报名参加这期AI训练营,希望能有一份不一样的体验。
1.定义和分类
1.视觉生产-定义:
通过一个/一系列视觉过程,产出新的视觉表达
产出:人或机器能够感知的图像视频,而不是标签或特征;
要求:新的,和输入不一样的。
过程:
2.视觉生产分类:
- 生成:从0到1
- 拓展:从1到N
- 摘要:从N到1
- 升维:从An到An+1(2D->2D+t;2D->3D)
- 增强/变换:从A到B
- 插入/合成:A+B=C
- 擦除:A-B=C
3.视觉生产—五个关键维度
- 满足视觉/美学表现(可看)
- 合乎语义/内容逻辑(合理)
- 保证结果的丰富性(多用)
- 提供用户预期的抓手(可控)
- 带来用户/商业价值(可用)
2.精细理解—寻微入里
1.精细理解—分割抠图
- 识别:知道是什么
人的识别、物的识别 - 检测:识别+知道在哪儿
- 分割:识别+检测
2.分割抠图—效果展示
3.视觉生成
1.视觉生成—框架流程
4.视觉编辑
1.视觉编辑—视频植入
- 挖掘视频核心价值:扩展广告曝光渠道,创意广告模式,提升用户体验。
- 扩大植入范围:自动化批处理视频内容,挖掘海量短视频、UCG内容等广告价值,扩大植入内容。
- 提升植入效果效率:取代手工后期,缩短植入周期,降低人力成本,给广告招商留出充足时间,且不需要修改与留出媒资。
2.视觉编辑—视频内容擦除
例如可以去除视频上的广告logo
3.视觉编辑—文字擦除
当老片变成高清的时候,可能字幕的分辨率也不高,这时候就需要把文字擦除,然后再添加上高清的文字
4.视觉编辑—图像尺寸变化
当一张图片要应用到不同设备不同场合的时候,图片可以根据不同的设备变换尺寸。
5.视觉增强—修复如新
- 视觉增强—视频增强
- 视觉增强—人脸修复增强
- 视觉增强—视频超分
- 视觉增强—视频插帧
- 视觉增强—HDR色彩扩展
6. 视觉增强—风格迁移
7. 视觉增强—颜色拓展
6.视觉制造—由虚入实
1.视觉制造—核心逻辑:
7.视觉开放平台—万剑归宗
视觉智能开放平台
传送门:https://vision.aliyun.com/