NLP不存在了
CV不存在了
GPT-4是OpenAI最新推出的语言模型,它在GPT-3的基础上做了许多改进和创新。GPT-4的主要突破之处有:
GPT-4具有多模态能力
即它能够同时理解和生成不同类型的输入和输出,比如视频、声音、图像和文本。
虚假的多模态LLM:LLM本身不理解图像,我们先用一些图转文的工具(例如CLIP),把图片转成文字,再将这个文字拼接进Prompt中,例如“我刚给你发了一张图,图的内容是一只黑色的猫,请基于这个信息回答我的问题”
真正的多模态LLM:LLM本身理解了图像,在预训练的过程中就将图像作为其中一部分,构建了图-文的全面理解。当你给他发一张图的时候,他是真正理解了这张图。
第二种才是真正的多模态LLM,才是GPT-4的魅力
自动分析笑点:
徒手生成网页,前端工程师直接原地失业
自己画个网页草图,拍照自动写代码,这不就是前端工程师干的事情吗,只能说设计部分还暂时没失业,开发部分完全失业
推理能力更强
GPT-4使用了更大的数据集和更强大的计算资源,使得它能够处理更复杂的语言任务,大幅增强推理能力。
量子读论文(这个ChatGPT)也行
量子做试卷(明显比ChatGPT)强
考试在全人类前百分之十
GPT-4能够更好地遵循用户的指令,并且更少地产生错误或虚构的信息。知道问题的边界,以及给出更优质的回答
ChatGPT:
GPT-4
明显更加有思考
更加具有常识,不容易被误导
GPT-4:
GPT-3.5(ChatGPT):
长指令
大约可输入2万汉字,巨幅提高
GPT-4支持多种语言,并且能够进行跨语言转换和对话。
格式化输出
指定输出格式
人机对齐
更能知晓问题边界,不容易诱导出错误价值观答案
GPT-4:
GPT-3.5(ChatGPT):
GPT-4是人工智能领域的一次重大突破,还能说啥,只能tqltqltql