GPT-4提供人类水平的表现，幻觉，和更好的Bing结果| PCMag

GPT-4提供人类水平的表现、幻觉和更好的Bing结果

OpenAI花了6个月的时间学习ChatGPT，添加图像作为输入，在性能方面完全超越了GPT-3.5。

通过马修·汉弗莱斯

马修·汉弗莱斯

高级编辑

我的经验

自2016年11月以来，我一直在PCMag工作，涵盖所有领域的技术和电子游戏新闻。在此之前，我在Geek.com工作了近15年，担任作家和编辑。大学毕业后的前6年，我作为专业游戏设计师在迪士尼、Games Workshop、20世纪福克斯和Vivendi工作。

阅读个人简介

2023年3月15日

昨天，OpenAI宣布了其多模态大型语言模型的下一个迭代GPT-4(在新窗口打开)，以及一些令人印象深刻的数据和一些熟悉的警告。

当ChatGPT第一次出现在去年11月，它就像一盏灯的开关被打开，我们都进入了一个新的水平人工智能网上。我们都还在适应，但OpenAI并没有停滞不前。ChatGPT使用GPT-3.5，和OpenAI花了六个月的时间(在新窗口打开)利用它从中吸取的经验教训和对抗性测试程序来创建GPT-4，将GPT-3.5甩在后面。

OpenAI表示，GPT-4在大多数领域都得到了改进。它更具创造性和协作性，接受图像作为输入，并可以从中生成标题、分类和分析。新模型还可以处理超过25,000字的文本(比ChatGPT多8倍)，并且在高级推理能力方面超过了ChatGPT。

(来源:OpenAI)

在表现比较方面，GPT-4在所有类型的考试中都优于GPT-3.5，包括统一律师考试、sat和各种奥林匹克运动会。例如，它在这些学术基准中提供了人类水平的表现，在律师考试中达到了90%。GPT-4在所有传统机器学习模型基准测试中也优于其他大型语言模型，即使你将问题翻译成24种不同的语言。

当然也有局限性，OpenAI公开承认这些局限性与早期版本的语言模型相似。GPT-4会产生“幻觉”，并在推理中犯错误。社会偏见仍然存在，并且正在进行更好地处理对抗性提示的工作。它可能“在预测中肯定是错误的”，并且缺乏对2021年9月之后发生的事件的知识，因为这是它的训练数据分界点。考虑到这一切，OpenAI的建议是“在高风险环境中”不要依赖GPT-4。

微软已经证实，必应正在运行一个GPT-4版本(在新窗口打开)已经为搜索定制了。任何人使用Bing新预览在搜索、阅读它生成的答案或聊天时已经体验过GPT-4。微软还证实，OpenAI对GPT-4的任何更新都将被输入必应。

编辑推荐

ChatGPT有了一个名为Claude的“有用、诚实和无害”的人工智能对手

ChatGPT即将进入你身边的应用程序:OpenAI为其聊天机器人推出API

微软斥资数十亿美元投资ChatGPT Creator OpenAI

OpenAI已经与其他组织合作，将GPT-4集成到他们的产品和服务中。列表包括DuolingoStripe帮助打击欺诈，摩根士丹利帮助组织其知识库，冰岛政府帮助保护其语言，可汗学院作为学习试点项目的一部分，以及做我的眼睛以帮助视觉可及性。

除了使用必应，OpenAI还让ChatGPT Plus用户可以使用GPT-4，但有一个使用上限。还有一个开发者候补名单(在新窗口打开)他们想要访问GPT-4 API，每天都会解锁新的地方。

Mozilla项目负责人与PCMag讨论应用程序隐私

What's New Now<\/strong> to get our top stories delivered to your inbox every morning.","first_published_at":"2021-09-30T21:30:40.000000Z","published_at":"2022-08-31T18:35:24.000000Z","last_published_at":"2022-08-31T18:35:20.000000Z","created_at":null,"updated_at":"2022-08-31T18:35:24.000000Z"})" x-show="showEmailSignUp()" class="rounded bg-gray-lightest text-center md:px-32 md:py-8 p-4 mt-8 container-xs">

获取我们最好的故事!

报名参加最新消息让我们的头条新闻每天早上发送到您的收件箱。

本通讯可能包含广告、交易或附属链接。订阅通讯即表示您同意我们的服务使用条款而且隐私政策．你可以随时退订时事通讯。beplay体育苹果下载

感谢您的报名!

您的订阅已确认。留意你的收件箱!

注册其他时事通讯beplay体育苹果下载

GPT-4提供人类水平的表现、幻觉和更好的Bing结果

编辑推荐

获取我们最好的故事!

深入挖掘相关故事

你会喜欢的PCMag故事

关于Matthew Humphries

高级编辑

请阅读马修·汉弗莱斯的最新报道