昨天,OpenAI宣布了其多模态大型语言模型的下一个迭代GPT-4(在新窗口打开),以及一些令人印象深刻的数据和一些熟悉的警告。
当ChatGPT第一次出现在去年11月,它就像一盏灯的开关被打开,我们都进入了一个新的水平人工智能网上。我们都还在适应,但OpenAI并没有停滞不前。ChatGPT使用GPT-3.5,和OpenAI花了六个月的时间(在新窗口打开)利用它从中吸取的经验教训和对抗性测试程序来创建GPT-4,将GPT-3.5甩在后面。
OpenAI表示,GPT-4在大多数领域都得到了改进。它更具创造性和协作性,接受图像作为输入,并可以从中生成标题、分类和分析。新模型还可以处理超过25,000字的文本(比ChatGPT多8倍),并且在高级推理能力方面超过了ChatGPT。
在表现比较方面,GPT-4在所有类型的考试中都优于GPT-3.5,包括统一律师考试、sat和各种奥林匹克运动会。例如,它在这些学术基准中提供了人类水平的表现,在律师考试中达到了90%。GPT-4在所有传统机器学习模型基准测试中也优于其他大型语言模型,即使你将问题翻译成24种不同的语言。
当然也有局限性,OpenAI公开承认这些局限性与早期版本的语言模型相似。GPT-4会产生“幻觉”,并在推理中犯错误。社会偏见仍然存在,并且正在进行更好地处理对抗性提示的工作。它可能“在预测中肯定是错误的”,并且缺乏对2021年9月之后发生的事件的知识,因为这是它的训练数据分界点。考虑到这一切,OpenAI的建议是“在高风险环境中”不要依赖GPT-4。
微软已经证实,必应正在运行一个GPT-4版本(在新窗口打开)已经为搜索定制了。任何人使用Bing新预览在搜索、阅读它生成的答案或聊天时已经体验过GPT-4。微软还证实,OpenAI对GPT-4的任何更新都将被输入必应。
OpenAI已经与其他组织合作,将GPT-4集成到他们的产品和服务中。列表包括DuolingoStripe帮助打击欺诈,摩根士丹利帮助组织其知识库,冰岛政府帮助保护其语言,可汗学院作为学习试点项目的一部分,以及做我的眼睛以帮助视觉可及性。
除了使用必应,OpenAI还让ChatGPT Plus用户可以使用GPT-4,但有一个使用上限。还有一个开发者候补名单(在新窗口打开)他们想要访问GPT-4 API,每天都会解锁新的地方。