stilltesting,nameisq

文章标签:还在测试,名字很 Q。

机器之心报道

机器之心编辑部

还在测试，名字很 Q。

ChatGPT 问世以后，这大半年的时间，科技领域整个被大模型洗礼了一遍。

在国内，由百度、阿里代表中国科技企业率先发布了大模型对话平台文心一言、通义千问，腾讯、京东在行业大模型上也已经出手，华为探索了，同时也有一批创业公司积极参与这场科技竞赛。

你是不是也好奇加期待，字节跳动的大模型在哪里？

如今，它终于露相了。

昨天，字节跳动大模型对话产品「豆包」邀测，用户可通过网页或者下载 App 体验这一人工智能助手。

「豆包」有哪些能力？体验起来效果如何？机器之心首先下口，尝了「豆包」。

「豆包」初体验

我们对「豆包」基本问答、常识问答、写作能力和数学能力四个方面进行了简单测试。

基本问答

先让「豆包」做个自我介绍：

从「豆包」的回答中，我们发现它主要具备自然语言处理、知识回答、语言翻译、文本摘要、情感分析几大能力：

对大型语言模型（LLM）来说，训练数据非常重要，直接影响模型掌握的信息和生成结果的质量。「豆包」表示其训练数据截止到 2023 年：

为了验证这一点，我们询问它是否知道 2023 年 3 月 OpenAI 推出的大型语言模型 GPT-4，显然，它知道。

常识问答

我们进一步询问一些应用型问题，比如「你知道机器之心吗」，「豆包」的回答可以说是非常准确详尽了：

如果我们想拟一个招聘文案，招聘要求里应该阐明哪些工作能力呢，「豆包」给出了答案：

我们又问了一个与英语学习相关的问题：如何提高英语写作能力，「豆包」的回答从读写练习、词汇语法、写作技巧、寻求反馈等方面给出了合理建议，条理清晰：

写作能力

除了对话问答，文本写作也是大模型的一个重要任务，具有广泛的应用前景。为了测试「豆包」的写作能力，我们让它编写了一个关于「未来人工智能」的科幻故事：

整个故事以人工智能的飞速发展为背景展开，故事过程完整、有趣味性，可见「豆包」具备一定的写作能力。

数学能力

众所周知，数学问题对大模型来说极具挑战性，因为解决数学问题需要严密的逻辑和推理。我们用经典的「鸡兔同笼」问题测试了一下「豆包」的数学能力，它用二元一次方程组准确、快捷地回答了这个问题，这也是「鸡兔同笼」问题的常见解法。

再测试一下「豆包」的基本计算能力和分数化简能力：

看了这些问题与回答，你初步感觉如何？

字节跳动「豆包」项目团队成员告诉机器之心，「豆包」还处于早期开发验证阶段，这次只是小范围的邀请制测试。目前测试期的「豆包」还存在较多局限，生成的内容也可能不准确，欢迎测试用户提供反馈意见，研发团队将持续改进产品。

值得一提的是，在进入「豆包」的对话页面后，我们发现除了「豆包」，字节跳动还开发了多个面向不同应用场景的对话平台，如「小宁」、英语学习助手、全能写作助手。看来字节跳动也在下一盘大模型应用的大棋，我们拭目以待。

举报/反馈

还在测试,名字很 Q。