文章标签:还在测试,名字很 Q。
机器之心报道
机器之心编辑部
还在测试,名字很 Q。
ChatGPT 问世以后,这大半年的时间,科技领域整个被大模型洗礼了一遍。
在国内,由百度、阿里代表中国科技企业率先发布了大模型对话平台文心一言、通义千问,腾讯、京东在行业大模型上也已经出手,华为探索了,同时也有一批创业公司积极参与这场科技竞赛。
你是不是也好奇加期待,字节跳动的大模型在哪里?
如今,它终于露相了。
昨天,字节跳动大模型对话产品「豆包」邀测,用户可通过网页或者下载 App 体验这一人工智能助手。
「豆包」有哪些能力?体验起来效果如何?机器之心首先下口,尝了「豆包」。
「豆包」初体验
我们对「豆包」基本问答、常识问答、写作能力和数学能力四个方面进行了简单测试。
基本问答
先让「豆包」做个自我介绍:
从「豆包」的回答中,我们发现它主要具备自然语言处理、知识回答、语言翻译、文本摘要、情感分析几大能力:
对大型语言模型(LLM)来说,训练数据非常重要,直接影响模型掌握的信息和生成结果的质量。「豆包」表示其训练数据截止到 2023 年:
为了验证这一点,我们询问它是否知道 2023 年 3 月 OpenAI 推出的大型语言模型 GPT-4,显然,它知道。
常识问答
我们进一步询问一些应用型问题,比如「你知道机器之心吗」,「豆包」的回答可以说是非常准确详尽了:
如果我们想拟一个招聘文案,招聘要求里应该阐明哪些工作能力呢,「豆包」给出了答案:
我们又问了一个与英语学习相关的问题:如何提高英语写作能力,「豆包」的回答从读写练习、词汇语法、写作技巧、寻求反馈等方面给出了合理建议,条理清晰:
写作能力
除了对话问答,文本写作也是大模型的一个重要任务,具有广泛的应用前景。为了测试「豆包」的写作能力,我们让它编写了一个关于「未来人工智能」的科幻故事:
整个故事以人工智能的飞速发展为背景展开,故事过程完整、有趣味性,可见「豆包」具备一定的写作能力。
数学能力
众所周知,数学问题对大模型来说极具挑战性,因为解决数学问题需要严密的逻辑和推理。我们用经典的「鸡兔同笼」问题测试了一下「豆包」的数学能力,它用二元一次方程组准确、快捷地回答了这个问题,这也是「鸡兔同笼」问题的常见解法。
再测试一下「豆包」的基本计算能力和分数化简能力:
看了这些问题与回答,你初步感觉如何?
字节跳动「豆包」项目团队成员告诉机器之心,「豆包」还处于早期开发验证阶段,这次只是小范围的邀请制测试。目前测试期的「豆包」还存在较多局限,生成的内容也可能不准确,欢迎测试用户提供反馈意见,研发团队将持续改进产品。
值得一提的是,在进入「豆包」的对话页面后,我们发现除了「豆包」,字节跳动还开发了多个面向不同应用场景的对话平台,如「小宁」、英语学习助手、全能写作助手。看来字节跳动也在下一盘大模型应用的大棋,我们拭目以待。
还在测试,名字很 Q。