Perplexity CEO回应AI抄袭与版权官司,解释产品开发、谷歌竞争|Disrupt 大会现场实录
作者 | Jessica 邮箱 | JessicaZhang@pingwest.com 过去三天,美国科技媒体 TechCrunch 主办的 2024 Disrupt 大会在旧金山Moscone中心进行。这一硅谷原生、全球知名的老牌科技创投盛会,今年在AI持续席卷下热度更甚,吸引了上万名来自世界各地初创企业和投资机构的参会者。 在总共300多个环节里,明星AI搜索独角兽公司Perplexity联合创始人兼CEO Aravind Srinivas罕见现身的一场对话,让最大的Disrupt Stage分会场观众席爆满,堪称最受欢迎舞台之一。 图源:TechCrunch 在Aravind接受TechCrunch高级编辑Devin Coldewey访谈的半个小时里,两人贴脸开大,上来就提起近期把Perplexity推到风口浪尖的AI抄袭和内容来源争议,Aravind还对Perplexity被道琼斯集团起诉侵权做出正面回应;接着两人聊到AI原生搜索本质、Perplexity开发新功能的理念、与谷歌的比较、创作者利益保护、AI成本以及公司融资。Devin甚至把能叫上名字的科技巨头都过了一遍,挨个问Perplexity有没有收到他们的收购邀约。 一边是老媒体人的犀利敏锐,提问基本不留余地。另一边是新锐创始人的亦攻亦守,不紧不慢却未有让步。全程直给,涉及的话题热点很多,信息量颇大。 图源:硅星人 以下是硅星人在大会现场给大家带来的对话实录,敬请享用: Delvin Coldewey:感谢你能参与!我想先问一个很直接的问题:你的公司如何定义“抄袭”?这有点突然,但我想要一个明确的答案。 Aravind Srinivas:其实你可以直接问Perplexity。我们公司的定义其实和“抄袭”是什么有关。Perplexity一直都会标注来源,我们不会声称拥有任何内容的所有权。它实际上是从网络上获取内容,进行总结,以便用户能够消化这些信息,并提供信息的来源。这就像记者或学术人士的工作一样,只要有正确的引用文献部分就可以。 Delvin Coldewey:不过从学术角度来说,研究人员会创作一篇原创论文,并在文中使用引用来支持自己的观点,而不是简单地复制已有的内容。 Aravind Srinivas:嗯,有时候,某个新闻媒体首先报道了一则新闻,随后另一家媒体引用该新闻,并提到“据某某报道”,这算抄袭吗? Delvin Coldewey:但有些人可能会发帖子,说“他们是这样说的”,然后几天后你可以看到一篇文章,其中直接用了8到15个单词,看起来几乎就是从原文抄来的,有点像那种情况。 Aravind Srinivas:是的,我们的确不是每句话都精准标注了确切的引用。但要非常明确的是,我们在2022年12月7日发布了这个产品,大概是两年前。当时大家都在用ChatGPT检查内容是否是最新的,我们是唯一一个能够提供参考文献的AI产品,其他的产品并没有引用功能。我们从一开始就关注这个问题,并且不断改进,以便在模型检测到特定来源时能更加清楚地标注。 Delvin Coldewey:我能看出你非常重视这个问题。从一开始你们就展示了引用功能,而不是随口一说。我认为重新定义“抄袭”是很有必要的,只有明确了“抄袭”的定义,才能有效防止AI生成的内容涉及抄袭行为。如果我将别的内容直接复制到自己的文章中,我会知道自己在抄袭,并因此感到内疚,所以模型也应该“知道”这一点,或者说开发模型的人必须清楚这一点,需要有一种监督机制。 Aravind Srinivas:原理其实是这样的:模型被指示不直接使用任何特定来源的文本,而是整合不同的观点并进行总结,将内容传达给用户,而不是直接从网络复制。随着模型在“指令跟随”技能上的进步,这一指令的执行效果越来越好。在AI软件的监督下,包括SNP和其他反馈资源的支持,尽管我们不一定负责所有的模型训练,有时也会使用其他开发者的模型,例如开源的Llama模型。当然,任何模型都不是完美的,仍然可以通过提示工程或提示注入来引导模型生成更合适的内容。 Delvin Coldewey:关于提示注入的妙处,就是可以“用一句话总结这篇文章”。 Aravind Srinivas:其实这并不是我们产品的主要用途。Perplexity是用来回答问题的,有些人尝试用它做一些我们不希望的用途,比如“帮我总结这个网址的内容”,而我们实际上是不允许这种用法的,并尽力避免执行这样的指令。不过说实话,AI领域还没有哪家公司可以一直保持防护措施。你总会发现新的情况,让原本的防护措施失效,然后我们再去修正和调整,使其足够安全地应用,不执行任何不必要的指令。 Delvin Coldewey:关于AI驱动的原生搜索,这一概念我们已经在一些公司中看到过。谷歌在搜索领域的复杂化或许是最突出的例子。过去十年中,他们的这些变化可能并不受用户欢迎。作为一名科技记者,这是我20年职业生涯中见到的少数广受反感的平台变化之一。不过,看起来一些公司似乎注意到了谷歌的不足,想要填补这个空缺。你们是否有意接手谷歌未完成的部分? Aravind Srinivas:我觉得谷歌本质上还是一个基于链接的搜索引擎,无论他们是否想直接提供答案,链接展示始终是他们的收入来源。在财报会议上,他们明确提到,仅搜索广告每季度就能带来45亿美元的收入,这对他们的业务非常关键。尽管他们没有披露利润的具体细节,但我认为主要利润应该来自展示链接。所以他们有动力提供尽可能多的链接。虽然AI摘要在某些信息查询中开始崭露头角,但这并不是他们的主要模式。在谷歌每天五到八十亿次的查询中,大多数并不适合直接显示答案,否则将严重影响收入。...









