AI情感助手
编辑:润 拉燕 【新智元导读】论文教你用ChatGPT炒股,收益最高能到500%! ChatGPT,要把人类基金经理也给替代了? 英国的一家金融咨询网站Finder表示,他们在3月6日创立了一个由ChatGPT选择的股票组成的投资组合,这个组合在两个月后上涨了4.93%。 而同期之内,英国10大最受欢迎的基金的平均表现为-0.78%,而且在87%的交易日中表现都不及「ChatGPT指数」。 同样的,同期标准普尔500指数(包含美国最有价值的500家公司的指数)也只上涨了3%。 难道除了文字工作者们的岗位受到了威胁之外,「打工人」的脸面——基金经理们也要失业了吗? 未曾设想的道路 谁能想到,国外研究者还真整了篇论文出来,细致入微地探索AI炒股的能力。 具体来说,就是「喂」给ChatGPT一些新闻标题,让ChatGPT来用情感分析(Sentiment Analysis)判断这些事件对股市的影响。 ChatGPT会判断出,某一事件对股票价格有利、不利,还是不相关。之后,研究者会依照该结果打分,用真实的股市回报来看ChatGPT准不准。 研究人员表示,ChatGPT要比别的模型强多了,像什么GPT-1、GPT-2都预测的不准。 这说明两件事,第一,股市的回报预测能力对语言模型来说是一个亟待进一步探究的能力。第二,更高级的语言模型一定能生成更准确的预测。 研究团队主要使用的三个数据集分别是证券价格研究中心(CRSP)的每日收益率汇总,各大新闻头条,以及RavenPack。 而数据样本的覆盖范围从2021年10月开始,到2022年12月结束。 选择这个时间段的道理也很简单。ChatGPT自己的训练数据是到2021年9月,也就是说10月之前的数据根本就不用让它预测,它自己早就知道结果如何了。所以,21年10月以后的新数据正好让ChatGPT拿来练手。 三个数据集中,CRSP的每日收益数据集包含了在美国主要的证券交易所上市的各种公司的股票的每日收益,包括股票价格、交易量和市值等数据。 其次,研究者搜集所有包含有公司名称或者股票代码的新闻,来源则是各类主要的新闻机构、金融新闻网站和社交媒体平台。 对于每家公司而言,研究人员会收集样本期间的所有新闻。 最后,RavenPack值得着重介绍一下。 自2003年以来,RavenPack一直是金融服务领域领先的数据分析供应商之一。 他们帮助企业从大量的信息中快速而轻松地有价值的部分。RavenPack的产品使客户能够提高收益、减少风险并提高运营效率。 总的来说,RavenPack的作用,就是保证喂给ChatGPT的都是有效/相关的信息。 最终,研究团队从RavenPack上匹配出4138家公司的67586条新闻标题。 同时,研究人员会给每条新闻打分,从0到100,衡量每条新闻和所提及的公司的关系。 0分意味着在新闻中是被动提到某家公司的,可能只是捎带手提了一嘴。研究人员追求的是100分的相关性。 同时,所有只介绍股市趋势的新闻也排除在外,这种新闻违背了预测的初衷。相同内容的重复报道也被研究团队规避,这样收集到的数据才能为实验更好的服务。 到这里,该收集的数据就差不多了,下一步就是该分析了。 打分制炒股 既然要让ChatGPT输出内容,那首先就是设计一个prompt出来。 研究团队使用的是以下这个prompt: 假设你是一个金融专家,且是一个有股票推荐经验的金融专家。如果这条新闻是好消息,请回答「YES」,如果是坏消息,请回答「NO」,如果不确定,请在第一行回答「UNKNOWN」,然后在下一行用一个短小精悍的句子进行阐述。 这个新闻对 _____(公司名称)的股票价格来说,在 _____ 内(短期、长期)是好是坏? 新闻标题:_____ 可以看到,研究人员让ChatGPT Cosplay一个有股票推荐经验的金融专家,而横线的部分则用具体信息替代。 举个栗子: 输入新闻标题:Rimini Street在与甲骨文的诉讼案中被罚63万美元 评价对象:甲骨文股价 时间跨度:短期...