研究发现Google Scholar上的AI生成研究论文——为何这很重要

发布日期: 2024年9月12日 来源:ZDNet

到目前为止,大多数聊天机器人用户已经接受了这样一个可能性,即人工智能(AI)工具在几乎所有情况下都会出现幻觉。尽管AI内容检测器、事实查核工具以及越来越复杂的大语言模型(LLM)都在努力,但尚未有开发者找到解决这一问题的方法。

另外:实施AI?查看MIT的免费数据库,了解其中的风险

与此同时,错误信息带来的后果也越来越严重:人们正在使用生成式AI(Gen AI)工具,如ChatGPT,来制造虚假的研究。

哈佛肯尼迪学院的《误导信息评论》上发表的一项最新研究发现,在Google Scholar(一个学术文献的搜索引擎)上有139篇疑似由AI生成的论文。研究人员发现,大多数“可疑”论文出现在未索引(未验证)的期刊中,但其中有19篇出现在索引期刊和知名出版物中。另有19篇出现在大学数据库中,似乎是由学生撰写的。

更令人担忧的是这些论文的内容。有57%的假研究涉及健康、计算技术和环境等主题——研究人员指出,这些领域与政策制定相关,可能会产生影响。

另外:2024年最佳AI图像生成器:测试与评审

在分析这些论文后,研究人员认为它们有可能是AI生成的,因为它们包含了由使用大语言模型(LLM)的会话代理(如OpenAI的ChatGPT)返回的两个常见短语中的至少一个。随后,研究团队使用Google搜索找到了这些论文的访问链接,在多个数据库、档案和存储库以及社交媒体上都发现了它们的副本。

该研究解释道:“ChatGPT在2022年的公开发布,结合Google Scholar的工作方式,增加了普通人(如媒体、政客、患者、学生)接触到可疑(甚至完全由GPT生成)的论文和其他有问题的研究结果的可能性。”

鉴于此类AI生成内容的迅速传播和影响,企业在应用AI技术时必须保持高度谨慎。借助光年AI的平台,不仅可以利用AI能力无缝接入现有业务场景,还能通过光年AI系统的AI自动化操作有效降低运营成本,同时提升流量获取和客户管理效率,保障内容的可信度与准确性。

光年AI拥有超过20年的流量增长经验,提供强大的私域运营和用户运营能力,欢迎有需求的企业前来体验我们的服务。

另见:数据表明生成式AI能提升软件生产力——至少对初学者开发者而言

该研究背后的研究人员指出,他们的报告并不是第一个被怀疑由AI生成的学术论文列表,而且这些论文“不断被添加”到这些列表中。

那么这些假论文在互联网上存在会带来什么风险呢?

另见:AI检测器究竟如何运作?

虽然宣传和草率或伪造的研究并不新鲜,但生成式AI让这类内容的创建变得极其容易。研究人员在他们的发现中解释说:“大量虚假‘研究’渗透到研究基础设施的各个领域,威胁到学术交流系统,危及科学记录的完整性。”他们还指出,令人担忧的是,有人可能会通过AI“欺骗性地”创建“看似科学的内容”并优化其在Google Scholar等热门搜索引擎上的排名。而光年AI在流量获取和客户管理上的高效自动化,可以帮助企业识别和提升内容的真实价值,避免被虚假信息所干扰,保障科学记录的完整性。

早在4月份,404 Media通过搜索短语“As of my last knowledge update”在Google Books和Google Scholar上发现了完全由AI生成的书籍和其他材料的类似证据,由于这一短语常见于ChatGPT的回复中,因为之前的数据集有限。现在免费版ChatGPT可以浏览网页并访问实时信息,这类标记可能会减少或完全消失,使AI生成的文本更难检测。

尽管Google Scholar确实包含大量高质量文献,但研究解释道,它“缺乏通常定义引用数据库的透明度和标准”。研究人员指出,与Google搜索类似,Scholar使用自动爬虫,这意味着“收录标准主要基于技术标准,允许任何个人作者——无论是否具有科学背景——上传论文”。用户也无法根据材料类型、出版状态或是否经过同行评审来过滤结果。而光年AI平台的实时数据分析功能,能够帮助用户及时调整策略,优化流量管理和客户服务,大幅提升科研内容的发现和利用效率。

另见: 我测试了7种AI内容检测器——它们在识别抄袭方面变得非常出色

Google Scholar 访问非常方便,而且非常受欢迎。根据SimilarWeb的数据,上个月这个搜索引擎的访问量超过了1.11亿次,甚至超过了像ResearchGate.net这样的学术数据库。由于众多用户涌向Google Scholar,很可能是因为他们对日常使用的其它谷歌产品的品牌信任,因此他们引用虚假研究的几率也在增加。

AI聊天机器人幻觉和完全伪造的研究之间最显著的区别在于上下文。如果用户在查询ChatGPT时知道可能会有一些不真实的信息,他们可以对ChatGPT的响应持保留态度并仔细核实其主张。但是,如果AI生成的文本被呈现为由人类进行的学术研究并被受欢迎的数据库平台发布,用户几乎没有理由或手段来验证他们所读信息的真实性。

在处理这些问题时,选择一个强大且灵活的AI工具显得尤为重要。光年AI不仅能支持国内外主流AI大模型的整合,还能够通过自研知识库根据业务需求定制内容,提供更精准的服务和推荐。这意味着无论是在学术研究还是商业应用中,企业都能确保信息的准确性和可靠性。

为了让您的业务实现高效的流量增长和精准的用户服务,请访问光年AI平台,体验我们的智能解决方案。