主页 > 波宝钱包官网 > 波宝pro苹果下载官网|声势浩大的搜寻AI,能颠覆传统搜寻引擎吗? | 动区动趋-最具影响力的区块链新闻媒体

波宝pro苹果下载官网|声势浩大的搜寻AI,能颠覆传统搜寻引擎吗? | 动区动趋-最具影响力的区块链新闻媒体

波宝pro苹果下载官 波宝钱包官网 2023年09月05日

现阶段的搜寻 AI,能取代不了传统搜寻引擎吗?我们用实际测试来判断。 (前情提要:AI成未来法官?台湾司法院9月试行以人工智慧写判决书 ) (背景补充:AI办案!台湾检警靠「ChatGPT」破获1.5亿虚拟货币诈骗案 )

本文目录

  • 1 实际表现
  • 2 人工智慧 VS 传统搜寻
  • 3 未来的搜寻引擎

在传统搜寻引擎的时代,想要找到某个问题的答案,你会怎么做?

也许你会开启你的浏览器,输入问题,然后点选搜寻按钮。然后,你会看到一大堆的网页连结。

但除了某些十分简单、很显而易见的问题外,只要是稍微複杂些的,需要提炼的知识,人们往往都难以直接从搜寻页面中获取答案。

于是,你不得不花费时间和精力去筛选和阅读这些网页,并不断点选「下一页」,才能找到你想要的资讯。

也正因如此,在生成式 AI 的浪潮下,如微软的 New Bing、Google的 bard、Perplexit AI 推出的会话搜寻引擎,都在试图解决人们的这一痛点。

而最近,这股 AI 搜寻引擎的大战,也席捲到了中国。

几天前,崑仑万维推出了基于自身「天工」大模型的 AI 产品 —— 天工 AI 搜寻。可以说,这是目前第一款落地,并投入应用的独立 AI 搜寻产品了。

该搜寻 AI 一出,即刻在中国掀起了不小波澜,一些科技媒体纷纷盛讚,称其会「革了传统搜寻引擎的命!」

那么,在表面的喧嚣之下,天工 AI 搜寻,及其类似的一票 AI 搜寻引擎,真正的现状究竟如何?

1 实际表现

鉴于到目前为止,关于天工 AI 搜寻的测评,已着实不少了。因此,本篇文章不打算再重複测试某些千篇一律、无关痛痒的功能,而是打算针对大部分普通使用者,在实际使用中最可能遇到的重点问题进行测评。

在这些重点中,最为人关切的,首先就是幻觉问题。

为了测试这点,我们分别将天工 AI 搜寻与 New Bing 进行了对比。

可以看到,在部分问题上,天工 AI 搜寻与 New Bing 都给出了较为準确的回答,没有出现幻觉 / 错误的情况。

但可以明显感到的是,天工 AI 搜寻的答案比 New Bing 要简略了许多。

例如,在「Google今年推出了哪些 AI 产品」这一问题下,天工 AI 只是笼统地提到了 PaLM2 这一产品。

而这很可能是天工 AI 的向量语义检索导致的。

这种检索方式的好处,是只需要计算向量之间的距离或相似度,而不需要对每个文字进行复杂的分析和处理。

在 New Bing 的精确模式下,AI 的回应也很简略

通过对问题和潜在相关文件进行编码,并计算它们之间的相似度,天工 AI 就能有效地过滤掉无关或低品质的资讯,只保留最相关和最有价值的资讯。

但这样一来,生成的内容就会变得十分简略。

可即便採用了向量语义检索,也难以完全避免幻觉问题。

在这个回答中,天工 AI 犯了一个明显的错误。众所周知,在目前 OpenAI 的计划中,GPT-4 是不开源的。

而同样的,类似的错误与幻觉也出现在了 New Bing 中。

从理论上来说,如果搜寻 AI 能够从网路上爬取到所有的资讯,并且能够完美地理解和处理这些资讯,那么它就不会产生幻觉或错误。但是,这在实际中是很难实现的。

至于具体的原因,暂时先留到文章第二部分解释。

在这里,我们先看看另一大使用搜索 AI 时的重点:理解和分析能力。

从功能上来说,AI 搜寻这个新物种,之所以被人们寄予了厚望,是因为自从其诞生的那天起,人们就不单单只想将其作为一个纯粹的搜寻工具,而是希望它成为一个能集知识的发现、处理、分析和重新组织为一身的个人智慧助理。

毕竟,在这个资讯密度倍增的时代,人们已经越来越不满足于接收那些未经「咀嚼」和「消化」的原始资讯了。

那么在这方面,天工 AI 搜寻表现得怎样呢?

我们可以用几个比较考验分析和理解能力的问题对其进行测试。

从这个回答,可以看出天工 AI 仍然保持了十分严谨的风格,对「核汙水是否会变核汙雨」没有给出一个轻率的结论。

然而,这样的回答,仍然停留在了一个「知其然」的层面,在对某些複杂问题进行询问时,人们更渴望搜寻 AI 展现出更智慧、更具主观能动性的一面。

在这个问题上,New Bing 的回答,则显得详细和深入得多。

而要想实现这样的回答,就不能仅仅只对网页中的资讯、资料进行简单的蒐集,而是要依靠 AI 自身的智慧,对其进行提炼、分析和理解。

而这样的智慧,在面对一些需要选择和比较的问题时,就显得尤为重要。

在某种程度上,AI 搜寻引擎迈向智慧助理的第一步,就是对问题形成自己的「看法」。

只有这样经过深度处理后的资讯,才能更有效地帮助人们进行思考、决策。

而这样具有「主动性」的特点,正是新一代 AI 搜寻引擎区别于传统搜寻引擎最本质的区别。

2 人工智慧 VS 传统搜寻

有了 AI 加成的搜寻引擎,究竟能否战胜传统的搜寻方式?

自从今年 New Bing 问世以来,这就是一个备受关注的话题,然而,最终的资料却无情地表明了:现阶段的搜寻 AI,暂时还干不掉传统搜寻引擎。

分析公司 StatCounter 的资料显示,今年 7 月份,Bing 在全球的市场份额为 3%。这一份额与今年 1 月 (New Bing推出前一个月) 的基本相同。

分析公司 Similarweb 的另一份报告显示,7 月份 Bing 的月访问量约为Google的 1%,也与 1 月份大致相同。

全球搜寻引擎市场份额,来源:StatCounter

儘管这样的资料,并没有对所有直接访问 Bing 聊天页面的人进行统计,但它仍印证了传统搜寻引擎的地位。

这样的现实,说明了在新式的搜寻 AI 推出许久之后,人们仍然不愿捨弃传统搜寻方式。

而这背后的原因,其实也很简单:可靠性。

对很多人来说,用Google、百度搜索,虽然麻烦一点,但找到的内容足以让自己的材料有足够高的可信度。

而如果使用 AI 搜寻,哪怕所有的答案中,只有 5% 是幻觉和错误,就足以让人在进行决策和判断时翻车。

并且从技术环节上来说,联网功能也并非根除幻觉的「灵丹妙药」。

这主要是因为,网路上的资讯包含了很多噪声,这些噪声往往是一些不完整、不一致、不可靠的资讯。

而搜寻 AI 在识别和过滤噪声方面的限制,是由多个技术环节共同造成的,这其中包括了网页抓取、索引构建、连结分析等。而从这些噪音中,提取出有价值和意义的资讯却绝非易事。

因为在这一过程中,连结的稀疏性、不均匀性,网页的多样化,都有可能影响搜寻 AI 判断,导致噪声的干扰。

既然如此,那这是否意味着,搜寻 AI 始终无法撼动传统搜寻引擎的地位呢?

其实不然,因为一项新技术的前景,有时不在于其在原有赛道表现如何,而在于其是否能开闢新的赛道。

如上一部分所述,在这个资讯密度倍增的时代,未经处理的原始资讯,已经很难满足人们的认知需求。

换句话说,在这个时代,人们想要的不仅是资讯、知识,而是智慧。

在目前 New Bing 等搜寻 AI 的应用场景中,最有价值,也最不可或缺的部分,就是其对某些晦涩、艰深内容的解读。

有时候,只要使用了正确的提示词,搜寻 AI 就能将资讯中难以理解的部分,转化为简明易懂的内容,

而这无疑大大地降低了个人的认知和理解成本。

从这个角度上说,搜寻 AI 有着传统搜寻引擎无法取代的意义。

因为其不仅仅是简单地将资讯摆在人们面前,并且还提供了一种见解、思路和策略,而这正是真正的个人智慧助理所必备的特质。

正如现在的某些浏览器,都会自带「翻译外挂」,方便人们在浏览外文网站时,能够高效率地理解其中的内容一样,或许在未来,搜寻 AI 也会以类似的形式,在人们阅读网页时,一边进行总结,一边提供思路,见解。

到了那时,人们甚至能要求其对网页中的具体的某段文字,进行分析和总结。

3 未来的搜寻引擎

按照上面的思路,未来的搜寻引擎,也许将是结合了传统搜寻与 AI 搜寻二者优势的产物。

其最有可能的技术思路,则很可能类似于当下的 AI 智慧体。

具体来说,在获取资讯时,搜寻 AI 可以先借助传统搜寻引擎,爬取大量网页,之后将这些庞大的,未经处理的资讯,交由一位智慧体专门进行筛选、提炼。

之后,这些经过提炼后的资讯,会交由一个负责稽核和纠错的智慧体,以核验资讯的準确性。

当确认无误后,这些资讯最终将交由负责整理和输出的智慧体,并通过其分析、推理能力,为人们提供有价值的思路、建议。

实际上,这样的技术路线,在现实中并不遥远,并且已经被某些团队投入了使用。

例如,最近一个由哥大研究人员开发,名为 GPT Researcher 的 AI 智慧体专案,已经能独立完成各种型别的网路科研任务。

其主要原理是执行「规划者」和「执行者」智慧体。

其中规划者生成研究问题,并提出针对该问题的一系列大纲、要领。

之后,执行者会针对大纲中的每个子问题,彙总 20 多个网路来源,形成客观、真实的结论。

这样的解决方案,避免了以往的 AI+ 联网搜寻时,因为获取的资源有限,以及内容的无规划性,可能导致肤浅的结论或带有幻觉的答案。

在可以预见的将来,倘若类似的技术,用在了 AI 搜寻上,那么人们就可以既能借助传统搜寻引擎的準确性,以及 AI 搜寻的智慧分析能力,极大地降低个人的认知成本,并以此将其作为每个人都能拥有智慧个人助理。

标签: ai   ChatGPT   搜尋引擎   Bing