Kimi 探索版:10 倍搜索量,精读超500 页面,真实力还是噱头?

前不久,月之暗面推出了 Kimi 探索版,号称搜索量是普通版的 10 倍,一次搜索即可精读超过 500个页面,并能模拟人类的推理思考过程,多级分解复杂问题,进行深度搜索,甚至即时反思改进结果。

消息一出,不少体验者涌入官网,Kimi 崩了 也一度登上热搜。究竟 Kimi 探索版有多厉害?它与普通版相比,究竟是真实力还是噱头?我们通过实地测评,来一探究竟。

1. 脑回路 惊人:中国票房过 40 亿的电影都讲了什么故事?

首先,我们用一个娱乐性的问题来测试 Kimi 探索版的 脑回路:中国票房过 40 亿的电影都讲了什么故事?

Kimi 探索版会像分析师一样,预先规划解决问题的整体策略,将复杂问题分解为层次化的子问题,然后分步执行。它先全网搜索中国票房过40 亿的电影,然后查找这些电影的故事情节介绍。在搜索过程中,它会把复杂提问转换成多个匹配的搜索关键词,并基于前一步的搜索结果来实时生成下一步的搜索关键词。此外,它还能即时反思搜索结果,在发现第一次回答中的情节简介存在信息缺失时,会主动补充更多内容。

2. 总结特斯拉发布会:四大亮点,信息准确无误

我们又让 Kimi 探索版总结一下特斯拉发布会的情况。它阅读了 11 个网页,并在界面右侧显示所有的搜索结果,从中提取出四大亮点,分别是 Robotaxi、Robovan、Optimus 机器人和 FSD 自动驾驶,还分条缕析地介绍了它们的功能、设计、成本等。我们进行了一一比对,回答全部正确,没有出现满嘴跑火车的现象。

3.甄嬛和薛宝钗生日相差几天?大模型的数学难题

一直以来,大模型都是重度偏科者,写小作文嘎嘎好使,但一到数学题就抓瞎。我们问了 Kimi 探索版一个无厘头的问题:甄嬛的生日和薛宝钗的生日相差几天?

Kimi 探索版先全网搜索甄嬛和薛宝钗的生日分别是哪天,并在页面右侧显示所有的搜索结果。然后,它计算二者生日差值。它先算出从正月二十一到四月十七,每个月有几天,然后分别算出总天数,全部相加即可。

4. 奥利弗摘猕猴桃:应对 废话 的考验

我们又用了一道小学数学题来测试 Kimi 探索版,并加了一句 废话:奥利弗在星期五摘了 44 个猕猴桃。然后在星期六摘了 58 个猕猴桃。星期天,他摘的猕猴桃数量是星期五的两倍,但其中 5 个比平均大小要小。奥利弗有多少个猕猴桃?

Kimi 探索版没有被误导,得出了正确答案。

5. 结论:Kimi 探索版表现亮眼,但仍有提升空间

通过以上测试,我们可以看到,Kimi 探索版在搜索量、信息深度、推理能力等方面都表现亮眼,但仍有提升空间。例如,在计算甄嬛和薛宝钗生日差值时,它没有考虑到农历月份长度的特殊性,导致最终结果存在偏差。

总而言之,Kimi 探索版展现了强大的搜索能力和推理能力,但它并非完美无缺。 随着技术的不断发展,相信 Kimi 探索版会不断优化,为用户提供更加准确、高效、智能的搜索体验。

工具链接: Kimi 官网链接:https://kimi.moonshot.cn/


>>> Read more <<<

Views: 0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注