即时新闻

互联网巨头大战长文本

AI大模型长文阅读“钱景”待检验

来源：羊城晚报 2024年03月31日版次：A04 栏目：作者：王丹阳

2024年被视为人工智能应用的元年图/新华社

　　羊城晚报记者王丹阳

　　“想象一下，你正踏上一片遥远的沙漠星球，那里的沙丘像金色的海浪一样延绵不绝，而一场关于权力、背叛和复仇的史诗故事正缓缓展开。”这并非来自影评人的遐想，而是当下国内一家热门AI初创公司智能机器人的“阅读总结”。

　　3月18日，国内通用人工智能“初创明星”月之暗面宣布在大模型上下文窗口技术上取得新突破，旗下的Kimi智能助手可支持200万字超长无损上下文，并开启产品内测，随即引发市场热议，并一度因过于火爆“宕机”。随后，阿里、百度、360也宣布将发力长文本。

　　2024年被视为人工智能应用的元年。被厂商“内卷”的长文本究竟是什么？为何突受关注？普通人可以用长文本做什么？效果如何？记者进行了实测。

　　好比“内存” 长文本其实并不稀奇

　　200万字是什么概念？一本《红楼梦》大约70多万字，《沙丘》系列六部曲加一起也不过115万字。当大模型具有200万文字的长文本技术，也意味着在一个窗口，智能机器“一口气读完”百万文字级的“大部头”只在瞬间，并能和其他人“侃侃而谈”。

　　简单来说，如果把大模型比作操作系统，那么上下文长窗口就像操作系统中的内存。内存越大，应用开发就越简单。

　　今年2月，谷歌发布的Gemini 1.5Pro模型曾一度创下最长上下文窗口的纪录。

　　根据官方数据，谷歌Gemini1.5 Pro 将上下文窗口容量提到了 100 万 token（极限为 1000 万 token）。这意味着机器可以一下子处理22小时的录音、超过十倍的完整的 1440 页的《战争与和平》以及四万多行代码、三小时的视频。

　　如果简单换算，100 万 token大约等于80万个汉字。这意味着月之暗面的上下文窗口容量是谷歌Gemini 1.5Pro模型的2.5倍。也或许可以理解，为何“Kimi概念”突然火了。

　　3月22日，阿里通义千问宣布向所有人免费开放1000万字的长文档处理功能，号称是全球文档处理容量第一的AI应用。

　　1000万字又是怎样的概念？《资治通鉴》为300多万字，一套《二十四史》大约2000多万字，意味着机器最多只需“读”两次，就能看完。

　　“要通往通用人工智能，无损的长上下文将会是一个很关键的基础技术。”月之暗面创始人、明星级算法专家杨植麟对外表示，历史上所有的模型架构演进，本质上都是在提升有效的、无损的上下文长度。

　　也有投资人表示，长文本在技术圈实际上并不稀奇，但此前各家大厂没有“开卷”的主要原因是对算力消耗极大，成本比较高。

　　是否好用？比较便捷但也答非所问

　　对于普通人来说，“消费”千万级、百万级的长文本似乎并不多，那AI长文本能干什么？

　　记者实测发现，从易用性上来说，作为有“超长记忆”的AI 助手，Kimi可直接用中文，还能上传doc、pdf、excel文件，甚至从微信聊天记录中选取文件，上手很方便。比如，给它一个网址链接，它就可以用剧本中的人物角色跟你聊天；把打车的交通发票扫描进文档，可以“整理”出报销表格；把录音文件整理成会议记录。

　　当长文本能力从20万字到200万字，也意味着AI应用“定制化”更前进了一步。长文本越长，意味着智能机器对相关背景就越熟悉。

　　不过，AI大模型作为“阅读神器”真的靠谱吗？

　　记者选择了包括Kimi和其他两家互联网大厂的大模型进行了“阅读题”评测，题目是“《红楼梦》中对东北有哪些描述？”

　　大模型A的答案之一是方言使用，A模型称《红楼梦》中运用了大量的东北方言，“这些方言语汇的使用，构成了《红楼梦》语言的一个独特特色，使得小说的对话更加生动传神。”大模型B的答案更“惊人”：“东北人在《红楼梦》中通常被描绘为豪爽、直率、热情、重义气等特点。例如，贾宝玉的奶妈李嬷嬷、王熙凤的母亲刘姥姥等人都具有这些特点。”至于大模型C则直接理解错误，回答介绍了东北作为方位词的意思。

　　除了文学上貌似正经却令人啼笑皆非的回答，网友评测反应，在法律条文的解读上，也容易张冠李戴、模棱两可。所以在现阶段，对大模型抱有太高的期望，显然并不现实。

　　正如有参与测评的网友所言，“大模型最大的优势是对上下文的总结能力相当好，可以快速帮助理解文章的重点，而其短板是，当我们需要快速定位文章的具体信息时，就无法满足需求了，依旧是总结，而不是给出确切的信息。”

　　实际上，近期备受关注的月之暗面本月刚度过一周岁生日。虽然成立仅1年，月之暗面已完成了至少三笔融资，投资方包括阿里、红杉中国、真格基金、小红书、美团等。估值从一年前的3亿美元飙升至现在的25亿美元，成为大模型领域的头部玩家之一。

　　值得一提的是，一个月前，月之暗面完成了最新一轮超10亿美元的融资，这是继ChatGPT掀起AI浪潮后，国内AI领域公司获得的单轮最大金额融资。有消息称，阿里巴巴在此次融资中领投，使这家年轻公司的估值在短短一年内增长了七倍。然而，阿里巴巴和月之暗面均未对此作出回应。

　　目前，各家大模型在长文本的应用“钱”景包括金融、法律、科研、医疗、教育等领域，用于快速读研报、分析财报、读科研论文、医疗报告、解读法律条文、分析考试成绩等。这一切，都以长文本是否更智能、更准确为前提。未来“钱”景如何，仍有待市场检验。

scroll