即时新闻

互联网巨头大战长文本

AI大模型长文阅读“钱景”待检验

来源:羊城晚报     2024年03月31日        版次:A04    栏目:    作者:王丹阳

     2024年被视为人工智能应用的元年 图/新华社

  

  羊城晚报记者 王丹阳

  

  “想象一下,你正踏上一片遥远的沙漠星球,那里的沙丘像金色的海浪一样延绵不绝,而一场关于权力、背叛和复仇的史诗故事正缓缓展开。”这并非来自影评人的遐想,而是当下国内一家热门AI初创公司智能机器人的“阅读总结”。

  3月18日,国内通用人工智能“初创明星”月之暗面宣布在大模型上下文窗口技术上取得新突破,旗下的Kimi智能助手可支持200万字超长无损上下文,并开启产品内测,随即引发市场热议,并一度因过于火爆“宕机”。随后,阿里、百度、360也宣布将发力长文本。

  2024年被视为人工智能应用的元年。被厂商“内卷”的长文本究竟是什么?为何突受关注?普通人可以用长文本做什么?效果如何?记者进行了实测。

  

  好比“内存” 长文本其实并不稀奇

  

  200万字是什么概念?一本《红楼梦》大约70多万字,《沙丘》系列六部曲加一起也不过115万字。当大模型具有200万文字的长文本技术,也意味着在一个窗口,智能机器“一口气读完”百万文字级的“大部头”只在瞬间,并能和其他人“侃侃而谈”。

  简单来说,如果把大模型比作操作系统,那么上下文长窗口就像操作系统中的内存。内存越大,应用开发就越简单。

  今年2月,谷歌发布的Gemini 1.5Pro模型曾一度创下最长上下文窗口的纪录。

  根据官方数据,谷歌Gemini1.5 Pro 将上下文窗口容量提到了 100 万 token(极限为 1000 万 token)。这意味着机器可以一下子处理22小时的录音、超过十倍的完整的 1440 页的《战争与和平》以及四万多行代码、三小时的视频。

  如果简单换算,100 万 token大约等于80万个汉字。这意味着月之暗面的上下文窗口容量是谷歌Gemini 1.5Pro模型的2.5倍。也或许可以理解,为何“Kimi概念”突然火了。

  3月22日,阿里通义千问宣布向所有人免费开放1000万字的长文档处理功能,号称是全球文档处理容量第一的AI应用。

  1000万字又是怎样的概念?《资治通鉴》为300多万字,一套《二十四史》大约2000多万字,意味着机器最多只需“读”两次,就能看完。

  “要通往通用人工智能,无损的长上下文将会是一个很关键的基础技术。”月之暗面创始人、明星级算法专家杨植麟对外表示,历史上所有的模型架构演进,本质上都是在提升有效的、无损的上下文长度。

  也有投资人表示,长文本在技术圈实际上并不稀奇,但此前各家大厂没有“开卷”的主要原因是对算力消耗极大,成本比较高。

  

  是否好用?比较便捷但也答非所问

  

  对于普通人来说,“消费”千万级、百万级的长文本似乎并不多,那AI长文本能干什么?

  记者实测发现,从易用性上来说,作为有“超长记忆”的AI 助手,Kimi可直接用中文,还能上传doc、pdf、excel文件,甚至从微信聊天记录中选取文件,上手很方便。比如,给它一个网址链接,它就可以用剧本中的人物角色跟你聊天;把打车的交通发票扫描进文档,可以“整理”出报销表格;把录音文件整理成会议记录。

  当长文本能力从20万字到200万字,也意味着AI应用“定制化”更前进了一步。长文本越长,意味着智能机器对相关背景就越熟悉。

  不过,AI大模型作为“阅读神器”真的靠谱吗?

  记者选择了包括Kimi和其他两家互联网大厂的大模型进行了“阅读题”评测,题目是“《红楼梦》中对东北有哪些描述?”

  大模型A的答案之一是方言使用,A模型称《红楼梦》中运用了大量的东北方言,“这些方言语汇的使用,构成了《红楼梦》语言的一个独特特色,使得小说的对话更加生动传神。”大模型B的答案更“惊人”:“东北人在《红楼梦》中通常被描绘为豪爽、直率、热情、重义气等特点。例如,贾宝玉的奶妈李嬷嬷、王熙凤的母亲刘姥姥等人都具有这些特点。”至于大模型C则直接理解错误,回答介绍了东北作为方位词的意思。

  除了文学上貌似正经却令人啼笑皆非的回答,网友评测反应,在法律条文的解读上,也容易张冠李戴、模棱两可。所以在现阶段,对大模型抱有太高的期望,显然并不现实。

  正如有参与测评的网友所言,“大模型最大的优势是对上下文的总结能力相当好,可以快速帮助理解文章的重点,而其短板是,当我们需要快速定位文章的具体信息时,就无法满足需求了,依旧是总结,而不是给出确切的信息。”

  实际上,近期备受关注的月之暗面本月刚度过一周岁生日。虽然成立仅1年,月之暗面已完成了至少三笔融资,投资方包括阿里、红杉中国、真格基金、小红书、美团等。估值从一年前的3亿美元飙升至现在的25亿美元,成为大模型领域的头部玩家之一。

  值得一提的是,一个月前,月之暗面完成了最新一轮超10亿美元的融资,这是继ChatGPT掀起AI浪潮后,国内AI领域公司获得的单轮最大金额融资。有消息称,阿里巴巴在此次融资中领投,使这家年轻公司的估值在短短一年内增长了七倍。然而,阿里巴巴和月之暗面均未对此作出回应。

  目前,各家大模型在长文本的应用“钱”景包括金融、法律、科研、医疗、教育等领域,用于快速读研报、分析财报、读科研论文、医疗报告、解读法律条文、分析考试成绩等。这一切,都以长文本是否更智能、更准确为前提。未来“钱”景如何,仍有待市场检验。