我们是如何被“大数据杀熟”的?(2) 2024年12月02日  

(请点击“数据”频道)

  2

  推荐系统如何从好变坏?

  当“正相关”遇见企业逐利本性,负面问题来了

  算法是一种中性的工具,但到了具体的应用场景中,商业赋予了它倾向性。在外界的印象里,个性化推荐就像漏斗一样,会将推荐内容与用户相匹配,倾向于向用户推荐高度符合其偏好的内容,致使推荐的内容越来越窄化。但与外界的固有认知相反,在行业实践中,互联网应用(特别是位于头部的大型平台)有追求算法多样性的内在动力。

  在对行业内代表性应用的数据分析后,阅读内容的类型数量是否够多、所阅读内容类型的分散程度是否够高,与用户是否能长期留存关联密切,呈正相关。上述两项指标对用户长期留存的作用,可以与信息的展现总量、用户的停留时长、用户阅读量等指标的影响相媲美。

  而当这种“正相关”遇见了企业的逐利本性,算法的广泛应用带来了一些众所周知的负面问题,诸如信息茧房、隐私侵犯、大数据杀熟、算法滥用等。

  英国竞争和市场监管机构对外发布的《算法对竞争和消费者损害的影响评估报告》认为,算法虽然极大地提高了企业及市场运作的效率和效益,并且是许多技术公司的核心,但随着算法系统的不断复杂化,算法的使用可能会减少竞争和损害消费者利益。

  报告指出,算法系统对消费者造成的损害包括针对消费者不透明的方式实施个性化定价、更广泛地被用来操纵选择或消费过程、算法歧视、不公平的排名和设计;算法系统在排他性行为中的使用包括自我偏好、操纵排名算法以排除竞争对手,以及改变网关服务中的算法系统损害依赖该系统的企业;定价算法潜在的合谋问题和平台监督不力的问题:缺乏透明度会使外部难以评估算法系统是否有效。

  上海赛博网络安全产业创新研究院发布的《AIGC数据安全与算法治理报告》指出,算力经济时代,以AIGC为代表的人工智能应用进入“成长期”,但数据安全和算法问题成为其发展的掣肘。AIGC数据和算法安全治理框架,包括健康有序鼓励创新应用、技术向善保障主体权益、敏捷治理强化技术赋能、多元包容推动国际合作的治理原则,完善顶层设计、建设标准体系、提高企业自身治理能力、打造全面安全治理能力供给的治理路径。我国应抢占先机,提高在人工智能安全领域的国际话语权和影响力。

  3

  用户普遍对算法不信任?

  超八成用户对超过一定限度的精准推荐表示担忧

  《算法应用的用户感知调查与分析报告(2021)》发现,人们既要便利,又要安全。

  绝大多数用户享受算法带来的便利和优惠,希望有个性化推荐,同时对提高算法透明度有较强诉求。超八成用户对超过一定限度的精准推荐表现出担忧,并希望可以选择推荐所依据的标签组合。

  半数以上用户对企业在提供互联网服务过程中使用算法这一事实,以及使用算法的内容和目的并不清楚,希望企业能够加强信息披露。

  用户对算法表现出普遍的“不信任”,但并不认同限制算法应用这种因噎废食的做法,而是希望在规范中促进算法的合理应用和健康发展。超过80%的用户认为,企业利用算法进行人为信息扭曲(比如操纵榜单、流量造假、信息屏蔽)的情况很多或比较多。针对算法风险的治理,用户希望多维度加强算法风险治理,其中企业自律最受期待(60.12%),而选择限制算法运用的比例最低(46.22%)。

  用户对“大数据杀熟”为代表的差别定价感知并不普遍,且不同用户对差别定价的态度差异非常之大。只有26.38%用户表示经常经历差别定价。

  算法推荐下的过度消费问题并不突出,信息茧房、网络沉迷一定程度上存在,但企业在不良信息治理、“适老化”“未成年人模式”设计方面不尽如人意。“信息茧房”因人而异,部分人认为推荐算法有助于帮助多元化的信息获取、可以节省信息搜寻时间等(40%),但也有部分人认为推荐算法的信息较为同质,容易造成“信息茧房”或内容过于娱乐化,导致上瘾(43%)。

  多数用户在使用软件应用的过程中收到过不良信息,超过2/3用户表示虽然举报过但不良信息出现的频次并未减少。超过1/3的用户认为所有行业在“适老化”“未成年人模式”等人性化设计方面做得都不够好。

  4

  如何让算法更好服务人类?

  构建可信任的算法认知,产业和消费者需共同努力

  有意思的是,国外侧重人工智能监管、公共服务中算法应用监管、算法应用中的个人数据保护、算法自动化决策、数字零工经济中的劳动者权益保障等问题。而国内重点针对互联网信息服务算法推荐、分享经济平台算法劳动管理、算法应用中数据竞争、算法推荐的版权治理、深度合成等问题积极探索立法和监管举措。

  对此,清华大学人工智能国际治理研究院副院长、人工智能治理研究中心主任梁正认为,当前国内对于算法治理的基本思路和框架都是清晰的,而分级分类精准治理的模式应当可以解决如何落实的问题。他还表示,需要明确的是,算法分级分类本身不是目标,而是要针对不同风险场景配备不同监管规则。

  中国社科院科技和社会研究中心主任段伟文则提到,算法治理需要构建可信任的算法认知,而这需要产业和消费者的共同努力:产业要努力提升算法精准性、透明度,减少偏见,减少歧视;消费者则需要提高数字素养,提升算法意识,加强在人机互动中自主性、控制感和协同意识。他认为,很多消费者缺乏对于算法的控制感,也缺乏自主性,因此对算法认知存在不信任。

  数据来源

  互联网数据中心《数据时代2025》、华东政法大学数字法治研究院《算法治理年度观察报告(2023)》、上海赛博网络安全产业创新研究院《2023年AIGC数据安全与算法治理报告》、清华大学人工智能国际治理研究院《我国算法治理政策研究报告》、腾讯研究院法律研究中心《人工智能时代的算法治理报告2022——构建法律、伦理、技术协同的算法治理格局》、中国人民大学数字经济研究中心《算法应用的用户感知调查与分析报告(2021)》、中国人民大学高瓴人工智能学院《算法向善与个性化推荐发展研究报告》、艾媒咨询《2023年中国AIGC行业发展研究报告》、英国竞争和市场监管机构《算法对竞争和消费者损害的影响评估报告2021》、荷兰个人数据管理局《荷兰AI与算法风险报告(2024年夏季)》