几周前裸舞 twitter,在参预全球数字权力会议“RightsCon”时期,我亲自感受到海外民间团体正在资格的结构性颤动。
RightsCon 是由非牟利组织 Access Now 发起的全球性的数字权力会议,旨在促进东谈主权、隐痛保护妥协放抒发,以及技能转换等中枢议题,该会议每年在全球不同城市举办。
在本年的会议上,来自寰宇各地(包括好意思国)的民间社会组织,运筹帷幄了怎样轻佻全球数字权力责任最大资助方之一“好意思国政府”撤资后带来的窘境。
值得暖和的是,刻下好意思国政事生态正在发生范式涟漪。正如斯前在报谈中所指出,政府对好意思国联邦机构职能的大幅缩小令东谈主战栗,并推动好意思国政事体制向一些政事学家口中的“竞争性威权主张”演进。
这种涟漪不仅重塑了华盛顿的权力争谱,也对硅谷科技巨头的全球策略产生深化影响,涉及多数好意思国科技公司的运营与政策。要知谈,这些好意思国科技公司的用户遍布全球,远超好意思国脉土市集。
RightsCon 会上有不少与会者向我涌现:他们照旧察觉到这些科技公司在参与和提拔用户基础较小的社区(尤其锐利英语用户群体)方面的意愿和投资正在减少。
正因如斯,不少政策制定者和生意首脑(特出是在欧洲)照旧驱动从头注释对好意思国科技的依赖,并念念考是否简略快速开发出更好、原土化的替代决策。在东谈主工智能鸿沟,这一趋势尤为昭着。
就拿酬酢媒体来说,这种舒适说明得最为凸起。连络巴西国内科技政策的法学教师 Yasmin Curzi 告诉我:“自特朗普再次上任以来,咱们照旧无法再指望好意思国的酬酢媒体平台去作念哪怕最基本的事情了。”
如今,酬酢媒体的内容审查照旧多数选拔自动化技能,并尝试期骗先进的东谈主工智能模子来识别有问题的帖子。
然而,在印度、南非、巴西等地,这些系统压根识别不出那些暴力内容。显著,东谈主工智能在符合不同文化寝兵话环境等方面还有很长的路要走。
欧洲非牟利法律中心挑升连络东谈主工智能治理的东谈主权讼师 Marlena Wisniak 指出,刻下酬酢平台若过度依赖大谈话模子进行内容审核,可能激发更严重的系统性风险,情况将变得更糟。
她向我涌现:“大谈话模子本人的审核就轻佻百出,而这些审核欠安的大谈话模子又被用来审核其他内容,这几乎便是一个恶性轮回,诞妄不竭类似、不竭放大。”
酿成这种情况的部分原因在于主流东谈主工智能系统的“谈话偏食症”:它们主如果依靠英语国度的数据进行进修的,况且大多如故好意思式英语,是以一朝碰上圈套地谈话和语境,比如印度的方言俚语,就会显得“水土抗拒”,说明欠佳。
哪怕是那些标榜能同期处理多种谈话的多谈话模子裸舞 twitter,在轻佻非西方谈话时一样也会力不从心。
举例,有东谈主对 ChatGPT 在医疗保健相关问题上的复兴作念了评估,发现由于汉文和印地语在北好意思数据妥协占比不高,它在这两种谈话上的复兴质料远不如英语和西班牙语。
对于很多 RightsCon 的与会者来说,这偶然阐明了他们一直号令的不雅点:不管是在酬酢媒体鸿沟,如故在改动常的其他鸿沟,齐需要更多以社区为导向的东谈主工智能开发模式
换句话说,想要封闭这种技能霸权,必须推动东谈主工智能研发模式的“原土化转型”,其中可能包括小谈话模子、聊天机器东谈主,以及针对特定用途、特定谈话和文化配景假想的数据集。
比如,能识别俚语和谩骂性词汇,认识羼杂多种谈话甚而字母书写的文句,还能分散“从头赋予意旨的词汇”(也便是曾经的谩骂性词汇,但如今被策画群体选择并赋予新意旨)。
这些东谈主工智能经过进修后,可能会出现一些细分的转换形式,比如具备文化感知才气的东谈主工智能助手,或是轻量化的区域谈话模子。
波多野吉衣2018在线理论毕竟,这些不时是科技巨头所冷漠的“谈话旯旮地带”:基于英语进修的谈话模子和自动化系统所忽略或误分类的内容。
对此,初创公司 Shhor AI 的创举东谈主在 RightsCon 会议上专揽了一场小组运筹帷幄,先容了公司新推出的、专注于印度原土方言的内容审核应用尺度编程接口(API)。
本色上,很多类似的处分决策照旧发展了好多年,咱们曾经报谈过不少相关形貌。比如,Mozilla 曾发起一个志愿者形貌,挑升集会非英语谈话的进修数据;还有一家名为 Lelapa AI 的初创公司,专注于为非洲谈话开发东谈主工智能技能。
甚而本年早些时辰,咱们还把“小谈话模子”列入2025 年“十大突破性技能”榜单
尽管如斯,当今的情况和以往有些不同。特朗普政府对好意思国科技公司的政策和活动产生了不小的影响,这显著是一个进犯原因,但背后还有其他成分在起作用。
一方面,近期对于谈话模子的连络和开发照旧达到了一个临界点,以往数据集的鸿沟被以为是决定模子性能的要津,但当今这少许照旧不再那么进犯了,这种变化意味着更多东谈主有契机参与到谈话模子的开发中来。
“绝不夸张地说,在一些资源较少的谈话环境下,小谈话模子整个有可能成为多谈话模子的有劲竞争者。”民主与技能中心拜谒学者、专注于自动化内容审核的连络员 Aliya Bhatia 指出。
另一方面,全球时局也在悄然发生变化。就在 RightsCon 会议召开的前一周,巴黎刚刚举办了一场东谈主工智能峰会,会上东谈主工智能鸿沟的海外竞争成为焦点议题。
从那以后,“主权东谈主工智能”的见解驱动受到正常暖和,其中枢是让某个国度或组织简略全面掌控东谈主工智能开发的各个尺度。
本色上,东谈主工智能主权仅仅改动常“技能主权”的一部分,现如今,大家对“技能主权”的暖和度越来越高,主要原因是东谈主们对数据传到好意思国后可能濒临的隐痛和安全问题越来越担忧。
旧年 11 月,欧盟任命了首位小心技能主权、安全和民主事务的专员,并鼓吹一项名为“欧洲堆栈(Euro Stack)”的计算,简便来说,这个计算的策画是打造一套属于欧洲我方的数字大家基础规律。
诚然这个见解的界说还不太明确,但它可能涵盖动力、水资源、云做事、芯片、软件、数据和东谈主工智能等多个鸿沟,这些技能和资源对于当代社会的发展以及将来的转换齐至关进犯,然而面前,它们大多由好意思国的科技公司掌控。
欧洲的这个计算在一定进程上鉴戒了印度的素质,印度早在几年前就推出了“印度堆栈(India Stack)”计算,拓荒了一套颇为完善的数字大家基础规律,其中还包括一个名为“Aadhaar”的生物识别信息料理系统。
除此除外,就在不久前,荷兰的议员们通过了几项新议案,旨在缩小该国对好意思国科技公司的依赖。
这让我想起了在 RightsCon 会议上与瑞士数字隐痛公司 Proton 首席实行官 Andy Yen 的对话。他提到,特朗普上任后的一系列举动本色上“推动了欧洲选择行为,并让欧洲相识到必须从头掌抓技能自主权”。
“一方面,这是因为总统简略影响科技公司的高层;另一方面,科技是关乎任何一个国度将来经济增长的要津成分。”他解释说。
不外,仅靠政府的介入并不料味着谈话模子中的包容性问题就能治丝而棼。
“我以为需要明确政府在这个经由中的脚色和界限。如果政府驱动指定哪些谈话应该得回优先发展,或者试图阻抑数据妥协呈现的不雅点,那可能会激发一系列问题。毕竟,用于进修模子的数据,在很猛进程上塑造了模子的领悟和认识式样,并决定它的‘寰宇不雅’。”Aliya Bhatia 指出。
面前,谁也说不准这一系列变化最终会走向何方,又有几许仅仅一时的炒作。但无论怎样,这齐是咱们将继续暖和的鸿沟。
https://www.technologyreview.com/2025/03/25/1113696/why-the-world-is-looking-to-ditch-us-ai-models/