作者 | Philipp Brauner,Alexander Hick,Ralf Philipsen,Martina Ziefle
译者 | 王瑞平
人工智能(AI)已经在医学、商业、制造业和交通运输中无处不在,并正在渗透进每个人的生活。公众对其看法褒贬不一,要么钦佩,要么认为它会造成威胁。
本文带你具体了解公众对人工智能的看法,以及它的使用规范和属性。这对于研究和创新至关重要。
一、研究意义与价值
尽管近年来弱人工智能取得了巨大的进步,但运用人工智能解决具体问题仍然困难重重。公众对人工智能的认知往往起始于科幻小说,比如,《银河系漫游指南》、《星际迷航》、《终结者》或《太空漫游》。这些故事里的描述可能会将人工智能扭曲成过度期待或毫无根据的悲观叙述。
研究者在开发人工智能改进算法、生成数据、为监督学习标记以及研究人工智能对组织、劳动力和社会的经济影响方面已经做出了很多研究,有必要定期更新这些学术见解。
本文主要明确了人工智能的定义并梳理了人工智能的最新发展进程和预测,还介绍了具体研究方法和研究样本。
为了开展研究,我们询问了122名德国参与者。询问内容主要包括与人工智能相关的38个陈述,涵盖:经济、工业、社会、文化、卫生等领域。具体评估了参与者的观点与感受(积极或消极)和在这些领域应用人工智能的可能性。
通过询问的方式,我们明确了评估与期望一致的领域以及存在较大差异的领域。差异较大可能会阻碍公众对人工智能的接受程度。关于人工智能风险和收益的社会讨论能够减少降低这些差异,有助于制订人工智能监管指南。
研究的结果以空间散点图的形式呈现,具有重大参考价值:
指导人工智能技术的开发人员和实施者;
指导特定领域的监管政策制定;
告知研究人员可以解决的领域,提高社会接受度;
明确学校人工智能课程重点。
最后,研究者还讨论了相关结果以及该项工作的局限性并总结了研究结果的使用方法。
2、人工智能不同版本的定义
“人工智能”一词是在1955年的“达特茅斯人工智能研讨会”上被创造出来的。当时的主题是“机器智能”。会议上的科学家们讨论了如何让计算机获得人类智能。
大家建议将人工智能定义为:“让机器拥有接近人类智能的能力。”它是研究计算机模拟或者替代人类智能行为的一门学科。
当时,研究人员确信,机器在两个月的时间里就能理解语言、使用抽象概念并能自我改进。这是一个雄心勃勃的目标,随之而来的是人工智能的准确定义。
人工智能作为计算机科学的分支,可用于创造智能机器。这些机器可以用来执行智能任务,如,视觉感知、语音识别、决策和语言翻译。
机器学习作为人工智能的子集,专注于算法和统计模型的开发,使机器能够通过数据学习提高执行特定任务的能力,而无需编程。
罗素和诺维格撰写的人工智能核心入门教科书将其定义为“设计和构建智能代理,这些智能代理可以从环境中接收感知并采取影响环境的行动。”
《剑桥词典》从不同的角度对人工智能进行了定义,将其定义为:“研究制造出具有人类思维的计算机,例如,理解语言、识别图片、解决问题和学习能力,”或者是“用与人类相似方式完成某项工作的计算机技术。”
3、强人工智能与弱人工智能
近年来,由于计算能力提高、数据增加、算法改进和资金的大力扶持,极大地推动了人工智能(AI)、深度神经网络(DNN)和机器学习(ML)的发展。
通用人工智能(AGI)也被称作“强人工智能”,指的是与人类智能相匹配的人工智能,可以将机器学习转移到新的任务中。虽然我们离实现“强人工智能”仍有一定的距离,但专注于完成细分领域任务的“弱人工智能”和相关的机器学习模型已经对个人、组织和社会产生了巨大的影响。
具体来讲,“强人工智能”可以模拟人类的智慧和行为,而“弱人工智能”则被应用于解决特定的、狭义的任务,如,图像识别、医疗诊断、天气预报和自动驾驶等。
最近,人工智能的相关媒体报道都可以被划归到弱人工智能领域,比如,进行更快、更准确的图像识别、翻译、图像和文本生成等。
4、人工智能的研究重点与应用领域
目前,人工智能的研究重点是将经常重复或累人的认知工作自动化。目的是为效率低下或效率较低的工作方式提供技术解决方案。然而,还有许多(潜在的)人工智能应用领域仅仅是人类思维能力的延伸,比如,创造力。
人工智能的主要应用领域包括:语音助理、自动语音识别、翻译、自动驾驶和飞行、医疗技术、生产控制、人机交互、人力资源管理和机器规范性维护。
例如,人工智能的图像识别功能被用于评估癌症诊断的医学图像,或者为自动驾驶汽车提供周围环境的模型。
5、公众对于人工智能的看法
随着人工智能逐渐成为生活中不可或缺的一部分,如,个人助理(Alexa、Siri等)、大型语言模型(ChatGPT、LaMDA)、智能购物清单和智能家居等,终端用户对技术的感知和评估变得越来越重要。
研究表明,公众对人工智能的看法不仅会受终端用户多样性的影响,还会受到相关情境的影响。
在一项研究中,研究者调查了人工智能在3种情况下(媒体、健康和法律)的可用性。研究结果表明:人们普遍担心人工智能带来的风险并质疑其对社会的公平性和实用性。
这意味着,为了使人工智能技术被广泛应用,应该在个人和社会层面考虑用户的最终看法和对其进行风险评估。
另一项研究则调查了公众对人类、机器人和人工智能代理的信任程度是否有所不同。
在这项研究中,研究人员通过信任游戏调查了参与者对人工智能代理或机器人虚拟货币的信任程度,以及人工智能代理或机器人的名称是否会对相关金额造成影响。
结果显示,最受信任的代理是一个用非人类名字命名的机器人,而最不受信任的代理是一个名为Michael的未指定控制(意思是没有表明它是否是人类)。
研究人员得出结论,人们会更信任一项复杂的技术。而这项技术在认知表现和公平性方面必须是可靠的。
该研究为以下理论提供了支持:较高的教育水平、人机交互时较高的自我效能水平可能会影响对相关技术的信任。
此外,在其它的调查中还发现,一方面,人们不希望与人工智能建立个人关系。
另一方面,用户的多样性影响了对于人工智能的评价。
越来越复杂的人工智能的持续发展可能会给个人、组织和整个社会带来深刻的变化。
总之,随着技术的发展,研究和创新要求我们不断更新对人工智能的社会评价和所造成影响的理解。
六、德尔菲研究方法
为评估公众对人工智能的看法,我们使用了德尔菲研究法,要求参与者对未来人工智能的发展情况做出预测。
为了评估参与者对人工智能的认知,我们构建出相关研究模型。第一阶段在专家研讨会上确定了主题,获得了准确列表,然后对这些主题进行评级。
1.确定主题
为了制订主题清单,我们同技术发展与预测领域的4位专家进行了3个阶段的专家讲习班。
第一阶段,我们对可能的主题进行了讨论;第二阶段,我们将相似话题进行了分组,然后挑选出最相关的38个话题;最后一个阶段,我们改写了38个话题的标签,便于参与者理解。
2.调查
在线调查问卷主要包括38个不同方面的问题,从人工智能对职业生涯的影响,到对经济、医疗保健、社会、文化的影响。
图1主要展示出研究方法和调查结构。本研究采用专家研讨会和后续调查研究相结合的多阶段研究设计。调查问卷包含人口统计数据、探索用户因素以及对38个人工智能相关场景的评估。
3.参与者信息统计
为了调查用户个人因素(年龄、性别等)对人工智能场景的预测,以及对可能产生的影响进行评估。调查以询问参与者的信息开始。具体来说,我们询问了参与者的年龄、性别和最高受教育程度。
然后,我们使用6点Likert量表搜集相关信息(范围从1到6)。内部可信度则使用Cronbach's alpha进行测试。经测试,量表具有良好的内部可信度(α = 0.804,n = 122,5项)。
4.人工智能感知
接下来,我们向参与者询问了人工智能未来发挥作用的各种主题,领域涵盖对个人的影响、经济和社会的变化以及管理问题。其中一些话题比较直接,而另一些则比较宽泛。
针对38个主题,我们询问了参与者未来发展的可能性以及他们的评价是积极的还是消极的。
上表列出了这些主题,从“人工智能将促进创新”,到“人工智能将创造重要的文化资产”,再到“人工智能将导致社会的衰落”,下文会具体说明。
问卷用3栏展示出相关的项目:左侧为项目文本,右侧为两个量表,用于查询参与者对实现期望的可能性和评价。
在参与者中,项目被随机化了,用来补偿问题顺序偏差。我们使用4点Likert量表评估预期结果的可能性。
5.调查分布和数据统计分析
我们使用社会科学组合方法检查了122个样本的数据集。为了评估变量之间的相关性,我们使用非参数和参数相关性分析了相关数据,设置显著性水平为5%(α=0.05)。
我们使用Cronbach's alpha检验用户因素的内部一致性。由于关于人工智能发展的陈述没有规范的顺序,没有重新编码这些值。
我们计算了38个题目未来发展的可能性,然后评估了参与者的平均得分(M)和标准偏差(SD)等,给出样本对每个主题评估的平均值。
表1显示了样本中用户因素之间的相关性
(122个参与者样本中用户因素的描述性统计和相关性)
七、结果
我们分析了参与者对于AI的不同陈述,并将这些陈述在空间上映射出来。图2显示了参与者对调查中38个主题的平均估计概率和平均评分的散点图。
图中,每个单独的点代表对一个主题的评价。横轴上的点的位置表示估计发生的可能性,被评为更有可能发生的话题在图的右边。纵轴上的位置显示了对该陈述的评价,评价越积极的主题在图表上的位置越高。
图2:AI预测估计可能性与评估之间关系的散点图
表2:各个语句及其评级,展示出AI场景中的所有语句。参与者对人工智能可能对生活和工作产生的各种后果的估计可能性(likelihood)和主观评估(Evaluation)
上述要点总结出人工智能在哪些方面没有实现参与者的想法。如图2所示,对于某些陈述,估计发生的可能性与参与者的个人评估一致,而另外的一些陈述则存在强烈的分歧。
同意度最高的陈述是人工智能将促进创新、威胁到参与者的职业未来,并将在工作生活中占据领先地位。
此外,参与者还认为人工智能的使用将导致交流减少并将受到精英的影响。它将摧毁更多的就业机会,还容易受到黑客攻击。
总的来说,参与者对于人工智能的评价既有积极的,也有消极的,并认为它促进社会的发展。我们由此推断,人工智能及其影响并不是非黑即白。另一方面,参与者对人工智能将如何影响他们的生活看法不一(积极或消极)。
八、写在最后:人工智能将重塑未来
人工智能在社会中的日益普及将重塑我们的未来。我们需要了解如何与技术互动,以及如何运用技术与他人互动。
这项工作表明,公众对于人工智能广泛的应用看法有所不同。根据调查结果绘制的散点图使这一评估清晰可见,并表现出具有迫切研究、开发需求的问题,从而有助于开展人工智能研究和创新。
我们还发现,人们对人工智能的看法存在个体差异。这可能会影响人们在未来的工作中提升技能的方向。总之,这是政治问题,而不是技术问题。人工智能可以在哪些领域影响我们的生活和社会发展方向,以及影响到什么程度。
作为社会中的一员,我们需要讨论人工智能在广泛应用中的可能性和局限性,并制订监管框架。为了实现这一点,我们首先需要对人工智能有基本的了解,以便参与关于它的发展潜力和局限性的讨论中。
因此,我们有必要学习针对成人的免费在线课程,以及教授数字化和人工智能基础知识的现代课程。
参考资料:https://www.frontiersin.org/articles/10.3389/fcomp.2023.1113903/full