Remove ads

人工智能AI的进展是指人工智能领域随着时间的推移所取得的进步、里程碑和突破。人工智能是计算机科学领域的一个多学科分支,旨在创建能够执行通常需要人类执行任务的机器和系统。人工智能技术已广泛应用于医疗诊断、金融领域、机器人操控、法律、科学探索、电子游戏和玩具等领域。然而,许多人工智能应用程序并不被视为人工智能:“许多尖端人工智能已经应用到通用应用程序中,但通常会被称为人工智能,因为一旦这项技术广泛应用,它就不再被成为人工智能了。” [1] [2] “这种现象使得许多人工智能技术已经应用到各行业的基础设施中,成为日常生活的一部分。” [3]在20世纪90年代末至21世纪初,人工智能技术被广泛应用于各种大型系统中, [3] [4]但当时该领域并未因这些成功而受到足够的赞誉和认可。

图片-机器分类进展
每年人工智能的错误率红线-受训人员在特定任务上的错误率。

卡普兰和 亨莱因按将人工智能分为三个演进阶段:1)狭义人工智能——仅将人工智能应用于特定任务; 2)通用人工智能——将人工智能应用于多个领域,并能够自主解决甚至未曾设计过的问题; 3)超级人工智能——将人工智能应用于任何具备科学创造力社交技能和综合智慧的领域。 [2]

为了与人类表现进行比较,人工智能可以在具体而清晰定义的问题上进行评估。此类测试被称为主题专家图灵测试。此外,通过解决较小的问题,人工智能可以实现更清晰的目标,且取得了越来越多的好成绩。

人类在所有方面的表现仍然远远优于GPT-4和在ConceptARC基准上训练的模型,这些模型在大多数方面的得分为60%,其中一个类别为77%,而人类在所有方面的得分为91%,其中一个类别为97%。 [5]

Remove ads

当前表现

更多信息 游戏名称, 冠军年份[6] ...
游戏名称 冠军年份[6] 法律状态 (log 10 ) [7] 博弈树复杂度(log 10 ) [7] 完美信息博弈? 参考号
跳棋(跳棋) 1994年 21 31 完美的 [8]
奥赛罗(黑白棋) 1997年 28 58 完美的 [9]
1997年 46 123 完美的
拼字游戏 2006年 [10]
将棋 2017年 71 226 完美的 [11]
2016年 172 360 完美的
两人无限下注德州扑克 2017年 不完善 [12]
星际争霸 - 270+ 不完善 [13]
《星际争霸2》 2019年 不完善 [14]
关闭

有许多有用的能力可以被归类为展示某种形式的智能。这为我们更好地了解人工智能在不同领域中的相对成功提供了更多见解。

人工智能就像电力或蒸汽机中的热能一样,是一种通用技术。对于人工智能擅长哪些任务,目前还没有达成共识。 [15]莫拉维克悖论的某些版本写到,人类更有可能在生理灵活性方面等直接成为自然选择目标的领域,胜过机器。 [16]尽管AlphaZero等项目已经成功地从零开始生成自己的知识,但许多其他机器学习项目仍然需要大量的数据集训练 [17] [18]研究人员安德鲁·吴(Andrew Ng)表示,作为“高度不完美的经验法则”,“几乎任何人类只需不到一秒钟的思维就能完成的事情,我们现在或在不久的将来可能可以通过人工智能实现自动化。” [19]

游戏为评估进度提供了一个高基准;许多游戏都拥有庞大的职业玩家群体和成熟的竞技评级系统。2016年,Deep Mind公司的阿尔法狗击败世界顶级职业围棋选手李世乭,证明了人工智能在围棋比赛中的竞争优势,从而结束了传统棋类游戏基准的时代。[20]在信息不对称的游戏中,人工智能在博弈论领域面临新的挑战;这一领域最显著的里程碑之一是冷扑大师在2017年的扑克比赛中取得胜利。[21] [22]电子竞技继续为评估人工智能进展提供额外的基准; Facebook AI、 DeepMind和其他公司已经涉足备受欢迎的《星际争霸》视频游戏系列。 [23] [24]

人工智能测试的结果有以下几种::

  • 表现最佳:无法表现得更好(注意:其中一些条目是由人类解决的)
  • 表现超越人类:表现优于所有人类
  • 表现优于人类:表现优于大多数人类
  • 表现接近于人类:表现与大多数人类相似
  • 表现低于人类:表现比大多数人差
Remove ads

表现最佳

  • 井字游戏
  • 四子棋:(1988年)
  • 跳棋(又名 8x8 跳棋):弱解 (2007年) [25]
  • 魔方:大部分已解决 (2010年) [26]
  • 一对一限注德州扑克:这种策略在统计学上表现出色,即“在有限的人类寿命内,无法通过有限的人类游戏经验来确定它是否是一个确切的解决方案”(2015年) [27]

表现超越人类

表现优于人类

表现接近于人类

表现低于人类

  • 识别印刷文本的光学字符识别(接近人类对于拉丁字母书写文本的能力)
  • 目标识别[需要解释]
  • 可能需要机器人硬件和人工智能方面的进步的各种机器人任务,包括:
    • 稳定的双足运动:双足机器人可以行走,但稳定性不如人类步行者(截至 2017 年) [60]
    • 仿人足球机器人[61]
  • 语音识别:“几乎等同于人类表现的水平”(2017年) [62]
  • 解释能力。当前的医疗系统能够诊断某些疾病,但无法向用户解释他们为何做出这样的诊断。 [63]
  • 流体智力多项测试(2020年) [58]
  • 邦加德视觉认知问题,例如邦加德-洛高基准(2020年) [58] [64]
  • 视觉常识推理 (VCR) 基准(截至 2020 年) [56]
  • 股市预测:使用机器学习算法进行金融数据收集和处理
  • 愤怒的小鸟》视频游戏(截至 2020 年)[65]
  • 在没有上下文知识的情况下难以解决的各种任务,包括:

人工智能提议性测试

在艾伦·图灵的著名图灵测试中,他选择了语言作为测试的基础,因为语言是人类的定义特征。 而如今人们认为图灵测试容易被操纵,不再是一个有意义的基准。 [66]

费根鲍姆测试由专家系统的发明者提出,测试机器对特定主题的知识和专业知识的学习程度。 [67]微软的吉姆·格雷在 2003 年发表的一篇论文中建议将图灵测试扩展到语音理解对话以及物体识别和行为识别这些方面。 [68]

提出的“通用智能”测试旨在比较机器、人类甚至非人类动物在尽可能通用的问题集上的表现。在极端情况下,这个测试可能包含每个可能的问题,按照科尔莫哥罗夫复杂度进行加权;然而,这些问题集往往以有限的模式匹配练习为主,其中经过调整的人工智能可以轻松超过人类的表现。 [69] [70] [71] [72] [73]

考试表现

根据OpenAI 的数据,2023 年ChatGPT GPT-4在统一律师考试中得到的分数分高于90%的考生人。在美国学业测试考试中,GPT-4 在数学方面得分的得分高于89%的考生,在阅读和写作方面得分高于 93%的考生。在美国研究生入学考试中,它的写作测试得分高于 54%的考生,数学测试得分高于 88%的考生,口语部分得分高于 99%的考生。在 2020 年美国生物奥林匹克半决赛中,它的得分达到最高。它在多项大学预科课程考试中获得了满分“5”分的好成绩。 [74]

独立研究人员在2023年发现,ChatGPT GPT-3.5美国医师执照考试的需要通过的三个测试中将将及格。 GPT-3.5还在明尼苏达大学四门法学院课程的考试中刚刚达到及格标准。 [74] 而GPT-4通过了通过文本材料进行评估的模拟医学情景考试。 [75] [76]

比赛情况

许多竞赛和奖项,例如图像数据库挑战赛,促进了人工智能领域的研究。竞赛的最常见领域包括通用机器智能、对话、数据挖掘、机器人汽车以及传统游戏。 [77]

历史和当前的预测

2016年左右,由人类未来研究所的卡佳·格雷斯及其同事进行的一项专家民意调查显示, 人工智能成为《愤怒的小鸟》游戏冠军的所需的中值预计时间为3年,成为世界扑克系列赛冠军需要4年, 而成为《星际争霸》游戏冠军则需要 6 年。在更为主观的任务方面,该调查还显示,人工智能估计需要6年才能在叠衣服工作上达到人类的工作水平,能够专业回答“容易在谷歌上找到答案的问题”需要7-10年,完成普通语音转录任务需要8年,在完成普通电话银行任务上想要达到人类水平则需要9年,而进行专业创作歌曲需要11年。此外,如果想要写一本《纽约时报》畅销书或赢得普特南数学竞赛,人工智能则需要30年以上的时间。[78] [79] [80]

在国际象棋项目上的表现

Thumb
计算机历史博物馆的深蓝计算机

1988 年,人工智能首次在常规锦标赛中击败了特级大师;随后更名为“深蓝” ,并于 1997 年击败了当时世界国际象棋冠军加里·卡斯帕罗夫(参见“深蓝对阵加里·卡斯帕罗夫”)。 [81]

更多信息 预测的时间, 预测到来时间 ...
预计计算机何时会在国际象棋比赛中击败人类
预测的时间 预测到来时间 年数 预测人 同期来源
1957年 1967年或更早 10或更少 赫伯特·A·西蒙,经济学家[82]
1990年 2000年或更早 10或更少 雷·库兹韦尔,未来学家 智能机器时代[83]
关闭

在围棋项目上的表现

阿尔法狗于 2015 年 10 月击败了欧洲围棋冠军,并于 2016 年 3 月击败了世界顶级棋手之一李世乭(参见AlphaGo 与李世乭)。据《科学美国人》和其他消息称,多数观察者曾预计要等至少十年才能见到超越人类水平的计算机围棋表现。 [84] [85] [86]

更多信息 预测的时间, 预测到来时间 ...
预计计算机何时会在围棋方面击败人类
预测的时间 预测到来时间 年数 预测人 联系 同期来源
1997年 2100年或之后 103年或更多 皮特·赫特——物理学家和围棋迷 普林斯顿高等研究院 纽约时报[87] [88]
2007年 2017年或更早 10年或更少 徐凤雄深蓝领衔 微软亚洲研究院 《科技纵览》杂志[89] [90]
2014年 2024年 10年 雷米·库隆—— 围棋计算机程序员 疯狂的石头 《连线》杂志[90] [91]
关闭

达到人类水平的通用人工智能(AGI)

人工智能先驱和经济学家赫伯特·A·西蒙 (Herbert A. Simon)在 1965 年错误地预测到:“二十年内,机器将能够完成人类能做的任何工作”。马文·明斯基 (Marvin Minsky)在 1970 年也曾写道:“在20-30年之内……创造人工智能的问题将得到实质性解决。” [92]

2012年和2013年进行的四项民意调查显示,专家对通用人工智能何时到来的平均估计为2040年至2050年,这具体取决于不同的民意调查。 [93] [94]

根据2016年左右的格雷斯民意调查显示,结果因不同的提问方式而异。那些被问及“在不受帮助的情况下,机器何时能够比人类更好、更便宜地完成每项任务”给出的中值答案为45年,其中有10%人认为这个情况的可能在9年内发生。其他受访者被问及“何时所有职业都能够实现完全自动化。也就是说,对于任何职业,机器都可以更好、性价比更好地执行任务”给出的答案估计中值为122年,其中有10%的人认为这个情况的可能在20年内发生。 对于“人工智能研究员”何时能够完全自动化的中值回答约为90年。虽然并未发现专业度和乐观主义之间的联系,但亚洲研究员的平均乐观主义值要比北美研究员高得多;亚洲人平均预测“完成每项任务”需要30年,而北美人则预测需要74年。 [78] [79] [80]

更多信息 预测的时间, 预测到来时间 ...
人工通用智能到来预估时间
预测的时间 预测到来时间 年数 预测人 同期来源
1965年 1985年或更早 20年或更少 赫伯特·西蒙 男性和管理自动化的形态[92] [95]
1993年 2023年或更早 30年或以下 弗诺·文奇,科幻小说作家 “即将到来的技术奇点” [96]
1995年 2040年或更早 45年或以下 汉斯·莫拉维克 ,机器人研究员 《连线》杂志[97]
2008年 永远不会/遥远的未来[note 1] 戈登·E·摩尔-摩尔定律的发明者 《科技纵览》杂志[98]
2017年 2029年 12年 雷·库兹韦尔 采访[99]
关闭

参见

参考资料

注释

外部链接

Wikiwand in your browser!

Seamless Wikipedia browsing. On steroids.

Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.

Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.

Remove ads