目前最热门的IT行业分支是人工智能行业。
“人工智能”实际上是统计学的一种,很多种智能算法都可以被称为“不可解释的统计推断”,虽然被广泛运用在各行各业之中,但是因为智能算法参数的知识对人类来讲无法理解,所以限制了自身的进步。
虽然AI这个词是上世纪50年代被人提出的,但是人类试图创造类人智能的努力一直没有停止。我对于具体的事件记不清楚,所以在这里大多使用的都是侧面反映制造类人智能努力的事件。
文艺复兴时代16世纪达芬奇就有设计机器人的手稿,设计了可以发声和挥动肢体的机器武士。
18世纪时候出现了一个魔术,由机械机器人和人类棋手对弈的表演“土耳其行棋傀儡”。傀儡进行了无数次表演,击败了当时大多数国际象棋棋手,直到19世纪中期才被揭露其中的原理,反应了当时民众相信科技水平足以制造类人机械以及对于制造类人机械的努力。
在20世纪到来之前,一直在用机械手段试图去实现类人机器,20世纪开始转为结合电气手段。
20世纪初期,卓别林喜剧 摩登时代 里,有机器人喂他吃东西,包括理发等等。
这些努力在当时的历史时期里都没有被视为荒谬的尝试,科学家与全社会民众对于科技水平与工程工资满怀信心。在不具备电子计算机的时代里,就消耗了大量的社会资源。类似的创新没有实现他们原本的目的,但是带动了机械工业的发展。
后面的历史可以在wiki查到。
人工智能1956年被人提出70年代感知器模型强化学习算法出现,一大批人又一次相信类人智能可以由这些算法实现,最终这类算法能实现的任务领域狭窄,计算能力与内存等硬件也存在瓶颈,人工智能陷入低谷。
80年代专家系统出现,核心是一种基于决策树的分类模型,由于专家系统具备使用价值,流行一时。东野圭吾的小说里也提到日本企业80年代最流行的就是建设专家系统以保留技术能手的知识,但很快被发现应用情景过于特定,90年代这类系统就不再成为热点。
在专家系统兴盛的同时,有人改进了感知器模型,将原有的感知器模型串联或并联,形成神经网络模型。BP算法的出现使得对神经网络的研究再次复活,BP意味着误差反传,网络结构里“隐节点”的加入对训练模型产生了大的改进。90年代的论文里,神经网络红极一时,可以解决很多问题。但是神经网络的学到的网络参数难以解释,调节参数对结果有很大影响,使得调参被看做一门科学之外的学问。
与神经网络同时兴盛的是“群智能”,最初是模拟生物进化的遗传算法,随后各类型群体智能算法仿照遗传算法诞生。群智能比起神经网络算法更加玄学,各类参数初始值设置不同可以得出不同的结论,以至于发展出解释初值影响结果的“种群早熟”、“步长”之类的术语。
智能算法由于需要样本多,训练时间长,学习效果难以保证,问题难以解释等等原因,应用领域也极为狭窄。改造这时期的智能算法并应用于现实的努力逐渐陷入低谷。
21世纪初在计算能力出现深度学习之前,国内主是学生做数学建模比赛使用这类智能算法。深度学习是在硬件计算能力大幅度提高之后,通过增大神经网络的规模,扩展出多层“隐含层”来提高神经网络结果。严格来说多层神经网络的构想在上世纪就有模型,受限于硬件计算能力而难以实现。
深度学习目前被广泛用在过去神经网络应用的范畴里,也被寄予厚望,希望突破获得类人智能。高效完成传统神经网络的任务是可行的,但是突破类人智能很可能是徒劳无功。因为目前提高效果是通过增加计算量实现的,每增加一层隐含层需要优化的参数都会增长,计算量的增长是非线性的。
使用今天突破的硬件去跑上世纪的模型算法,优化众多效果不明的参数,获得不可解释的统计推断结论。这种模式可以取得有意义的结论,但是依赖硬件提高性能的模式不可持续,如果模型不能取得创新,陷入冬天只是时间问题。