预测人类生活各个领域的未来-机器学习 (预测人类生活的方法)
导言
人类生活的可预测性在社会科学领域一直是争论不休的问题。虽然社会人口学因素对个人生活轨迹起着重要作用,但过去的研究一直难以准确预测生命结局。
新研究
发表在《自然·计算科学》上的一项新研究提出了一个机器学习方法,该方法可以从多个方面准确预测人类生活,包括早期死亡可能性和个性差异。
该方法由丹麦技术大学的研究团队开发,利用了丹麦国家登记处约 600 万人的数据。这些数据包括教育、健康、收入、职业和其他生活事件。
研究人员通过调整语言处理技术,使用类似语言模型的方式来表达人类生活。这种方法可以生成一个生活事件术语表,类似于语言模型捕捉词语之间复杂关系的方式。
研究人员提出的模型被称为 life2vec。它可以确定健康相关诊断、居住地、收入水平等概念之间的复杂关系。它将个人生活编码为一个压缩向量,作为预测生活结局的基础。
结果
研究团队证明了 life2vec 模型可以预测早死率,即 35 至 65 岁个体从 2016 年 1 月 1 日起存活 4 年的概率。
该模型在捕捉细微个性差异方面也超过了当前最先进的模型和基准标准,表现提高了至少 11%。
意义
这项研究表明,通过表征社会结局和健康结局之间的复杂关联,准确预测生命结局可能是可能的。
研究团队强调,他们的研究只是对可能性的探索,而且只应在确保个人权利受到保护的监管下才可用于现实世界。
结论
这项研究为个性化医疗、心理健康治疗和社会政策制定等领域开辟了新的可能性。随着机器学习方法的不断发展,我们对人类生活的理解可能会得到进一步的增强。
规模化学习崛起,2020十大科技趋势预测,未来我们会与AI共处吗?
12月24日,网络研究院发布2020十大科技趋势预测,从2019年科技的蓬勃发展中提前展望2020。作为2019年度最受关注的科技热词之一,“AI”自然成为了焦点。网络研究院也对AI产业给出了几点关键预测。其中一点就是,AI技术已发展到可大规模生产的工业化阶段,2020年将出现多家“AI工厂”。
图:网络研究院预测2020年将出现多家AI工厂
网络研究院有此预测并不难理解,“AI工厂”的诞生在行业中早有端倪。人工智能独角兽企业旷视推出的自研人工智能算法平台Brain++,就已画出了AI工厂的雏形。
旷视首席科学家、旷视研究院院长孙剑博士曾这样介绍Brain++:正是“Brain++让规模化算法训练成为可能。”与此同时,通过Brain++,旷视“能够针对不同垂直领域的碎片化需求定制出丰富且不断增长的算法组合,包括很多长尾需求。此外,我们能以更少的人力和更短的时间开发出各种新算法。”
事实上,AI技术要实现大规模生产,首先要解决的就是如何低成本、大规模地产生算法。目前业界普遍把深度学习框架作为算法开发工具,但这又面临着学习和使用成本高,难以规模化的问题。究其原因,在于只有深度学习框架是不够的,需要打通从数据到算力再到框架的端到端解决方案,旷视Brain++恰好涵盖了深度学习算法开发的所有环节。
拆解Brain++的总体架构可以看到,其包含了深度学习框架MegEngine、深度学习云计算平台MegCompute、以及数据管理平台MegData三个核心组件。这恰好对应了AI发展中的三大要素:数据、算法以及算力。
图:旷视Brain++架构
从数据的获取、清洗、预处理、标注和存储开始,到研究人员设计算法架构、设计实验环节、搭建训练环境、训练、加速、调参、模型效果评估和产生模型,到最终的模型分发和部署应用,旷视Brain++让研发人员获得了从数据到算法产业化的一揽子技术能力。
除了大规模产生算法,旷视Brain++核心深度学习框架MegEngine还在不断提升算法的工程化开发能力。相比业内主流框架,其具有独特的训练和推理一体化能力,可实现一次算法训练直接部署模型。
基于深度学习框架,不仅人工智能技术的开发门槛被大大降低,而且还有效提高了人工智能应用的质量和效率。据《全球深度学习系统市场报告》显示,到2020年,全球深度学习系统市场规模将超13亿美元。网络研究院也在预测中指出,2020年,各行各业将会大规模应用深度学习技术实施创新,加快转型和升级。
图:深度学习技术将大规模深入产业
不过,深度学习框架的搭建还离不开自动机器学习AutoML技术的发展。长期以来,业内都有一个调侃叫做所谓人工智能,有多少智能就有多少人工。但是通过AutoML技术,则可以让机器自动进行端到端的优化,从而大幅减少人力的成本投入。旷视Brain++核心深度学习框架MegEngine就集成了旷视自研的AutoML技术,对深度学习算法的各个关键环节进行自动化的设计、搜索和优化,一次训练完成自动化过程,将计算代价减小至传统AutoML方法的万分之一,进一步推进技术的成熟。
网络研究院也在预测中指出,AutoML的快速发展将大大降低机器学习的门槛,扩大AI应用普及率。这对于早已将AutoML运用到机器学习中的旷视而言,其已走到了行业前列。更值得一提的是,AutoML领域的研究一直都被国外谷歌AutoML Vision、微软Microsoft Custom Vision、亚马逊Amazon SageMaker等企业以及平台“垄断”,旷视等企业在这一领域的探索,将有效打破国外企业的垄断格局,构建起中国AI产业核心竞争力。
图:网络研究院预测AutoML 的快速发展将大大降低机器学习的门槛
基于Brain++,旷视“AI工厂”初现。依托Brain++,旷视实现了云、端、芯的深度神经网络算法全面覆盖,并推出了多种高效的以人工智能驱动的物联网解决方案,并成功为个人物联网、城市物联网、供应链物联网等垂直领域的客户赋能,助力创造更多价值。
据IDC统计,2019年全球人工智能市场规模达到375亿美元,中国人工智能市场预计占全球的12%,成为了全球第二大人工智能单一市场,且市场规模保持高速增长。人工智能产业迭代的力量即将喷涌而出,但就像第一次工业革命的纺织工厂,第二次工业革命的汽车工厂,AI革命也需要打造一个智能时代的“AI工厂”,以应对即将来临的AI大生产时代的需求。这不仅是AI企业发展的必经之路,更是直接决定着整个国家的产业在这个新时代节点之中参与全球竞争的底气。以旷视Brain++为代表,它们作为中国AI企业极少数的自主可控的算法框架,无疑将在中国AI产业发展中留下浓墨重彩的一笔
读《人工智能——李开复谈AI如何重塑个人、商业与社会的未来图谱》
时下人工智能是非常热门的话题,尤其是2017年5月围棋程序AlphaGo战胜李世石的事件掀起人工智能的热潮。 人工智能的发展,促使我们面对几个问题:人工智能是什么,有什么影响,如何应对?作为人工智能领域的专家,产业推动者,思想布道者,李开复先生通过这本书解答了我们的问题。 这本书内容丰富,几乎涉及到人工智能的方方面面,但是感觉结构有些松散。 总的来说作为一本科普读物,还是给予我很多启发。 一、什么是人工智能 人工智能的概念从计算机发明之初就已经提出,图灵提出的图灵测试,就开始思考人工智能的发展并给出了测试方式。 书中列举了历史上对于人工智能定义的演进过程,与定义的抽象相反,人工智能现在已经实实在在的在我们身边,例如智能助理、新闻推荐、机器视觉、AI艺术、新搜索引擎、阿尔法狗等。 书中用高德纳技术成熟度曲线论证,现在的人工智能热潮与以往有本质的区别,它实现了语音识别、机器视觉、数据挖掘等多个领域追上甚至超过了正常人类水平,突破了心理阈值,进入真实应用场景,并与商业模式紧密结合,在产业界发挥真正的价值。 深度学习造就了当下的人工智能,是背后的关键技术。 2006年,杰弗里.辛顿及其合作者用一篇《一种深度置信网络的快速学习算法》的论文宣告了深度学习时代的到来。 深度学习算法来自人工神经网络技术,技术灵感来源于对于人类神经节的沿着网状结构传递和处理信息的假说,历史上这个技术因为“异或难题”陷入停滞,直到1975年这个问题被解决,人们又开发出多层神经网络技术,到2010年后逐步成熟。 书中对深度学习这种神秘的算法作了形象且容易理解的介绍。 从根本上来说,深度学习和所有机器学习方法一样,是用数学模型对真实世界的特定问题进行建模,以解决该领域内相似问题的过程。 用人类小朋友学习认字的过程类比,计算机要总结出文字规律,以后看到类似的图案,按照之前总结的规律知道图案是什么,这个过程叫做“计算机学习”。 学习对象叫做“训练数据集”,数据集中的数据通过“特征”区别,计算机“建模”来总结出模型。 计算机学习有不同的算法,如决策树。 深度学习的特点是在表达能力上灵活多变,同时允许计算机不断尝试,直到逼近目标。 从数学的角度,深度学习与传统机器学习方法本质上没有实质差别,都希望在高维空间中,根据对象特征,将不同类别的对象区别开,但是他的表达能力比传统机器学习高明。 具体一点来说,可以把学习的对象看成一大堆数据,把数据丢进一个复杂的、包含多个层次的数据处理网络(深度神经网络),然后检查经过这个网络处理得到的结果数据是不是符合要求,如果符合就保留模型,否则就继续调整,直到输出满足要求为止。 书中举了水池阀门的例子。 这种方式所需要的是计算机用特定的方式近乎疯狂的调节所有流量调节阀,不断试验,摸索,增加层数、变量数量,加大算力、加大数据量,直到凑出最佳模型。 所以指导深度学习的基本是一种实用主义。 到这可以看出,深度学习算法有效发挥作用的前提,一是芯片计算性能、处理能力大幅度提升,二是因为互联网长夜发展带来的高质量海量数据。 在这两个条件成熟后,基于深度学习的人工智能随之强大起来。 有点玄妙的是,深度学习算法很有效,但做出模型出来后,设计模型的人也无法能够说得清楚为什么,因果关系是什么。 有史以来最有效的机器学习方法,在许多人看来是一个“黑盒子”,由此也会引发一个问题:人们开发出自己无法理解的程序,只知道它做了什么,但是不清楚它掌握的是一种什么样的规律,这种学习程序会不会失控?二、人工智能的影响 对于人工智能讨论的最热烈的应该是科幻电影吧,《骇客帝国》、《攻壳机动队》、《我,机器人》、《终结者》,这个名单可以很长……讨论了无数种可能。 简单的归类,分为乐观和悲观两种观点。 人工智能对我们有威胁么?电影喜欢这种设置,人工智能发展超过了人类的控制,人类被赡养、奴役或者消灭。 我觉得的确是杞人忧天了。 书中对人工智能进行分类:弱人工智能、强人工智能、超人工智能。 书中观点是,我们现在能够看到的是弱人工智能,就是应用型人工智能,专注于且只能解决特定领域问题的人工智能;强人工智能,又称通用型人工智能,可以胜任人类所有工作的人工智能,具有在不确定环境下推理、策略、解决问题、制定决策、有常识、规划、学习、沟通等,强人工智能可以替代人类。 但是这里,强人工智能是否有“意识”?这个问题很复杂,如果人工智能有了自我意识,那么跟人类有区别么?人和机器的关系,就不是人和工具的关系了;超人工智能,假设人工智能继续发展,可以比世界上最聪明的人,最有天赋的人还聪明,这个定义比较模糊,因为已经超过人类的理解,只能从哲学、科幻的角度去解析了。 书中有个关于是否奇点来临的讨论,前阵子很流行所谓“吓尿指数”,人们发现人类的科技水平是加速发展,且短短百年,人类已经远远超过了历史。 因此人们也担心这种加速度趋势,会使得强人工智能和超人工智能快速发展,一旦奇点来临,人类命运是难以预料的,就像美洲土著无法预料科技先进的欧洲殖民者到底会带来什么影响。 按照书中的观点,特定的科技如人工智能,在一段时间的加速度发展后,会遇到难以逾越的技术瓶颈,例如芯片性能。 他的结论是,在一定时期内,都是人类的工具,很难突破人工智能的门槛。 霍金的忧虑是机器与人在进化速度上的不对等,人工智能可以加速度进化,但是人类的进化有限。 此外,还有失业问题。 总的来说,我赞同书中观点,在我有生之年可以见到弱人工智能的充分发展,也许可以看到强人工智能的出现,但是超人工智能还是在科幻电影里。 我们能够看到的,更大的可能是一个人与作为工具的人工智能协作发展的景象。 三、如何应对人工智能时代 人工智能时代到来是无法回避的客观事实,从乐观的角度来看,人工智能可能是人类社会全新的一次大发展,与三次工业革命一样重要,人类因此生活在完全不同的时代,个性和自由可以得到更大的发展。 人们的联系的效率,生产的效率提高,引起的社会、经济的变化。 顺应时代潮流是理性的选择。 首先面对的问题是工作,我们的工作会被取代么?书中给出经验法则:“五秒钟原则”,如果人可以在5秒内对工作中所需要思考和决策的问题作出相应的决策,那么这项工作很有可能被替代。 想一想自己的工作真是有点担心。 但如果涉及到缜密的思考,周全的推理和复杂的决策,那么久是很难取代的。 有专家认为,那些有清晰的评估标准,工作业绩可以被客观的衡量的,人工智能容易取代。 在未来,无论什么样的层次工作,都会跟人工智能合作进行,以让高级人才发挥他们的技能特长,着眼于最不容易被自动化的工作。 这种趋势已经很明显,各行各业都开始了AI+的过程。 既然人工智能在某些领域会做的远远比人类好,我们要考虑的是作为人类的话要如何捍卫自己的价值。 做那些人工智能做不好的事情,例如跨界推理、抽象能力、小样本和无监督学习能力、知其然知其所以然的能力、建立整体体系的能力、常识能力、自我意识、审美、情感等。 其次面临的问题是教育,我们需要什么样的教育?书中从社会结构的角度来讨论这个问题,传统的社会结构是金字塔型,在人工智能时代,金字塔会更加合理和高效,底层从事基础工作、重复性劳动的人会减少,但金字塔不会坍塌,更多的可能是在现有基础上自我调整。 乐观的来说,随着生产力的发展,更多的人从繁重的生计中解脱出来,可以或者说必须投入更加人性化的领域。 因此,教育体制需要进行大调整,要培养更多博学、专深、领导、艺术人才,增强人机协作的技能。 更多培养如思考、创造、沟通、情感交流、人与人的依恋、归属和协作、综合感悟和对世界的想象力等人所特有的能力。 仅靠记忆和练习就能掌握的技能是最没有价值的,几乎一定可以由机器来完成。 死记硬背的应试教育和计算能力是最无用的技能了。 只有人的个性才是人工智能时代人类的真正价值。 从表现形式来看,作者举了两个前沿的例子,一个是密涅瓦大学,一个是清华的的“姚班”,他总结人工智能时代的核心、有效的学习方法是,主动挑战极限,从实践中学习,关注启发式教育,互动式在线教育,主动向机器学习,学习人与机器的协作,学习要追随兴趣。 找到一个不容易被机器替代的工作,无论是为了美还是为了好奇心。 书中也对未来产业发展进行了阐述。 自动驾驶是人工智能最大的应用场景,充满想象。 它会带动新的业态,新的基础设施建设,新的生活方式,这对我来说是个福音。 作者还详细的阐述了自动驾驶技术的发展情况,他认为中国发展自动驾驶技术的优势是很大的,可以扮演关键角色。 一个是因为法律和道德上宽容度更高,一个是基础设施建设是我们的长项。 另一个人工智能目前被看好的是智慧金融。 利用深度挖掘大数据,在量化交易,智能投顾,风险防控、安防和客户身份识别、智能客服精准营销等上具有优势;翻译、智慧医疗。 智慧医疗是我很看好的,医疗资源紧缺,通过人工智能的辅助,可以提高效率和受众面,顶尖医生可以腾出精力来进行研究真正具有挑战性的科研。 书中还对人工智能创业,从国家战略到企业层面进行了阐述,中国政府拥有更强大的执行能力,中国也有优秀的科研人员。 此外,也还讨论了人工智能时代的信息安全问题的担忧和建议。 四、给我的启示 生活在这个时代是幸运也是不幸的。 说幸运,是因为我们处于变革期,有机会看到未来颠覆性的发展。 不幸是要调整自己面对不确定性,而且可能见不到“强人工智能”的充分发展和“超人工智能”。 乐观的来看,未来由于从低端的劳动中解脱出来,人可以投身内心真正渴求的工作,为自己的热爱而工作,生活体验将更加丰富多彩。 人工智能将创造出更多的财富,大多数人可以更加自由的生活,将会有更好的新的社会福利体系。 由于人工智能的出现,人再次确认自己的独特价值,就是有自主意识,可以解悟生命的意义和死亡的内涵,因为生命有限,才能使得思想和命运如此宝贵。 书中引用法国哲学家布莱兹的话:“人只不过是一根芦苇草……不过,人知道自己要死亡以及宇宙队他所具有的优势,而宇宙对此一无所知,因而我们的全部尊严在于思想”。 不断提高自己,善于利用人类的特长,善于借助机器的能力,将是未来社会里各领域人才的必备特质。 同时,人工智能的发展必然会带来严重的问题,从历史上来看,生产力的发展,尤其是初期,会带来诸多社会问题,给当时的人们带来痛苦,新技术也未必会普惠到大多数人,可能会造成更大的社会不公。 即使从目前来看,信息安全问题、接受的信息被过滤操纵(如剑桥分析事件)就非常严重,我们面临的危险更多了。
免责声明:本文转载或采集自网络,版权归原作者所有。本网站刊发此文旨在传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及版权、内容等问题,请联系本网,我们将在第一时间删除。同时,本网站不对所刊发内容的准确性、真实性、完整性、及时性、原创性等进行保证,请读者仅作参考,并请自行核实相关内容。对于因使用或依赖本文内容所产生的任何直接或间接损失,本网站不承担任何责任。