阿里的创举-用AI绘图模型破解写字难题 (阿里创办人是谁)
After years of waiting, we finally have an AI that can write Chinese characters accurately. AnyText, developed by Alibaba, is a groundbreaking tool that can add text to images with precision, supporting Chinese along with English, Japanese, and Korean.
Unlike previous AI models that struggled to draw Chinese characters, AnyText can do so with ease. It can recognize complex writing styles, place the text anywhere in the image, and even add text to existing images or edit it.
How to UseAnyText
- Deploy AnyText (instructions provided by Alibaba)
- Provide a text prompt in English or Chinese
- Set the text position
- Run the model
Example Results
-
Elon Musk wearing a white T-shirt with "Quantum Bits AI" logo
-
Chinese characters on a chalkboard
-
e-commerce poster with Japanese text
How Does It Work?
AnyText is a diffusion model that consists of two modules: a latent space assistant module and a text embeddingmodule. The assistant module encodes character shape, position, and mask information, while the text embedding module separates semantics from the text and extracts character information before combining it with the semantics.
Benefits of AnyText
- High accuracy in writing Chinese and other languages
- Natural integration of text and background
- Can be used to add text to existing images or modify existing text
- Supports custom fonts
Conclusion
AnyText is a game-changer in the field of AI image generation. It opens up new possibilities for designers and creatives by providing an efficient and accurate way to add text to images. As the model continues to improve, we can expect even more impressive results in the future.
For more information:
- Paper
- GitHub
- Moddy (Colab deployment)
- Ant Design Magic Data Site
乱花渐欲迷人眼,AI如何才能真正落地?
人工智能历史上经历过数次沉浮,如今再次被引爆。
从政府、学术界、企业界、投资界到创业者们,无一不将人工智能视为未来方向;而分析师和媒体从业者们的海量分析报道,更是让人工智能快速占领了每一个普通人的视听。
于是,正如历史上每一个产业的兴起,人工智能在歌舞升平的同时,也逐渐变得有些“乱花渐欲迷人眼”。
从积极的一面来看,人工智能催生了大量新技术、新企业和新业态,为个人、企业、国家乃至全球提供了新的经济增长点,甚至将驱动第四次技术革命,创造巨大的价值。
IDC预计,全球人工智能支出到2020年将达到2758亿人民币,未来五年复合年增长率将超过50%。中国人工智能技术支出将达到325亿元,占全球整体支出的12%。
从消极的一面来看,尽管人工智能揭开了一个全新的时代,但也在不断滋生着“泡沫”,吹捧有之,跟风有之,噱头有之,近两年,数十家中美AI创业企业密集倒闭,大量AI创业项目中途夭折,不免让人感慨,人工智能是否只是“看上去很美”?
那么,人工智能的未来到底会发展成怎样?如何才能真正落地?如何才能实现规模商业化?尽管人工智能的概念的提出已经有六十余年,但理论、技术和应用、商业的结合并没有太多前人的足迹。
故而,在人工智能产业的发展中,“拓荒者”和“领头羊”的角色就显得尤为重要。
“场景驱动”是AI落地关键
在人工智能的诸多玩家中,阿里巴巴已经正在努力成为这一角色。对于AI的未来,阿里已经有了清晰的认知,以及与众不同的AI发展路径。
12月20日,在云栖大会·北京峰会上,阿里云总裁胡晓明提出了“AI for Industries”(产业AI)的理念:人工智能不应仅仅是实验室里的、PPT里的“概念上的AI”,更应是“产业AI”。
胡晓明表示,“产业AI”的提出,是基于阿里巴巴对人工智能的三个判断:
“第一,必须要有场景驱动,我们在解决什么问题,为这个社会的成本降低了多少,效率提高了多少;第二,在人工智能背后是否是有足够的数据来驱动AI能力的提升;第三,是否有足够的计算能力支撑我们的算法、深度学习;只有三个场景同时具备的前提下,人工智能才会有价值”。
阿里将“场景驱动”放在了首位,这正是阿里“产业AI”战略的核心,也是阿里独特的AI发展路径,更是阿里能够将AI实现落地的独家秘笈。
和很多企业和机构的做法不同,阿里的AI旅程并不是从实验室中的研究和讨论开始,而是反其道行之,从基础业务部门开始推动,让AI从日常场景中“长出来”。
例如,手机淘宝中能够让用户通过拍照的方式实现“以图搜图”的“拍立淘”功能,就是源于电商场景,之后通过解决一个个的技术问题,最终形成成熟的AI解决方案。
电商平台为阿里提供了AI生长的优良土壤。大量消费者普遍的、或者个性化的需求造就了不同的应用场景;海量数据为AI提供了充足的“原料”;而阿里云强大的计算能力则成为了AI实现的加速器。三要素齐备,阿里得以让人工智能快速发挥出价值。
事实证明,阿里选择的这条“自下而上”、“从场景中来”、“再到场景中去”的产业AI路径方向正确,并行之有效,推动了AI技术在行业应用场景中的真正落地。
“双11”当天,机器人客服“阿里小蜜”承担了95%的客服咨询;机器智能推荐系统生成了超过567亿个专属货架;AI设计师“鲁班”在双11期间设计了4.1亿张商品海报;而阿里华北数据中心运维机器人接替了运维人员30%的重复性工作。
不仅在零售领域,阿里“产业AI”布局已经覆盖城市、金融、司法、农业、教育、航空、工业、安全、环境、医疗十大垂直领域,并已相继开花结果,目标以AI技术对垂直产业进行全局重塑。
例如,在金融领域,阿里通过云计算和智能算法,将南京银行申请贷款过程中的人工视频验证减少54%;在工业领域,阿里云ET工业大脑帮助天合光能将电池A品率提升7%;在智慧城市领域,阿里云ET城市大脑在杭州接管了128个路口的红绿灯,通过对视频等数据的全量分析来优化道路运营速度和效率,在试点区域的道路上通行时间减少了15.3%。
在胡晓明看来,过去每一次产业革命都是技术与产业的深度融合,从而引发经济和社会变革,AI也不例外。未来AI要深入各行各业,去解决生活、生产和社会环境中遇到的棘手问题,这样才能引领真正的产业革命。
通过“产业AI”布局,阿里正在这条“产业与AI深度结合”的路上渐行渐远。
“ET大脑”让行业共享AI红利
一年前,阿里云发布了人工智能ET,全面整合了阿里巴巴的语音、图像、人脸、自然语言理解等能力。在12月20日的云栖大会·北京峰会上,阿里云正式推出整合城市管理、工业优化、辅助医疗、环境治理、航空调度等全局能力为一体的ET大脑,将ET从单点的技能升级为具备全局智能的ET大脑,全面布局产业AI。
ET大脑LOGO
据阿里云机器智能首席科学家闵万里介绍,ET大脑的核心能力是“量子拓扑”,其诞生主线要追溯到1905年爱因斯坦发布的关于布朗运动的论文:“从一个巨大的网络上,怎么样从这些传播的表象上找到它最核心的路径?而这一点恰恰是ET大脑最核心的一个能力,也是与众不同的能力。”
闵万里表示,相较于其他AI产品,阿里云ET大脑将AI技术、云计算大数据能力与垂直领域行业知识相结合,基于类脑神经元网络物理架构及模糊认知反演理论,实现从单点智能到多体智能的技术跨越,打造出具备多维感知、全局洞察、实时决策、持续进化等类脑认知能力的超级智能体。
ET大脑的发布,意味着阿里云的AI能力已经从单点技术进化到面向垂直行业的全局能力,在过去的一年中,ET大脑在城市、工业、医疗等领域获得大量实践,量变引发质变,进而能够升级为各行业的“大脑”。闵万里表示,ET大脑将被设定为一个开放的生态,让创业公司、开发者和行业公司一起来分享技术的红利。
除了ET大脑,阿里云在云栖大会·北京峰会上还发布了ET航空大脑,用运筹优化、机器学习等人工智能方法分配停机位,预计每天调度1700架次航班,帮助乘客节省5000个小时,大大提高航班中转效率,从而降低延误率。
据闵万里介绍,为机场提供停机位的智能调度只是ET航空大脑的功能之一,航空大脑还希望深入航空的其他场景。此前,阿里云天池平台曾联合厦门航空、白云机场启动智慧航空AI大赛,向全球工程师发出邀请,用智能算法解决航空场景下的问题。未来,ET航空大脑将继续为航班智能恢复、机场地勤人员调度、航空公司航线规划等提供人工智能解决方案,打造智慧航空。
在云栖大会·北京峰会上,阿里云还宣布推出具备智能风控、千人千面、关系网络、智能客服等能力的智能决策金融方案——ET金融大脑。
据阿里云金融事业部总经理徐敏介绍,ET金融大脑可辅助银行、证券、保险等金融机构实现对贷款、征信、保险等业务的智能决策及风控监管,可大幅降低资损率,提高信用卡等预测准确率,促进金融机构在互联网消费金融、中小微企业金融服务等普惠金融方面的探索。
如今,ET金融大脑已经在南京银行、浙商银行、广发银行等金融机构得到应用,在智能风控、“千人千面”的金融服务、开拓“新金融”商业模式中大显身手。
推落地促生态,让AI“普惠”大众
从《终结者》、《黑客帝国》到《西部世界》,人类表达了对于人工智能的隐忧,未来,人工智能是否将代替人类?MIT人类动力学实验室主任、《智慧社会》的作者Alex Pentland曾经指出,其实我们要忧虑的并非是全球化人工智能本身,而是它的幕后操纵者。
人工智能是人类创造的工具。如今,业界更乐于将人工智能定位于“增强智能”,其目标不是为了代替人类,而是增强人类的能力,为人类生产生活服务。故而,人工智能不应被封闭在实验室之中,而是要与人类生产生活紧密结合,普惠大众。
阿里所提倡的“产业AI”,正是一种将其AI能力开放,普惠大众的做法。阿里AI能力相继在城市、工业、汽车、零售、金融、家居、航空等领域落地,在破解行业难题的同时,也切实为普通消费者的生活带来了改变,让消费者切实能够从AI中获益。
阿里也正在通过开放合作,让AI能力惠及更多的行业和消费者。
在云栖大会·北京峰会上,阿里云和中国电信在安全领域展开合作,双方将于明年共同推出定制化DDoS防护服务,为中小企业提供普惠安全;新华书店携手阿里云,布局智慧书店,在消费侧与顾客建立紧密连接,打造全新的“悦读生活”理念,满足消费者多元化、个性化的需求。
同时,阿里云同隆平高科、中信云宣布达成战略合作,计划将ET大脑推进到农业领域,主要用于筛选育种、基建数据化、农事管理、基地选址及农作物生产预测。阿里云与宝马中国正式对外宣布,双方将基于物联网,为宝马车主提供从家到车的一站式无缝连接的远程服务,实现查询汽车实时状态以及远程控制车辆的智能生活。
除了将AI技术和行业深入结合,普惠大众,阿里还在积极参与人工智能生态的建设和人才的培养,推动人工智能在中国的加速落地。
在云栖大会·北京峰会上,阿里云联合掌通家园、贝聊、智慧树、小蚁科技、得图等厂商发布了“AI视觉守护联盟”,希望将人工智能、视频技术和工业、农业、教育等行业深度结合。
阿里云深度融入了国家大数据战略,包括深度参与两个由政府发起的大数据国家工程实验室;阿里云“天池”大数据平台已经聚集了超过11万名开发者;阿里亦已和307所中国大学开启了普惠计划,将云计算、大数据、人工智能等新技术带进高校,培养人才。
综上,中国人工智能的发展和落地,既需要“拓荒者”和“领头羊”,也需要整个生态的繁荣和健康发展。在这个过程中,阿里及其所布局的“产业AI”,都扮演了关键的角色。
低调而强大的AI绘图工具那就是无界AI
无界AI是一个非常有趣的平台,它提供了多种功能,让用户能够轻松地探索和创建各种类型的图像。以下是该平台的一些关键功能和特点:
免责声明:本文转载或采集自网络,版权归原作者所有。本网站刊发此文旨在传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及版权、内容等问题,请联系本网,我们将在第一时间删除。同时,本网站不对所刊发内容的准确性、真实性、完整性、及时性、原创性等进行保证,请读者仅作参考,并请自行核实相关内容。对于因使用或依赖本文内容所产生的任何直接或间接损失,本网站不承担任何责任。