也许我们从生成人工智能中看到的最令人费解的含义是,与“创造力将是人类独创力的最后堡垒”的普遍观点相反,实际上将相当困难的创造性任务自动化似乎比将相对简单的编程任务自动化要容易得多。为了理解这一点,我们比较了两个更流行的生成AI用例:代码生成和图像生成。但我们相信这种说法更普遍,即使生成模型扩展到更复杂的应用程序也是如此。
简单来说,虽然像GitHubCopilot这样的产品,在其当前形式下,可以使编码更高效,但它并不能消除对具有编程知识的有能力的软件开发人员的需求。一个重要原因是,在构建程序时,正确性真的很重要。如果AI生成一个程序,它仍然需要人来验证它是否正确——这项工作的重要程度几乎与开始创建它的水平相同。
另一方面,任何会打字的人都可以使用像StableDiffusion这样的模型在几分钟内生成高质量、独一无二的图像,而且成本要低很多个数量级。创造性的工作产品通常没有严格的正确性约束,模型的输出非常完整。很难不看到依赖创意视觉的行业发生全面的相变,因为对于许多用途而言,人工智能现在能够产生的视觉效果已经足够了,而我们仍处于该技术的早期阶段。
a16z合伙人Chris Dixon推出新书Read Write Own: Building the Next Era of the Internet:6月23日消息,a16z合伙人Chris Dixon撰文介绍新书Read Write Own: Building the Next Era of the Internet,称这本书回顾了互联网的历史,展示了它如何经历了三个主要的设计时代:第一个关注民主化信息(阅读),第二个关注民主化出版(写作),第三个关注民主化所有权(拥有)。
Dixon表示,这本书回答了一个常见问题,“区块链解决了哪些问题?”区块链解决了其他数字服务所解决的问题,但结果更好。它们可以将人们连接在社交网络中,同时赋予用户权力,超越了企业的利益。它们可以支持市场和支付系统,促进商业交易,而手续费始终较低。它们可以实现可盈利的媒体形式,互操作性和沉浸式的数字世界,以及补偿创作者和社区的人工智能服务,而不是吞噬它们。[2023/6/23 21:56:02]
我们完全承认,按照该领域的发展速度,很难对任何预测充满信心。不过现在,我们似乎更有可能看到完全由程序员创建的充满创意图像的应用程序,而不是完全由创作者构建的具有人工设计艺术的应用程序。
a16z在美CFTC诉Ooki DAO案中称:监管应用程序而非协议是双赢选择:11月2日消息,a16z总法律顾问Miles Jennings在推特上表示:“a16z已在美国商品期货交易委员会(CFTC)诉Ooki DAO案中提交了法庭之友简报,并主要关注‘CFTC应该监管应用程序,而不是协议’这一观点的原因,根据美国联邦法案,为非法人团体提供有效服务要求CFTC声称团体的成员具有‘共同的合法目的’,而CFTC并没有声称Ooki DAO有合法的目的,尽管他们确实有一个合法目的,即管理Ooki Protocol。最终,这种方法将使CFTC既能追究不良行为者的责任,又能保护Web3和它的良好行为者。换句话说,这是双赢的。”[2022/11/2 12:09:28]
为什么炒作,为什么是现在?
在我们深入了解代码生成与图像生成的具体细节之前,了解一下目前AI整体现状和生成AI的流行程度是很有用的。
a16z宣布推出使用零知识证明技术的空投领取工具:金色财经报道,加密风投机构a16z在官网宣布推出使用零知识证明技术的空投领取工具,使得加密项目方向活跃贡献者发放空投时保护贡献者的地址隐私,特别是根据用户链下活动空投代币的情况下。
具体而言,潜在的空投接收者可以通过公共渠道(如 Telegram、Discord、Twitter 或 Signal)提供消息(称为“承诺”);然后,空投者通过将这些承诺散列在一起,构建一个Merkle树。随后,潜在的接受者可以通过提供零知识Merkle证明,证明他们是树内承诺的作者,而无需透露是哪一个,从而声称自己的空投份额。
a16z称,以这种方式申领代币将收件人的公共地址与所有其他有权空投的用户的公共地址混合在一起,从而保护他们的匿名性。[2022/3/28 14:21:12]
生成AI正以前所未有的速度被开发人员采用。在我们撰写本文时,StableDiffusion轻松遥遥领先于GitHub存储库的趋势图表。它的增长远远领先于基础设施或加密领域的任何最新技术。几乎每天都有使用该技术的初创公司的启动和融资公告,在线社交网络上充斥着由生成模型创建的内容。
a16z:已经在2021年筹集总共90亿美元基金:1月8日消息,a16z发文宣布已经于2021年筹集总共90亿美元基金,包括15亿美元Bio基金,50亿美元增长基金,25亿美元风投基金,22亿美元加密基金,4亿美元种子基金,并表示将继续投资全阶段(公司),(为这些公司)提供2.5万到数亿美元投资。[2022/1/8 8:34:11]
过去十年对人工智能的总体投资水平也不容小觑。自2010年代中期以来,我们已经看到仅出版物的数量就呈指数级增长。今天,arXiv上发布的所有文章中约有20%是关于AI、ML和NLP的。重要的是,理论成果已经跨越了一个临界阈值,它们变得易于使用,并引发了新技术、软件和初创公司的寒武纪大爆发。
上图中最近的峰值主要是由于生成人工智能。在短短十年内,我们已经从可以对图像进行分类和创建词嵌入的专家专用AI模型,发展为可以编写有效代码并使用自然语言提示创建非常准确图像的公开可用模型。创新的步伐刚刚加快也就不足为奇了,当生成模型开始侵入曾经由人类主导的其他领域时也就不足为奇了。
a16z将Autonomous Partners创始人提升为加密基金普通合伙人:金色财经报道,据官方消息,Andreessen Horowitz(a16z)宣布将Autonomous Partners创始人Arianna Simpson提升为其最新的加密基金普通合伙人。
此前消息,自3月起,Simpson作为交易合伙人加入Andreessen Horowitz(a16z)加密团队。[2021/7/20 1:03:29]
生成AI和编程
生成AI的最早用途之一是作为程序员的辅助。它的工作方式是在大量代码库上训练模型,然后在程序员编码时向他们提出建议。结果非常出色。如此大量的使用使这种方法有望成为未来编程的代名词。
生成的代码:防止不使用分号而遭受的攻击。
然而,相对于我们将在下面介绍的图像生成,生产率的提高并不大。如上所述,部分原因是正确性在编程中至关重要。例如,最近的一项研究发现,对于匹配高风险CWE的场景,40%的AI生成代码包含漏洞。
因此,用户必须在生成足够的代码以提供有意义的生产力提升与仍然限制它以便检查正确性之间取得平衡。因此,Copilot帮助提高了开发人员的工作效率——最近的研究将收益提高了2倍或更少——但达到了我们在开发人员语言和工具之前的进步中看到的水平。例如,根据一些估计,从汇编语言到C语言的跳跃将生产率提高了2-5倍。
对于更有经验的程序员来说,关注点可能会超出代码的正确性并扩展到整体代码质量。正如fast.ai的JeremyHoward就最新版本的OpenAICodex模型所解释的那样,“它编写冗长的代码是因为它生成的是平均代码。对我来说,将普通代码变成我喜欢并且我知道是正确的代码比从头开始编写要慢得多——至少在我熟悉的语言中是这样。”
因此,虽然很明显生成编程是开发人员生产力的阶跃函数,但尚不清楚这种改进与我们之前看到的有很大不同。生成AI可以培养更好的程序员,但他们仍然必须进行编程。
生成AI和视觉效果
另一方面,生成模型对图像生成等创造性工作输出的影响是极端的。它在效率和成本方面带来了许多数量级的改进,并且很难不看到它在整个行业范围内带来阶段性转变。
生成AI在这个领域的工作方式是从用户那里获取简单的文本输入,称为提示,然后模型生成视觉输出。目前,有用于创建许多输出格式的模型,包括图像、视频、3D模型和纹理。
特别有趣的是如何扩展这些模型以生成新的或特定领域的图像,而几乎没有创造性的干预。例如,Guido采用了预训练图像模型,并在他自己的几十张照片上对其进行了重新训练。从那里,他能够在提示中使用<guido>生成图片。以下是根据以下提示生成的照片:“<guido>美国队长”、“<guido>在巴黎”、“<guido>在油画中”。
在商业环境中,图像生成与代码生成的巨大差异在于生成式AI在多大程度上改变了经济计算。为了创建上述图片,Guido在基础设施资源上为几张照片花费了大约0.50美元来训练模型。经过训练后,生成图像的计算资源成本约为0.001美元,可以在云端或最新一代笔记本电脑上完成。此外,生成图像只需几秒钟。
如果没有生成AI,获得自定义图像的唯一方法是聘请艺术家或自己动手。即使我们假设一个人可以在一小时内以10美元的价格创建完全定制的逼真图像,生成AI方法也很容易便宜四个数量级,速度也快一个数量级。更现实地说,任何定制艺术品或图形设计项目都可能需要数天或数周时间,并且将花费数百甚至数千美元。
与上述编程辅助工具类似,生成AI将被艺术家用作一种工具,两者都需要一定程度的用户监督。但是,很难夸大图像模型模仿完整艺术家输出的能力所产生的经济差异。使用代码生成模型,即使编写执行标准计算任务的非常基本的功能程序也需要审查、编辑和添加许多代码片段的测试。但对于一个基本图像,输入promt并从十几个建议中挑选图像可以在一分钟内完成。
以我们自己的漫画家YokoLi(@stuffyokodraws)为例。我们使用她之前的70张图像训练了一个模型,该模型能够生成具有令人毛骨悚然的模仿水平的图像。每个艺术家都必须弄清楚下一步要创作什么,她甚至发现经过训练的模型可以呈现出比她想象的更多的选择——至少在给定时间段内被迫生产某些东西时是这样。绘制同一对象的方法有数百种,但生成模型可以立即明确哪些路径值得探索。
因此,当涉及到此类任务时,我们并不是说计算机在1:1的基础上一定比人类更好。但与许多其他任务一样,当计算机可以产生完整的工作输出时,它们会在规模上秒杀我们。
试着猜猜下面哪些图是Yoko直接画的,哪些是生成的。
答:AI模型生成的图像拥有一个非白色背景。
经济的巨大进步、创造新风格和新概念的灵活性以及生成完整或接近完整作品的能力向我们表明,我们准备好看到创意资产是业务主要部分的所有行业发生显着变化。并且这不仅限于图像,而是适用于整个设计领域。例如:
生成AI可以创建2D艺术、纹理、3D模型,并帮助进行游戏关卡设计。在营销方面,它看起来有望取代库存艺术、产品摄影和插图。我们已经在网页设计、室内设计和景观设计中看到了应用。我们真的才刚刚开始。如果一个用例需要创造性地生成内容,那么很难理解为什么生成AI不会颠覆它或至少成为这个流程的一部分。
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。