体育游戏app平台创新的将来愿景:究诘了AI在创意产业中的后劲-开云平台网站皇马赞助商| 开云平台官方ac米兰赞助商 最新官网入口

图片开端:a16z体育游戏app平台
Z Highlights:
从磋议到创业:Mohammad Norouzi共享了从谷歌的AI磋议员到Ideogram公司长入首创东说念主兼CEO的波折,答复了他在创办公司过程中濒临的挑战和得益。
败坏性的AI本事:深刻探讨了Transformer和扩散模子在图像生成中的应用,零散是如何将复杂的文本和图像交融在沿途,完结高质料的视觉输出。
用户体验至上:强调了在AI居品开发中以用户体验为中枢的进军性,通过与用户的精良无比互动,不时改良居品功能,安闲用户需求。
创新的将来愿景:究诘了AI在创意产业中的后劲,零散是如何通过AI本事使每个东说念主都能完结我方的创意想法,从而引发更大的创造力。
本事与实践的团结:Mohammad谈及如安在有限资源下优化策动和模子性能,确保AI本事不仅苍劲且高效,同期省略大领域应用于履行居品中。
草创文本到图像模子: 从童年的绘画到AI磋议
Mohammad:我如实领会到其时的一些对话是对于将文本到图像本事应用到Google的不同出产力器用中,举例Google PPT。问题是,这是一项价值1亿好意思元的生意吗?当它不是1亿好意思元时,很丢丑到它的价值。是以从根柢上讲,这种居品创新比大公司更难,因为有好多容易完结的磋议不错去完结。你也不错把时分花在告白改良上,提高0.0001%。
Derrick:嗨,我是Derrick Harris。你正在收听的是a16z的AI播客,咱们专注于在东说念主工智能前沿诞生东说念主才。这正好形貌了本周的嘉宾,Ideogram的长入首创东说念主兼首席实行官Mahama Noruzi。他在谷歌担任AI磋议员神圣十年,磋议NLP、翻译和策动机视觉,最终在谷歌的文本到图像模子方面达到了激越。我与a16z结伴东说念主Jennifer Li沿途与Muhammad进行了交谈。咱们涵盖了Muhammad的统统这个词旅程,从小时候在伊朗画画,到在大学里参加编程比赛,再到他创办公司并让任何东说念主都能创作我方的相片的资历。这是一场阔气知戮力的对话,如果您对学习文本到图像模子背后的一些关键见解感意思,请享受此次究诘。
Jennifer:行为提醒,请严防,此处内容仅供参考,不应被视为法律、贸易、税务或投资建议,也不应用于评估任何投资或证券,而况不针对任何投资者或任何A16Z基金的潜在投资者。联系更多详备信息,请参阅A16Z.com/线路。
Mohammad:是的,我在伊朗长大,其时照旧个小孩。我莫得上幼儿园,也莫得东说念主护理。我所铭刻的便是在高中时在祖父母的后院里闲荡,听故事和画画。我爱上了数学和编程的布景是咱们在大学举行世界入学考试。如果你成效进入奥林匹亚队和信息学或数学,你就不错跳过考试。因此,我所作念的便是与一群其他有建立的高中生竞争编程和数学问题。这包括好多组合数学、几何和图论,但我最终更多地转向编程。然后我为团队作念了一些竞争性编程,因为我跳过了考试而进入了大学。
在大学里,我有好多算法和数据结构的布景。我莫得作念太多的学习,我作念的大部分事情都是为竞争性编程构建这些web应用范例。这些应用范例被用于下一代高中生试图在编程方面竞争。这主如若一个零丁面容。我并莫得想过要把它变成一门生意,然后在大学行将扫尾时,我在念念考下一步想作念什么。我的大多数一又友都进入了表面策动机科学领域,罕有学布景,但我合计我想作念一些更履行的事情。我自学了神经收集和反向传播。履行上,我其时读了对于卷积神经收集的论文,其时卷积神经收集并不受宽贷。我初始在Java中完结反向传播,并在LaTeX上编写了公式。是以这有点风趣,我只是第一次阅读学术论文,然后我方把它全部弄明晰。
Derrick:那是什么时分段?我能问一下吗?
Mohammad:2007年。
Derrick:好的,是以你比时间超前了几年。
Mohammad:是的,这是很久之前的事情,然后我在想也许我想深刻磋议通晓科学,了解更多对于大脑如何责任的信息,因为其时好多指摘都在究诘神经收集和大脑之间的关系。我试过了,我在加拿大读硕士的时候尝试作念一些通晓科学,但那不合乎我。是以我很快就转向了策动机视觉、机器学习之类的领域。东说念主们一初始就问我,你对策动机视觉照旧当然语言处理感意思?因为这是机器学习的两个主要应用领域,但把这两个领域分开并莫得让我感到合适。因此,我作念了一些NLP,一些策动机视觉,然后在多伦多作念了博士磋议,将卷积神经收集应用到大领域相似性搜索中。但其后我去了谷歌,那时照旧构建深度学习收集的早期阶段。我是brain team的一员,我参与了一大堆探索性面容,并深刻磋议。
Jennifer:有好多风趣的面容。如果你在谷歌责任,可能最知名的便是图像生成,这可能导致了咱们今天所处的位置。我很景仰,在初始磋议这些前沿模子之前,你们作念了哪些面容和磋议?统统这个词图像生成面容背后是什么样的故事?
Derrick:然后你作念了cat video(生成系统)吗?因为那时是2012年。
Mohammad:我想我是cat video面容之后在谷歌实习的。当我全职加入时,东说念主们正在进行监督学习,而不是无监督学习。我参与的第一个面容是使用卷积神经收集进行机器翻译,并履行使用强化学习来提高机器翻译。我认为这有点超前,咱们面前使用好多强化学习来休养大型语言模子。但在其时,这些模子并不是很大,但仍然是用于翻译的语言模子。这导致了翻译质料的大幅进步,推出了translate.google.com。
然后有几年,我在策动机视觉、强化学习和当然语言处理方面作念了好多探索性责任。我认为有一个共同的主题,那便是找到一个更大的面容,不错奉献我的时分和团队元气心灵。有好多对于不同类型的生成模子的责任,它们不错生成复杂的序列、图像,以及咱们如何使用强化学习来提高这些模子的性能。
当Transformer论文出刻下,我履行上是在山景城(Mountain View,ZP注:她与隔壁的Palo Alto City、Sunnyvale City和San Jose构成了硅谷的最主要塞区)隔壁。这有点可笑。咱们很早就在究诘这个问题,它与扩散模子联系。当Jacob、Ashish和我议论这个问题时,更多的是在咱们如何为语言进行并行生成的布景下。大型语言模子通过一次生成一个token来责任。有一个宽绰的想法,咱们如何突出一次生成一个token,并进行更多的并行生成,以便更灵验地生成长文本块?是以这是Transformer论文背后的初步念念考的一部分,但跟着他们络续究诘时分生成的问题,仍然有一些图像生成方面的并行生成想法。
但仍然有东说念主认为,每次生成一个图像块或一次只生成一个图像的统统这个词见解不会产生太多感知,因为图像不是当然有序的。咱们正在探究更灵验地生成图像的不同形态。咱们看到了Jonathan Ho的论文,还有扩散模子。咱们坐窝领会到,这项责任有很大的后劲。于是咱们打消了其他面容,专注于这项本事,并在其上构建了一些应用范例。咱们发现了这一丝。是以统统这个词想法是,咱们如何使用AI构建比单个面容更伟大的东西?当咱们看到了这些后劲,探究到我的布景和经历,我初始合计这是我应该奉献一世的事情。
Jennifer:我想知说念,插足你和团队的时分以及你一世的责任到一个磋议主题中的想法是什么?
Mohammad:这履行上是一个相配复杂的优化问题。在寻找从本事角度有很大改良空间的东西方面,因为归根结底,我的专科是AI的本事和磋议,是以当先,它应该是在开发和本事复杂方面有更永劫分的东西,但亦然我能感到柔顺并爱上的东西。我爱上了艺术,视觉输出对我来说比文本更容易聚合。我猜对大多数东说念主来说,视觉信息更接近感官处理,咱们大脑的大部分资源都用于处理视觉信息。是以,当咱们看到新本事在改换图像和视频生成方面具有雄伟后劲时,我感到相配激动。我确切嗅觉这是一个相配大的范围,是我内心所鄙吝的东西。是以这并不是需要太多念念考,一朝我找到了阿谁范围,在此之前我需要念念考好多。是要作念更多的语言建模,照旧更多的强化学习?这样的遴荐。
Transformer与扩散模子: 比较分析
Derrick:为了让咱们的一些听众更好地领略,您能将传统的Transformer模子与扩散模子进行比较和对比吗?因为我认为当东说念主们听到这里时,token见解是零散熟练的,但很少有东说念主了解扩散或图像模子是如何责任的。
Mohammad:虽然,我会说这是对于你听到的对于Transformer、卷积等架构的,更多是对于生成高维对象的骨子上的不同。无论是图像、文本照旧音频,你都不错将它们退换为一系列比特。面前至少有两种主要形态不错生成高维的比特序列。一种是每次生成一个比特,或者一次生成一块比特,这被称为自转头建模。统统大型语言模子都基于这个见解责任。你生成第一个比特,然后将其行为输入,生成下一个比特。你不错通过稽察迄今为止生成的统统比特进行迭代,然青年景下一个比特或一组比特。你不错膨大这个想法,不是一次作念一个比特,而是一次作念两个比特,等等。这便是tokens和tokens大小的见解。
面前,还有另一种生成这些比特的形态,那便是通过迭代过程同期生成统统比特。布景是,只需向数据中添加杂音,就不错很容易地将数据退换为杂音。杂音指的是一个完全随即的比特序列。生成完整的随即比特序列相配容易。生成与图像相对应的随即比特序列相配裂缝。扩散模子的统统这个词念念想是从一系列随即比特初始,通过一个迭代过程,尝试使其更访佛于一幅图像或一系列翰墨。这两种形态的根柢区别在于,一种形态是一次作念一个token,或者一次作念一块token,而另一种形态是进行举座的生成和改良。
当你深刻念念考这个问题时,你会领会到,在创造艺术品的过程中,咱们并不像点彩画那样逐点进行。正常,咱们会从一个宏不雅的构想启航,随后绘图草图,上色,并通过一个反复的细化过程来完善作品。从这个角度来看,东说念主类创作画作或艺术作品的过程,与扩散模子所撤职的旅途更为相似。然则,从另一个角度来看,念念考咱们谈话或撰写段落的风气,咱们会发现,无论是书写真旧白话抒发,咱们都是当然则然地从第一个词初始,逐词逐句地伸开。
Jennifer:这完全正确。我老是念念考去噪过程,因为我也画画,尽管我不是一个伟大的画家,但它相配访佛于如何将一个想法从脑海中的粗鄙草图变成一个有好多细节的作品,这是一种精真金不怕火。我发现去噪过程不错相配准确地响应了现实世界的过程。当Transformer论文出来时,你也在那儿究诘它。我很景仰,其时这种新架构给东说念主的嗅觉是什么样的?你有莫得预预料这会是一件大事?它之后改换了机器学习和AI行业,东说念主们是否感到诧异?
Mohammad:再说一遍,Ashish是我的亲密一又友。咱们一直在究诘好多话题。其时我在湾区责任,我想他在论文提交后就知说念这是本事的一个相配进军的部分。他在走廊上告诉我它是如何责任的,以及它给翻译带来了若干改良。再一次,翻译也曾是Transformer论文的磨练台。它在两个方面有所匡助,一个是老师的速率,另一个是翻译的质料。平允地说,我认为其时莫得东说念主相配明晰地知说念这会变得多大,而且风趣的是,面前Transformer不仅是语言处理的基础架构,亦然策动机视觉的基础架构。咱们远远超出了语言翻译行为一项任务。咱们面前在议论通用东说念主工智能和构建通用智能机器的想法。看到Transformer在这些领域中弘扬如斯进军的作用,如实令东说念主感到忍让。除了架构外,还有东说念主领会到建模语言自身是一项风趣的任务,鼓舞了建模语言并鼓舞了一次生成一个token的想法。一次一个token,不错带咱们走这样远。我认为OpenAI的东说念主有好多功劳,因为他们发现相通的基本原则,相通的建模语言念念想,不错导致相配智能的代理。其时在谷歌有一些对于这个的究诘,但我不认为有相配悉心策动的计谋和强硬的信念。咱们花了多年时分在更大的数据集上进行演示领域的老师,这将为咱们提供相配苍劲的机器,而它的对都方面在很猛进程上亦然未知的。咱们不错使用极少、坚毅的指示和反应或东说念主工反馈的想法,使这些模子更易于接近。其时这些都是未知的。
Jennifer:沿着团结念念路,我也很景仰,当你的长入首创东说念主Jonathan Ho发表了扩散模子论文时,这是否引颈你们走上了图像生成和扩散模子之路?看到这篇论文发表时的嗅觉是什么?这是一种预期之内的,照旧震悚磋议行业的?
Mohammad:我十足认为这在其时是一个败坏,因为咱们需要某些类型的生成模子,包括GANs和自转头的Transformer模子,但至少在其时,它们都无法膨大到大型图像数据集上生成更高分手率和更各种化的图像。即使从扩散面容的早期阶段来看,这种模子也能创造出更高保真度的图像,而况有很大的后劲。这篇论文还是让咱们在这方面走得很远,但当你考究GANs的历史时,一步步改良模子需要几年的时分。扩散模子在好多方面改良了GANs。是以我认为这是一个败坏,咱们看到了它的后劲,并在某种进程上完结了这一后劲。咱们不一定预料到将来的全部发展,但咱们深信罢手了好多其他面容,并将扩散模子行为一个进军的磋议宗旨。
还有一种想法是,一朝图像模子初始运作细密,咱们就不错从图像或遐想的形貌波折为履行的图像和遐想。这种将文本翻译成图像的问题是创意产业转型的一个相配基本的部分。我认为其时并不长短常瓦解,但咱们必须鼓舞它。好的,让咱们通过文本到图像、文本到视频来让这些模子更容易被东说念主们摄取,成为新一波创造力的鼓舞者。

图片开端:Unsplash
从磋议员到企业家: 用东说念主工聪敏创新创造力
Derrick:是什么最终导致你离开谷歌并创建Ideogram?谷歌显明在很长一段时安分都处于前沿。我作念了好多这样的磋议。
Mohammad:我确切认为咱们会创造一个莫名的境地,这是一个伟大而惊东说念主的磋议,出自谷歌。咱们在扩散模子上使用的一些责任再次出自谷歌,这种被称为“象征符免费蛊惑”的本事相配流行,再次由Jonathan提议,但我想谷歌磋议团队的任务并不是构建居品。咱们尝试作念了一些居品,但这并艰涩易,因为我想咱们是一群磋议东说念主员,咱们之前莫得信得过发货过居品。我不认为有东说念主信托咱们以致不错作念好责任,但从根柢上说,我不细目居品创新是否不错在大公司内庸碌发生,因为你有一个繁荣发展的业务而况正在运作。是以我如实领会到其时的一些对话,举例将文本到图像本事应用到Google的不同出产力器用中,举例Google幻灯片,但问题是,这是一项价值一亿好意思元的生意吗?
Jennifer:面前?事实讲解它是。
Mohammad:是的,真实地说,但当它不是1亿好意思元的生意时,很丢丑到它的后劲。是以我认为,从根柢上讲,这种居品创新比大公司更难,因为有好多容易完结的磋议。你知说念,你不妨把时分花在告白改良上,提高0.001%。
Jennifer:面前你还是在Ideogram责任了一年多。考究谷歌的资历,你学到了什么?有哪些告诫对于老师这些大型模子仍然具有蛊惑性和价值?面前你在构建居品时有哪些东西,你发布(居品)的速率相配快,这与谷歌的情况酿成了很大的对比。
Mohammad:是的,面前咱们需要更全面地探究统统这个词责任流。咱们还需要更高效地摆布咱们的资源,无论是策动资源照旧东说念主力资源。咱们是一个敏捷的团队,咱们领有的策动资源履行上是惊东说念主的,但还莫得达到谷歌的领域,是以这是咱们必须面对的一个现实。我认为这可能是一件功德。缺少资源促使你愈加接力责任,赢得更多建立。还有一件事是咱们倾销公司的式样,咱们是一家垂直整合的AI公司。咱们是AI优先,但咱们亦然居品优先,咱们是社区优先。因此,咱们的复旧包括社区、本事和居品。
我认为当咱们在谷歌担任磋议东说念主员时,咱们相配注重新奇性和磋议,创重生成图像和文本的新形态、新想法,这很棒。但在居品开发的布景下,咱们需要更多地探究用户的需求。咱们的用户想要什么?咱们如何完结这一丝?咱们如何创建不错完成任务的新基础模子,以及构念念、创造和裁剪的新形态?各式创意应用的将来是什么?视频创作的将来是什么?在完结通用视频生成之前,有哪些可完结的里程碑?当咱们行为磋议东说念主员念念考这些问题时,这些问题都莫得出现。我认为与用户坐下来谈确切很令东说念主振奋。
我每周都有这种聊天。基本上,这是一种完全有机的与用户互动的式样。东说念主们会手把手地提议各式随即恳求来领导或使用居品,然后有些东说念主会提供一些反馈或指摘。看到用户对居品的心疼确切很好。就在那时,咱们推出了这个居品。咱们看到了用户的好多关注,他们相配感恩。咱们还有一个相配高亢的免费层,是以在这个级别与咱们的用户互动确切很好。我认为在大公司里这样作念要裂缝得多,因为你正常需要通讯、公关和社区等部门的维持,而咱们莫得这些。
Jennifer:我参加了一些社区聊天,望望用户来自那儿以及他们的布景确切很风趣。有些东说念主可能不了解扩散模子的细节,但他们不错制作出这些秀好意思的图像和艺术作品,对迭代过程有很好的领略。行为别称居品不雅众,这相配迷东说念主,我确信也相配值得。
Mohammad:是的,那是确切。这种契机不错让我在个东说念主可爱的居品上责任,我一直都在使用它。我合计使用Ideogram更有创意,这是一个相配私有的契机,不错在个东说念主层面上作念一些让你感到振奋的事情。值得行运的是,这对多量用户来说也很令东说念主振奋。
居品的中枢情念是,每个东说念主都渴慕创造出省略视觉化抒发自我的作品。尽管有东说念主可能但愿通过绘画来完结这一愿望,但并非每个东说念主都有这样的妙技。这种局限经常制约了他们的创造性自我抒发。跟着AI本事的出现,咱们有契机败坏手工艺术的按序,让创造性想法的抒发变得愈加解放。我对此感到相配激动,零散是看到新一代东说念主正在掌抓并摆布这项本事成长。我信托,当东说念主们省略将我方的想法变为现及时,他们不仅在创造力上得到进步,而且会变得愈加创意无穷。因此,我认为新一代东说念主将会因为每个东说念主都能解放抒发自我而变得阔气创造力。这无疑是一件令东说念主立志的事情,因为创造力不仅是时髦朝上的基石,也在经济层面创造了雄伟的价值。
更始性的遐想: Ideogram创新的文本和图像整合形态

图片开端:Unsplash
Jennifer:让咱们深刻了解更多对于Ideogram的内容。如果听众今天玩了商场上统统其他模子,咱们会发现Ideogram相配擅长领导领略、视觉作风,尤其是拼写、排版和结构的智商。Ideogram有何不同之处?如果你能揭开一些艰深,与其他模子比拟,你们是如何将翰墨如斯好地融入这些图像模子中的?
Mohammad:是的,我想在更高的层面上,当你预料遐想和遐想软件时,你会看到文本的进军性。因为省略以某种式样呈现文本和图像,让咱们在更深档次上进行交流,更有创意地进行交流。当你预料模子时,它们正常有图像和文本。我认为模子封装了一种相配有创意的交流式样。但是更进一步,当你预料告白、营销、各式遐想时,你经常会看到翰墨和图像交汇在沿途。
当你预料传统的文本渲染式样时,你有字体,你有将字体退换成图像的引擎。其中一些可能是复杂的,或某些语言的字体相配小。咱们所领有的不雅点是,在将想法滚动为图像的过程中,AI不错略过字体形态。是以咱们不错平直生成图像。咱们不错领有自界说字体,即字体之间的差值。咱们不错更好地处理透视,更好地处理图像和文本之间的复杂关系。
是以这仍然是咱们领有的不雅点,如果这都是对于自界说字体阶段的,而是对于为每个遐想创建新字体呢?是以从一初始,咱们就认为这是商场上的一个空缺,它将使许多创造性的应用成为可能。当咱们构建这些数据集时,当咱们发布新模子时,咱们相配关注文本的质料。
东说念主们问什么是艰深开端?我想咱们可能有一些贸易玄妙,但归根结底,这一切都是对于专注于一个进军的问题并料理它,而在咱们的情况下,问题便是遐想,让统统常识责任者,每个莫得太多遐想专科常识的东说念主都不错使用遐想。我认为契机在于咱们不错领有相配浅易的用户体验,但提供优质的遐想,如果莫得遐想专科常识,就很难创造出来。这便是咱们应该很快完结的愿景。
Jennifer:我一直在玩文本,零散是Ideogram,制作模子,以及这些纹理文本,如纱线或花朵,或通过不同的版块制作。我不错看到这一丝,而况本事拼写智商跟着时分的推移而提高。我很景仰,与只是是一个变装或时局图像比拟,使用文本有哪些挑战?你们是如何料理这些挑战的?
Mohammad:我想咱们濒临的一个挑战是让字体变得败兴。因此,改良文本生成是可行的。总的来说,一个挑战是提高拼写质料,因为如果你有一个文本生成器,你但愿它是竣工的,对吧?你给了字符,它长久不会偏离你输入的字符。但接下来的挑战是你需要决定字体、大小、颜料、位置,而且很难使它成为图像的原生内容。面前,当咱们使用AI来生成图像时,咱们不错通过使用更多的策动资源来提高准确性,但这样会变得很败兴。提供优质遐想和定制字体的统统这个词愿景变得愈加裂缝。是以咱们濒临的挑战是同期提高准确性、创造力和遐想质料。
另一个挑战是你不错有相配好的文本,但模子在其他统统方面可能都很厄运。履行上,创建一个只处理文本很好的模子是很容易的。但是如果变装手持一个标记,而文本看起来不真实或分手率不高,那就不好了。是以我想这是咱们想要保持文本准确性的另一个挑战,同期也要为各式其他目的提供最好的图像质料。然后,我想这个行业的另一个宽绰挑战是推理老本,因为咱们想要改良模子,加多模子大小。这触及到你所说的比例定律。但与此同期,咱们但愿将这些居品提供给尽可能多的东说念主,并让他们更具创造力。在新版块的模子中,咱们是否不错保持低老本并跟着时分的推移镌汰老本?
Derrick:有莫得一种可能,一些老本或策动老本被卸载给用户的征战?
Mohammad:这是一个风趣的问题。是以你的风趣是,如果策动发生在手机或个东说念主征战上?
Derrick:是的,尤其是面前咱们领有相配苍劲的AI芯片,至少在苹果居品中是这样,对吧?他们看起来有智商。
Mohammad:将来十年将如何发展是一个风趣的问题。到面前为止,最苍劲的模子似乎仍然越来越大,而况它们生计在云霄,而在手持征战中,你有一个较弱的版块。是以我认为跟着本事的朝上和征战的改良,也许咱们不错在征战上提供更高质料的文本和图像生成。但我仍然认为咱们将领有最智能并将模子保存在云霄。
Jennifer:有些东说念主说,面前咱们玩图像模子还是几年了,它有点成为商品。你认为从长期来看,这个领域的玩家会有所不同吗?你在我方的用户群体中看到了什么相配私有和新的东西?
Mohammad:我认为在主要图像建模方面至少还需要几年的时分。你将在不同的公司领有更多访佛的模子,但咱们倾向于低估。咱们还需要作念若干本事责任才智达到最高的质料水平,才智信得过用合成媒体取代信得过的媒体?想想影荒谬先破耗多量时分裁剪和休养的统统高分手率图像。愿景是AI不错作念到这一切。是以我认为在本事方面还有好多责任要作念,以进一步鼓舞质料。是以我不认为这些模子很快就会成为商品。
同期,我认为围绕这些模子的责任经由和用户体验相配进军和难得。这便是为什么成为居品第一和AI第一的公司给了咱们一个私有的上风,因为咱们不错创造由于基础模子智商而私有各别化的用户体验。一个很好的例子履行上是对于GPT-4的新责任,您不错在其中老师一个模子,以减少语音交互的蔓延。我认为,由于AI本事,这提供了私有的各别化用户体验。而其他公司在莫得建立基础模子的情况下很难复制这一丝。
是以我认为对咱们来说,在图像创建、裁剪和遐想方面,真实的用户体验是什么?咱们如何才智让一个外行人提议一个浅易的恳求?假定他们想为他们的孩子生辰派对遐想一个邀请函,或者他们想为一又友创建一张贺卡。他们带着一个想法,然后带着一个完成的遐想离开,这个遐想不错用于任何目的。因此,我认为将会有好多迭代,有好多裁剪。他们可能想要在图像中放手一些他们我方的个东说念主相片和联系领导,咱们需要探究如何将其行为一个举座来完结。
用户体验需要多量的念念考。我不认为旧的用户体验一定是AI时间的梦想体验。因此,将会有新的裁剪图像的形态,使其愈加无缝,愈加直不雅。咱们将建造它。这愈加各别化,因为用户体验和AI功能是端到端构建的。
Jennifer:将来生辰卡片能播放歌曲,幻灯片能自动陶冶吗?你是如何看待用户体验的?多传感器体验是否依赖于多模态本事?
Mohammad:将会有好多视频。这将会是好多视频动画。因为视频创作濒临的挑战是什么?这很难,对吧?制作动画贺卡更难,而东说念主们不错在线制作模板并快速制作贺卡,制作动画版块需要更多的责任。但有了AI,这将相配容易,而且很快就会到来。
Derrick:这有点不关要紧,但你之前提到你年青时作念了好多竞争性的编程面容,但AI范例能模拟出你吗?
Mohammad:我想面前风趣的是AI编写范例很容易,但调试范例却很难。是的,我不知说念咱们需要若干年才智信得过写出正确的范例,而且咱们不需要任何编程专科常识。让咱们说不。是的,但我的风趣是,到面前为止,我认为策动机不成很好地编程,优秀的范例员。
从磋议员到企业家的转型: 在AI嗡嗡声中创办公司的资历告诫
Derrick:在咱们扫尾之前,回到创办公司的想法,对于AI给我带来颠簸的一件事,尤其是面前,你会看到好多东说念主花了好多时分进行磋议和相配高水平的磋议,然后去创办一家公司。我认为尤其是从谷歌的多数预算和统统这个词招聘经由初始,就像一些以致不是本事上的东西,就像你学到了什么雷同,我猜,或者你所看到的一些事情,从磋议东说念主员到面前经营一家公司,不得不作念统统这些演变的事情?
Mohammad:要明确的是,咱们莫得创办公司,因为AI很酷。我在(Google)的终末一天是在ChatGPT发布两天后,之后咱们创办了公司,因为咱们合计AI有很大的后劲。天外确切很令东说念主振奋,咱们想站在它的前沿,开发本事并享受其中的乐趣,发生的事情是我猜AI也很受宽贷,是以这是一个很好的赶巧。但这并不是为了引起咱们在公司方面的关系,履行上这有点风趣,我合计这是一个让我更多地了解我方,发展更多妙技和成为更好东说念主的契机,因为有好多弥留和复杂性,将不同的利益联系者对都统统这些辐射。我认为这亦然一种个东说念主旅程。它在不同层面上挑战了我和团队中的每个东说念主,但好音讯是你经历了一些挑战和灾难,因此你对我方有了更多的了解,并但愿创造一些价值。这是看待它的一种式样,我嗅觉它走出了我的沉着区。这很令东说念主振奋,因为它将匡助我和公司的其他东说念主成为更有智商、更好的东说念主。
Derrick:这周就到这里了。咱们但愿你可爱听Mohammad的共享,就像咱们可爱和他交谈雷同。如果你可爱,请铭刻给播客评分,并与你的一又友和共事共享。下周见,谢谢收听。
原播客:The Future of Image Models Is Multimodal https://a16z.com/podcast/the-future-of-image-models-is-multimodal/
编译:Ryan Du 杜竑喆
-----------END-----------体育游戏app平台
