chatgpt火遍全球怎么玩

1人浏览 2026-04-17 09:04
chatGPT
chatGPT在线试用

新一代对话式人工智能,历史上增长最快的消费者应用程序

6个回答

  • 最佳回答
    梁诚月河
    梁诚月河
    “ChatGPT” 是一种基于人工智能技术的聊天机器人模型,可用于自然语言处理和生成对话。下面是一些使用ChatGPT的常见玩法:1. 尝试与ChatGPT进行对话:您可以使用与ChatGPT交互的在线聊天界面或聊天应用程序,通过键入文字与聊天机器人进行对话。ChatGPT会尽力理解您的问题或指令,并生成相对应的回答。您可以尝试提问有关事实、新闻、娱乐等各种话题,甚至可以与ChatGPT进行一些轻松而有趣的闲聊。2. 编写故事或剧本:ChatGPT可以用于创作故事、剧本和对话,可以作为一个创意写作工具。您可以向ChatGPT提供一些情节线索或角色设定,然后与它进行交流,它将生成相应的故事或对话片段。这对于创作灵感的激发和故事构建的探索非常有帮助。3. 学习和提问:ChatGPT可以作为一个知识问答工具,帮助您回答问题或了解特定领域的信息。您可以向ChatGPT提问历史、科学、文化、技术等方面的问题,它会尽力提供合理的回答。请注意,ChatGPT是基于训练数据生成回答的,有时可能会提供不准确或不完全准确的信息。4. 聊天和社交互动:有些人将ChatGPT视为一个虚拟伙伴,他们使用ChatGPT来进行一些社交互动和闲聊。您可以与ChatGPT分享您的想法、感受、问题,并从它那里获得回应。ChatGPT是一个机器人模型,它无法产生真实的情感或理解人类的情感。尽管ChatGPT在处理自然语言方面表现出色,但它仍然存在一些局限性。它可能会产生不准确或令人困惑的回答,或者会偏向提供流行文化或互联网上的常见观点。ChatGPT还没有意识、记忆和跨会话一致性。在使用ChatGPT时,需要谨慎对待其生成的回答,并理解它只是一个基于模型训练的智能工具。
  • 李元园莎
    李元园莎
    【2022,风暴里的AIGC元年】2022年12月16日,Science杂志发布了2022年度科学十大突破。年度热词——AIGC赫然在列。沿着我们熟悉的PGC、UGC等概念,AIGC指的是利用人工智能技术生成内容,即内容生产者从真人变成了AI。过去的一年里,火遍全网的AI绘画,震惊世人的ChatGPT,我们普通人都可以体验的各种明星级产品的问世,使得AIGC强势破圈。其实早在年初,就有行家预测:2022年是AIGC元年(当时我们用得更多的另一个词是“生成式AI”)。今年3、4月份的时候,也有前同事想拉我入伙,向我介绍他的“虚拟数字讲解员”的商用项目,并向我描述生成式AI解放生产力之种种蓝图。但无奈于技术关卡和实现资源等难题,最终只得作罢。在困扰我们的种种技术难题当中,数字人所搭载的合成AI语音一直是我的阿喀琉斯之踵。出于我的职业惯性,我希望数字人能有自然流畅的、接近真人的嗓音,这在信息传播过程中才更富有亲和力和说服力,但现有的合成AI语音完全无法满足我的需求。在这一波AIGC浪潮里,虽然我已下船旁观,但我依然一直关注着前沿技术的发展。在2022年的最后一个月,作为首位签约TME的超写实虚拟偶像鹿晓希LUCY横空出世,并接连发布了三首不同曲风的原创单曲。 当前浏览器不支持播放音乐或语音,请在微信或其他浏览器中播放 目的地 音乐: 鹿晓希LUCY - 目的地 我该怎样去形容最初听到LUCY时的惊喜呢?我一度反复地确认:这里头,真的不是藏着个“中之人”吗?(注:中之人,指藏在虚拟主播身后、为VTuber提供声音来源的真人工作者)这明明是如假包换的真人歌手嘛!这怎么还会是AI啊?我便和大家聊聊,在2022这一“AIGC元年”里,推出的又一颗璀璨新星:首位拥有“唱片级智能歌声”的虚拟偶像——鹿晓希LUCY。【虚拟歌姬的前世今生】AI歌手其实并不是什么新鲜事。2004年,YAMAHA便正式推出了电子歌声合成软件,输入音调和歌词,就可以合成类似人类声音的歌声,这就是大名鼎鼎的VOCALOID,国内俗称的“V家”。合成语音的原理听起来很简单:通过采集大量的人类声音样本,以神经网络合成技术,制作成音源库。玩家通过设定参数调用里头的声音,AI这就唱起歌来。在此基础上,诞生了我们熟悉的初音未来、洛天依、星尘等虚拟歌手,这都是来自于VOCALOID的技术。但,这些虚拟歌手,只要一开嗓,我们就知道——这是假人啊。尽管VOCALOID自初代发布以来,一直都在更新迭代,但依然有明显的“电音感”和“机械感”。人声是所有音源里最最难模拟的东西。我们可以轻易地在midi里模拟出三角钢琴的自然共鸣,也可以模拟出木吉他弦在指尖摩擦的声音,但人的肉嗓却是这个星球上最精密、最神奇的发音体,哪怕你把“开口度”、“明亮度”、“性别度”等参数列了个十几项,也仅仅是模拟人类唱歌的基础框架而已。V家的应用范围大都仅限于二次元——反正我和三次元井水不犯河水。若干年前,我在担任女团制作人的时候,向某些二次元作者收歌,他们倒也会用VOCALOID去作为Demo歌手做范唱。收到这些Demo的时候,我的内心OS是:求求你找个妹子唱吧,V家,老板们听不懂的啦……过去数年,随着AI技术整体的提升,虚拟歌姬也有了长足的发展。以小冰为代表的x studio凭借微软的金漆招牌一时风头无量,但依然逃不开其电音质感;异军突起的ace studio倒是有越来越多的朋友使用,虽然还是能一耳朵便听得出这是AI歌手(音色气息还是缺了变化),但你若是一个作曲者/编曲人,这已经是一个相当得力的能帮你唱demo的歌手朋友了。但在鹿晓希LUCY的面前,这些技术都显得像是上个世代的产物。用各位都能听得懂的比方,LUCY就像是唯一领跑的次世代主机,把PS4 / XBOX 360等统统抛在后头。【鹿晓希LUCY是怎样炼成的】我相信,每一位听到LUCY的朋友都会惊讶于其革命性的声音表现力。LUCY是真正属于次世代的AI歌手。在现已发布的三首单曲当中,LUCY的声音表现自然、流畅,没有半点“机器嗓”的不适。《叠加态少女》里,在这首爽朗的Teen-Pop里,LUCY展现自己的年轻无敌,用充满了弹性和跳跃感的音色去营造19岁少女的勇敢无畏;《1234你》里,LUCY又化身为一个多愁善感的小女生,R&B对于虚拟歌姬来说总是不易拿捏,因为其音程和气息之间的控制实在是过于复杂,但LUCY的表现依然无可指摘(是一个练习时长至少两年以上的声乐学生的标准了);第三首单曲《目的地》则是带着轻摇滚/urban/City Pop的时尚曲风,这是迄今为止LUCY所发布的单曲中我最喜欢的一首,她的锐利度、冲撞感让我一瞬间感到:这个姑娘,就在我眼前。 当前浏览器不支持播放音乐或语音,请在微信或其他浏览器中播放 叠加态少女 音乐: 鹿晓希LUCY - 叠加态少女 要让LUCY“活”起来,其所要做的第一件事,是思考这个问题:鹿晓希LUCY的声音究竟是怎样的?。关于这位19岁少女,我们对她的嗓音有这样一个大致的轮廓:她留着齐肩的短发,挑染代表了自由和飘逸;她一定不是一个娃娃音,LUCY有自己的一套,带有一定的中性色彩;她的外冷内热,乍一看是酷酷的女孩,但又保持着可爱;她甚至还带有一点儿“少年感”,这让她可以展现出洒脱、勇敢的一面。在这样的人物画像的指导下,通过 TME天琴实验室LyraSinger引擎,以海量歌手样本数据的人工智能学习下,指向了属于LUCY的声音。为了满足LUCY“唱片级”的声音定位,开发团队特邀行业知名制作人文颖秋担任AI声学艺术监制,基于艺人的定位,提取采样库中多种音色亮点进行配比捏合。相比于其他人工合成语音,LUCY要求以唱片级制作流程规范样本声音标准,及专业歌手录唱标准调试和设定每一个声音细节的处理方式。最终通过精细控制各音色建模单元的比例,并吸取每种源音色的优点并有机融合,在多种比例中不断捏和,甚至对每一句歌词演绎情感及气息的不断打磨,最终生成独一无二的LUCY声纹。这也使得我们现在听到LUCY的声音是充满个性之表达能力的。 当前浏览器不支持播放音乐或语音,请在微信或其他浏览器中播放 1234你 音乐: 鹿晓希LUCY - 1234你 “捏嗓”只是LUCY的第一步。第二步是LUCY的演唱技巧。你是如何理解“技巧”这件事的?我听过很多琴童的家长这样问老师:老师,我们家娃,弹琴总觉得没感情,咋整?老师大都会白家长一眼,然后说:感情?感情是什么?感情就是触键!强弱变化!句子之间的线条!这些全都是技巧!把这些技巧练会了,才有所谓“感情”好吧!对于歌手来说,同样如此。只有强大的技巧(唱功)才能支撑不同的表达。而LUCY显然是我见到过技巧最全面的AI歌手。这来源于两点。其一是LUCY的学习样本库本就是“唱片级”的。在音色样本库采集时,LUCY用的就是上百位专业级歌手的素材。这样的采集学习方式在国内非常少有。大部分开发者基于成本考虑,仅是模拟某位或某几位歌手之演唱。博取百家之长的好处不言自明,在此过程中可最大程度让AI学习到更广泛的演唱技巧,包括气声、混声、弱声、转音等多种表达,以便应对歌曲中不同场景、情绪的需要。同时也因为样本覆盖足够多,在AI的音域表现方面,从女中到女高多重音区之样本模型能提供更多可学习的范例,使得LUCY在高音区的真假音能有灵巧和高密度的回弹(这点我们稍后马上会讲到)。另一个重要的原因是LUCY在开发时所采用的史无前例的智能演唱垂类全新标注标准。数据标注是人工智能的基础。简单地说,数据标注相当于给“投喂”AI准备“饲料”。举个例子:当你在一段声音中标注“这是气声”,重复1000次不同的片段,AI在第1001次的时候便“学会了”气声的正确用法。数据标注是构建AI 歌手的基础力量,通过海量的已标注数据,AI才能逐渐学会怎么唱歌。如果标注能够越细致,那自然最后声音的呈现也能越丰满。这一次,LUCY的数据标注数量级是国内技术的佼佼者,其标注样本精细到毫秒级,事无巨细地把气声、真假音转换等多个演唱技巧维度统统标注好,以此最大程度上还原每一个人声演唱技巧。如此双管齐下,使得LUCY在音乐技法模型的能力,在广度和深度方面,都代表了次世代之水准。我们不妨来细听下现已发行的三首单曲,直面感受LUCY音乐领域的强大“天赋”:《叠加态少女》:作为一首主打青春主张的Teen Pop,LUCY在这首歌其实只需要做好一件事:把她的朝气、勇往直前呈现出来就好了。说着简单,但如果没有足够声音强弱表现,这就真的是机器人唱法了。开头第一句,“伴着日落行驶向快乐”,其中“乐”字一上来就巧妙地秀了一把真假声无缝转换;“没有终点的终点更酷”,如果“酷”字把它给唱实了,这就逊毙了,此处的弱音也处理的异常平滑。进入副歌后,是一个强弱交替的重音强调唱法,每一个重拍处都要求着重强调,并在非重音下加入混声和气声,这是一个很高段位的演唱技巧,也是我们之前所说的“高音区的真假音快速回弹”能力,LUCY完成的同样精准自然。而整首歌最高音处唱到C5,基于超强引擎的全音域生成能力,依然在混声的时候合成除了高保真的声音表现,这实在是令人惊讶。 《叠加态少女》高音片段 《1234你》:这首浪漫的R&B抒情曲,考验着的是发声的细节,慢歌里特别一不小心就容易露馅。主歌时,LUCY有一些故意pitch有瑕疵的地方,“不小心塞满抽屉的秘密”,你仔细听,其实不是100%准的,但这种呼吸感恰恰又是真人歌手情绪最容易流露之处。在歌曲里的大量转音部分,如“哪怕生活其实不太识趣”之“趣”,一个字里连转了五个音,LUCY的声音也不像是同类型产品那种明显的“划线感”。以及可以留意这首歌的气口,尤其是副歌部分,LUCY每一个轻微的换气动作,这种自然的呼气吸气,来源于LUCY毫秒级的呼吸采样学习,你说谁能识别出来,这是AI? 因作品本身的乐队感很强,LUCY唱起歌来走路有风。此处可特别留意的是LUCY因为在这首歌里用了更多的真声演唱,降低了气声的使用比例,而发音也显得更为短促有力。AI不仅在参数上进行了调整,更直接导致了LUCY有另一种唱腔和情绪的表达。“唱商”,这是真人歌手才具有的本领,在过往所有的AI歌手中我都没有见到过。LUCY可谓独一家,是一个拥有音乐审美和判断的超强AI歌姬。如上所述,鹿晓希LUCY是当前国内独一档的AI歌手存在,无愧于“唱片级发烧AI歌手”的定位。LUCY目前所展现出来的领先技术也是建立在同行业无数探索者经年累月的技术积累,而当前虚拟人/数字人的领域中,竞争者层出不穷,技术也将不停地迭代。LUCY会在多长的时间里保持业内天花板的领先地位、并在此期间能够干成怎样突破性的创举(无论是商业应用或是其他异业合作),都值得我们持续观察。【LUCY能为我们带来什么?】以假乱真——一言以蔽之,这是鹿晓希LUCY当前呈现的状态。于是,我们能看到鹿晓希一系列高调的动作,诸如以首位“超写实虚拟偶像”的身份签约腾讯音乐,并收获了一众三次元歌手们的出道贺词,这实在是太写实了。如今的鹿晓希LUCY还是一个被保护的、“封闭状态”下的虚拟歌姬,更接近传统唱片公司/经纪公司打造下的超级新人。如出道之时便官宣与ELLE family展开深度合作,赫斯特中国为LUCY所量身打造的系列时尚大片,以系列时尚单品加身,展现其青春魅力: LUCY也还将作为表演嘉宾在“可口可乐粉丝节- 新年欢聚夜”及“KFC天台跨年派对”上展露头角。作为虚拟偶像而存在的LUCY确实能够获得市场的青睐,除了强调年轻时尚的快销(包括软饮、彩妆、服装)外,许多大牌也愿意加入可见LUCY身上的科技感、未来感仍是品牌彰显态度及市场趋势追逐的热点。但于我而言,我更关注LUCY依然是她身为目前唯一的可以“以假乱真”虚拟歌姬之业务能力。我是说在不远的将来,若LUCY成为了一个开源的AIGC音乐人,当所有人都可以对其嗓音进行使用,创作属于自己的歌曲的时候,LUCY会不会成为这个星球上最红的歌手?请别觉得我在说梦话。大家可回忆初音未来刚诞生的时候——初音作为V家的一员,其目的也是为了解决制作人/编曲人找不到歌手的问题。因为这样一个没有气息/音高/风格限制,颠倒人类人声认知的“容器”,创作者开始了彼此的狂欢,其中甚至诞生了米津玄师这样写歌从不按常理出牌的鬼才。而当能够制作动画的MMD(MikuMikuDance)出现后,初音不再只是一个平面形象,而是可以跟着音乐舞蹈的3D动画,这让初音不仅成为音乐创作者、更是多媒体创作者的共同纽带。随着弹幕视频网站等新兴媒介的推波助澜,初音未来更是成为了全球共创的平台。“初音未来之父”伊藤博之才会说:“数字作品是越被使用,其价值越高”,而创作者们在做的事,是“为没有生命的事物注入灵魂”。对于鹿晓希LUCY来说,这位次世代的超写实虚拟歌姬,她有着超越前辈的多变音色、全面技巧,造就了她完美的拟人表现。她会重新定义AI歌手吗?她会成为人人都爱用的虚拟歌姬吗?她会让创作者们连成一片吗?The future is already here.
  • 金凝晨彦
    金凝晨彦
    【2022,风暴里的AIGC元年】2022年12月16日,Science杂志发布了2022年度科学十大突破。年度热词——AIGC赫然在列。沿着我们熟悉的PGC、UGC等概念,AIGC指的是利用人工智能技术生成内容,即内容生产者从真人变成了AI。过去的一年里,火遍全网的AI绘画,震惊世人的ChatGPT,我们普通人都可以体验的各种明星级产品的问世,使得AIGC强势破圈。其实早在年初,就有行家预测:2022年是AIGC元年(当时我们用得更多的另一个词是“生成式AI”)。今年3、4月份的时候,也有前同事想拉我入伙,向我介绍他的“虚拟数字讲解员”的商用项目,并向我描述生成式AI解放生产力之种种蓝图。但无奈于技术关卡和实现资源等难题,最终只得作罢。在困扰我们的种种技术难题当中,数字人所搭载的合成AI语音一直是我的阿喀琉斯之踵。出于我的职业惯性,我希望数字人能有自然流畅的、接近真人的嗓音,这在信息传播过程中才更富有亲和力和说服力,但现有的合成AI语音完全无法满足我的需求。在这一波AIGC浪潮里,虽然我已下船旁观,但我依然一直关注着前沿技术的发展。在2022年的最后一个月,作为首位签约TME的超写实虚拟偶像鹿晓希LUCY横空出世,并接连发布了三首不同曲风的原创单曲。 当前浏览器不支持播放音乐或语音,请在微信或其他浏览器中播放 目的地 音乐: 鹿晓希LUCY - 目的地 我该怎样去形容最初听到LUCY时的惊喜呢?我一度反复地确认:这里头,真的不是藏着个“中之人”吗?(注:中之人,指藏在虚拟主播身后、为VTuber提供声音来源的真人工作者)这明明是如假包换的真人歌手嘛!这怎么还会是AI啊?我便和大家聊聊,在2022这一“AIGC元年”里,推出的又一颗璀璨新星:首位拥有“唱片级智能歌声”的虚拟偶像——鹿晓希LUCY。【虚拟歌姬的前世今生】AI歌手其实并不是什么新鲜事。2004年,YAMAHA便正式推出了电子歌声合成软件,输入音调和歌词,就可以合成类似人类声音的歌声,这就是大名鼎鼎的VOCALOID,国内俗称的“V家”。合成语音的原理听起来很简单:通过采集大量的人类声音样本,以神经网络合成技术,制作成音源库。玩家通过设定参数调用里头的声音,AI这就唱起歌来。在此基础上,诞生了我们熟悉的初音未来、洛天依、星尘等虚拟歌手,这都是来自于VOCALOID的技术。但,这些虚拟歌手,只要一开嗓,我们就知道——这是假人啊。尽管VOCALOID自初代发布以来,一直都在更新迭代,但依然有明显的“电音感”和“机械感”。人声是所有音源里最最难模拟的东西。我们可以轻易地在midi里模拟出三角钢琴的自然共鸣,也可以模拟出木吉他弦在指尖摩擦的声音,但人的肉嗓却是这个星球上最精密、最神奇的发音体,哪怕你把“开口度”、“明亮度”、“性别度”等参数列了个十几项,也仅仅是模拟人类唱歌的基础框架而已。V家的应用范围大都仅限于二次元——反正我和三次元井水不犯河水。若干年前,我在担任女团制作人的时候,向某些二次元作者收歌,他们倒也会用VOCALOID去作为Demo歌手做范唱。收到这些Demo的时候,我的内心OS是:求求你找个妹子唱吧,V家,老板们听不懂的啦……过去数年,随着AI技术整体的提升,虚拟歌姬也有了长足的发展。以小冰为代表的x studio凭借微软的金漆招牌一时风头无量,但依然逃不开其电音质感;异军突起的ace studio倒是有越来越多的朋友使用,虽然还是能一耳朵便听得出这是AI歌手(音色气息还是缺了变化),但你若是一个作曲者/编曲人,这已经是一个相当得力的能帮你唱demo的歌手朋友了。但在鹿晓希LUCY的面前,这些技术都显得像是上个世代的产物。用各位都能听得懂的比方,LUCY就像是唯一领跑的次世代主机,把PS4 / XBOX 360等统统抛在后头。【鹿晓希LUCY是怎样炼成的】我相信,每一位听到LUCY的朋友都会惊讶于其革命性的声音表现力。LUCY是真正属于次世代的AI歌手。在现已发布的三首单曲当中,LUCY的声音表现自然、流畅,没有半点“机器嗓”的不适。《叠加态少女》里,在这首爽朗的Teen-Pop里,LUCY展现自己的年轻无敌,用充满了弹性和跳跃感的音色去营造19岁少女的勇敢无畏;《1234你》里,LUCY又化身为一个多愁善感的小女生,R&B对于虚拟歌姬来说总是不易拿捏,因为其音程和气息之间的控制实在是过于复杂,但LUCY的表现依然无可指摘(是一个练习时长至少两年以上的声乐学生的标准了);第三首单曲《目的地》则是带着轻摇滚/urban/City Pop的时尚曲风,这是迄今为止LUCY所发布的单曲中我最喜欢的一首,她的锐利度、冲撞感让我一瞬间感到:这个姑娘,就在我眼前。 当前浏览器不支持播放音乐或语音,请在微信或其他浏览器中播放 叠加态少女 音乐: 鹿晓希LUCY - 叠加态少女 要让LUCY“活”起来,其所要做的第一件事,是思考这个问题:鹿晓希LUCY的声音究竟是怎样的?。关于这位19岁少女,我们对她的嗓音有这样一个大致的轮廓:她留着齐肩的短发,挑染代表了自由和飘逸;她一定不是一个娃娃音,LUCY有自己的一套,带有一定的中性色彩;她的外冷内热,乍一看是酷酷的女孩,但又保持着可爱;她甚至还带有一点儿“少年感”,这让她可以展现出洒脱、勇敢的一面。在这样的人物画像的指导下,通过 TME天琴实验室LyraSinger引擎,以海量歌手样本数据的人工智能学习下,指向了属于LUCY的声音。为了满足LUCY“唱片级”的声音定位,开发团队特邀行业知名制作人文颖秋担任AI声学艺术监制,基于艺人的定位,提取采样库中多种音色亮点进行配比捏合。相比于其他人工合成语音,LUCY要求以唱片级制作流程规范样本声音标准,及专业歌手录唱标准调试和设定每一个声音细节的处理方式。最终通过精细控制各音色建模单元的比例,并吸取每种源音色的优点并有机融合,在多种比例中不断捏和,甚至对每一句歌词演绎情感及气息的不断打磨,最终生成独一无二的LUCY声纹。这也使得我们现在听到LUCY的声音是充满个性之表达能力的。 当前浏览器不支持播放音乐或语音,请在微信或其他浏览器中播放 1234你 音乐: 鹿晓希LUCY - 1234你 “捏嗓”只是LUCY的第一步。第二步是LUCY的演唱技巧。你是如何理解“技巧”这件事的?我听过很多琴童的家长这样问老师:老师,我们家娃,弹琴总觉得没感情,咋整?老师大都会白家长一眼,然后说:感情?感情是什么?感情就是触键!强弱变化!句子之间的线条!这些全都是技巧!把这些技巧练会了,才有所谓“感情”好吧!对于歌手来说,同样如此。只有强大的技巧(唱功)才能支撑不同的表达。而LUCY显然是我见到过技巧最全面的AI歌手。这来源于两点。其一是LUCY的学习样本库本就是“唱片级”的。在音色样本库采集时,LUCY用的就是上百位专业级歌手的素材。这样的采集学习方式在国内非常少有。大部分开发者基于成本考虑,仅是模拟某位或某几位歌手之演唱。博取百家之长的好处不言自明,在此过程中可最大程度让AI学习到更广泛的演唱技巧,包括气声、混声、弱声、转音等多种表达,以便应对歌曲中不同场景、情绪的需要。同时也因为样本覆盖足够多,在AI的音域表现方面,从女中到女高多重音区之样本模型能提供更多可学习的范例,使得LUCY在高音区的真假音能有灵巧和高密度的回弹(这点我们稍后马上会讲到)。另一个重要的原因是LUCY在开发时所采用的史无前例的智能演唱垂类全新标注标准。数据标注是人工智能的基础。简单地说,数据标注相当于给“投喂”AI准备“饲料”。举个例子:当你在一段声音中标注“这是气声”,重复1000次不同的片段,AI在第1001次的时候便“学会了”气声的正确用法。数据标注是构建AI 歌手的基础力量,通过海量的已标注数据,AI才能逐渐学会怎么唱歌。如果标注能够越细致,那自然最后声音的呈现也能越丰满。这一次,LUCY的数据标注数量级是国内技术的佼佼者,其标注样本精细到毫秒级,事无巨细地把气声、真假音转换等多个演唱技巧维度统统标注好,以此最大程度上还原每一个人声演唱技巧。如此双管齐下,使得LUCY在音乐技法模型的能力,在广度和深度方面,都代表了次世代之水准。我们不妨来细听下现已发行的三首单曲,直面感受LUCY音乐领域的强大“天赋”:《叠加态少女》:作为一首主打青春主张的Teen Pop,LUCY在这首歌其实只需要做好一件事:把她的朝气、勇往直前呈现出来就好了。说着简单,但如果没有足够声音强弱表现,这就真的是机器人唱法了。开头第一句,“伴着日落行驶向快乐”,其中“乐”字一上来就巧妙地秀了一把真假声无缝转换;“没有终点的终点更酷”,如果“酷”字把它给唱实了,这就逊毙了,此处的弱音也处理的异常平滑。进入副歌后,是一个强弱交替的重音强调唱法,每一个重拍处都要求着重强调,并在非重音下加入混声和气声,这是一个很高段位的演唱技巧,也是我们之前所说的“高音区的真假音快速回弹”能力,LUCY完成的同样精准自然。而整首歌最高音处唱到C5,基于超强引擎的全音域生成能力,依然在混声的时候合成除了高保真的声音表现,这实在是令人惊讶。 《叠加态少女》高音片段 《1234你》:这首浪漫的R&B抒情曲,考验着的是发声的细节,慢歌里特别一不小心就容易露馅。主歌时,LUCY有一些故意pitch有瑕疵的地方,“不小心塞满抽屉的秘密”,你仔细听,其实不是100%准的,但这种呼吸感恰恰又是真人歌手情绪最容易流露之处。在歌曲里的大量转音部分,如“哪怕生活其实不太识趣”之“趣”,一个字里连转了五个音,LUCY的声音也不像是同类型产品那种明显的“划线感”。以及可以留意这首歌的气口,尤其是副歌部分,LUCY每一个轻微的换气动作,这种自然的呼气吸气,来源于LUCY毫秒级的呼吸采样学习,你说谁能识别出来,这是AI? 因作品本身的乐队感很强,LUCY唱起歌来走路有风。此处可特别留意的是LUCY因为在这首歌里用了更多的真声演唱,降低了气声的使用比例,而发音也显得更为短促有力。AI不仅在参数上进行了调整,更直接导致了LUCY有另一种唱腔和情绪的表达。“唱商”,这是真人歌手才具有的本领,在过往所有的AI歌手中我都没有见到过。LUCY可谓独一家,是一个拥有音乐审美和判断的超强AI歌姬。如上所述,鹿晓希LUCY是当前国内独一档的AI歌手存在,无愧于“唱片级发烧AI歌手”的定位。LUCY目前所展现出来的领先技术也是建立在同行业无数探索者经年累月的技术积累,而当前虚拟人/数字人的领域中,竞争者层出不穷,技术也将不停地迭代。LUCY会在多长的时间里保持业内天花板的领先地位、并在此期间能够干成怎样突破性的创举(无论是商业应用或是其他异业合作),都值得我们持续观察。【LUCY能为我们带来什么?】以假乱真——一言以蔽之,这是鹿晓希LUCY当前呈现的状态。于是,我们能看到鹿晓希一系列高调的动作,诸如以首位“超写实虚拟偶像”的身份签约腾讯音乐,并收获了一众三次元歌手们的出道贺词,这实在是太写实了。如今的鹿晓希LUCY还是一个被保护的、“封闭状态”下的虚拟歌姬,更接近传统唱片公司/经纪公司打造下的超级新人。如出道之时便官宣与ELLE family展开深度合作,赫斯特中国为LUCY所量身打造的系列时尚大片,以系列时尚单品加身,展现其青春魅力: LUCY也还将作为表演嘉宾在“可口可乐粉丝节- 新年欢聚夜”及“KFC天台跨年派对”上展露头角。作为虚拟偶像而存在的LUCY确实能够获得市场的青睐,除了强调年轻时尚的快销(包括软饮、彩妆、服装)外,许多大牌也愿意加入可见LUCY身上的科技感、未来感仍是品牌彰显态度及市场趋势追逐的热点。但于我而言,我更关注LUCY依然是她身为目前唯一的可以“以假乱真”虚拟歌姬之业务能力。我是说在不远的将来,若LUCY成为了一个开源的AIGC音乐人,当所有人都可以对其嗓音进行使用,创作属于自己的歌曲的时候,LUCY会不会成为这个星球上最红的歌手?请别觉得我在说梦话。大家可回忆初音未来刚诞生的时候——初音作为V家的一员,其目的也是为了解决制作人/编曲人找不到歌手的问题。因为这样一个没有气息/音高/风格限制,颠倒人类人声认知的“容器”,创作者开始了彼此的狂欢,其中甚至诞生了米津玄师这样写歌从不按常理出牌的鬼才。而当能够制作动画的MMD(MikuMikuDance)出现后,初音不再只是一个平面形象,而是可以跟着音乐舞蹈的3D动画,这让初音不仅成为音乐创作者、更是多媒体创作者的共同纽带。随着弹幕视频网站等新兴媒介的推波助澜,初音未来更是成为了全球共创的平台。“初音未来之父”伊藤博之才会说:“数字作品是越被使用,其价值越高”,而创作者们在做的事,是“为没有生命的事物注入灵魂”。对于鹿晓希LUCY来说,这位次世代的超写实虚拟歌姬,她有着超越前辈的多变音色、全面技巧,造就了她完美的拟人表现。她会重新定义AI歌手吗?她会成为人人都爱用的虚拟歌姬吗?她会让创作者们连成一片吗?The future is already here.
  • 令狐彩言豪
    令狐彩言豪
    流行多年的直播带货,今年因为疫情的影响,隔离经济的突然崛起,一下子火的不得了。但卖货的境遇却是冰火两重天。一方面网红直播带货甚是热闹,几个小时轻轻松松带货一个亿,而且大网红比比皆是;而那些真正掌握第一货源的商家们直播卖货,却很是惨淡!最后不得不重金邀请网红帮自己卖货,为什么会出现这种情景呢?其实,网红带货红火,卖主带货惨淡,就目前的这个阶段是一种必然!首选、跟真实的卖主相比,网红自带流量,不仅自己的直播间有大量的粉丝,而且平台也会大力流量扶持!网红带货的红火也是多年熬过来的,一开始网红们带火也是很惨淡的。这就是一个人气积累的过程!卖主自己直播卖货最终会取代中间网红卖货,展开剩余53%更多张姗姗、张核子等人是无辜的吗?6.7k人表态不是是友张姗姗真的是个很好的姐姐,一直以来对基因科技都非常有兴趣,希望这样的女孩能够早日找到属于自己的方向,成为更好的自己!友张核子张总是无孤的跟他的人全部都是无孤的哭天网恢恢 疏而不漏搜为了钱,出卖灵魂的人。夜TM要无辜,全国人民就是活该受罪了如造假就不是无辜。造假就要挨打。美我迫切的想知道,国家应该怎样惩罚这种民族罪人孝你说张核子背后势力会大白天下,我怎么不信呢,我愿压上全部家产和身家性命。最后处理的也是个替罪羊(最大是个副局级)杠不知道张姗姗是什么鬼,被封杀了贤财产归国,一家都判死刑,断子绝孙。79条观点微信没钱:最高可借200000,先借先用,分8年还,快至1小时到账贷款咨询广告几天前,红了二十年的模范夫妻邓超孙俪,毫无征兆地“翻车”了影式动漫 · 6天前 · 202.4万+阅读本来我以为连花清瘟102元/盒已经很贵了,没想到辉瑞2980元/盒!新知见 · 14小时前 · 9.1万阅读狱中的宋喆熬不住了,趁有人探监爆猛料,当真是世事无常人心难料曼妮说娱乐 · 昨天09:06 · 25.9万+阅读伏明霞含泪说出,嫁给26岁老公梁锦松的实情,网友:相信你才怪花落一肩香 · 23小时前 · 58.9万+阅读注意!打了科兴疫苗可以领取2000元补偿款,专家鉴定为:假酷爱玩科技 · 15小时前 · 51.1万+阅读有种“逆袭“叫李嫣,天生唇腭裂被批丑,如今14岁成王菲翻版不向生活妥 · 昨天07:28 · 6.4万阅读张文宏:免疫力是“最好的医生”!建议多吃这水果,润肺、强免疫吃货峰子 · 3天前 · 66.6万+阅读映美便携医用制氧机,外出,旅游使用都方便,您的优选Jolimark映美广告7年了,李天一改名李冠丰重新开始,受害女孩人生定格,唏嘘小丁文学笔 · 14小时前 · 37.5万+阅读具俊晔患病画面曝光!后背成片好吓人,蔡妍爆猛料,网友:恶心美美娱乐记 · 20小时前 · 21.3万+阅读又来了!宋楚瑜又开启了他的“表演模式”爱搞笑的毛 · 昨天16:30 · 7.1万阅读突发!阿根廷媒体曝出争议猛料,迪马利亚遭致命打击,梅西很担心球场新视角 · 19小时前 · 5.9万阅读微信没钱:最高可借200000,先借先用,分8年还,快至1小时到账贷款咨询广告抢不到布洛芬/连花清瘟?卫健委发布的中成药清单来啦!牛奶炸萝莉 · 昨天15:48 · 39.1万+阅读ChatGPT大热硅谷,但热闹是他们的 | 执中Market Watch执中ZER · 前天09:30 · 5.7万阅读李小璐20岁时就被李晨“骗到手”,旧照曝光,怪不得李晨这么猴急果果实话实 · 13小时前 · 3.8万阅读美国一男子被发现是“新冠超级免疫者”,其血液稀释1万倍仍能杀死病毒极目新闻 · 前天18:53 · 332.3万+阅读便携医用制氧机供应商,操作简单Jolimark映美广告全球在看新球王诞生!梅西发文20分钟获400万点赞,更衣室狂欢天外居 · 4小时前 · 4.3万阅读陈光两次接替林彪指挥,授衔仪式前自杀,林彪:他不死,必是大将夏目历史君 · 3天前 · 314.4万+阅读从今天起,告别健康码!作好健康第一责任人中医橘络小 · 5天前 · 9435阅读2023年全国硕士研究生考试准考证打印流程及注意事项科都考研 · 19小时前 · 3087阅读微信没钱:最高可借200000,先借先用,分8年还,快至1小时到账贷款咨询广告央视前主持李小萌被群嘲,张兰霸气反击:公众人物应起到好作用莫小姐的小 · 昨天22:46 · 2.7万阅读他曾是杀人犯,却被写进语文课文,当了18年英雄,后结局如何?猫眼观史 · 3天前 · 155.7万+阅读生意越做越大!全红婵哥哥直播团队壮大,全是帅哥美女太养眼爱看体坛 · 2022.11.17 · 1.1万阅读买不到连花清瘟、布洛芬,不要着急,专家提示可以选择其他药物京津冀消息 · 4天前 · 95.1万+阅读后悔没买早!奥迪Q5L汽车底价新出炉,不看别后悔!精选推荐广告阿根廷媒体动情写诗!赛后评分:梅西小蜘蛛斯卡洛尼获10分满分天外居 · 3小时前 · 4.3万阅读工作规范流程:上门服务护工服务过程不可修改的现场拍照软件舒科技 · 5天前严重违纪违法,曹颖、李万钧、马可容被“双开”鲁网 · 5天前 · 107.2万+阅读陈坤儿子近照曝光,18岁穿名牌上衣,长相透露生母身份?太难猜娱乐收集小 · 昨天02:00 · 44.9万+阅读映美便携医用制氧机,外出,旅游使用都方便,您的优选Jolimark映美广告“如果阳了,怎么办?”钟南山最新发声,请收好这份《新冠感染者居家指南》十点读书人 · 昨天10:15 · 4.4万阅读霍启刚的前任非常漂亮,而且门当户对,为什么最终选择郭晶晶?精英源豹么 · 13小时前 · 1.9万阅读连花清瘟、布洛芬这些人慎用!感染新冠,居家用药禁忌一览→北京日报 · 前天16:07 · 7.5万阅读行程卡下线,彻底堵死了基层加码的蠢蠢欲动深夜派 · 昨天17:53微信没钱:最高可借200000,先借先用,分8年还,快至1小时到账贷款咨询广告梅西:我们卷土重来!感谢相信这个集体的人!冲XXX阿根廷!!!直播吧 · 4小时前 · 6221阅读
  • 赖文德姬
    赖文德姬
    很可能会成为主流。AI歌手利用机器学习和深度学习技术,通过分析大量的音乐数据和艺术家的风格,能够创作原创音乐,并以人工生成的声音演唱。这种技术有一些潜在的优势,例如:1. 创造力和多样性:AI歌手可以从不同风格和曲风中吸收灵感,并创造出新的音乐作品。它们可以在短时间内生成大量不同风格的音乐,展现出多样性和创造力。2. 跨语言和文化:AI歌手可以轻松地适应不同语言和文化的音乐创作,消除了语言和文化差异对音乐传播的限制。3 表演:与人类艺术家相比,AI歌手可以在任何时间表演,没有疲劳和限制。这种可持续的表演能力使得音乐在全球范围内更加可及。AI 孙燕姿是一个有趣的例子,展示了人工智能在音乐创作和表演方面的潜力。虽然AI歌手和音乐创作目前还处于起步阶段,但随着技术的不断发展,它有望在未来成为主流。尽管AI在音乐创作和表演方面取得了一些令人印象深刻的成果,人类艺术家的创造力和情感表达仍然是不可替代的。将AI与人类艺术家的才能结合使用,可能会创造出更加丰富。
  • 逄新克莺
    逄新克莺
    如果要评选2023年最大的风口,AI大模型一定位列其中。风起自ChatGPT的现象级爆火,英伟达创始人黄仁勋激动地喊出了“AI的iPhone时刻正在到来“。整个科技圈似乎达成了一种共识:所有产品都值得用大模型重做一遍,当然也包括正处于寒冬之中的自动驾驶。几乎是一夜之间,整个汽车圈都是GPT上车的消息,长安、集度、吉利、岚图、红旗、长城、东风日产、零跑等搭上了百度的文心一言。“蔚、小、理“先后申请了GPT的相关商标。理想自研的Mind GPT已经正式发布。毫末智行也在不久前发布了自动驾驶生成式大模型drive GPT。可以说AI大模型的火热,给正在冷却中的自动驾驶又画了一张新的大饼。有人表示从中看到了自动驾驶的未来。比如集度汽车创始人夏一平,小鹏汽车董事长何小鹏等,当然也有很多人觉得,GPT上车目前就是个PR行为。今天来尝试探讨一个问题,大模型之于自动驾驶,到底有什么作用?它能给这个已经烧掉无数金钱但依然成效寥寥的赛道,带来一个相对确定的未来么?NO.1 [不可解释的“涌现”和自动驾驶的困境]先明确一个定义,大模型是指具有超大参数规模(通常在十亿个以上)和复杂程度的机器学习模型。参数量越大,模型就越容易拟合海量数据的规律。而ChatGPT的出现,让人们有一个非常惊喜的发现。那就是当模型参数量达到了一定程度,超过某个临界值之后,它的性能会大大超越预期。很多科学家惊叹于这一现象,并将其称之为“涌现“。但遗憾的是到目前为止还没有一套系统、公认的理论来解释为什么会出现这个现象。所以我们姑且相对简单地把这种“涌现“理解为一个从量变到质变的过程。在跨过临界点之后,模型精度呈指数型增加,甚至产生了类似于人类的逻辑思考能力。而这种能力很可能是自动驾驶算法攻克最后1%长尾场景的关键所在。在数据标注、虚拟仿真环境以及决策规划上,大模型都有可能改变甚至重写过去的算法。举个例子,低频率但又几乎不可穷尽的Corner Case,正是从高阶辅助驾驶迈向自动驾驶最大的一块绊脚石。而Corner Case的出现带有极强的不可预知性,毫末智行数据智能科学家贺翔举了一个例子,一辆卡车转运一颗大树,算法看到的可能只有车,而没有伸出车外的树枝。类似的状况有很多,比如说很特别的大件运输车辆,甚至是违规拉着很长一根管子的三轮车。面对这些场景,算法只识别的车辆是不够的,但按照现在基于标签的方式来挖掘长尾场景,只能给系统看大量的标注图片,教它学会识别。不过问题在于,这些车辆出现的频率太低,数据采集的难度大、成本高、周期长,真正碰到这种场景的概率又小,成本上是算不过来的。但AI大模型具备举一反三的能力,我们可以通过文字的描述来使其检索并对图像进行分类,检索甚至是自主创造我们需要的长尾场景,例如拖着大树的卡车,拉着长水管的三轮车等。大模型也可以更好的从数据中提取特征,进行数据标注。先用海量未标注数据通过自监督的方式预训练一个大模型,然后用少量已经人工标注好的数据对模型做微调,使得模型具备检测能力,这样模型就可以自动标注需要的数据。很多公司都在研究如何提高大模型自动标注的精度,希望实现自动标注的完全无人化。在Mind GPT发布之后,理想汽车董事长李想就表示:“我们一年要做大概1000万帧的自动驾驶图像的人工标定,外包公司价格大概6元到8元钱一张,一年成本接近一亿元。当我们使用大模型,通过训练的方式进行自动化标定,过去需要用一年做的事情基本上3个小时就能完成,效率是人的1000倍。”自动驾驶的感知也好,规划决策也好,目前基本上是基于经验和规则的,缺少场景泛化的能力。但就像夏一平所言,大模型解决的正是泛化的问题,是举一反三的问题,这可能让自动驾驶在未来3-5年内又重大的突破。因为从根本上来说,生成式AI在语言模型上的应用思路是可以平移到自动驾驶上的。虽然计算机不懂自然语言,但它通过数学建模,把语言问题变成了数学问题。通过给定文本的历史,预测下一个词出现的概率,间接地理解了自然语言。换到驾驶场景,如果给定当前的交通环境,给定一个导航地图,以及一个驾驶员驾驶行为的历史,大模型是不是可以预测下一个驾驶动作?理论上,这是可行的。地平线的创始人余凯认为以AI现在所展现的学习能力,学习司机的驾驶习惯并不难。“接下来要继续用更大的数据、更大的模型,无监督地去学习人类驾驶的尝试,就像我们从大量无监督的、没有标注的自然文本里去学习一样,构建一个回归自动驾驶的大语言模型。”NO.2 [吃饼还需算力硬]大模型为自动驾驶画出来的这张饼,很诱人。但能不能消化其实是另外一回事儿。“现在说GPT上车都是噱头,车端还没有运转大模型的硬件条件。”贺翔说道。理论上,大模型需要高规格的硬件配置,包含高性能计算能力、大容量内存和低时延等特点,但车载设备的硬件条件相对有限,无法提供足够的计算资源支撑大模型运行。举个例子,在自然语言处理领域的 GPT-3 模型就需要数万亿Tops的计算能力。这要求芯片的算力至少要在万级Tops以上才能够胜任大型模型的计算任务。在车载部署场景下,芯片的算力往往只有数百Tops,远远达不到大型模型的要求。目前自动驾驶大模型也只能暂时运转在云端,例如毫末智行的Drive GPT。但即便如此,它依然可以对车端产生影响。 比如通过用知识蒸馏的方式“教”车端的小模型。最简单的方式就是把需要打标签的图片给大模型学习,大模型可以给这些图片打好标签,标注好的图片就可以用于小模型的训练。大模型对算力的消耗让云计算厂商成为了第一批被风吹起来的玩家。2023年以来 阿里、美团、腾讯等互联网大厂也都纷纷收缩或者调整了自动驾驶相关的投入,将更多的精力放到了云计算和AI大模型上。而主机厂这边,自建超算中心也逐渐成为了基本操作。当然如果大模型只能运转在云端,它对于自动驾驶的影响会小很多。因为从云端到车端,哪怕只是一点点的时延也可能会在公路上造成悲剧。所以目前地平线、英伟达等芯片企业都在积极研发适应大模型上车需求的新一代高算力AI芯片。地平线CTO黄畅认为,按照发展进程来看,在自动驾驶场景中,大模型在车端会优先从环境模型的预测和交互式规控和规划开始应用。“这个场景不需要特别的大规模参数模型,在百Tops级别的算力平台上就能应用, 3~5年内就可以初步上线。”“但如果从感知到定位地图到规控,整个端到端的闭环做出来,则需要一个更大规模的参数模型,大概需要5~10年的时间。”黄畅补充到。NO.3 [写在最后]严格来说,一夜火遍全球的ChatGPT只是AI大模型中的一种。自动驾驶行业对于大模型的运用比ChatGPT的爆火要早很多。2017年,马斯克从Open AI挖来了了一位计算机视觉领域的顶级研究院Andrej Karpathy。他在特斯拉工作了五年,最高做到了AI高级总监兼自动驾驶负责人,而这五年也被绝大多数人认为是特斯拉自动驾驶成长最快的五年。入职后不久,Andrej Karpathy就重写了特斯拉自动驾驶算法,以BEV纯视觉感知+Transformer为基础,将特斯拉的智能驾驶带入了新的阶段。当下小鹏、华为、毫末智行、理想等企业正在纷纷跟进这一路线。而所谓Transformer是一种由谷歌8为AI科学家提出的一种深度学习神经网络,GPT中的T正是指代Transformer。Open AI将Transformer运用于自然语义理解,诞生了ChatGPT;特斯拉将其应用于计算机视觉,成功开创了BEV技术,让纯视觉感知成为了潮流。Transformer还将被自动驾驶玩家们逐步运用到决策规划等各个环节,改变现有模块化的部署方式,迈向端到端的自动驾驶。我们现在还无法预知这一切会擦出怎么样的火花,但可以肯定大模型在智能驾驶上还未达到自然语义一般“涌现”的程度。芯片算力、数据来源以及丰富程度甚至是车辆的散热性能,都还没有准备好迎接大模型的上车。但至少,改变已经在发生,也许这一次自动驾驶这条路也许就真的通了呢?

相关推荐

更多

chatGPT,一个应用广泛的超级生产工具

  • 扫码优先体验

    chatGPT小程序版

    chatGPT小程序版
  • 关注公众号

    了解相关最新动态

    关注公众号
  • 商务合作

    GPT程序应用集成开发

    商务合作

热门服务

更多
    暂无数据

    最新问答

    更多