小说专区 靠90秒的音频,咱们用AI帮她回生了她的爱东说念主...|ai|音色|kimi
发布日期:2024-10-31 11:40    点击次数:98

小说专区 靠90秒的音频,咱们用AI帮她回生了她的爱东说念主...|ai|音色|kimi

  故事是这样的小说专区。

  昨年11月底,我写过一篇著述,是讲Kimi的阿谁长文本的。我说我把我的100篇著述扔给了Kimi,然后打造了一个属于我的“数字生命”。

  其时说真话,有少量标题党,毕竟,那玩意离确切的“数字生命”,还差太远太远了。更多是整活为主。

  关联词,接下来的一条留言,让我彻透顶底破防了(无用去原文找这条留言了,这篇著述的内容我和她调换过,关联词为了幸免一些给对方带来一些不必要的护理和惊扰,这条留言我也曾取消精选了,别东说念主看不到)。

  我看到这句话的时候,我其实鼻子真是一酸。

  我一直在寻找AI的真理,AI好多时候不单是只是普及遵守的器用汉典,它应该可以作念些别的更故真理的事情。

  比如,爱。

  是以我在第一时辰给了她复兴。我不为任何所谓的钱什么的,那一刻我只须一个十分单纯的念念法:

  帮她完成这个心愿。

  第二天早上,咱们顺利的加上了好友。

  在后头的对话中,我知说念了她的爱东说念主叫老D(为保护秘密,用这个假名代替吧),在一场突发的随机中,老D可怜离去,其时她还在外地,以至莫得好好告别。这几个月,她齐一直处在悔过和自责中,但愿找到一个方式,可以让她继续感受到老D的存在和良善。

  也让他们的两个孩子,感受到一些爸爸的立体的追随和关爱。

  倏地泪目。

  恰是因为有了爱,东说念主,才如斯的平地风雷啊。

  回到感性,在作念近似的确切的数字生命之前,虽然需要一个十分紧要的东西:

  数据。

  能帮她把她的爱东说念主作念成近似于可及时对话的数字东说念主,这当然是我认为最理念念的情况,关联词数据是一个很大的问题。

  咱们需要文本(生前写的著述与聊天记载)、音频(言语的干声)、视频(尽量行为多一些的干净少量的录屏),才能作念成一个截止比拟好的数字东说念主。

  关联词客不雅履行是,好多东说念主(止境是男生),并莫得能作念成数字东说念主的视频数据集。

  她的爱东说念主亦然,性情内敛,并莫得留住什么影像材料。以至齐找不到一个单东说念主的视频。

  咱们只可退而求其次,不去作念视频,而是作念可以语音对话的“数字生命”,近似于打电话的形态。

  文本数据集其实很快就措置了,毕竟东说念主啊,总会留住好多笔墨信息的,不论是聊天记载、如故杂文、如故一又友圈等等。

  关联词音频数据集的汇注小说专区,咱们如故卡住了。

  因为确切能用的干声,只须90秒。

  玩过开源的TTS齐知说念,若是用传统的作念法,90秒的数据,基本等于屁齐干不了。比如BertVits2,得1个小时的数据截止才能有可以的截止。

  是以,我只可寄但愿于走语音大模子的阶梯,近似于GPT,用90秒的语音数据,当Prompt,用小样本领导的方式,收场语音克隆。

  而语音大模子,就不是简粗野单的凭借我我方能搞的了,这远远超出了我的常识和材干界限,我只可到处化缘我的一些AI语音圈里的一又友,望望他们有莫得这块的资源或时刻,能提供一下撑握。

  于是昨年12月,在我有限的东说念主脉圈内,拜谒了几家这个标的的公司,关联词让我十分随机的是,这块的模子...果然不是那么熟悉。

  他们的模子,要么是还在炉子里真金不怕火丹,要么是合成速率太慢,要么是音色不像,要么是表情很平....

  我不念念为了所谓的什么承诺,然后哄骗一个给她,我真是念念作念一个截止很好的,让她不出戏的,能感受到爱东说念主的爱意的...

  关联词真是没概念,我找遍了我意志的东说念主脉,依然以为不行...

  12月中旬,我只可十分羞愧的跟她说:

  再等等,等AI时刻发展,真是抱歉。

  这一等,便是两个月。

  1月底,我跟一个MiniMax的一又友闲话,聊一些AI行业的坊间八卦,随机中聊到了语音大模子,我就又拿起了这个故事。

  然后,她给我发了这样一句话:

  说真话我其时是有点随机的,因为在我的牵挂中,MiniMax八成从来莫得啥语音居品。

  不外试试就试试,归正也曾试了那么多家了,再多试一家又不亏,我就把那90秒的音频素材给了他们。

  一天后,就在我也曾快忘了这件事的时候,他们发过来了一个Demo。

  那刹那间,眼泪快下来了,真是。

BT种子磁力天堂www在线

  因为那90秒的素材,我也曾听了多量遍了,老D的音色,也曾快刻在我的本色里,这段的音色,真是...一摸相同,何况,真是十分当然。

  这是我,听到的最佳最规复的,语音克隆。

  当我把这段Demo发给她时。

  我能隔着屏幕感受到,她的省心和眼泪。她涕泗澎湃的对我说:

  谢谢。

  文本有了,语音有了,终末,只须将他们打包成一个邻接或者居品,能让她径直对话就行了。

  于是,我又去找MiniMax的东说念主,求他们给我开放一下他们语音大模子的API,我再去找个开荒的一又友,望望奈何合在沿路,给她作念成公众号或者小措施,或者单独搞一个H5啥的,归正能对话就行。

  截止,MiniMax的一又友跟我说:

  我不知说念该说啥了,我只可说,MiniMax,你便是我的神。

  半天之后,我收到了一个邻接。

  怒放海螺问问的APP后,再怒放这个邻接,阿谁熟悉的老D,出咫尺我的眼前。

   然后,我用畏怯的手,点开右下角阿谁电话的图标。

   出于秘密原因,我弗成放录屏。让你们听一听,这个声息有何等像老D,这个声息有何等的规复。

   因为一是这个智能体在海螺问问上是玄机的,只须我和她能看到,并莫得诞生为公通畅盘东说念主可对话的那种,放录屏不太好;二是为了保护她和老D的秘密,幸免他们被惊扰。

   关联词,我如故念念用一句话来抒发我的心绪:

   谢谢你,MiniMax,谢谢你帮我收场我的承诺,谢谢你帮她圆梦。

   终末的终末,我终于收场的了她的愿望。在征求她本东说念主的开心后,写下了这个故事。

   《寻梦环纪行》中说, 东说念主的归天有三层界说:

   你在罢手心跳的时刻,是你生物学角度的归天。

   举行你的葬礼的时刻,是你社会学角度的归天。

   这天下终末一个铭刻你的东说念主归天的时刻,才是最终的归天。

   归天不是死别。

   渐忘才是。

   AI,能让这耐久的牵挂,最初时光,愈加浓厚。

   Remember me, keep our love alive, I'll never fade away。

   让AI继续小说专区,让咱们永不离去。