想问问各位大佬加了扩散模型带电音就是反效果是什么原因
sovits吧
全部回复
仅看楼主
level 1
我这个扩散模型跑了10w步,主模型也跑了20w步,扩散模型loss值最高在0.03,最低0.01,主模型loss值最高在23,最低12,数据集有5000多条,都是人声干声,确认是没有混响的,1秒的和大于15秒我全删了,至于用的歌的话我也是确认过的,uvr5三个模型去了三遍,把混响去干净了,应该是不是歌的问题,总之就是加了扩散模型就是反效果,有很明显的电音,直接用主模型推理就没有电音,这种情况是哪里出了问题。
2025年10月15日 01点10分 1
level 9
跑过头了,7w5-9w之间就行,过度拟合了。
2025年10月16日 06点10分 2
level 3
过拟合了,不会看日志的话可以把日志丢给ai
2026年02月21日 18点02分 3
1