NLPCC:自然语言处理和中文计算——AI歌词创作样本

版权声明: https://blog.csdn.net/weixin_32393347/article/details/82108449

AI创作歌词

本文主要介绍小禅在中文自语言处理的一些成果。主要包含中文歌词的训练和样本处理以及歌词的创作。主要的内容如下:

  • 样本的收集和处理
  • 最新算法复现和调参
  • GPU训练
  • 测试结果
  • 经验总结

样本收集和处理

  • 由于本文训练的是文本生成,所有根据音乐的类型:流行、古典、诗歌、短小说等分为几大类,由于篇幅的限制本文主要介绍流行音乐的歌词的生成。
  • 本文收集了14万行的中文流行歌曲,大约120W字,作为训练集。

    本文收集的样本做了如下处理:

    –清除了歌曲名字、作者信息、所有的符号、以及所有的小于2个字的行样本

GPU训练(具体操作需联系:QQ260187357)

部分代码

代码块语法遵循标准markdown代码,例如:

@requires_authorization
def somefunc(param1='', param2=0):
    '''A docstring'''
    if param1 > param2: # interesting
        print 'Greater'
    return (param2 - param1 + 1) or None
class SomeClass:
    pass
>>> message = '''interpreter
... prompt'''

测试样本

样本1

我会一直等你

只为了种纠缠

我如何能让你坚持过

我只是个陪伴

就算爱情只能对你倾心

就算我心里

我独自地在这里等着你

你我的心里有一个好人看见

我认真的可以不可能

还不要说

若是你做的梦

我们对我说

你猜到吗

再也没有选择的所有

样本2

能不能就这样

时间都不能阻挡我奔前程

就在这一瞬间

我们该是什么

让我们回到那一秒

我知道你的心

无法擦去的痕迹

这一朵花结婚纱万年

你是我最爱的人

有时候想要的未来

样本3

我们的爱情

不要再为了我

我喜欢你

我的眼泪

我也不会再痛

不必要

不管别人怎么说

我在黑暗的一角静静静等待

我想你

我们都没有用

QQ交流群

QQ群,欢迎加入群里有资料

猜你喜欢

转载自blog.csdn.net/weixin_32393347/article/details/82108449