总结一下。
参考http://blog.csdn.net/luoyexuge/article/details/73313586 这个博文很赞。
1. 数据加载器还是要自己写的。你的数据格式,你的输入输出,需要动手实现一下,然后才能喂给网络
2. 我处理的是中文,所以分词是个问题,报错好几次。终于不忍了,参考结巴java版,自己写了一个分词器。
把dl4j的word2vec模型的所有term,都放入到分词词典中,再也不会出现term无值的情况了,啊哈哈~~~
3. DL方法的调参是个大工程。必须做好每次的实验记录,参数设置是什么,实验结果是什么,下一步改进的方向是什么。 不要偷懒,否则就是越忙越乱,越乱越忙,花了时间没有效果。避免原地打转。
4. 我才开始认真学习DL,希望可以坚持下来。
========================================================
期望值:
predict(net, wordVectors, "苹果干"); // 2predict(net, wordVectors, "黄萝卜");// 1
predict(net, wordVectors, "薏苡");// 0
predict(net, wordVectors, "当归");//2
predict(net, wordVectors, "胡椒");//2
实际值:
苹果干 : 2
黄萝卜 : 1
薏苡 : 0
当归 : 2
胡椒 : 2
高兴哭了~
接下来尝试句子分类