当前总结
到此已经完成了一个基于Spring Boot的ALBERT词向量服务的小项目,但其实还存在一些需要改进的点:
- 目前仅支持单次单个词请求,不支持单次批量词向量生成。
- 分词器尚未考虑英文分词情况,而在BERT系列中英文分词的机制其实比汉字更加复杂一点。
- 目前仅进行了简单测试,未进行针对性的一致性测试和单元测试。
目前可以想到的就这些点,有时间再补,如果有大佬很懂相关领域,望不吝赐教!
Python支持工程开源代码:https://github.com/Aiwiscal/albert-vec-support
Java主工程开源代码:https://github.com/Aiwiscal/albert-vec
喜欢请给star哦~