LocalLDAModel源码中的getTopicDistributionMethod - 代码天地

LocalLDAModel源码中的getTopicDistributionMethod

其他 2018-07-16 12:20:10 阅读次数: 0

LocalLDAModel源码中的getTopicDistributionMethod 方法是这样的

private[spark] def getTopicDistributionMethod(sc: SparkContext): Vector => Vector = {
val expElogbeta = exp(LDAUtils.dirichletExpectation(topicsMatrix.toBreeze.toDenseMatrix.t).t)
val expElogbetaBc = sc.broadcast(expElogbeta)
val docConcentrationBrz = this.docConcentration.toBreeze
val gammaShape = this.gammaShape
val k = this.k

(termCounts: Vector) =>
if (termCounts.numNonzeros == 0) {
Vectors.zeros(k)
} else {
val (gamma, _) = OnlineLDAOptimizer.variationalTopicInference(
termCounts,
expElogbetaBc.value,
docConcentrationBrz,
gammaShape,
k)
Vectors.dense(normalize(gamma, 1.0).toArray)
}
}

这个broadcast 根本没有必要，完全是照搬了def topicDistributions(documents: RDD[(Long, Vector)])，其实就是把参数从RDD换成一个Vector。

而且这个broadcast 最好要destory。所以参数sc 是没有必要的。

看了issue mail，2017年的3月份改了。

SPARK的官方代码都有这样的问题，说明代码走读还是有必要的。

猜你喜欢

转载自blog.csdn.net/hhtop112408/article/details/79148476

LocalLDAModel源码中的getTopicDistributionMethod

Hibernate中HibernateDaoSupport 的源码

Robotium中源码网址

ffmepg源码中的 -re

.NET源码中的链表

MySQL源码中的String

python中查看源码

源码中transient的用途

EventBus源码研读(中)

解读源码中的问题

java源码中的注解

drf中listreializer源码

linux中的源码安装

JavaClassLoader源码分析（中）

java中equals源码

android系统源码中添加app源码（源码部署移植）

Mybatis中selectKey源码分析

源码安装中./configure的使用

Iterator在ArrayList中的源码实现

从GitHub中获取Spring源码

LinkedBlockingQueue中put源码分析

eclipse 中绑定 android源码

Android中的ThreadLocal源码解析

ibatis中selectKey的用法与源码

String源码中hashCode算法

eclipse中建geoserver源码

android源码中混淆编译

RHEL中Nginx源码安装

在Eclipse中查看Android源码

Netty中的Future源码解读

今日推荐

周排行

Access的四舍五入取整

8.23 前端学习过程

入门学习过程方向与漏洞复现总结：

操作分布式文件之八：如何批量并行读写远程文件和事务补偿处理

应邀出个教程（搭建tensorflow跑网络环境）

Kubernetes之Pod控制器应用进阶

14-[mysql内置功能]--

HDU6212 区间dp 好题

VS2015生成代码图

验证手机号的工具类

每日归档

更多

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)

2024-10-12(0)