介绍
这是来自WWW 2021的一篇论文《A Longitudinal Study of Removed Apps in iOS App Store》作者如下:Fuqi Lin, Haoyu Wang, Liu Wang, Xuanzhe Liu
文章内容
对IOS应用商城中的被删除应用的纵向测量。
前置知识
ASO:app search optimization,应用搜索优化,通过优化应用元数据(名字、描述)的关键词,在搜索结果中表示流行率
测量方法
- 通过比较2019年1月到2020年4月的数据集,确定哪些应用程序被删除,以及相关日期
- 描述被删除应用的整体状况
- 分析被删除的流行应用程序背后的实际原因
- 设计了一个基于机器学习技术的应用程序移除预测模型
数据集来源
1.每天从IOS应用商店获取每天删除的应用,通过比较两个连续的数据集知道哪些应用程序被删除以及删除的时间
2.应用程序的详细信息:{[应用程序目标信息:应用程序名称、ID、开发者名称、应用价格],[应用评价],[应用程序流行程度:市场排名、ASO能力]},其中ASO能力的数据来自合作公司。
测量角度
角度一. 总体情况
1.被删除应用的总体趋势
1)总体分布:
2)被删除的应用程序种类:
2.被删除应用程序的流行程度
1)应用流行程度
2)用户的评级数量
3.被删除应用程序的开发人员
1)每个开发者中被删除的应用程序比例
2)最激进的开发者
4.被删除的应用程序生命周期
测量更新日期和删除日期,发布时间和删除时间,删除日期和重新启动日期
角度二. 流行应用程序被删除原因
1.被删除的原因
2.应用评论的行为模式
1)重复的评论
通过已删除的流行应用程序和普通应用程序重复的评论比例
2)五星好评
3)异常用户
3.ASO关键则的行为模式
4.描述的行为模式
角度三. 检测已删除的应用程序
利用机器学习设计出自动化预测可疑的应用程序
Logistic Regression, Support Vector Machine (a.k.a, SVM), K-Nearest Neighbors (a.k.a, KNN),Random Forest, and Gradient Boosting Decision Tree (a.k.a, GBDT).(基于https://scikit-learn.org/stable/,https://lightgbm.readthedocs.io/en/latest/)
对比两篇相似的论文:
Beyond Google Play: A Large-Scale Comparative Study of Chinese Android App Markets(2018IMC):只对恶意软件的删除情况做了测量
Why are Android Apps Removed From Google Play? A Large-scale Empirical Study(2018MSR):
将被删除的应用按恶意软件、具有隐私风险的软件、虚假应用、垃圾邮件应用、广告拦截应用、违反COPPA的应用(开发者是否提高明确的隐私通知、应用描述是否符合、第三方库是否分享敏感信息);没有建立预测模型