1 import jieba 2 str1 = input('请输入一段汉字\n') 3 temp=jieba.cut(str1) 4 dict={} 5 for i in temp: 6 if(len(i)==2): 7 dict[i]=dict.get(i,0)+1 8 top=0 9 for k in sorted(dict,key=dict.__getitem__,reverse=True): 10 if top==10:break 11 print(k+"---------"+str(dict[k])) 12 top=top+1
1. 任意给定一个长度不小于100个汉字的字符串,统计每个长度为2的词语出现的次数,并按出现次数降序输出出现次数最多的10个词语。
2.任意给定一个包含HTML标记的字符串,输出其中涉及的HTML标签。
如,输入的字符串为下面的字符串,则输出为:html,head,meta,title,body
<html lang="en">
<head>
<meta name="Author" content="山东理工大学计算机学院">
<meta name="Keywords" content="计算机,大数据,新工科,创新班">
<meta name="Description" content="软件1805是山东理工大学新工科建设试点班级">
<title>山东理工大学新工科建设</title>
</head>
<body>
</body>
</html>