数据清洗demo 1

其他 2018-05-12 17:47:28 阅读次数: 2

from urllib import urlopen

from BeautifulSoup import BeautifulSoup as BS

import re

def ngrams(input,n):

input=input.replace("\n","")

input=input.split(' ')

output=[]

for i in range(len(input)-n+1):

output.append(input[i:i+1])

return output

html=urlopen("https://en.wikipedia.org/wiki/Python_(programming_language)%22)")

bsObj=BS(html)

content=bsObj.find("div",{"id":"mw-content-text"})

ngrams=ngrams(str(content),2)

print ngrams

print "2-ngrams count is:" + str(len(ngrams))

猜你喜欢

转载自my.oschina.net/u/730477/blog/1570802

数据清洗demo 1

python数据清洗1

数据清洗和准备1

数据预处理(1)——数据清洗

数据预处理（1）数据清洗

【Python数据分析】数据预处理1——数据清洗

大数据课堂测试3——数据清洗（1）

数据预处理1--ETL和数据清洗

使用python脚本进行数据清洗（1）

15-数据清洗和特征选择-jieba_demo

数据清洗和特征选择→PCA→1.算法理解

基于pagerank算法的运用Hbase的搜索引擎（1）——数据清洗篇

三-下-1, 数据清洗(ETL)和计数器浅析及案例实操

数据清洗

清洗数据

progressbar请求数据加载demo1

Java mysql数据库连接Demo1

yuyang1994 tensorflow_yolov3训练报错：IndexError: index 68 is out of bounds for axis 1 with size 68（数据清洗）

Kaggle 数据清洗挑战 Day 1 - 手把手教你五步处理缺失值

[学习笔记]每天1小时学会数据分析、挖掘、清洗、可视化从入门到项目实战

demo1

my React demo 1

Demo1_赋值

LeapMotion Demo1

demo_1

1、Python基础&demo

QML ListView Demo（1）

js demo1

abp demo运行1

支付demo1

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)