软件工程第二次作业—个人项目

1. 代码仓库地址：https://gitee.com/liumangxiaozi/software_engineering.git

2. PSP表格

PSP2.1	Personal Software Process Stages	预估耗时（分钟）	实际耗时（分钟）
Planning	计划	5	10
· Estimate	· 估计这个任务需要多少时间	10	5
Development	开发	10	15
· Analysis	· 需求分析 (包括学习新技术)	200	300
· Design Spec	· 生成设计文档	60	100
· Design Review	· 设计复审	20	20
· Coding Standard	· 代码规范 (为目前的开发制定合适的规范)	10	5
· Design	· 具体设计	20	20
· Coding	· 具体编码	500	500
· Code Review	· 代码复审	200	250
· Test	· 测试（自我测试，修改代码，提交修改）	200	200
Reporting	报告	40	40
· Test Repor	· 测试报告	40	40
· Size Measurement	· 计算工作量	10	10
· Postmortem & Process Improvement Plan	· 事后总结, 并提出过程改进计划	20	20
	合计	1345	1535

3. 学习日志

学习时段：2018.1229.0800-0930

学习内容：python对文本文件的读取

收获体会：在学习过程中效率很低，主要原因在于自己对于python的整体的编程能力的不足，我在自己的D盘内设置有a.txt文件，但是我在编码的过程中采用的调用格式一直也只是a.txt,到最后一直无法对文件进行操作，最后发现，应该在a.txt后面再加一个.txt，这么一个小的错误花费了一个小时才解决

自我效率评价:差

学习时段：20198.0102.1900-2030

学习内容：文本处理-字符串

收获体会：找了一本python基础的书，对其中字符串处理模块进行了学习，由于是对着书本学习，边学习边编写，所以感觉整体效率还算不错。

自我效率评价:较高

学习时段：20198.0104.1400-1730

学习内容：编写词频统计程序

收获体会：参考了https://www.cnblogs.com/Eudemines/p/9764409.html博文的内容和方法，对自己的编程有了一个整体的规划，在缓冲区的处理部分，暂时采用了该博主提供的方法，但是整个程序还是有bug没消掉。

自我效率评价:较低

学习时段：20198.0105.1400-1700

学习内容：编写词频统计程序

收获体会：参考了社区大神的许多建议和方法，针对bug进行处理，解决了bug,并优化了部分的程序结构。

自我效率评价:较低

4. 解题思路描述

①将文本保存为一个字符串形式，统计字符串的长度，文本的行数；

②将字符串内所有的大写字母转为小写字母；

③将字符串中缓冲区进行处理；

④将字符串分离为单个的单词

⑤统计单词的词频

⑥输出词频在前十的单词

⑦对特定的功能点检查自己实现的功能点的缺陷，一个一个优化

5. 设计思路过程

测试用例

功能	测试文本	输出
纯英文字符	The to the	长度：10，行数：1 ，‘the’：2，‘to’：1
数字英文混合行数检测	the123 1the	长度：14，行数：2，‘the123’：1，‘to’：1
大小写检测	The the	长度：7，行数：1，‘the’：2
空行处理	the the	长度：13，行数：2，‘the’：2
首尾空格	The the	长度：10，行数：1 ，‘the’：2
汉字处理	这 the	长度：4，行数：1 ，‘the’：1
特殊字符处理	@#$ the	长度：7，行数：1 ，‘the’：1
字母数字混合	The123the	长度：9，行数：1 ，‘the123the’：1

6. 性能分析

通过程序对四段英文字符串进行处理，程序运行一共花费了接近0.121秒

7. 关键代码

def main():

dst = "a.txt.txt"

bvffer = process_file(dst)

word_freq = process_buffer(bvffer)

output_result(word_freq)

if __name__ == "__main__":

import cProfile

import pstats

cProfile.run("main()", "result")

# 直接把分析结果打印到控制台

p = pstats.Stats("result") # 创建Stats对象

p.strip_dirs().sort_stats("call").print_stats() # 按照调用的次数排序

p.strip_dirs().sort_stats("cumulative").print_stats() # 按执行时间次数排序

p.print_callers(0.5, "process_file") # 如果想知道有哪些函数调用了process_file,小数,表示前百分之几的函数信息

p.print_callers(0.5, "process_buffer") # 如果想知道有哪些函数调用了process_buffer

p.print_callers(0.5, "output_result") # 如果想知道有哪些函数调用了output_res

8心路历程和收获

本次开发过程比较坎坷，中间还穿插着一门矩阵理论的考试课，所以总体的时间还是很紧张，自己编写的软件中存在许多的不足，譬如没能实现老师要求的对以英文和数字混合字符的识别和统计，只是对纯英文文本进行处理，同时对其他字符的处理只是简单的采用了识别和替换的方法，若是输入超出我的编写程序的范围可能会导致软件的奔溃，不管其他，最终还是做出来了一个小小的软件，基本实现了其功能，感悟有三点：一、自己的编程技术太low,需要加强、加强、再加强；二、软件工程中各个部分的工作加起来远比编程多得多；三、学到了许多实用的技能。

软件工程第二次作业—个人项目

软件工程第二次作业—个人项目

猜你喜欢