Google大数据处理的三驾马车:GFS,Bigtable和MapReduce
MapReduce主要思想:
将原问题递归地分成若干个子问题,直到子问题满足边界条件,停止递归。将子问题逐个击破,将已经解决的子问题合并,最后算法会层层合并得到原问题的答案
分治算法的步骤:
- 分:递归地将问题分解为各个子问题
- 治:将这些规模更小的子问题逐个击破
- 合:将已解决的子问题逐层合并,最终得出原问题的解
分治法适用的情况
- 原问题的计算复杂度随着问题的规模增加而增加
- 原问题能够被分解成更小的子问题
- 子问题的结构和性质与原问题一样,并且相互独立,子问题之间不包含公共的子子问题
- 原问题分解出的子问题的解可以合并为该问题的解
算法
python代码:
class Solution:
def majorityElement(self, nums: List[int]) -> int:
if len(nums) == 1:
return nums[0]
left = self.majorityElement(nums[:len(nums)//2])
right = self.majorityElement(nums[len(nums)//2:])
if left == right:
return right
elif nums.count(right) > nums.count(left):
return right
else:
return left
python代码
class Solution:
def maxSubArray(self, nums: List[int]) -> int:
if len(nums) == 1:
return nums[0]
left = self.maxSubArray(nums[:len(nums)//2])
right = self.maxSubArray(nums[len(nums)//2:])
max_l = nums[len(nums)//2]
tmp = 0
for i in range(len(nums)//2,len(nums)):
tmp += nums[i]
max_l = max(tmp,max_l)
max_r = nums[len(nums)//2-1]
tmp_1 = 0
for i in range(len(nums)//2-1,-1,-1):
tmp_1 += nums[i]
max_r = max(tmp_1,max_r)
return max(left,right,max_l+max_r)
python代码
class Solution:
def myPow(self, x: float, n: int) -> float:
if n < 0 :
x = 1/x
n = -n
if n == 0:
return 1
if n%2 == 1:
p = x*self.myPow(x, n-1)
return p
return self.myPow(x*x,n/2)
参考资料